Como os hemos estado contando a lo largo de varios posts, el ciclo de vida completo de los proyectos de ML es difícil de gestionar. Porque como sabréis, desarrollar un proyecto de Machine Learning en producción no sólo implica desarrollar un código optimizado, hay un montón de aspectos complicados que se deben diseñar. Estos retos […]
LazyPredict: la solución vaga que te va a ahorrar mucho tiempo en tus proyectos
En este post te traigo una librería que quizá no conozcas, pero te aseguro que te va a encantar y la vas a usar bastante. Se trata de LazyPredict. Este paquete de Python nos ayudará a saber qué modelos son los mejores para los datos con los que estamos trabajando, sin tener que comerte la […]
Kubernetes: El director de la Orquesta Cloud
Tras más de década y media de experiencia desplegando aplicaciones en producción a gran escala, Google decidió en 2014 utilizar las mejores ideas y prácticas de la comunidad para desarrollar lo que es ahora Kubernetes, el orquestador de contenedores estándar en la comunidad. Kubernetes (gobernador/timonel en griego) se trata de una plataforma portable y extensible […]
Transformer: la tecnología que domina el mundo
En un post anterior ya te expliqué qué son los modelos secuenciales y cómo han ido evolucionando desde las redes neuronales recurrentes (RNN) hasta el Transformer, pasando por LSTM y GRU. En este post toca explicar en detalle qué es un Transformer, el estado del arte para tareas de NLP. Os traigo una explicación muy […]
Modelos de Secuencia. Todo lo que necesitas es atención
Los modelos de secuencias (en inglés sequence models) son las técnicas utilizadas cuando el orden y la secuencia de los datos aportan mucho valor predictivo. (Aunque están algo relacionados, no lo confundáis con las series temporales). ¿A qué nos referimos con secuencia? Una secuencia es una serie de elementos que se suceden unos a otros […]
Docker para principiantes! Aprende en 5 mins lo necesario!
¿Cuántas veces tienes código que funciona a la perfección en tu ordenador y de repente deja de funcionar? ?Se lo pasas a algún compañero y en su ordenador saltan mil errores? ?Te matas a trabajar durante un largo tiempo y cuando entregas el proyecto no funciona? Todos estos errores se solventan, y además, muy fácilmente, […]
MLOps – Lanza tus modelos a producción
No, MLOps no se trata de un Call of Duty Nuevo. Este campo de ML son las metodologías para lanzar tus modelos de predicción a producción implementando las mejores prácticas del desarrollo de software. ¿Qué es ML-Ops? Poner un modelo en producción significa que el modelo va a operar en la vida real. Va a […]
XGBoost, el algoritmo que lo peta en las competiciones de Kaggle
El XGBoost es uno de los algoritmos supervisados de Machine Learning que más se usan en la actualidad. Esto se debe por su facilidad de implementación, sus buenos resultados y porque está predefinido en un montón de lenguajes. En este post vamos a aprender a implementarlo en Python. Para este post, asumo que ya tenéis […]
K-Means Clustering: algoritmo, aplicaciones y desventajas
¿Te suena haber escuchado más de una vez algo sobre el K-Means clustering? Normal. Se trata de uno de los algoritmos de Machine Learning no supervisados más utilizados por los Data Scientists y que además es muy fácil tanto de usar como de interpretar. En este post voy a hacer que entiendas qué es el […]
Entiende de una vez qué es el Tradeoff Bias-Variance
Nos pasa a todos, leemos artículos sobre el tradeoff de bias vs variance (sesgo vs varianza), lo pillamos y a los dos días se nos ha olvidado. Posiblemente no lo habéis leído con atención, o puede ser que dierais con una explicación compleja. Vamos a intentar entenderlo por fin con un post cortito y al […]