Modelos de ML · Evaluación rigurosa · Madrid
Modelos de machine learning en Madrid
Entreno y evalúo modelos de machine learning con rigor: pipeline sin fugas, validación cruzada, probabilidades calibradas y umbral de decisión por coste de negocio. Un modelo que pasa un test honesto en validación es un modelo en el que puedes confiar en producción.

Validación sin fugas de datos
El preprocesado (escalado, encoding, imputación) vive dentro del pipeline, así que se ajusta solo con los datos de entrenamiento en cada partición de validación cruzada. La métrica que obtengo en validación es la que puedo esperar en producción, sin inflar.
Probabilidades calibradas
Si el modelo va a tomar decisiones basadas en la probabilidad, esa probabilidad tiene que ser fiable. Calibro el modelo (Platt scaling o isotónica) y lo compruebo con el Brier score y la curva de calibración. Un 0,7 tiene que significar de verdad un 70%.
El umbral importa tanto como el modelo
El umbral de decisión no es 0,5 por defecto. Lo elijo minimizando el coste real del negocio: cuánto cuesta un falso negativo frente a un falso positivo. Ese ajuste suele cambiar más el resultado operativo que cambiar de algoritmo.
Análisis de error por segmento
Las métricas globales ocultan problemas. Analizo el error por subgrupos relevantes (antigüedad, categoría, región) para saber dónde falla el modelo y por qué, y ajusto si hace falta.
¿Tienes datos y quieres un modelo que funcione de verdad?
Escríbeme con el problema: qué quieres predecir, qué datos tienes, qué decisiones vas a tomar con el resultado. Primera llamada gratis.
Empezar un proyectoFAQ
¿Qué tipo de modelos de ML hacéis?
Principalmente modelos para datos tabulares: clasificación (impago, fuga, fraude, conversión) y regresión (demanda, precio, tiempo). También modelos de NLP con transformers para clasificación de texto, extracción de información y búsqueda semántica. Para LLMs, integración y fine-tuning.
¿Qué significa que el modelo esté bien calibrado?
Significa que cuando el modelo dice '70% de probabilidad de impago', de verdad ocurre impago en alrededor del 70% de esos casos. Sin calibración, los scores son un ranking pero no probabilidades reales, lo que complica tomar decisiones de negocio con ellos.
¿Por qué no usar siempre el umbral de 0,5?
Porque el coste de equivocarse no es simétrico. En riesgo de crédito, un falso negativo (dar crédito a alguien que impaga) suele costar 5 veces más que un falso positivo (rechazar a alguien que habría pagado). El umbral óptimo refleja esa asimetría, no una convención.
¿Cuánto cuesta entrenar un modelo de ML?
Depende del tipo de problema y la complejidad de los datos. Un modelo tabular con pipeline completo y evaluación rigurosa parte de unos 1.500€. Problemas más complejos (datos heterogéneos, requerimientos de explicabilidad, integración con sistemas existentes) se presupuestan caso a caso.
¿Podéis trabajar con datos que ya tenemos?
Sí, y es la situación más habitual. Aportas los datos (exportación de tu base de datos, ficheros CSV, conexión a un data warehouse) y yo diseño el pipeline de preprocesado, el modelo y la evaluación. El primer paso es revisar la calidad de los datos y definir la variable objetivo.