Question 1

¿Qué diferencia hay entre ciencia de datos y machine learning?

Accepted Answer

La ciencia de datos es más amplia: incluye la exploración, el análisis estadístico, la visualización y la narrativa sobre los datos. El ML es una herramienta dentro de la ciencia de datos, la parte de construir modelos predictivos. En la práctica los dos van juntos en casi todos los proyectos.

Question 2

¿Con qué tipos de datos trabajáis?

Accepted Answer

Principalmente datos tabulares (bases de datos de clientes, transacciones, registros de uso), texto (emails, tickets, documentos, reseñas) y series temporales (ventas, consumo, métricas de producto). Para imágenes o audio, consulta el alcance concreto.

Question 3

¿Qué necesito para empezar un proyecto de ciencia de datos?

Accepted Answer

Un objetivo de negocio claro (qué decisión quieres tomar mejor) y datos históricos con la variable que quieres predecir o entender. No necesitas los datos perfectos ni saber de ML: la primera sesión sirve para diagnosticar qué hay y qué hace falta.

Question 4

¿Podéis trabajar con datos confidenciales?

Accepted Answer

Sí, con las medidas de seguridad adecuadas: NDA, trabajo en tu entorno o entorno controlado, sin datos en servidores externos. Si los datos son muy sensibles (salud, finanzas), lo hablamos antes de empezar.

Question 5

¿Cuánto tarda un proyecto de ciencia de datos?

Accepted Answer

Un análisis exploratorio con informe de conclusiones tarda entre 1 y 2 semanas. Un proyecto completo (análisis + modelo + evaluación + entrega) está entre 4 y 8 semanas dependiendo del volumen de datos y la complejidad del problema. Los proyectos de despliegue y producción van aparte.

Ciencia de datos en Madrid

El análisis que precede al modelo

Ingeniería de variables que aporta

Modelos con metodología

Resultados que se pueden usar

¿Tienes datos y quieres saber qué puedes hacer con ellos?

FAQ

¿Qué diferencia hay entre ciencia de datos y machine learning?

¿Con qué tipos de datos trabajáis?

¿Qué necesito para empezar un proyecto de ciencia de datos?

¿Podéis trabajar con datos confidenciales?

¿Cuánto tarda un proyecto de ciencia de datos?