Question 1

¿Cuándo tiene sentido usar RAG en lugar de solo un LLM?

Accepted Answer

Cuando las respuestas tienen que venir de tus documentos específicos, no del conocimiento general del modelo. RAG es la diferencia entre 'el modelo sabe sobre esto en general' y 'el modelo busca en tu documentación y cita de dónde saca la respuesta'. Siempre que las respuestas deban ser verificables y actualizables sin reentrenar.

Question 2

¿Cómo se evalúa si un sistema RAG funciona bien?

Accepted Answer

Con un conjunto de preguntas con respuesta esperada y métricas de faithfulness (la respuesta viene del contexto recuperado) y relevancia (el contexto recuperado es el correcto). También hay que evaluar la recuperación por separado: que el sistema encuentre los fragmentos correctos antes de generar.

Question 3

¿Qué modelos de LLM usáis?

Accepted Answer

Depende del caso. GPT-4o y GPT-4o-mini de OpenAI para la mayoría de los casos de producción. Claude de Anthropic para tareas con documentos largos. Modelos de HuggingFace para fine-tuning o cuando la privacidad de los datos no permite usar APIs externas. Llama y Mistral para despliegue on-premise.

Question 4

¿Puedo usar LLMs con mis datos internos sin que salgan de mi infraestructura?

Accepted Answer

Sí. Si los datos son confidenciales, trabajo con modelos desplegados on-premise o en tu cloud privado: Llama, Mistral u otros modelos open-weights. El sistema RAG corre en tu infraestructura y los documentos no salen nunca a APIs externas.

Question 5

¿Cuánto cuesta desarrollar una aplicación con LLMs?

Accepted Answer

Un asistente RAG básico (indexado + recuperación + API + interfaz mínima) está entre 2.500€ y 5.000€. Un agente con herramientas múltiples o un sistema con evaluación y fine-tuning, entre 5.000€ y 12.000€. Los costes de uso de la API del modelo van aparte y dependen del volumen.

Aplicaciones con LLMs en Madrid

RAG: respuestas que citan la fuente

Agentes con guardrails

Evaluación, no solo demo

Fine-tuning cuando la API no es suficiente

¿Quieres construir algo con LLMs que funcione de verdad?

FAQ

¿Cuándo tiene sentido usar RAG en lugar de solo un LLM?

¿Cómo se evalúa si un sistema RAG funciona bien?

¿Qué modelos de LLM usáis?

¿Puedo usar LLMs con mis datos internos sin que salgan de mi infraestructura?

¿Cuánto cuesta desarrollar una aplicación con LLMs?