Cómo funciona

El pipeline de IA local, en dos fases

FASE 1 — INGESTA una sola vez por documento
PDF
Trocear en fragmentos (chunks)
Convertir cada fragmento en un vector (embedding)
Guardar en Qdrant→ vector + metadatos: documento + página
FASE 2 — CONSULTA en cada pregunta
Pregunta del usuario
Convertir la pregunta en un vector (embedding)
Buscar en Qdrant los fragmentos más parecidos
Reordenar por relevancia con el reranker
Pasar los mejores fragmentos al modelo como contexto
Respuesta en lenguaje natural + cita (documento + página)