El pipeline de IA local en dos fases: ingesta y consulta

FASE 1 — INGESTA una sola vez por documento

PDF

Trocear en fragmentos (chunks)

Convertir cada fragmento en un vector (embedding)

Guardar en Qdrant→ vector + metadatos: documento + página

FASE 2 — CONSULTA en cada pregunta

Pregunta del usuario

Convertir la pregunta en un vector (embedding)

Buscar en Qdrant los fragmentos más parecidos

Reordenar por relevancia con el reranker

Pasar los mejores fragmentos al modelo como contexto

Respuesta en lenguaje natural + cita (documento + página)

El pipeline de IA local, en dos fases