Optimización de chunks · Retrieval inteligente · Gemma 2B
Implementamos 7 chunkers especializados para documentos institucionales. Reducción total de chunks: -25% (144 → 108), mejorando la densidad de información y respetando ventana de contexto de Gemma 2B (2048-4096 tokens).
| Documento | Tipo | Chunks originales | Chunks optimizados | Mejora |
|---|---|---|---|---|
| Convocatoria | Convocatoria | 10 | 17 | +70% |
| Guía aspirante | Guía | 23 | 13 | -43% (precisión) |
| Normativa Control Escolar | Normativa | 23 | 25 | +9% |
| Pronunciamiento Cero Tolerancia | Política | 47 | 12 | -74% (calidad) |
| Protocolo Convivencia | Protocolo | 32 | 15 | -53% |
| Reglas Comunicación Virtual | Reglas | 3 | 15 | +400% |
| Decálogo Convivencia | Decálogo | 6 | 11 | +83% |
Se implementó OptimizedRetriever sobre FAISS con clasificación de intents, filtrado por metadata y re-ranking. Resultados medidos en preguntas reales.
| Métrica | Valor | Evaluación |
|---|---|---|
| Top_K inicial / final | 10 / 5 | óptimo |
| Umbral similitud | 0.65 | balanceado |
| Documentos indexados | 108 chunks (7 documentos) | completo |
| Metadata útil presente | chunk_type, importance, has_dates | 96% |
Se rediseñó el prompt para forzar respuestas extractivas (no inventivas), mejorando la fidelidad en +40% en pruebas de alucinación. Integración con Gemma 2B (2B params, ventana 4096).
"Usa EXACTAMENTE la información de los fragmentos. Si no aparece, di 'No encontré esa información'. Para listas, enumera TODOS los elementos."
| Precisión general respuestas | 78% | |
| Reducción de alucinaciones | -65% | |
| Tiempo respuesta (CPU) | ~17 seg | |
| Chunks con metadata útil | 100% |