Spaces:
Sleeping
Sleeping
Update app.py
Browse files
app.py
CHANGED
|
@@ -1,9 +1,3 @@
|
|
| 1 |
-
#!/usr/bin/env python3
|
| 2 |
-
"""
|
| 3 |
-
Финальная векторная RAG система для HuggingFace Spaces
|
| 4 |
-
Адаптированная версия с поддержкой векторного поиска и резервным режимом
|
| 5 |
-
"""
|
| 6 |
-
|
| 7 |
import os
|
| 8 |
import json
|
| 9 |
import pickle
|
|
@@ -214,13 +208,13 @@ class VectorRAGSystem:
|
|
| 214 |
- 📋 Структурированный вывод: {structured_output}
|
| 215 |
|
| 216 |
🚀 **Архитектурные особенности:**
|
|
|
|
| 217 |
- 🔎 **Векторный поиск** с text-embedding-3-large
|
| 218 |
- 📄 **Parent-page enrichment** через PyMuPDF
|
| 219 |
- 🧠 **LLM реранкинг** для повышения релевантности
|
| 220 |
- 🤔 **Chain-of-Thought** рассуждения
|
| 221 |
- 📋 **JSON Schema** для структурированных ответов
|
| 222 |
- 📊 **Confidence scoring** и детальная аналитика
|
| 223 |
-
- 📚 **Предобработка** с pdfplumber + таблицы
|
| 224 |
|
| 225 |
💡 **Готова к интеллектуальному анализу отчета ПАО Сбербанк 2023!**"""
|
| 226 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
import os
|
| 2 |
import json
|
| 3 |
import pickle
|
|
|
|
| 208 |
- 📋 Структурированный вывод: {structured_output}
|
| 209 |
|
| 210 |
🚀 **Архитектурные особенности:**
|
| 211 |
+
- 📚 **Предобработка** PDF файла (текст и таблицы) через pdfplumber
|
| 212 |
- 🔎 **Векторный поиск** с text-embedding-3-large
|
| 213 |
- 📄 **Parent-page enrichment** через PyMuPDF
|
| 214 |
- 🧠 **LLM реранкинг** для повышения релевантности
|
| 215 |
- 🤔 **Chain-of-Thought** рассуждения
|
| 216 |
- 📋 **JSON Schema** для структурированных ответов
|
| 217 |
- 📊 **Confidence scoring** и детальная аналитика
|
|
|
|
| 218 |
|
| 219 |
💡 **Готова к интеллектуальному анализу отчета ПАО Сбербанк 2023!**"""
|
| 220 |
|