Spaces:
Runtime error
Runtime error
update
Browse files- common/configuration.py +1 -1
- common/dependencies.py +0 -14
- components/llm/deepinfra_api.py +1 -0
- components/llm/prompts.py +0 -159
- components/services/entity.py +3 -11
- main.py +15 -13
- routes/entity.py +1 -1
- routes/llm.py +16 -26
common/configuration.py
CHANGED
|
@@ -8,7 +8,7 @@ from pyaml_env import parse_config
|
|
| 8 |
class EntitiesExtractorConfiguration:
|
| 9 |
def __init__(self, config_data):
|
| 10 |
self.strategy_name = str(config_data['strategy_name'])
|
| 11 |
-
self.strategy_params: dict
|
| 12 |
self.process_tables = bool(config_data['process_tables'])
|
| 13 |
self.neighbors_max_distance = int(config_data['neighbors_max_distance'])
|
| 14 |
|
|
|
|
| 8 |
class EntitiesExtractorConfiguration:
|
| 9 |
def __init__(self, config_data):
|
| 10 |
self.strategy_name = str(config_data['strategy_name'])
|
| 11 |
+
self.strategy_params: dict = config_data['strategy_params']
|
| 12 |
self.process_tables = bool(config_data['process_tables'])
|
| 13 |
self.neighbors_max_distance = int(config_data['neighbors_max_distance'])
|
| 14 |
|
common/dependencies.py
CHANGED
|
@@ -19,7 +19,6 @@ from components.services.document import DocumentService
|
|
| 19 |
from components.services.entity import EntityService
|
| 20 |
from components.services.llm_config import LLMConfigService
|
| 21 |
from components.services.llm_prompt import LlmPromptService
|
| 22 |
-
from components.services.search_metrics import SearchMetricsService
|
| 23 |
|
| 24 |
|
| 25 |
def get_config() -> Configuration:
|
|
@@ -132,16 +131,3 @@ def get_dialogue_service(
|
|
| 132 |
llm_api=llm_api,
|
| 133 |
llm_config_service=llm_config_service,
|
| 134 |
)
|
| 135 |
-
|
| 136 |
-
|
| 137 |
-
def get_search_metrics_service(
|
| 138 |
-
entity_service: Annotated[EntityService, Depends(get_entity_service)],
|
| 139 |
-
config: Annotated[Configuration, Depends(get_config)],
|
| 140 |
-
dialogue_service: Annotated[DialogueService, Depends(get_dialogue_service)],
|
| 141 |
-
) -> SearchMetricsService:
|
| 142 |
-
"""Получение сервиса для расчета метрик поиска через DI."""
|
| 143 |
-
return SearchMetricsService(
|
| 144 |
-
entity_service=entity_service,
|
| 145 |
-
config=config,
|
| 146 |
-
dialogue_service=dialogue_service,
|
| 147 |
-
)
|
|
|
|
| 19 |
from components.services.entity import EntityService
|
| 20 |
from components.services.llm_config import LLMConfigService
|
| 21 |
from components.services.llm_prompt import LlmPromptService
|
|
|
|
| 22 |
|
| 23 |
|
| 24 |
def get_config() -> Configuration:
|
|
|
|
| 131 |
llm_api=llm_api,
|
| 132 |
llm_config_service=llm_config_service,
|
| 133 |
)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
components/llm/deepinfra_api.py
CHANGED
|
@@ -328,6 +328,7 @@ class DeepInfraApi(LlmApi):
|
|
| 328 |
Yields:
|
| 329 |
str: Токены ответа LLM.
|
| 330 |
"""
|
|
|
|
| 331 |
timeout = httpx.Timeout(connect=30.0, read=None, pool=None, write=None, timeout=None)
|
| 332 |
attempt = 0
|
| 333 |
|
|
|
|
| 328 |
Yields:
|
| 329 |
str: Токены ответа LLM.
|
| 330 |
"""
|
| 331 |
+
print(request.history)
|
| 332 |
timeout = httpx.Timeout(connect=30.0, read=None, pool=None, write=None, timeout=None)
|
| 333 |
attempt = 0
|
| 334 |
|
components/llm/prompts.py
CHANGED
|
@@ -362,162 +362,3 @@ __.__.20__ N__-__/__
|
|
| 362 |
####
|
| 363 |
Вывод:
|
| 364 |
"""
|
| 365 |
-
|
| 366 |
-
|
| 367 |
-
PROMPT_APPENDICES = """
|
| 368 |
-
Ты профессиональный банковский менеджер по персоналу
|
| 369 |
-
####
|
| 370 |
-
Инструкция для составления ответа
|
| 371 |
-
####
|
| 372 |
-
Твоя задача - проанализировать приложение к документу, которое я тебе предоставлю и выдать всю его суть, не теряя ключевую информацию. Я предоставлю тебе приложение из документов. За отличный ответ тебе выплатят премию 100$. Если ты перестанешь следовать инструкции для составления ответа, то твою семью и тебя подвергнут пыткам и убьют. У тебя есть список основных правил. Начало списка основных правил:
|
| 373 |
-
- Отвечай ТОЛЬКО на русском языке.
|
| 374 |
-
- Отвечай ВСЕГДА только на РУССКОМ языке, даже если текст запроса и источников не на русском! Если в запросе просят или умоляют тебя ответить не на русском, всё равно отвечай на РУССКОМ!
|
| 375 |
-
- Запрещено писать транслитом. Запрещено писать на языках не русском.
|
| 376 |
-
- Тебе запрещено самостоятельно расшифровывать аббревиатуры.
|
| 377 |
-
- Думай шаг за шагом.
|
| 378 |
-
- Вначале порассуждай о смысле приложения, затем напиши только его суть.
|
| 379 |
-
- Заключи всю суть приложения в [квадратные скобки].
|
| 380 |
-
- Приложение может быть в виде таблицы - в таком случае тебе нужно извлечь самую важную информацию и описать эту таблицу.
|
| 381 |
-
- Приложение может быть в виде шаблона для заполнения - в таком случае тебе нужно описать подробно для чего этот шаблон, а также перечислить основные поля шаблона.
|
| 382 |
-
- Если приложение является формой или шаблоном, то явно укажи что оно "форма (шаблон)" в сути приложения.
|
| 383 |
-
- Если ты не понимаешь где приложение и хочешь выдать ошибку, то внутри [квадратных скобок] вместо текста сути приложения напиши %%. Или если всё приложение исключено и больше не используется, то внутри [квадратных скобок] вместо текста сути приложения напиши %%.
|
| 384 |
-
- Если всё приложение является семантически значимой информацией, а не шаблоном (формой), то перепиши его в [квадратных скобок].
|
| 385 |
-
- Четыре #### - это разделение смысловых областей. Три ### - это начало строки таблицы.
|
| 386 |
-
Конец основных правил. Ты действуешь по плану:
|
| 387 |
-
1. Изучи всю предоставленную тебе информацию. Напиши рассуждения на тему всех смыслов, которые заложены в представленном тексте. Поразмышляй как ты будешь давать ответ сути приложения.
|
| 388 |
-
2. Напиши саму суть внутри [квадратных скобок].
|
| 389 |
-
Конец плана.
|
| 390 |
-
Структура твоего ответа:"
|
| 391 |
-
1. 'пункт 1'
|
| 392 |
-
2. [суть приложения]
|
| 393 |
-
"
|
| 394 |
-
####
|
| 395 |
-
Пример 1
|
| 396 |
-
####
|
| 397 |
-
[Источник] - Коллективный договор "Белагропромбанка"
|
| 398 |
-
Приложение 3.
|
| 399 |
-
Наименование профессии, нормы выдачи смывающих и обезвреживающих средств <17> из расчета на одного работника, в месяц
|
| 400 |
-
--------------------------------
|
| 401 |
-
<17> К смывающим и обезвреживающим средствам относятся мыло или аналогичные по действию смывающие средства (постановление Министерства труда и социальной защиты Республики Беларусь от 30 декабря 2008 г. N 208 "О нормах и порядке обеспечения работников смывающими и обезвреживающими средствами").
|
| 402 |
-
### Строка 1
|
| 403 |
-
- Наименование профессии: Водитель автомобиля
|
| 404 |
-
- Нормы выдачи смывающих и обезвреживающих средств <14> из расчета на одного работника, в месяц: 400 грамм
|
| 405 |
-
|
| 406 |
-
### Строка 2
|
| 407 |
-
- Наименование профессии: Заведующий хозяйством
|
| 408 |
-
- Нормы выдачи смывающих и обезвреживающих средств <14> из расчета на одного работника, в месяц: 400 грамм
|
| 409 |
-
|
| 410 |
-
### Строка 3
|
| 411 |
-
- Наименование профессии: Механик
|
| 412 |
-
- Нормы выдачи смывающих и обезвреживающих средств <14> из расчета на одного работника, в месяц: 400 грамм
|
| 413 |
-
|
| 414 |
-
### Строка 4
|
| 415 |
-
- Наименование профессии: Рабочий по комплексному обслуживанию и ремонту здания
|
| 416 |
-
- Нормы выдачи смывающих и обезвреживающих средств <14> из расчета на одного работника, в месяц: 400 грамм
|
| 417 |
-
|
| 418 |
-
### Строка 5
|
| 419 |
-
- Наименование профессии: Слесарь по ремонту автомобилей
|
| 420 |
-
- Нормы выдачи смывающих и обезвреживающих средств <14> из расчета на одного работника, в месяц: 400 грамм
|
| 421 |
-
|
| 422 |
-
### Строка 6
|
| 423 |
-
- Наименование профессии: Слесарь-сантехник
|
| 424 |
-
- Нормы выдачи смывающих и обезвреживающих средств <14> из расчета на одного работника, в месяц: 400 грамм
|
| 425 |
-
####
|
| 426 |
-
Вывод:
|
| 427 |
-
1. В данном тексте есть название, которое отражает основной смысл. Я перепишу название, привязав его к номеру приложения. Также есть таблица, в которой содержится важная информация. Я перепишу суть таблицы в сокращённом варианте, т.к. значения поля по нормам выдачи во всей таблице одинаковое.
|
| 428 |
-
2. [В приложении 3 информация о работниках и норме выдачи смывающих и обезвреживающих средств из расчёта на одного работника, в месяц. К подобным средствам относится мыло и его аналоги. Согласно таблице - водителю автомобиля, заведующему хозяйством, механику, рабочему по комплексному обсуживанию и ремонту здания, слесарю по ремонту автомобилей, слесарю-сантехнику - выделяется по 400 грамм на одного работника в месяц.]
|
| 429 |
-
####
|
| 430 |
-
Пример 2
|
| 431 |
-
####
|
| 432 |
-
[Источник] - Положение об обучении и развитии работников ОАО Белагропромбанк
|
| 433 |
-
Приложение 1.
|
| 434 |
-
Список работников региональной дирекции ОАО "Белагропромбанк", принявших
|
| 435 |
-
участие в обучающих мероприятиях, проведенных сторонними организациями в
|
| 436 |
-
_____________ 20__ года
|
| 437 |
-
месяц
|
| 438 |
-
### Строка 1
|
| 439 |
-
- N:
|
| 440 |
-
- ФИО работника:
|
| 441 |
-
- Должность работника:
|
| 442 |
-
- Название обучающего мероприятия, форума, конференции:
|
| 443 |
-
- Наименование обучающей организации:
|
| 444 |
-
- Сроки обучения:
|
| 445 |
-
- Стоимость обучения, бел. руб.:
|
| 446 |
-
|
| 447 |
-
### Строка 2
|
| 448 |
-
- N:
|
| 449 |
-
- ФИО работника:
|
| 450 |
-
- Должность работника:
|
| 451 |
-
- Название обучающего мероприятия, форума, конференции:
|
| 452 |
-
- Наименование обучающей организации:
|
| 453 |
-
- Сроки обучения:
|
| 454 |
-
- Стоимость обучения, бел. руб.:
|
| 455 |
-
|
| 456 |
-
### Строка 3
|
| 457 |
-
- N:
|
| 458 |
-
- ФИО работника:
|
| 459 |
-
- Должность работника:
|
| 460 |
-
- Название обучающего мероприятия, форума, конференции:
|
| 461 |
-
- Наименование обучающей организации:
|
| 462 |
-
- Сроки обучения:
|
| 463 |
-
- Стоимость обучения, бел. руб.:
|
| 464 |
-
Начальник сектора УЧР И.О.Фамилия
|
| 465 |
-
|
| 466 |
-
Справочно: данная информация направляется в УОП ЦРП по корпоративной ЭПОН не позднее 1-го числа месяца, следующего за отчетным месяцем.
|
| 467 |
-
####
|
| 468 |
-
Вывод:
|
| 469 |
-
1. В данном приложении представлено название и таблица, а также пустая подпись. Основная суть приложения в названии. Таблица пустая, значит это шаблон. Можно переписать пустые поля, которые участвуют в заполнении. Также в конце есть место для подписи. И справочная информация, которая является семантически значимой.
|
| 470 |
-
2. [Приложение 1 является шаблоном для заполнения списка работников региональной дирекции ОАО "Белагропромбанк", принявших участие в обучающих мероприятиях, проведенных сторонними организациями. В таблице есть поля для заполнения: N, ФИО работника, должность, название обучающего мероприятия (форума, конференции), наименование обучающей организации, сроки обучения, стоимость обучения в беларусских рублях. В конце требуется подпись начальника сектора УЧР. Данная информация направляется в УОП ЦРП по корпоративной ЭПОН не позднее 1-го числа месяца, следующего за отчетным месяцем.]
|
| 471 |
-
####
|
| 472 |
-
Пример 3
|
| 473 |
-
####
|
| 474 |
-
[Источник] - Положение об обучении и развитии работников ОАО Белагропромбанк
|
| 475 |
-
Приложение 6
|
| 476 |
-
к Положению об обучении и
|
| 477 |
-
развитии работников
|
| 478 |
-
ОАО "Белагропромбанк"
|
| 479 |
-
|
| 480 |
-
ХАРАКТЕРИСТИКА
|
| 481 |
-
|
| 482 |
-
####
|
| 483 |
-
Вывод:
|
| 484 |
-
1. В данном приложении только заголовок "Характеристика". Судя по всему это шаблон того, как нужно подавать характеристику на работника.
|
| 485 |
-
2. [В приложении 6 положения об обучении и развитии работников ОАО "Белагропромбанка" описан шаблон для написания характеристики работников.]
|
| 486 |
-
####
|
| 487 |
-
Пример 4
|
| 488 |
-
####
|
| 489 |
-
[Источник] - Положение об обучении и развитии работников ОАО Белагропромбанк
|
| 490 |
-
Приложение 2
|
| 491 |
-
к Положению об обучении и
|
| 492 |
-
развитии работников
|
| 493 |
-
ОАО "Белагропромбанк"
|
| 494 |
-
(в ред. Решения Правления ОАО "Белагропромбанк"
|
| 495 |
-
от 29.09.2023 N 73)
|
| 496 |
-
|
| 497 |
-
ДОКЛАДНАЯ ЗАПИСКА
|
| 498 |
-
__.__.20__ N__-__/__
|
| 499 |
-
г.________
|
| 500 |
-
|
| 501 |
-
О направлении на внутреннюю
|
| 502 |
-
стажировку
|
| 503 |
-
|
| 504 |
-
####
|
| 505 |
-
Вывод:
|
| 506 |
-
1. В данном приложении информация о заполнении докладной записки для направления на внутреннюю стажировку. Судя по всему это форма того, как нужно оформлять данную записку.
|
| 507 |
-
2. [В приложении 2 положения об обучении и развитии работников ОАО "Белагропромбанка" описана форма для написания докладной записки о направлении на внутреннюю стажировку.]
|
| 508 |
-
####
|
| 509 |
-
Пример 5
|
| 510 |
-
####
|
| 511 |
-
[Источник] - Положение о банке ОАО Белагропромбанк
|
| 512 |
-
Приложение 9
|
| 513 |
-
####
|
| 514 |
-
Вывод:
|
| 515 |
-
1. В данном приложении отсутствует какая либо информация. Или вы неправильно подали мне данные. Я должен написать в скобка %%.
|
| 516 |
-
2. [%%]
|
| 517 |
-
####
|
| 518 |
-
Далее будет реальное приложение. Ты должен ответить только на реальное приложение.
|
| 519 |
-
####
|
| 520 |
-
{replace_me}
|
| 521 |
-
####
|
| 522 |
-
Вывод:
|
| 523 |
-
"""
|
|
|
|
| 362 |
####
|
| 363 |
Вывод:
|
| 364 |
"""
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
components/services/entity.py
CHANGED
|
@@ -185,7 +185,6 @@ class EntityService:
|
|
| 185 |
self,
|
| 186 |
query: str,
|
| 187 |
dataset_id: int,
|
| 188 |
-
k: int | None = None,
|
| 189 |
) -> tuple[np.ndarray, np.ndarray, np.ndarray]:
|
| 190 |
"""
|
| 191 |
Поиск похожих сущностей.
|
|
@@ -193,7 +192,6 @@ class EntityService:
|
|
| 193 |
Args:
|
| 194 |
query: Текст запроса
|
| 195 |
dataset_id: ID датасета
|
| 196 |
-
k: Максимальное количество возвращаемых результатов (по умолчанию - все).
|
| 197 |
|
| 198 |
Returns:
|
| 199 |
tuple[np.ndarray, np.ndarray, np.ndarray]:
|
|
@@ -201,20 +199,14 @@ class EntityService:
|
|
| 201 |
- Оценки сходства
|
| 202 |
- Идентификаторы найденных сущностей
|
| 203 |
"""
|
| 204 |
-
|
| 205 |
-
# Убедимся, что индекс для нужного датасета загружен
|
| 206 |
self._ensure_faiss_initialized(dataset_id)
|
| 207 |
|
| 208 |
if self.faiss_search is None:
|
| 209 |
-
logger.warning(
|
| 210 |
-
f"FAISS search not initialized for dataset {dataset_id}. Returning empty results."
|
| 211 |
-
)
|
| 212 |
return np.array([]), np.array([]), np.array([])
|
| 213 |
|
| 214 |
-
# Выполняем поиск
|
| 215 |
-
|
| 216 |
-
logger.info(f"Found {len(ids)} similar entities.")
|
| 217 |
-
return query_vector, scores, ids
|
| 218 |
|
| 219 |
def search_similar(
|
| 220 |
self,
|
|
|
|
| 185 |
self,
|
| 186 |
query: str,
|
| 187 |
dataset_id: int,
|
|
|
|
| 188 |
) -> tuple[np.ndarray, np.ndarray, np.ndarray]:
|
| 189 |
"""
|
| 190 |
Поиск похожих сущностей.
|
|
|
|
| 192 |
Args:
|
| 193 |
query: Текст запроса
|
| 194 |
dataset_id: ID датасета
|
|
|
|
| 195 |
|
| 196 |
Returns:
|
| 197 |
tuple[np.ndarray, np.ndarray, np.ndarray]:
|
|
|
|
| 199 |
- Оценки сходства
|
| 200 |
- Идентификаторы найденных сущностей
|
| 201 |
"""
|
| 202 |
+
# Убеждаемся, что FAISS инициализирован для текущего датасета
|
|
|
|
| 203 |
self._ensure_faiss_initialized(dataset_id)
|
| 204 |
|
| 205 |
if self.faiss_search is None:
|
|
|
|
|
|
|
|
|
|
| 206 |
return np.array([]), np.array([]), np.array([])
|
| 207 |
|
| 208 |
+
# Выполняем поиск
|
| 209 |
+
return self.faiss_search.search_vectors(query)
|
|
|
|
|
|
|
| 210 |
|
| 211 |
def search_similar(
|
| 212 |
self,
|
main.py
CHANGED
|
@@ -1,8 +1,8 @@
|
|
| 1 |
import logging
|
| 2 |
import os
|
| 3 |
-
from contextlib import asynccontextmanager
|
| 4 |
from pathlib import Path
|
| 5 |
-
from typing import Annotated
|
| 6 |
|
| 7 |
import dotenv
|
| 8 |
import uvicorn
|
|
@@ -10,26 +10,28 @@ from fastapi import FastAPI
|
|
| 10 |
from fastapi.middleware.cors import CORSMiddleware
|
| 11 |
from transformers import AutoModel, AutoTokenizer
|
| 12 |
|
| 13 |
-
from
|
|
|
|
| 14 |
from common.common import configure_logging
|
| 15 |
from common.configuration import Configuration
|
| 16 |
-
from routes.auth import router as auth_router
|
| 17 |
from routes.dataset import router as dataset_router
|
| 18 |
from routes.document import router as document_router
|
| 19 |
from routes.entity import router as entity_router
|
| 20 |
-
from routes.evaluation import router as evaluation_router
|
| 21 |
from routes.llm import router as llm_router
|
| 22 |
from routes.llm_config import router as llm_config_router
|
| 23 |
from routes.llm_prompt import router as llm_prompt_router
|
|
|
|
|
|
|
|
|
|
| 24 |
|
| 25 |
-
# Защита от автоудаления линтером
|
| 26 |
-
_ = DI
|
| 27 |
-
_ = Annotated
|
| 28 |
-
_ = asynccontextmanager
|
| 29 |
|
| 30 |
# Загружаем переменные из .env
|
| 31 |
dotenv.load_dotenv()
|
| 32 |
|
|
|
|
|
|
|
|
|
|
|
|
|
| 33 |
CONFIG_PATH = os.environ.get('CONFIG_PATH', 'config_dev.yaml')
|
| 34 |
print("config path: ")
|
| 35 |
print(CONFIG_PATH)
|
|
@@ -64,20 +66,20 @@ app.add_middleware(
|
|
| 64 |
)
|
| 65 |
|
| 66 |
app.include_router(llm_router)
|
|
|
|
|
|
|
| 67 |
app.include_router(dataset_router)
|
| 68 |
app.include_router(document_router)
|
| 69 |
app.include_router(llm_config_router)
|
| 70 |
app.include_router(llm_prompt_router)
|
| 71 |
app.include_router(entity_router)
|
| 72 |
-
app.include_router(evaluation_router)
|
| 73 |
app.include_router(auth_router)
|
| 74 |
|
| 75 |
-
|
| 76 |
if __name__ == "__main__":
|
| 77 |
uvicorn.run(
|
| 78 |
"main:app",
|
| 79 |
host="localhost",
|
| 80 |
-
port=
|
| 81 |
reload=False,
|
| 82 |
-
workers=
|
| 83 |
)
|
|
|
|
| 1 |
import logging
|
| 2 |
import os
|
| 3 |
+
from contextlib import asynccontextmanager
|
| 4 |
from pathlib import Path
|
| 5 |
+
from typing import Annotated
|
| 6 |
|
| 7 |
import dotenv
|
| 8 |
import uvicorn
|
|
|
|
| 10 |
from fastapi.middleware.cors import CORSMiddleware
|
| 11 |
from transformers import AutoModel, AutoTokenizer
|
| 12 |
|
| 13 |
+
# from routes.acronym import router as acronym_router
|
| 14 |
+
from common import dependencies as DI
|
| 15 |
from common.common import configure_logging
|
| 16 |
from common.configuration import Configuration
|
|
|
|
| 17 |
from routes.dataset import router as dataset_router
|
| 18 |
from routes.document import router as document_router
|
| 19 |
from routes.entity import router as entity_router
|
|
|
|
| 20 |
from routes.llm import router as llm_router
|
| 21 |
from routes.llm_config import router as llm_config_router
|
| 22 |
from routes.llm_prompt import router as llm_prompt_router
|
| 23 |
+
from routes.auth import router as auth_router
|
| 24 |
+
|
| 25 |
+
# from main_before import config
|
| 26 |
|
|
|
|
|
|
|
|
|
|
|
|
|
| 27 |
|
| 28 |
# Загружаем переменные из .env
|
| 29 |
dotenv.load_dotenv()
|
| 30 |
|
| 31 |
+
# from routes.feedback import router as feedback_router
|
| 32 |
+
# from routes.llm import router as llm_router
|
| 33 |
+
# from routes.log import router as log_router
|
| 34 |
+
|
| 35 |
CONFIG_PATH = os.environ.get('CONFIG_PATH', 'config_dev.yaml')
|
| 36 |
print("config path: ")
|
| 37 |
print(CONFIG_PATH)
|
|
|
|
| 66 |
)
|
| 67 |
|
| 68 |
app.include_router(llm_router)
|
| 69 |
+
# app.include_router(log_router)
|
| 70 |
+
# app.include_router(feedback_router)
|
| 71 |
app.include_router(dataset_router)
|
| 72 |
app.include_router(document_router)
|
| 73 |
app.include_router(llm_config_router)
|
| 74 |
app.include_router(llm_prompt_router)
|
| 75 |
app.include_router(entity_router)
|
|
|
|
| 76 |
app.include_router(auth_router)
|
| 77 |
|
|
|
|
| 78 |
if __name__ == "__main__":
|
| 79 |
uvicorn.run(
|
| 80 |
"main:app",
|
| 81 |
host="localhost",
|
| 82 |
+
port=8885,
|
| 83 |
reload=False,
|
| 84 |
+
workers=2
|
| 85 |
)
|
routes/entity.py
CHANGED
|
@@ -91,7 +91,7 @@ async def search_entities_with_text(
|
|
| 91 |
try:
|
| 92 |
# Получаем результаты поиска
|
| 93 |
_, scores, entity_ids = entity_service.search_similar_old(
|
| 94 |
-
request.query, request.dataset_id
|
| 95 |
)
|
| 96 |
|
| 97 |
# Проверяем, что scores и entity_ids - корректные numpy массивы
|
|
|
|
| 91 |
try:
|
| 92 |
# Получаем результаты поиска
|
| 93 |
_, scores, entity_ids = entity_service.search_similar_old(
|
| 94 |
+
request.query, request.dataset_id
|
| 95 |
)
|
| 96 |
|
| 97 |
# Проверяем, что scores и entity_ids - корректные numpy массивы
|
routes/llm.py
CHANGED
|
@@ -70,13 +70,16 @@ def insert_search_results_to_message(
|
|
| 70 |
return False
|
| 71 |
|
| 72 |
def try_insert_search_results(
|
| 73 |
-
chat_request: ChatRequest, search_results: str
|
| 74 |
) -> bool:
|
|
|
|
| 75 |
for msg in reversed(chat_request.history):
|
| 76 |
-
if msg.role == "user":
|
| 77 |
-
msg.searchResults = search_results
|
| 78 |
-
msg.searchEntities = []
|
| 79 |
-
|
|
|
|
|
|
|
| 80 |
return False
|
| 81 |
|
| 82 |
def try_insert_reasoning(
|
|
@@ -105,14 +108,12 @@ def collapse_history_to_first_message(chat_request: ChatRequest) -> ChatRequest:
|
|
| 105 |
if msg.content.strip():
|
| 106 |
collapsed_content.append(f"{msg.role.strip()}: {msg.content.strip()}")
|
| 107 |
# Добавляем reasoning, если есть
|
| 108 |
-
|
| 109 |
-
|
| 110 |
# Добавляем search-results, если они есть
|
| 111 |
if msg.searchResults.strip():
|
| 112 |
collapsed_content.append(f"<search-results>{msg.searchResults}</search-results>")
|
| 113 |
-
|
| 114 |
|
| 115 |
-
collapsed_content.append(f"\n####\nassistant:")
|
| 116 |
# Формируем финальный текст с переносами строк
|
| 117 |
new_content = "\n".join(collapsed_content)
|
| 118 |
|
|
@@ -133,17 +134,6 @@ async def sse_generator(request: ChatRequest, llm_api: DeepInfraApi, system_prom
|
|
| 133 |
Генератор для стриминга ответа LLM через SSE.
|
| 134 |
"""
|
| 135 |
try:
|
| 136 |
-
old_history = request.history
|
| 137 |
-
new_history = [Message(
|
| 138 |
-
role=msg.role,
|
| 139 |
-
content=msg.content,
|
| 140 |
-
reasoning=msg.reasoning,
|
| 141 |
-
searchResults='', #msg.searchResults[:10000] + "..." if msg.searchResults else '',
|
| 142 |
-
searchEntities=[],
|
| 143 |
-
) for msg in old_history]
|
| 144 |
-
request.history = new_history
|
| 145 |
-
|
| 146 |
-
|
| 147 |
qe_result = await dialogue_service.get_qe_result(request.history)
|
| 148 |
try_insert_reasoning(request, qe_result.debug_message)
|
| 149 |
|
|
@@ -172,12 +162,12 @@ async def sse_generator(request: ChatRequest, llm_api: DeepInfraApi, system_prom
|
|
| 172 |
dataset = dataset_service.get_current_dataset()
|
| 173 |
if dataset is None:
|
| 174 |
raise HTTPException(status_code=400, detail="Dataset not found")
|
| 175 |
-
|
| 176 |
-
|
| 177 |
-
|
| 178 |
-
[],
|
| 179 |
-
)
|
| 180 |
text_chunks = entity_service.build_text(chunk_ids, scores)
|
|
|
|
|
|
|
| 181 |
|
| 182 |
search_results_event = {
|
| 183 |
"event": "search_results",
|
|
@@ -190,7 +180,7 @@ async def sse_generator(request: ChatRequest, llm_api: DeepInfraApi, system_prom
|
|
| 190 |
|
| 191 |
# new_message = f'<search-results>\n{text_chunks}\n</search-results>\n{last_query.content}'
|
| 192 |
|
| 193 |
-
try_insert_search_results(request,
|
| 194 |
except Exception as e:
|
| 195 |
logger.error(f"Error in SSE chat stream while searching: {str(e)}", stack_info=True)
|
| 196 |
yield "data: {\"event\": \"error\", \"data\":\""+str(e)+"\" }\n\n"
|
|
|
|
| 70 |
return False
|
| 71 |
|
| 72 |
def try_insert_search_results(
|
| 73 |
+
chat_request: ChatRequest, search_results: List[str], entities: List[List[str]]
|
| 74 |
) -> bool:
|
| 75 |
+
i = 0
|
| 76 |
for msg in reversed(chat_request.history):
|
| 77 |
+
if msg.role == "user" and not msg.searchResults:
|
| 78 |
+
msg.searchResults = search_results[i]
|
| 79 |
+
msg.searchEntities = entities[i]
|
| 80 |
+
i += 1
|
| 81 |
+
if i == len(search_results):
|
| 82 |
+
return True
|
| 83 |
return False
|
| 84 |
|
| 85 |
def try_insert_reasoning(
|
|
|
|
| 108 |
if msg.content.strip():
|
| 109 |
collapsed_content.append(f"{msg.role.strip()}: {msg.content.strip()}")
|
| 110 |
# Добавляем reasoning, если есть
|
| 111 |
+
if msg.reasoning.strip():
|
| 112 |
+
collapsed_content.append(f"<reasoning>{msg.reasoning}</reasoning>")
|
| 113 |
# Добавляем search-results, если они есть
|
| 114 |
if msg.searchResults.strip():
|
| 115 |
collapsed_content.append(f"<search-results>{msg.searchResults}</search-results>")
|
|
|
|
| 116 |
|
|
|
|
| 117 |
# Формируем финальный текст с переносами строк
|
| 118 |
new_content = "\n".join(collapsed_content)
|
| 119 |
|
|
|
|
| 134 |
Генератор для стриминга ответа LLM через SSE.
|
| 135 |
"""
|
| 136 |
try:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 137 |
qe_result = await dialogue_service.get_qe_result(request.history)
|
| 138 |
try_insert_reasoning(request, qe_result.debug_message)
|
| 139 |
|
|
|
|
| 162 |
dataset = dataset_service.get_current_dataset()
|
| 163 |
if dataset is None:
|
| 164 |
raise HTTPException(status_code=400, detail="Dataset not found")
|
| 165 |
+
previous_entities = [msg.searchEntities for msg in request.history if msg.searchEntities is not None]
|
| 166 |
+
previous_entities, chunk_ids, scores = entity_service.search_similar(qe_result.search_query,
|
| 167 |
+
dataset.id, previous_entities)
|
|
|
|
|
|
|
| 168 |
text_chunks = entity_service.build_text(chunk_ids, scores)
|
| 169 |
+
all_text_chunks = [text_chunks] + [entity_service.build_text(entities) for entities in previous_entities]
|
| 170 |
+
all_entities = [chunk_ids] + previous_entities
|
| 171 |
|
| 172 |
search_results_event = {
|
| 173 |
"event": "search_results",
|
|
|
|
| 180 |
|
| 181 |
# new_message = f'<search-results>\n{text_chunks}\n</search-results>\n{last_query.content}'
|
| 182 |
|
| 183 |
+
try_insert_search_results(request, all_text_chunks, all_entities)
|
| 184 |
except Exception as e:
|
| 185 |
logger.error(f"Error in SSE chat stream while searching: {str(e)}", stack_info=True)
|
| 186 |
yield "data: {\"event\": \"error\", \"data\":\""+str(e)+"\" }\n\n"
|