Spaces:
Running
Running
File size: 3,912 Bytes
4c6d96a | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 | # Scope, data freshness & expectations (LPD / Верховний Суд)
Цей документ фіксує **межі поставки (scope)** та **очікування щодо даних**, щоб уникнути непорозумінь при передачі коду замовнику.
## 1) In-scope (обов’язково для MVP)
### 1.1 Генерація правових позицій
- Вкладка/розділ: **«Генерація правових позицій»**.
- Вхід: текст / URL / файл.
- Вихід: **структурований JSON** з полями: `title`, `text`, `proceeding`, `category`.
### 1.2 Налаштування моделей і режимів «роздумів»
Для розділу генерації мають бути узгоджені (з порталом) параметри:
- `provider` (openai | anthropic | gemini | deepseek)
- `model`
- `thinking_enabled` (true/false)
- `thinking_level` (low | medium | high) — **уніфікований** рівень; деталізація/мапінг до провайдерів робиться в backend.
- (опційно) `openai_verbosity` (low | medium | high) — якщо замовник хоче це в UI.
### 1.3 Додаткове поле «Коментар» (опціонально)
- UI: textarea **«Коментар до генерації (опціонально)»**.
- Backend payload: `comment`.
- Призначення: дати моделі коротку інструкцію/акцент (що підкреслити, який аспект важливий тощо).
## 2) Out-of-scope (не є критерієм приймання MVP, якщо не зазначено в ТЗ)
### 2.1 Пошук схожих позицій
Функціонал пошуку (vector+BM25) може бути:
- залишений у коді як **опціональний**, або
- **вимкнений у customer build**, якщо замовнику зараз не потрібен.
### 2.2 Порівняльний аналіз / прецедентний аналіз
Аналіз результатів пошуку також вважається **опціональним**, якщо він не прописаний у ТЗ.
## 3) Джерело індексів (search KB) та актуальність даних
Якщо пошук увімкнений, застосунок може завантажувати індекси з HuggingFace Dataset:
- `https://huggingface.co/datasets/DocSA/legal-position-indexes`
### Важливий нюанс
- Ця база індексів була отримана **приблизно 1.5 роки тому** як тестовий snapshot від ВС.
- З того часу вона **не оновлювалася**.
### Наслідки
- Пошук/аналіз може **не знаходити** нові/оновлені позиції після дати snapshot.
- Це **не дефект генерації**; це обмеження актуальності корпусу для retrieval-компоненти.
### Як комунікуємо замовнику
- У документації та Help UI має бути явна примітка: **search/analysis optional + data snapshot may be outdated**.
- За потреби — показувати користувачу `Index snapshot: …` (якщо буде додано manifest/version).
## 4) Якщо замовнику колись знадобиться актуалізація
Це окремий потік робіт (не обов’язково для MVP):
- хто надає нові дані (ВС / відповідальна сторона)
- хто будує індекси
- де вони зберігаються
- частота оновлень (разово / періодично)
|