A newer version of the Gradio SDK is available:
6.6.0
metadata
license: mit
task_categories:
- text-retrieval
- sentence-similarity
language:
- uk
tags:
- legal
- ukrainian-law
- supreme-court
- vector-database
- embeddings
size_categories:
- n<1K
Legal Position Indexes
Індекси векторної бази даних для Legal Position AI Analyzer
📋 Опис
Цей датасет містить передобчислені індекси для швидкого пошуку релевантних судових рішень та правових позицій Верховного Суду України.
Склад індексів:
- BM25 Retriever - індекс для пошуку за ключовими словами
- BM25 Retriever Meta - індекс з метаданими
- BM25 Retriever Short - скорочений індекс
- ChromaDB with HuggingFace Embeddings - векторні представлення документів
- Docstore - сховище документів з фільтрацією
🔧 Використання
Завантаження через Python:
from huggingface_hub import snapshot_download
snapshot_download(
repo_id="DocSA/legal-position-indexes",
repo_type="dataset",
local_dir="Save_Index_Ivan"
)
Використання в Legal Position AI Analyzer:
Індекси автоматично завантажуються при запуску додатку на Hugging Face Spaces.
📊 Характеристики
- Розмір: ~530 MB
- Мова: Українська
- Джерело: Судові рішення Верховного Суду України
- Embeddings: OpenAI text-embedding-3-small
- BM25 Parameters: k1=1.5, b=0.75
🔗 Пов'язані ресурси
- Application: Legal Position AI Analyzer
- Organization: DocSA
📄 Ліцензія
MIT License - вільне використання з attribution