renatavl commited on
Commit
a2348dd
·
1 Parent(s): 754ec2f

added readme

Browse files
Files changed (1) hide show
  1. README.md +58 -0
README.md ADDED
@@ -0,0 +1,58 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ title: RAG QA (CookingRecipes)
3
+ emoji: 🍲
4
+ colorFrom: indigo
5
+ colorTo: gray
6
+ sdk: gradio
7
+ sdk_version: "4.0.0"
8
+ app_file: app.py
9
+ pinned: false
10
+ ---
11
+
12
+ # RAG QA (CookingRecipes)
13
+
14
+ Це мінімальний RAG Question Answering застосунок на датасеті HuggingFace CodeKapital/CookingRecipes.
15
+
16
+ ## Як працює
17
+
18
+ 1. Беремо перші N рецептів з датасету (щоб не завантажувати весь).
19
+ 2. Розбиваємо текст на chunks (з overlap).
20
+ 3. Робимо пошук релевантних chunks:
21
+ - BM25 (keyword)
22
+ - Dense (embeddings)
23
+ 4. (Опційно) Reranker (cross-encoder) покращує порядок результатів.
24
+ 5. Відправляємо фінальні chunks у LLM через LiteLLM і отримуємо відповідь.
25
+
26
+ ## Налаштування в UI
27
+
28
+ - N recipes to index — скільки перших рецептів індексувати.
29
+ - Use streaming — читати перші N без завантаження всього датасету.
30
+ - Use BM25 / Use Dense / Use Reranker — перемикачі retrieval.
31
+ - Top-K — скільки кандидатів брати з кожного retriever.
32
+ - Chunks to LLM (final) — скільки chunks реально піде в LLM.
33
+
34
+ ## Важливо про LLM
35
+
36
+ На HuggingFace Spaces локальний Ollama не доступний, тому для відповідей:
37
+
38
+ - в полі LLM model використай, наприклад: openai/gpt-4o-mini
39
+ - в полі API key введи свій ключ провайдера (ключ не зберігається в коді).
40
+
41
+ ## Demo queries (BM25 vs Dense)
42
+
43
+ BM25-only (вимкни Dense):
44
+
45
+ 1. Which recipes include worcestershire sauce?
46
+ 2. Find a recipe that uses xanthan gum
47
+
48
+ Dense-only (вимкни BM25):
49
+
50
+ 1. Give me a quick dairy-free dessert idea
51
+ 2. Suggest a high-protein breakfast
52
+
53
+ ## Run locally
54
+
55
+ ```bash
56
+ pip install -r requirements.txt
57
+ python app.py
58
+ ```