Ahmed-Alghamdi commited on
Commit
d4b0c50
·
verified ·
1 Parent(s): d957734

Update config.py

Browse files
Files changed (1) hide show
  1. config.py +14 -10
config.py CHANGED
@@ -2,20 +2,24 @@ import os
2
 
3
  class Config:
4
  DOCUMENT_FILE = 'RAG DATA.txt'
5
- EMBEDDING_MODEL = 'sentence-transformers/paraphrase-multilingual-mpnet-base-v2'
6
 
7
- # --- إعدادات المعالجة ---
 
 
 
8
  BATCH_SIZE = 32
9
- MAX_LENGTH = 1000 # نبقيه كبيراً لأننا عدلنا ملف المعالجة
10
 
11
- # --- حل مشكلة "لا تتوفر معلومات" ---
12
- # كان 0.28 وهو رقم مرتفع، سنخفضه ليسمح بمرور فقرات أكثر حتى لو كانت نسبة الشبه أقل
13
- MIN_SIMILARITY_SCORE = 0.20
 
 
 
 
14
 
15
- # نقلل العدد قليلاً لتسريع المعالجة (5 فقرات كافية جداً مع الموديل السريع)
16
- TOP_K = 5
17
 
18
- # --- حل مشكلة البطء (هام جداً) ---
19
- # استخدام الموديل السريع جداً "Instant" بدلاً من الموديل الضخم
20
  GROQ_API_KEY = os.getenv("GROQ_API_KEY")
21
  LLM_MODEL = "llama-3.1-8b-instant"
 
2
 
3
  class Config:
4
  DOCUMENT_FILE = 'RAG DATA.txt'
 
5
 
6
+ # --- التغيير الأول: نموذج بحث خفيف جداً وسريع ---
7
+ # هذا النموذج أسرع بـ 5 مرات من السابق ويعطي نتائج ممتازة للعربية
8
+ EMBEDDING_MODEL = 'sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2'
9
+
10
  BATCH_SIZE = 32
 
11
 
12
+ # --- التغيير الثاني: تقليل عدد الفقرات ---
13
+ # بما أننا حسنا طريقة التقطيع (Chunking) وجعلنا الفقرة كبيرة،
14
+ # لسنا بحاجة لقراءة 5 فقرات. 3 كافية جداً وستقلل وقت المعالجة للنصف.
15
+ TOP_K = 3
16
+
17
+ # تقليل نسبة التشابه قليلاً لتجنب "لا توجد معلومات"
18
+ MIN_SIMILARITY_SCORE = 0.22
19
 
20
+ # حجم الفقرة (كما اتفقنا عليه سابقاً)
21
+ MAX_LENGTH = 1000
22
 
23
+ # استخدام Groq السريع
 
24
  GROQ_API_KEY = os.getenv("GROQ_API_KEY")
25
  LLM_MODEL = "llama-3.1-8b-instant"