Ahmed-Alghamdi commited on
Commit
bc8a406
·
verified ·
1 Parent(s): d4b0c50

Update config.py

Browse files
Files changed (1) hide show
  1. config.py +8 -10
config.py CHANGED
@@ -3,23 +3,21 @@ import os
3
  class Config:
4
  DOCUMENT_FILE = 'RAG DATA.txt'
5
 
6
- # --- التغيير الأول: نموذج بحث خفيف جداً وسريع ---
7
- # هذا النموذج أسرع بـ 5 مرات من السابق ويعطي نتائج ممتازة للعربية
8
- EMBEDDING_MODEL = 'sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2'
9
 
10
  BATCH_SIZE = 32
11
 
12
- # --- التغيير الثاني: تقليل عدد الفقرات ---
13
- # بما أننا حسنا طريقة التقطيع (Chunking) وجعلنا الفقرة كبيرة،
14
- # لسنا بحاجة لقراءة 5 فقرات. 3 كافية جداً وستقلل وقت المعالجة للنصف.
15
- TOP_K = 3
16
 
17
- # تقليل نسبة التشابه قليلاً لتجنب "لا توجد معلومات"
18
  MIN_SIMILARITY_SCORE = 0.22
19
 
20
- # حجم الفقرة (كما اتفقنا عليه سابقاً)
21
  MAX_LENGTH = 1000
22
 
23
- # استخدام Groq السريع
24
  GROQ_API_KEY = os.getenv("GROQ_API_KEY")
25
  LLM_MODEL = "llama-3.1-8b-instant"
 
3
  class Config:
4
  DOCUMENT_FILE = 'RAG DATA.txt'
5
 
6
+ # 1. رجعنا للموديل القوي والدقيق جداً في العربية
7
+ EMBEDDING_MODEL = 'sentence-transformers/paraphrase-multilingual-mpnet-base-v2'
 
8
 
9
  BATCH_SIZE = 32
10
 
11
+ # 2. إعدادات متوازنة:
12
+ # 4 فقرات كافية جداًأننا كبرنا حجم الفقرة الواحدة لـ 1000 حرف)
13
+ # هذا سيخفف الحمل قليلاً مقارنة بـ 6 فقرات
14
+ TOP_K = 4
15
 
16
+ # خفضنا النسبة لضمان عدم ضياع أي معلومة محتملة
17
  MIN_SIMILARITY_SCORE = 0.22
18
 
 
19
  MAX_LENGTH = 1000
20
 
21
+ # 3. نبقي على الموديل السريع جداً في الكتابة لتعويض بطء البحث
22
  GROQ_API_KEY = os.getenv("GROQ_API_KEY")
23
  LLM_MODEL = "llama-3.1-8b-instant"