Spaces:

AI-Driven-Data-Driven
/

Arabic-Rag-Chatbot

Sleeping

Ahmed-Alghamdi commited on Dec 30, 2025

Commit

bc8a406

verified ·

1 Parent(s): d4b0c50

Update config.py

Files changed (1) hide show

config.py CHANGED Viewed

@@ -3,23 +3,21 @@ import os
 class Config:
     DOCUMENT_FILE = 'RAG DATA.txt'
-    # --- التغيير الأول: نموذج بحث خفيف جداً وسريع ---
-    # هذا النموذج أسرع بـ 5 مرات من السابق ويعطي نتائج ممتازة للعربية
-    EMBEDDING_MODEL = 'sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2'
     BATCH_SIZE = 32
-    # --- التغيير الثاني: تقليل عدد الفقرات ---
-    # بما أننا حسنا طريقة التقطيع (Chunking) وجعلنا الفقرة كبيرة،
-    # لسنا بحاجة لقراءة 5 فقرات. 3 كافية جداً وستقلل وقت المعالجة للنصف.
-    TOP_K = 3
-    # تقليل نسبة التشابه قليلاً لتجنب "لا توجد معلومات"
     MIN_SIMILARITY_SCORE = 0.22
-    # حجم الفقرة (كما اتفقنا عليه سابقاً)
     MAX_LENGTH = 1000
-    # استخدام Groq السريع
     GROQ_API_KEY = os.getenv("GROQ_API_KEY")
     LLM_MODEL = "llama-3.1-8b-instant"

 class Config:
     DOCUMENT_FILE = 'RAG DATA.txt'
+    # 1. رجعنا للموديل القوي والدقيق جداً في العربية
+    EMBEDDING_MODEL = 'sentence-transformers/paraphrase-multilingual-mpnet-base-v2'
     BATCH_SIZE = 32
+    # 2. إعدادات متوازنة:
+    # 4 فقرات كافية جداً (لأننا كبرنا حجم الفقرة الواحدة لـ 1000 حرف)
+    # هذا سيخفف الحمل قليلاً مقارنة بـ 6 فقرات
+    TOP_K = 4
+    # خفضنا النسبة لضمان عدم ضياع أي معلومة محتملة
     MIN_SIMILARITY_SCORE = 0.22
     MAX_LENGTH = 1000
+    # 3. نبقي على الموديل السريع جداً في الكتابة لتعويض بطء البحث
     GROQ_API_KEY = os.getenv("GROQ_API_KEY")
     LLM_MODEL = "llama-3.1-8b-instant"