Spaces:

AI-Driven-Data-Driven
/

Arabic-Rag-Chatbot

Sleeping

Ahmed-Alghamdi commited on Dec 30, 2025

Commit

d4b0c50

verified ·

1 Parent(s): d957734

Update config.py

Files changed (1) hide show

config.py CHANGED Viewed

@@ -2,20 +2,24 @@ import os
 class Config:
     DOCUMENT_FILE = 'RAG DATA.txt'
-    EMBEDDING_MODEL = 'sentence-transformers/paraphrase-multilingual-mpnet-base-v2'
-    # --- إعدادات المعالجة ---
     BATCH_SIZE = 32
-    MAX_LENGTH = 1000  # نبقيه كبيراً لأننا عدلنا ملف المعالجة
-    # --- حل مشكلة "لا تتوفر معلومات" ---
-    # كان 0.28 وهو رقم مرتفع، سنخفضه ليسمح بمرور فقرات أكثر حتى لو كانت نسبة الشبه أقل
-    MIN_SIMILARITY_SCORE = 0.20
-    # نقلل العدد قليلاً لتسريع المعالجة (5 فقرات كافية جداً مع الموديل السريع)
-    TOP_K = 5
-    # --- حل مشكلة البطء (هام جداً) ---
-    # استخدام الموديل السريع جداً "Instant" بدلاً من الموديل الضخم
     GROQ_API_KEY = os.getenv("GROQ_API_KEY")
     LLM_MODEL = "llama-3.1-8b-instant"

 class Config:
     DOCUMENT_FILE = 'RAG DATA.txt'
+    # --- التغيير الأول: نموذج بحث خفيف جداً وسريع ---
+    # هذا النموذج أسرع بـ 5 مرات من السابق ويعطي نتائج ممتازة للعربية
+    EMBEDDING_MODEL = 'sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2'
     BATCH_SIZE = 32
+    # --- التغيير الثاني: تقليل عدد الفقرات ---
+    # بما أننا حسنا طريقة التقطيع (Chunking) وجعلنا الفقرة كبيرة،
+    # لسنا بحاجة لقراءة 5 فقرات. 3 كافية جداً وستقلل وقت المعالجة للنصف.
+    TOP_K = 3
+    # تقليل نسبة التشابه قليلاً لتجنب "لا توجد معلومات"
+    MIN_SIMILARITY_SCORE = 0.22
+    # حجم الفقرة (كما اتفقنا عليه سابقاً)
+    MAX_LENGTH = 1000
+    # استخدام Groq السريع
     GROQ_API_KEY = os.getenv("GROQ_API_KEY")
     LLM_MODEL = "llama-3.1-8b-instant"