Spaces:

aab20abdullah
/

kkkkd

Runtime error

App Files Files Community

aab20abdullah commited on Nov 24, 2025

Commit

7b09a87

verified ·

1 Parent(s): 2fb5ada

Update app.py

Browse files

Files changed (1) hide show

app.py +14 -13

app.py CHANGED Viewed

@@ -13,13 +13,13 @@ import warnings
 warnings.filterwarnings("ignore")
 # ==================== CONFIGURATION (Final) ====================
-# 🔴 1. اسم النموذج الأساسي (يجب أن يكون صحيحاً ومتاحاً لحسابك)
 BASE_MODEL_ID = "meta-llama/Llama-4-Maverick-17B-128E-Instruct"
 # 🔴 2. مسار مُحولات التدريب (استبدله بالمعرف الصحيح للمستودع الخاص بك)
 ADAPTER_REPO_ID = "YOUR_HF_USERNAME/Llama-4-Turkmen-Adapter"
 ADAPTER_FOLDER = "Final_Adapter"
-# إعدادات الذاكرة والتوكن
 HF_TOKEN = os.environ.get("HUGGING_FACE_HUB_TOKEN", None)
 BNB_CONFIG = BitsAndBytesConfig(load_in_4bit=True, bnb_4bit_quant_type="nf4", bnb_4bit_compute_dtype=torch.float16)
 DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
@@ -29,12 +29,11 @@ LANG_MAP = {"English": "en", "Turkish": "tr"}
 # 1. دالة تحميل النموذج (تتم مرة واحدة عند بدء التطبيق)
 def load_model():
     print("=====================================================")
-    print("🚀 PHASE 1: Loading Base Model (4-bit QLoRA)")
     print("=====================================================")
     if HF_TOKEN is None:
-        print("❌ FATAL ERROR: HUGGING_FACE_HUB_TOKEN not found in secrets.")
-        sys.exit(1)
     base_model = AutoModelForCausalLM.from_pretrained(
         BASE_MODEL_ID,
@@ -68,8 +67,10 @@ def calculate_similarity(text1, text2):
 def generate_and_verify(topic, lang, tokenizer, model):
     lang_code = LANG_MAP[lang]
-    # 1. التوليد
     prompt = f"<|start_header_id|>user<|end_header_id|>\n\nWrite a factual summary about {topic}<|eot_id|><|start_header_id|>assistant<|end_header_id|>\n\n"
     input_ids = tokenizer(prompt, return_tensors="pt").input_ids.to(DEVICE)
     outputs = model.generate(
         input_ids, max_new_tokens=150, do_sample=True, temperature=0.6, pad_token_id=tokenizer.eos_token_id
@@ -79,7 +80,7 @@ def generate_and_verify(topic, lang, tokenizer, model):
     try: ai_body = full_text.split("assistant\n\n")[-1].strip()
     except: ai_body = full_text
-    # 2. التحقق المباشر من ويكيبيديا (Live Verification)
     wiki_live = wikipediaapi.Wikipedia(user_agent='HFConsoleVerifier', language=lang_code, extract_format=wikipediaapi.ExtractFormat.WIKI)
     page = wiki_live.page(topic)
@@ -96,7 +97,7 @@ def generate_and_verify(topic, lang, tokenizer, model):
              output_report.append(f"AI Response: {ai_body}")
         else:
              output_report.append(f"STATUS: 🔴 REJECTED (Low Match, Corrected)")
-             output_report.append(f"AI Hallucination: {ai_body[:80]}...")
              output_report.append(f"CORRECT SOURCE: {real_summary[:200]}...")
     else:
         output_report.append(f"STATUS: ❌ WIKI SOURCE ERROR (Unverified)")
@@ -110,15 +111,15 @@ def generate_and_verify(topic, lang, tokenizer, model):
 if __name__ == "__main__":
-    # تحميل الموديل مرة واحدة عند بدء التطبيق
     TOKENIZER, MODEL = load_model()
-    # قائمة الاختبارات للتشغيل التلقائي
     tests_to_run = [
         ("Kirkuk", "English"),
-        ("Altun Kupri massacre", "English"),
-        ("Kerkük", "Turkish"),
-        ("Seljuk Empire", "English")
     ]
     print("\n\n######################################################################")

 warnings.filterwarnings("ignore")
 # ==================== CONFIGURATION (Final) ====================
+# 🔴 1. اسم النموذج الأساسي: هذا النموذج ضخم ويتم تحميله بضغط 4-بت.
 BASE_MODEL_ID = "meta-llama/Llama-4-Maverick-17B-128E-Instruct"
 # 🔴 2. مسار مُحولات التدريب (استبدله بالمعرف الصحيح للمستودع الخاص بك)
 ADAPTER_REPO_ID = "YOUR_HF_USERNAME/Llama-4-Turkmen-Adapter"
 ADAPTER_FOLDER = "Final_Adapter"
+# إعدادات الذاكرة والتوكن (يتم قراءة التوكن من الأسرار)
 HF_TOKEN = os.environ.get("HUGGING_FACE_HUB_TOKEN", None)
 BNB_CONFIG = BitsAndBytesConfig(load_in_4bit=True, bnb_4bit_quant_type="nf4", bnb_4bit_compute_dtype=torch.float16)
 DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
 # 1. دالة تحميل النموذج (تتم مرة واحدة عند بدء التطبيق)
 def load_model():
     print("=====================================================")
+    print(f"🚀 PHASE 1: Loading Base Model ({BASE_MODEL_ID})")
     print("=====================================================")
     if HF_TOKEN is None:
+        print("⚠️ WARNING: HUGGING_FACE_HUB_TOKEN not found. Access to Llama models may fail.")
     base_model = AutoModelForCausalLM.from_pretrained(
         BASE_MODEL_ID,
 def generate_and_verify(topic, lang, tokenizer, model):
     lang_code = LANG_MAP[lang]
+    # تنسيق السؤال (Llama Chat Template)
     prompt = f"<|start_header_id|>user<|end_header_id|>\n\nWrite a factual summary about {topic}<|eot_id|><|start_header_id|>assistant<|end_header_id|>\n\n"
+    # التوليد
     input_ids = tokenizer(prompt, return_tensors="pt").input_ids.to(DEVICE)
     outputs = model.generate(
         input_ids, max_new_tokens=150, do_sample=True, temperature=0.6, pad_token_id=tokenizer.eos_token_id
     try: ai_body = full_text.split("assistant\n\n")[-1].strip()
     except: ai_body = full_text
+    # 3. التحقق المباشر من ويكيبيديا
     wiki_live = wikipediaapi.Wikipedia(user_agent='HFConsoleVerifier', language=lang_code, extract_format=wikipediaapi.ExtractFormat.WIKI)
     page = wiki_live.page(topic)
              output_report.append(f"AI Response: {ai_body}")
         else:
              output_report.append(f"STATUS: 🔴 REJECTED (Low Match, Corrected)")
+             output_report.append(f"AI Hallucination: {ai_body[:100]}...")
              output_report.append(f"CORRECT SOURCE: {real_summary[:200]}...")
     else:
         output_report.append(f"STATUS: ❌ WIKI SOURCE ERROR (Unverified)")
 if __name__ == "__main__":
+    # 1. تحميل النموذج
     TOKENIZER, MODEL = load_model()
+    # 2. قائمة الاختبارات للتشغيل التلقائي
     tests_to_run = [
         ("Kirkuk", "English"),
+        ("Altınköprü Katliamı", "Turkish"),
+        ("Gokturks", "English"),
+        ("Kerkük", "Turkish")
     ]
     print("\n\n######################################################################")