Spaces:

Georg4000
/

Octagon

Runtime error

App Files Files Community

Georg4000 commited on Mar 23, 2025

Commit

317ab43

verified ·

1 Parent(s): ec2ca3d

Update app.py

Browse files

Files changed (1) hide show

app.py +17 -9

app.py CHANGED Viewed

@@ -19,20 +19,20 @@ model_name = "TinyLlama/TinyLlama-1.1B-Chat-v1.0"
 # 🔹 تحديد الجهاز المناسب (GPU أو CPU)
 device = "cuda" if torch.cuda.is_available() else "cpu"
-# 🔹 تحميل النموذج والمحول
 model = AutoModelForCausalLM.from_pretrained(
     model_name,
     torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
-    device_map="auto",
     trust_remote_code=True
-)
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 # 🔹 حل مشكلة الـ padding
 tokenizer.pad_token = tokenizer.eos_token
-# 🔹 ردود مخصصة
 custom_responses = {
     "ما هو هدفك؟": "هدفي هو تقديم المساعدة والإجابة على أسئلتك بأفضل طريقة ممكنة.",
     "who created you?": "I was created by George.",
@@ -45,9 +45,9 @@ custom_responses = {
     "你的编程者是谁？": "我的编程者是 George。",
 }
-# 🔹 دالة الدردشة
 def chatbot(user_input):
-    if not user_input.strip():  # التأكد من أن الإدخال ليس فارغًا
         return "Please enter a message."
     user_input = user_input.lower()
@@ -57,11 +57,19 @@ def chatbot(user_input):
         if question in user_input:
             return answer
-    # معالجة الإدخال باستخدام النموذج
     inputs = tokenizer(user_input, return_tensors="pt", padding=True, truncation=True).to(device)
-    with torch.no_grad():  # تحسين الأداء
-        output = model.generate(**inputs, max_length=150, pad_token_id=tokenizer.eos_token_id)
     response = tokenizer.decode(output[0], skip_special_tokens=True)

 # 🔹 تحديد الجهاز المناسب (GPU أو CPU)
 device = "cuda" if torch.cuda.is_available() else "cpu"
+# 🔹 تحميل النموذج والمحول مع تحسين الأداء
 model = AutoModelForCausalLM.from_pretrained(
     model_name,
     torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
+    device_map="cuda" if torch.cuda.is_available() else "cpu",
     trust_remote_code=True
+).eval()  # 🔥 تحسين السرعة بتعطيل التدريب
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 # 🔹 حل مشكلة الـ padding
 tokenizer.pad_token = tokenizer.eos_token
+# 🔹 ردود مخصصة (Instant Responses)
 custom_responses = {
     "ما هو هدفك؟": "هدفي هو تقديم المساعدة والإجابة على أسئلتك بأفضل طريقة ممكنة.",
     "who created you?": "I was created by George.",
     "你的编程者是谁？": "我的编程者是 George。",
 }
+# 🔹 دالة الدردشة السريعة
 def chatbot(user_input):
+    if not user_input.strip():
         return "Please enter a message."
     user_input = user_input.lower()
         if question in user_input:
             return answer
+    # 🔥 تحسين الأداء باستخدام المعلمات التالية:
     inputs = tokenizer(user_input, return_tensors="pt", padding=True, truncation=True).to(device)
+    with torch.no_grad():  # تحسين السرعة
+        output = model.generate(
+            **inputs,
+            max_length=50,          # 🔹 تقليل الطول الأقصى لتسريع الاستجابة
+            temperature=0.7,        # 🔹 ضبط الحرارة لجعل الردود أسرع وأفضل
+            top_p=0.9,              # 🔹 تقليل الاحتمالات غير المفيدة
+            do_sample=True,         # 🔹 السماح بالتوليد العشوائي لتجنب التكرار
+            early_stopping=True,    # 🔹 إنهاء التوليد عندما يكون كافيًا
+            pad_token_id=tokenizer.eos_token_id
+        )
     response = tokenizer.decode(output[0], skip_special_tokens=True)