Spaces:

FECUOY
/

Test1

Sleeping

App Files Files Community

FECUOY commited on Jan 19

Commit

a8ba3e2

verified ·

1 Parent(s): 171a056

Update app.py

Browse files

Files changed (1) hide show

app.py +48 -139

app.py CHANGED Viewed

@@ -1,168 +1,77 @@
 import gradio as gr
-from huggingface_hub import InferenceClient
 import zipfile
 import os
-import fitz  # مكتبة PyMuPDF لقراءة ملفات PDF
-import docx  # مكتبة لقراءة ملفات Word
-# --- إعدادات المعالجة ---
-MAX_CHAR_LIMIT = 50000  # أقصى عدد حروف يتم قراءته من الملفات لتجنب تجاوز ذاكرة النموذج
-MAX_ZIP_FILES_PREVIEW = 20  # عدد الملفات التي يتم قراءتها من داخل المجلد المضغوط
-def extract_text_from_file(file_path):
-    """دالة شاملة لاستخراج النصوص بناءً على نوع الملف"""
-    try:
-        filename = os.path.basename(file_path)
-        ext = filename.split('.')[-1].lower()
-        # 1. معالجة PDF
-        if ext == 'pdf':
-            text = ""
-            with fitz.open(file_path) as doc:
-                for page in doc:
-                    text += page.get_text()
-            return f"\n--- بداية ملف PDF: {filename} ---\n{text[:MAX_CHAR_LIMIT]}\n--- نهاية الملف ---\n"
-        # 2. معالجة Word (DOCX)
-        elif ext == 'docx':
-            doc = docx.Document(file_path)
-            text = "\n".join([para.text for para in doc.paragraphs])
-            return f"\n--- بداية ملف Word: {filename} ---\n{text[:MAX_CHAR_LIMIT]}\n--- نهاية الملف ---\n"
-        # 3. معالجة الملفات النصية والبرمجية (txt, py, md, json, html, csv)
-        elif ext in ['txt', 'py', 'js', 'html', 'css', 'md', 'json', 'csv', 'xml']:
-            with open(file_path, "r", encoding="utf-8", errors="ignore") as f:
-                content = f.read()
-            return f"\n--- بداية ملف نصي: {filename} ---\n{content[:MAX_CHAR_LIMIT]}\n--- نهاية الملف ---\n"
-        # 4. معالجة ملفات ZIP (الذكية)
-        elif ext == 'zip':
-            report = f"\n--- تحليل مجلد مضغوط: {filename} ---\n"
-            with zipfile.ZipFile(file_path, 'r') as z:
-                all_files = z.namelist()
-                report += f"المجلد يحتوي على {len(all_files)} ملف/مجلد.\n"
-                report += "قائمة الملفات (أول 50):\n" + "\n".join(all_files[:50]) + "\n"
-                # قراءة محتوى عينة من الملفات داخل الـ ZIP
-                read_count = 0
-                for sub_file in all_files:
-                    if read_count >= MAX_ZIP_FILES_PREVIEW: break
-                    if sub_file.endswith(('/', '\\')): continue # تجاهل المجلدات الفارغة
-                    # محاولة قراءة الملفات النصية داخل الـ ZIP
-                    if sub_file.lower().endswith(('.txt', '.py', '.md', '.json', '.csv')):
-                        with z.open(sub_file) as f:
-                            content = f.read().decode('utf-8', errors='ignore')
-                            report += f"\n[محتوى ملف داخل ZIP: {sub_file}]\n{content[:2000]}...\n"
-                        read_count += 1
-            return report + "\n--- نهاية المجلد المضغوط ---\n"
-        else:
-            return f"\n⚠️ تنبيه: الملف {filename} بصيغة غير مدعومة للقراءة النصية المباشرة.\n"
-    except Exception as e:
-        return f"\n⚠️ خطأ أثناء قراءة الملف {os.path.basename(file_path)}: {str(e)}\n"
-def respond(
-    message,
-    history: list[dict[str, str]],
-    system_message,
-    max_tokens,
-    temperature,
-    top_p,
-    hf_token: gr.OAuthToken,
-):
-    # 1. التحقق من التوكن
-    if not hf_token or not hf_token.token:
-        yield "⚠️ **خطأ:** يرجى تسجيل الدخول بحساب Hugging Face أولاً من الزر الموجود في الأعلى."
         return
-    # إعداد العميل (Client)
-    client = InferenceClient(
-        model="moonshotai/Kimi-K2-Instruct",
-        token=hf_token.token
-    )
-    # 2. استخراج البيانات من رسالة المستخدم
     user_text = message.get("text", "")
     files = message.get("files", [])
-    # 3. معالجة الملفات (إن وجدت)
     extracted_knowledge = ""
     if files:
-        yield "⏳ **جاري تحليل الملفات وقراءة محتوياتها...**"
         for file_obj in files:
-            # Gradio يعيد مسار الملف في file_obj أو file_obj['path']
             path = file_obj if isinstance(file_obj, str) else file_obj.name
             extracted_knowledge += extract_text_from_file(path)
-    # 4. بناء الرسالة النهائية للنموذج
-    full_prompt = ""
-    if extracted_knowledge:
-        full_prompt = f"البيانات المستخرجة من الملفات المرفقة:\n{extracted_knowledge}\n\n"
-    full_prompt += f"سؤال/طلب المستخدم: {user_text}"
-    # 5. تجهيز سجل المحادثة
     messages = [{"role": "system", "content": system_message}]
-    messages.extend(history)
     messages.append({"role": "user", "content": full_prompt})
-    # 6. البث المباشر للإجابة (Streaming)
-    response_text = ""
     try:
-        for msg in client.chat_completion(
-            messages,
             max_tokens=max_tokens,
             stream=True,
-            temperature=temperature,
-            top_p=top_p,
-        ):
-            if msg.choices:
-                token = msg.choices[0].delta.content
-                if token:
-                    response_text += token
-                    yield response_text
     except Exception as e:
-        yield f"⚠️ **حدث خطأ من المصدر:** {str(e)}\n\nتأكد من أن الملفات ليست ضخمة جداً (أكبر من سياق النموذج) أو حاول تقليل عدد الملفات."
-# --- واجهة المستخدم (UI) ---
-with gr.Blocks(theme=gr.themes.Soft(), title="Advanced AI Assistant") as demo:
-    gr.Markdown(
-        """
-        # 🤖 المساعد الذكي المتكامل (تحليل ملفات + دردشة)
-        قم برفع ملفات PDF, Word, أو ZIP (حتى لو كانت كبيرة) واسأل عنها مباشرة.
-        """
-    )
-    with gr.Row():
-        with gr.Column(scale=1):
-            gr.LoginButton(value="تسجيل دخول Hugging Face")
-            with gr.Accordion("⚙️ إعدادات النموذج", open=False):
-                system_msg = gr.Textbox(
-                    value="أنت مساعد ذكي ومحلل بيانات خبير. قم بالإجابة باللغة العربية بوضوح.",
-                    label="تعليمات النظام (System Prompt)",
-                    lines=3
-                )
-                max_tokens = gr.Slider(512, 8192, value=2048, step=64, label="طول الإجابة (Max Tokens)")
-                temperature = gr.Slider(0.1, 2.0, value=0.6, step=0.1, label="الإبداع (Temperature)")
-                # ... تكملة السطر الأخير الذي توقف عندك
-                top_p = gr.Slider(0.1, 1.0, value=0.9, step=0.05, label="Top-p")
-        with gr.Column(scale=4):
-            # إعداد واجهة الدردشة
-            gr.ChatInterface(
-                respond,
-                chatbot=gr.Chatbot(height=600, type="messages"), # تحديد الطول والنوع
-                type="messages",
-                multimodal=True,  # ضروري لظهور زر رفع الملفات
-                additional_inputs=[system_msg, max_tokens, temperature, top_p],
-                title="Kimi-K2 File Analysis Bot",
-                description="ارفع ملفاتك (ZIP, PDF, DOCX) وسأقوم بتحليلها والإجابة عن أسئلتك.",
-            )
 if __name__ == "__main__":
-    demo.queue().launch()

 import gradio as gr
+from openai import OpenAI # مكتبة OpenAI متوافقة مع Kimi
 import zipfile
 import os
+import fitz
+import docx
+# إعداد العميل ليتصل بسيرفرات Moonshot مباشرة
+# استبدل MOONSHOT_API_KEY بمفتاحك الخاص أو اجعل المستخدم يدخله
+def get_client(api_key):
+    return OpenAI(
+        api_key=api_key,
+        base_url="https://api.moonshot.cn/v1",
+    )
+# ... (دالة extract_text_from_file تبقى كما هي في الكود السابق)
+def respond(message, history, system_message, max_tokens, temperature, api_key):
+    if not api_key:
+        yield "⚠️ يرجى إدخال Moonshot API Key الخاص بك."
         return
+    client = get_client(api_key)
     user_text = message.get("text", "")
     files = message.get("files", [])
     extracted_knowledge = ""
     if files:
+        yield "⏳ جاري قراءة الملفات بعمق عبر سيرفرات Moonshot..."
         for file_obj in files:
             path = file_obj if isinstance(file_obj, str) else file_obj.name
             extracted_knowledge += extract_text_from_file(path)
+    full_prompt = f"{extracted_knowledge}\n\nسؤال المستخدم: {user_text}"
     messages = [{"role": "system", "content": system_message}]
+    for msg in history:
+        messages.append(msg)
     messages.append({"role": "user", "content": full_prompt})
     try:
+        completion = client.chat.completions.create(
+            model="moonshot-v1-128k", # أو 32k أو 8k حسب المتاح لك
+            messages=messages,
+            temperature=temperature,
             max_tokens=max_tokens,
             stream=True,
+        )
+        response_text = ""
+        for chunk in completion:
+            delta = chunk.choices[0].delta.content
+            if delta:
+                response_text += delta
+                yield response_text
     except Exception as e:
+        yield f"⚠️ خطأ من مزود Moonshot: {str(e)}"
+# واجهة المستخدم مع خانة لإدخال الـ API Key الخاص بـ Moonshot
+with gr.Blocks(theme=gr.themes.Soft()) as demo:
+    gr.Markdown("# 🚀 Kimi-K2 Ultra Memory Assistant")
+    with gr.Sidebar():
+        api_key_input = gr.Textbox(label="Moonshot API Key", type="password", placeholder="sk-...")
+        system_msg = gr.Textbox(value="أنت مساعد خبير في تحليل البيانات.", label="System Prompt")
+        max_t = gr.Slider(512, 128000, value=4096, label="Max Tokens")
+        temp = gr.Slider(0.1, 1.5, value=0.7, label="Temperature")
+    gr.ChatInterface(
+        respond,
+        additional_inputs=[system_msg, max_t, temp, api_key_input],
+        multimodal=True,
+        type="messages"
+    )
 if __name__ == "__main__":
+    demo.launch()