Spaces:

IAUCourseExp
/

Tajrobiat_Bot

Sleeping

App Files Files Community

IAUCourseExp commited on May 4, 2025

Commit

cb87184

verified ·

1 Parent(s): bd3c3a6

Upload 3 files

Browse files

Files changed (3) hide show

app.py +20 -64
my_logic.py +114 -0
requirements.txt +6 -1

app.py CHANGED Viewed

@@ -1,64 +1,20 @@
-import gradio as gr
-from huggingface_hub import InferenceClient
-"""
-For more information on `huggingface_hub` Inference API support, please check the docs: https://huggingface.co/docs/huggingface_hub/v0.22.2/en/guides/inference
-"""
-client = InferenceClient("HuggingFaceH4/zephyr-7b-beta")
-def respond(
-    message,
-    history: list[tuple[str, str]],
-    system_message,
-    max_tokens,
-    temperature,
-    top_p,
-):
-    messages = [{"role": "system", "content": system_message}]
-    for val in history:
-        if val[0]:
-            messages.append({"role": "user", "content": val[0]})
-        if val[1]:
-            messages.append({"role": "assistant", "content": val[1]})
-    messages.append({"role": "user", "content": message})
-    response = ""
-    for message in client.chat_completion(
-        messages,
-        max_tokens=max_tokens,
-        stream=True,
-        temperature=temperature,
-        top_p=top_p,
-    ):
-        token = message.choices[0].delta.content
-        response += token
-        yield response
-"""
-For information on how to customize the ChatInterface, peruse the gradio docs: https://www.gradio.app/docs/chatinterface
-"""
-demo = gr.ChatInterface(
-    respond,
-    additional_inputs=[
-        gr.Textbox(value="You are a friendly Chatbot.", label="System message"),
-        gr.Slider(minimum=1, maximum=2048, value=512, step=1, label="Max new tokens"),
-        gr.Slider(minimum=0.1, maximum=4.0, value=0.7, step=0.1, label="Temperature"),
-        gr.Slider(
-            minimum=0.1,
-            maximum=1.0,
-            value=0.95,
-            step=0.05,
-            label="Top-p (nucleus sampling)",
-        ),
-    ],
-)
-if __name__ == "__main__":
-    demo.launch()

+import gradio as gr
+import google.generativeai as genai
+from my_logic import answer_question
+import os
+genai.configure(api_key=os.getenv("GEMINI_API_KEY"))
+gemini_model = genai.GenerativeModel("models/gemini-2.0-pro-exp-02-05")
+def chatbot_interface(user_question):
+    return answer_question(user_question, gemini_model)
+demo = gr.Interface(
+    fn=chatbot_interface,
+    inputs=gr.Textbox(lines=2, placeholder="مثلاً: برای مدار منطقی استاد شایگان چطوره؟", label="❓ سوال شما"),
+    outputs=gr.Textbox(label="📘 پاسخ"),
+    title= "🤖 ربات مشاور تجربیات انتخاب واحد",
+    description="پاسخ بر اساس تجربیات واقعی دانشجویان از کانال @IAUCourseExp"
+)
+demo.launch()

my_logic.py ADDED Viewed

	@@ -0,0 +1,114 @@

+from collections import defaultdict
+from difflib import SequenceMatcher
+# NOTE: You must define search_reviews, filter_relevant, metadata, etc.
+def similar(a, b):
+    return SequenceMatcher(None, a, b).ratio()
+def keyword_match_reviews(query, metadata):
+    query = query.strip().replace("؟", "")
+    keywords = set(query.split())
+    results = []
+    for row in metadata:
+        prof = str(row["professor"])
+        course = str(row["course"])
+        for k in keywords:
+            if k in prof or k in course or similar(k, prof) > 0.7 or similar(k, course) > 0.7:
+                results.append(row)
+                break
+    return results
+def relevance_score(row, query):
+    score = 0
+    if row["professor"] in query:
+        score += 2
+    if row["course"] in query:
+        score += 2
+    if row["professor"].split()[0] in query:
+        score += 1
+    if row["course"].split()[0] in query:
+        score += 1
+    return score
+def build_strict_context(reviews, user_question):
+    prof_match_scores = defaultdict(int)
+    course_match_scores = defaultdict(int)
+    for r in reviews:
+        prof_sim = similar(user_question, r["professor"])
+        course_sim = similar(user_question, r["course"])
+        if prof_sim > 0.6:
+            prof_match_scores[r["professor"]] += prof_sim
+        if course_sim > 0.6:
+            course_match_scores[r["course"]] += course_sim
+    best_prof = max(prof_match_scores, key=prof_match_scores.get, default="")
+    best_course = max(course_match_scores, key=course_match_scores.get, default="")
+    if best_prof and best_course:
+        filtered = [r for r in reviews if similar(best_prof, r["professor"]) > 0.85 and similar(best_course, r["course"]) > 0.85]
+    elif best_course:
+        filtered = [r for r in reviews if similar(best_course, r["course"]) > 0.85]
+    elif best_prof:
+        filtered = [r for r in reviews if similar(best_prof, r["professor"]) > 0.85]
+    else:
+        filtered = reviews
+    result = f"👨‍🏫 استاد: {best_prof or '[نامشخص]'} — 📚 درس: {best_course or '[نامشخص]'}\\n💬 نظرات:\\n"
+    for i, r in enumerate(filtered, 1):
+        result += f"{i}. {r['comment'].strip()}\\n🔗 لینک: {r['link']}\\n\\n"
+    return result
+def truncate_reviews_to_fit(reviews, max_chars=127000):
+    total = 0
+    final = []
+    for r in reviews:
+        size = len(r["comment"])
+        if total + size > max_chars:
+            break
+        final.append(r)
+        total += size
+    return final
+def answer_question(user_question, model):
+    print(f"\\n🧠 Starting debug for question: {user_question}")
+    retrieved = search_reviews(user_question, top_k=100)
+    print(f"🔍 FAISS returned {len(retrieved)} raw rows")
+    retrieved = filter_relevant(retrieved, user_question)
+    print(f"✅ After filter_relevant(): {len(retrieved)} rows")
+    keyword_hits = keyword_match_reviews(user_question, metadata)
+    print(f"🔠 Keyword hits found: {len(keyword_hits)}")
+    existing_links = set(r["link"] for r in retrieved)
+    added = 0
+    for r in keyword_hits:
+        if r["link"] not in existing_links:
+            retrieved.append(r)
+            added += 1
+    print(f"➕ Added {added} unique fallback keyword rows")
+    print(f"📊 Total before truncation: {len(retrieved)}")
+    if not retrieved:
+        return "❌ هیچ تجربه‌ای در مورد سوال شما در داده‌های کانال یافت نشد."
+    retrieved.sort(key=lambda r: relevance_score(r, user_question), reverse=True)
+    retrieved = truncate_reviews_to_fit(retrieved)
+    print(f"✂️ After truncation: {len(retrieved)} rows")
+    context = build_strict_context(retrieved, user_question)
+    print("📝 Sample context sent to Gemini:\\n", context[:1000], "\\n...")
+    prompt = f\"\"\"شما یک دستیار هوشمند انتخاب واحد هستید که فقط و فقط بر اساس نظرات واقعی دانشجویان از کانال @IAUCourseExp پاسخ می‌دهید.
+❗ قوانین مهم:
+- فقط از داده‌های همین نظرات استفاده کن.
+- اگر هیچ نظری نیست، بگو: «هیچ تجربه‌ای دربارهٔ این مورد در کانال ثبت نشده است.»
+- سوالات ممکنه درباره یک استاد، درس، مقایسه، یا معرفی بهترین/بدترین‌ها باشه.
+- همه نظرات رو تحلیل کن. لینک هر کدوم رو هم بیار.
+- در پایان جمع‌بندی کن و بنویس:
+📊 این پاسخ بر اساس بررسی {len(retrieved)} نظر دانشجویی نوشته شده است.
+🔎 سوال دانشجو:
+{user_question}
+📄 نظرات دانشجویان:
+{context}
+📘 پاسخ نهایی:
+\"\"\"
+    response = model.generate_content(prompt)
+    return response.text

requirements.txt CHANGED Viewed

	@@ -1 +1,6 @@
1	- ~~huggingface_hub==0.25.2~~

+pandas
+numpy
+gradio
+google-generativeai
+faiss-cpu
+sentence-transformers