Spaces:

afouda
/

EduNativesChatbot

Runtime error

App Files Files Community

afouda commited on Sep 15, 2025

Commit

bc7377c

verified ·

1 Parent(s): e01009a

Update app.py

Browse files

Files changed (1) hide show

app.py +615 -460

app.py CHANGED Viewed

@@ -343,28 +343,27 @@
 # if __name__ == "__main__":
 #     demo.launch(debug=True)
-# app.py  -- Full EduNatives chatbot with RAG + Application + Team flows
 from __future__ import annotations
 import os
-import json
-import time
 import re
 import uuid
-import datetime
-from dataclasses import dataclass
 from typing import List, Dict, Any, Optional
-import markdown
 import gradio as gr
 from openai import OpenAI
-import fitz  # PyMuPDF
-import docx
 import weaviate
 from weaviate.classes.init import Auth
 from weaviate.classes.config import Configure, Property, DataType
 # -------------------- Configuration --------------------
 MODEL_NAME = os.getenv("MODEL_NAME", "openai/gpt-oss-120b")
@@ -375,77 +374,17 @@ WEAVIATE_URL = os.getenv("WEAVIATE_URL", "htorgbgpt4w63nvf1yeuw.c0.us-west3.gcp.
 WEAVIATE_API_KEY = os.getenv("WEAVIATE_API_KEY", "ZUd6clB5WmYzVGkxeU40cl96NTY5UkViUlVzY05Md3IzQ0JKelBZQmxGZHRPeGpCeGdxS1FUNnlYUkFFPV92MjAw")
 MEMORY_FILE = os.getenv("MEMORY_FILE", "chat_memory.json")
-LOG_FILE = os.getenv("LOG_FILE", "chat_analytics.json")
 # -------------------- Clients --------------------
-# LLM client
 llm_client = OpenAI(api_key=DEEPINFRA_API_KEY, base_url=BASE_URL)
-# Weaviate client
 weaviate_client = weaviate.connect_to_weaviate_cloud(
     cluster_url=WEAVIATE_URL,
     auth_credentials=Auth.api_key(WEAVIATE_API_KEY),
 )
-# -------------------- KB, Keys, prompts --------------------
-KB: Dict[str, Dict[str, str]] = {
-    "student_registration": {
-        "en": (
-            "**How to register / create an account (Student)**\n\n"
-            "1. Go to the EduNatives site and choose Sign Up.\n"
-            "2. Use your university email if possible and verify it.\n"
-            "3. Complete your profile (major, skills, interests).\n"
-            "4. Enable notifications for internships/scholarships."
-        ),
-        "ar": (
-            "**طريقة التسجيل وإنشاء حساب (طلاب)**\n\n"
-            "١. اذهب إلى موقع EduNatives واختر Sign Up.\n"
-            "٢. يفضل استخدام إيميل الجامعة وتأكيده.\n"
-            "٣. أكمل ملفك الشخصي (التخصص، المهارات، الاهتمامات).\n"
-            "٤. فعّل التنبيهات لفرص التدريب والمنح."
-        ),
-    },
-    "student_internships": {
-        "en": (
-            "**Finding internships & scholarships**\n\n"
-            "- Use the search filters: field, location, duration, paid/unpaid.\n"
-            "- Follow companies and set up alerts for new opportunities.\n"
-            "- Keep your profile and resume updated."
-        ),
-        "ar": (
-            "**كيفية العثور على تدريب أو منحة**\n\n"
-            "- استخدم فلاتر البحث: التخصص، المكان، المدة، مدفوع/غير مدفوع.\n"
-            "- تابع الشركات وفعّل التنبيهات للفرص الجديدة.\n"
-            "- حافظ على تحديث ملفك الشخصي وسيرتك الذاتية."
-        ),
-    },
-}
-KEYS = {
-    "student_registration": ["register", "sign up", "signup", "create account", "account", "تسجيل", "انشاء", "إنشاء", "حساب", "اعمل حساب", "سجل"],
-    "student_internships": ["intern", "internship", "training", "scholar", "scholarship", "grant", "opportunity", "تدريب", "تدريبي", "منحة", "منح", "فرصة", "فرص", "انترنشيب"],
-    "student_mentors": ["mentor", "advisor", "professor", "supervisor", "faculty", "connect", "منتور", "مشرف", "دكتور", "أستاذ", "استاذ", "التواصل", "اكلم"],
-    "university_publish": ["publish", "paper", "research", "preprint", "conference", "event", "seminar", "webinar", "نشر", "أبحاث", "ابحاث", "بحث", "مؤتمر", "فعالية", "فعاليات", "ندوة", "ورشة"],
-    "university_connect": ["students", "connect with students", "reach students", "collaborate", "طلاب", "تواصل مع الطلاب", "التواصل مع الطلاب", "تعاون"],
-    "company_post_jobs": ["job", "jobs", "post job", "hiring", "hire", "internships", "graduate", "وظيفة", "وظائف", "اعلان", "إعلان", "نشر وظيفة", "توظيف", "فرص تدريب", "خريجين"],
-    "company_find_talent": ["talent", "candidate", "recruit", "search", "find", "pipeline", "موهبة", "مواهب", "مرشحين", "تعيين", "تجنيد", "ابحث", "دور على"],
-    "project_query": ["project", "projects", "مشروع", "مشاريع", "هدف", "أهداف"],
-    "apply_job_opportunity": ["apply", "application", "تقديم", "طلب", "عايز اقدم", "اريد التقديم", "اريد اتقدم"],
-    "join_team": ["team", "join team", "فريق", "انضمام لفريق", "انضمام", "انضم"],
-}
-AUDIENCE_MAP = {
-    "student_registration": "student",
-    "student_internships": "student",
-    "student_mentors": "student",
-    "university_publish": "university",
-    "university_connect": "university",
-    "company_post_jobs": "company",
-    "company_find_talent": "company",
-    "project_query": "student",
-    "apply_job_opportunity": "student",
-    "join_team": "student",
-}
 SYSTEM_PROMPT_BASE = (
     "You are **EduNatives Assistant**, a helpful, friendly, and precise academic/career guide. "
@@ -464,12 +403,45 @@ SYSTEM_PROMPT_BASE = (
     "- Ensure that all generated prompts are phrased using positive reinforcement."
 )
-CONTEXT_INJECT_TEMPLATE = (
-    "Context to guide your answer (do not repeat verbatim):\n"
-    "- Audience: {audience}\n- Intent: {intent}\n- Extra hints: Keep it practical for this audience."
-)
-# -------------------- Utility helpers --------------------
 ARABIC_RANGE = (
     (0x0600, 0x06FF), (0x0750, 0x077F), (0x08A0, 0x08FF),
     (0xFB50, 0xFDFF), (0xFE70, 0xFEFF), (0x1EE00, 0x1EEFF)
@@ -483,63 +455,59 @@ def is_arabic(text: str) -> bool:
                 return True
     return False
 def format_chat_html(history: List[Dict[str, str]]) -> str:
     html = "<div class='chatbot'>"
-    for message in history:
-        role = message["role"]
-        content = message["content"]
         if role == "user":
             html += f"<div class='user-bubble'>{content}</div>"
-        elif role == "assistant":
             html_content = markdown.markdown(content, extensions=['tables'])
             html += f"<div class='bot-bubble'>{html_content}</div>"
     html += "</div>"
     return html
-# Simple keyword-based CV skills/experience extractor (improvable)
-_SKILL_REGEX = re.compile(r"\b(python|java|c\+\+|c#|javascript|nlp|machine learning|deep learning|data science|sql|aws|azure|docker|kubernetes|react|node\.js)\b", re.IGNORECASE)
-_EXP_REGEX = re.compile(r"(\d+)\s*(?:years|year|months|month)\s*(?:of)?\s*(?:experience|exp|worked)", re.IGNORECASE)
-def extract_skills_experience(text: str) -> Dict[str, List[str]]:
-    skills = list({m.group(0).lower() for m in _SKILL_REGEX.finditer(text)})
-    experiences = [m.group(0) for m in _EXP_REGEX.finditer(text)]
-    return {"skills": skills, "experience": experiences}
-# -------------------- Ensure auxiliary collections --------------------
-def ensure_aux_collections():
-    # Team
-    if not weaviate_client.collections.exists("Team"):
-        weaviate_client.collections.create(
-            name="Team",
-            properties=[
-                Property(name="teamId", data_type=DataType.TEXT),
-                Property(name="name", data_type=DataType.TEXT),
-                Property(name="projectId", data_type=DataType.TEXT),
-                Property(name="members", data_type=DataType.TEXT_ARRAY),
-                Property(name="createdAt", data_type=DataType.DATE),
-                Property(name="creatorId", data_type=DataType.TEXT),
-            ],
-            vectorizer_config=Configure.Vectorizer.none()
-        )
-    # Application
     if not weaviate_client.collections.exists("Application"):
         weaviate_client.collections.create(
             name="Application",
             properties=[
                 Property(name="applicationId", data_type=DataType.TEXT),
                 Property(name="jobId", data_type=DataType.TEXT),
-                Property(name="opportunityId", data_type=DataType.TEXT),
                 Property(name="applicantName", data_type=DataType.TEXT),
                 Property(name="applicantEmail", data_type=DataType.TEXT),
                 Property(name="coverLetter", data_type=DataType.TEXT),
                 Property(name="cvText", data_type=DataType.TEXT),
                 Property(name="createdAt", data_type=DataType.DATE),
             ],
             vectorizer_config=Configure.Vectorizer.none()
         )
-    # Memory
     if not weaviate_client.collections.exists("Memory"):
         weaviate_client.collections.create(
             name="Memory",
@@ -552,54 +520,80 @@ def ensure_aux_collections():
             vectorizer_config=Configure.Vectorizer.none()
         )
-ensure_aux_collections()
-# -------------------- Weaviate query helpers (RAG) --------------------
 def query_weaviate_collection(class_name: str, query_text: str, limit: int = 5) -> List[dict]:
-    """
-    Query using v4 weaviate client (hybrid search).
-    """
     try:
         collection = weaviate_client.collections.get(class_name)
-        # Hybrid search
-        res = collection.query.hybrid(query=query_text, limit=limit)
-        items = [o.properties for o in res.objects]
-        # --- fallback لو مفيش نتيجة
         if not items:
-            print(f"[Hybrid returned 0 → fallback filter on {class_name}]")
-            res2 = collection.query.fetch_objects(limit=limit)  # مجرد fallback بسيط
-            items = [o.properties for o in res2.objects]
         return items
     except Exception as e:
-        print(f"[Weaviate Query Error] class={class_name} error={e}")
         return []
 def build_rag_prompt(user_question: str, retrieved_items: List[dict], class_name: str) -> str:
-    intro = f"Use the following {len(retrieved_items)} records from {class_name} to answer the question succinctly.\n\n"
-    parts = []
     for i, item in enumerate(retrieved_items, 1):
         if class_name == "Job":
-            parts.append(f"{i}. Title: {item.get('title','N/A')} | Company: {item.get('companyName','N/A')} | Skills: {', '.join(item.get('skills',[]))} | Desc: {item.get('description','')[:200]}")
-        elif class_name == "Opportunities":
-            parts.append(f"{i}. Title: {item.get('title','N/A')} | Topic: {item.get('topic','N/A')} | Skills: {', '.join(item.get('skills',[]))} | Overview: {item.get('overview','')[:200]}")
-        elif class_name == "Project":
-            parts.append(f"{i}. Title: {item.get('title','N/A')} | ShortDesc: {item.get('shortDescription','')[:200]} | Fields: {', '.join(item.get('fields',[]))}")
         else:
-            parts.append(f"{i}. {str(item)[:200]}")
-    context_block = "\n".join(parts)
-    closing = f"\n\nQuestion: {user_question}\nAnswer concisely and, if applicable, include next steps (how to apply / contact / form a team)."
-    return intro + context_block + closing
 def rag_answer(user_question: str, class_name: str, top_k: int = 5) -> (str, List[dict]):
     retrieved = query_weaviate_collection(class_name, user_question, limit=top_k)
     if not retrieved:
         return "", []
     prompt = build_rag_prompt(user_question, retrieved, class_name)
     try:
         resp = llm_client.chat.completions.create(
             model=MODEL_NAME,
@@ -607,368 +601,529 @@ def rag_answer(user_question: str, class_name: str, top_k: int = 5) -> (str, Lis
                 {"role": "system", "content": SYSTEM_PROMPT_BASE},
                 {"role": "user", "content": prompt}
             ],
-            temperature=0.2,
-            max_tokens=512
         )
         answer = resp.choices[0].message.content or ""
     except Exception as e:
         print(f"[RAG LLM Error] {e}")
         answer = ""
     return answer, retrieved
-# -------------------- Save helpers --------------------
-def save_application_to_weaviate(application: dict) -> bool:
-    try:
-        collection = weaviate_client.collections.get("Application")
-        # ensure createdAt exists
-        application.setdefault("createdAt", datetime.datetime.utcnow().isoformat() + "Z")
-        # add stable uuid
-        uid = str(uuid.uuid5(uuid.NAMESPACE_DNS, application.get("applicationId", str(uuid.uuid4()))))
-        collection.data.insert(properties=application, uuid=uid)
-        return True
-    except Exception as e:
-        print(f"[Save Application Error] {e}")
-        return False
-def save_team_to_weaviate(team_props: dict) -> Optional[dict]:
     try:
-        collection = weaviate_client.collections.get("Team")
-        team_props.setdefault("createdAt", datetime.datetime.utcnow().isoformat() + "Z")
-        uid = str(uuid.uuid5(uuid.NAMESPACE_DNS, team_props.get("teamId", str(uuid.uuid4()))))
-        collection.data.insert(properties=team_props, uuid=uid)
-        return team_props
     except Exception as e:
-        print(f"[Save Team Error] {e}")
-        return None
-def save_memory_to_weaviate(session_id: str, text: str) -> bool:
     try:
-        collection = weaviate_client.collections.get("Memory")
-        mem = {"memoryId": str(uuid.uuid4()), "sessionId": session_id, "text": text, "createdAt": datetime.datetime.utcnow().isoformat() + "Z"}
-        collection.data.insert(properties=mem, uuid=str(uuid.uuid5(uuid.NAMESPACE_DNS, mem["memoryId"])))
-        return True
     except Exception as e:
-        print(f"[Save Memory Error] {e}")
-        return False
-# -------------------- File processing --------------------
-def process_uploaded_file(file_obj: Any) -> dict | None:
     """
-    file_obj is a Gradio file (file_obj.name present)
-    returns dict with 'content' and 'profile' keys or None
     """
-    if not file_obj:
-        return None
-    file_path = file_obj.name
-    filename = os.path.basename(file_path)
-    text_content = ""
-    try:
-        if filename.lower().endswith(".pdf"):
-            with fitz.open(file_path) as doc:
-                for page in doc:
-                    text_content += page.get_text()
-        elif filename.lower().endswith(".docx"):
-            doc = docx.Document(file_path)
-            for p in doc.paragraphs:
-                text_content += p.text + "\n"
-        elif filename.lower().endswith(".txt"):
-            with open(file_path, "r", encoding="utf-8") as f:
-                text_content = f.read()
-        else:
-            return {"error": f"Unsupported file type: {filename}"}
-        profile = extract_skills_experience(text_content)
-        return {"content": text_content.strip(), "profile": profile, "filename": filename}
-    except Exception as e:
-        print(f"[File process error] {e}")
-        return {"error": f"Error processing file {filename}: {e}"}
-# -------------------- Logging --------------------
-def log_interaction(user_message: str, route: 'Route', response: str):
-    entry = {"timestamp": time.time(), "user_message": user_message, "audience": route.audience, "intent": route.intent, "language": route.language, "response": response}
     try:
-        if os.path.exists(LOG_FILE):
-            with open(LOG_FILE, "r", encoding="utf-8") as f:
-                logs = json.load(f)
-        else:
-            logs = []
-        logs.append(entry)
-        with open(LOG_FILE, "w", encoding="utf-8") as f:
-            json.dump(logs, f, ensure_ascii=False, indent=2)
     except Exception as e:
-        print(f"[Log error] {e}")
-# -------------------- Intent routing --------------------
-@dataclass
-class Route:
-    audience: str
-    intent: str
-    language: str
-def route_intent(text: str, forced_audience: str | None = None) -> Route:
-    lang = "ar" if is_arabic(text) else "en"
-    text_l = text.lower() if text else ""
-    match_label = None
-    for label, kws in KEYS.items():
-        for kw in kws:
-            if kw in text_l:
-                match_label = label
-                break
-        if match_label:
-            break
-    audience = AUDIENCE_MAP.get(match_label, "general")
-    if forced_audience and forced_audience in {"student", "university", "company"}:
-        audience = forced_audience
-    return Route(audience=audience, intent=match_label or "general", language=lang)
-# -------------------- call_llm --------------------
-def call_llm(user_message: str, history: List[Dict[str, str]], route: Route, temperature: float = 0.6, max_tokens: int = 512) -> str:
-    messages = [
-        {"role": "system", "content": SYSTEM_PROMPT_BASE},
-        {"role": "system", "content": CONTEXT_INJECT_TEMPLATE.format(audience=route.audience, intent=route.intent)}
-    ]
-    # include last few turns
-    MAX_TURNS = 3
-    trimmed = history[-MAX_TURNS*2:] if history else []
-    messages.extend(trimmed)
-    messages.append({"role": "user", "content": user_message})
-    try:
-        resp = llm_client.chat.completions.create(
-            model=MODEL_NAME,
-            messages=messages,
-            temperature=temperature,
-            max_tokens=max_tokens
         )
-        return resp.choices[0].message.content or ""
-    except Exception as e:
-        print(f"[LLM Error] {e}")
-        return ""
-# -------------------- Main respond flow (Gradio) --------------------
-with gr.Blocks(css="""
-.chatbot {height: 500px; overflow: auto;}
-.user-bubble {background-color: #DCF8C6; padding: 10px; border-radius: 12px; max-width: 75%; float: right; clear: both; margin: 5px; word-wrap: break-word;}
-.bot-bubble {background-color: #F1F0F0; padding: 10px; border-radius: 12px; max-width: 75%; float: left; clear: both; margin: 5px; word-wrap: break-word;}
-.chatbox-container {display: flex; gap: 8px; margin-top: 10px;}
-.bot-bubble table {border-collapse: collapse; width: 100%;}
-.bot-bubble th, .bot-bubble td {border: 1px solid #ddd; padding: 8px; text-align: left;}
-.bot-bubble th {background-color: #e9e9e9;}
-""") as demo:
-    gr.Markdown("# 🤖 EduNatives Assistant")
-    with gr.Row():
-        audience_dd = gr.Dropdown(label="Audience", choices=["Auto", "Student", "University-Research", "Company"], value="Auto", interactive=True)
-        clear_btn = gr.Button("🧹 Clear Chat")
-    status = gr.Markdown("Status: Ready.")
-    chatbot_html = gr.HTML("<div class='chatbot' id='chatbot'></div>")
-    chat_history_state = gr.State([])
-    user_id_state = gr.State("default_user")
-    with gr.Row(elem_classes="chatbox-container"):
-        msg = gr.Textbox(placeholder="اكتب سؤالك هنا... / Ask your question here...", lines=2, scale=4, autofocus=True)
-        file_uploader = gr.File(label="Upload Document (.txt, .pdf, .docx)", file_types=[".txt", ".pdf", ".docx"], file_count="single", interactive=True)
-        with gr.Column(scale=1, min_width=120):
-            send_btn = gr.Button("➡️ Send", scale=1, variant="primary")
-    def respond(user_text: str, file_obj: Any, history: List[Dict[str, str]], audience_choice: str, user_id: str):
-        user_text = (user_text or "").strip()
-        # process file if exists
-        doc_info = process_uploaded_file(file_obj) if file_obj else None
-        if not user_text and not doc_info:
-            return "", format_chat_html(history), history, "Status: Please type a message or upload a file.", None, user_id
-        # build combined input
-        llm_input = user_text
-        if doc_info and "content" in doc_info:
-            llm_input = f"Based on the document content below, answer the question.\n\n---DOCUMENT---\n{doc_info['content'][:6000]}\n---END DOCUMENT---\n\nQuestion: {user_text}"
-        forced = {"Student": "student", "University-Research": "university", "Company": "company"}.get(audience_choice)
-        route = route_intent(llm_input, forced_audience=forced)
-        status_text = f"**Audience**: {route.audience} | **Intent**: {route.intent} | **Lang**: {route.language.upper()}"
-        # quick CV skills if provided
-        cv_profile = doc_info.get("profile") if doc_info and "profile" in doc_info else {"skills": [], "experience": []}
-        # Decide RAG target based on intent / keywords
-        text_lower = (user_text or "").lower()
-        wants_project = any(k in text_lower for k in KEYS.get("project_query", []))
-        wants_job = any(k in text_lower for k in KEYS.get("company_post_jobs", [])) or any(k in text_lower for k in KEYS.get("apply_job_opportunity", []))
-        wants_opp = any(k in text_lower for k in KEYS.get("student_internships", []))
-        final_answer = ""
-        retrieved = []
         try:
-            if wants_project or route.intent == "project_query":
-                final_answer, retrieved = rag_answer(user_text or (doc_info or {}).get("content",""), "Project", top_k=5)
-                if not final_answer:
-                    final_answer = KB.get("student_internships", {}).get(route.language, "") if route.intent == "student_internships" else ""
-            elif wants_job or route.intent == "apply_job_opportunity" or route.intent == "company_post_jobs":
-                # try jobs first
-                final_answer, retrieved = rag_answer(user_text or (doc_info or {}).get("content",""), "Job", top_k=5)
-                if not final_answer:
-                    # fallback to ops
-                    final_answer, retrieved = rag_answer(user_text or (doc_info or {}).get("content",""), "Opportunities", top_k=5)
-            elif wants_opp or route.intent == "student_internships":
-                final_answer, retrieved = rag_answer(user_text or (doc_info or {}).get("content",""), "Opportunities", top_k=5)
-            else:
-                # default LLM response with context
-                final_answer = call_llm(llm_input, history, route) or KB.get("student_registration", {}).get(route.language, "Sorry, I don't have info.")
         except Exception as e:
-            print(f"[Respond Error] {e}")
-            final_answer = call_llm(llm_input, history, route) or KB.get("student_registration", {}).get(route.language, "")
-        # --- Application flow: if user indicated they want to apply (keywords) ---
-        wants_apply = any(kw in text_lower for kw in KEYS.get("apply_job_opportunity", []))
-        app_summary = ""
-        generated_cover = ""
-        if wants_apply:
-            target = retrieved[0] if retrieved else None
-            cover_text = ""
-            if target:
-                # build cover letter prompt using target and CV text if present
-                cover_prompt = f"Write a concise 3-paragraph cover letter applying for this role:\nRole details: {json.dumps(target, ensure_ascii=False)[:1500]}\n"
-                if doc_info and "content" in doc_info:
-                    cover_prompt += f"\nApplicant CV summary: {doc_info['content'][:2000]}\n"
-                cover_prompt += "\nWrite the letter in the same language as the user."
-                try:
-                    resp = llm_client.chat.completions.create(
-                        model=MODEL_NAME,
-                        messages=[{"role":"system","content":SYSTEM_PROMPT_BASE},{"role":"user","content":cover_prompt}],
-                        temperature=0.3,
-                        max_tokens=512
-                    )
-                    cover_text = resp.choices[0].message.content or ""
-                except Exception as e:
-                    print(f"[Cover generation error] {e}")
-                    cover_text = "I can help craft a cover letter, but an error occurred while generating it."
-                application = {
-                    "applicationId": str(uuid.uuid4()),
-                    "jobId": target.get("id") or target.get("jobId"),
-                    "opportunityId": target.get("id") or target.get("opportunityId"),
-                    "applicantName": "Unknown",
-                    "applicantEmail": "Unknown",
-                    "coverLetter": cover_text,
-                    "cvText": doc_info.get("content","")[:4000] if doc_info else "",
-                    "createdAt": datetime.datetime.now().isoformat()
-                }
-                saved = save_application_to_weaviate(application)
-                app_summary = "✅ Application prepared and saved." if saved else "⚠️ Application could not be saved."
-                generated_cover = cover_text
-            else:
-                app_summary = "لم أجد وظيفة/فرصة مناسبة تلقائياً من النتائج. أرسل عنوان الوظيفة أو اختر من النتيجة."
-        # --- Team creation flow (join_team) ---
-        team_created_msg = ""
-        wants_team = any(k in text_lower for k in KEYS.get("join_team", []))
-        if wants_team and (wants_project or route.intent == "join_team"):
-            # attempt to suggest members using cv skills or create empty team entry
-            suggested_members = []
-            if cv_profile and cv_profile.get("skills"):
-                # use skills to search opportunities maybe get studentName fields
-                matches = query_weaviate_collection("Opportunities", " ".join(cv_profile.get("skills", [])), limit=5)
-                for m in matches:
-                    name = m.get("studentName") or m.get("student") or m.get("name")
-                    if name:
-                        suggested_members.append(name)
-            if not suggested_members:
-                team_props = {
-                    "teamId": str(uuid.uuid4()),
-                    "name": f"Team for project - {uuid.uuid4().hex[:6]}",
-                    "projectId": retrieved[0].get("globalId") if retrieved and retrieved[0].get("globalId") else None,
-                    "members": [],
-                    "createdAt": datetime.datetime.utcnow().isoformat()+"Z",
-                    "creatorId": user_id
-                }
-                saved_team = save_team_to_weaviate(team_props)
-                if saved_team:
-                    team_created_msg = f"✅ Team created with id {team_props['teamId']}. يمكنك إضافة أعضاء لاحقًا."
-                else:
-                    team_created_msg = "⚠️ لم أتمكن من إنشاء الفريق الآن."
             else:
-                team_props = {
-                    "teamId": str(uuid.uuid4()),
-                    "name": f"Team for project - {uuid.uuid4().hex[:6]}",
-                    "projectId": retrieved[0].get("globalId") if retrieved and retrieved[0].get("globalId") else None,
-                    "members": suggested_members,
-                    "createdAt": datetime.datetime.utcnow().isoformat()+"Z",
-                    "creatorId": user_id
-                }
-                saved_team = save_team_to_weaviate(team_props)
-                if saved_team:
-                    team_created_msg = f"✅ Team created with members: {', '.join(suggested_members)}"
-                else:
-                    team_created_msg = "⚠️ لم أتمكن من إنشاء الفريق الآن."
-        # Save a short memory entry
-        try:
-            sess = str(uuid.uuid5(uuid.NAMESPACE_DNS, (user_id or "anon") + (user_text or "")[:50]))
-            mem_text = f"User: {user_text[:300]} | Action: RAG on { 'Project' if wants_project else 'Job' if wants_job else 'Opportunities' if wants_opp else 'LLM' }"
-            save_memory_to_weaviate(sess, mem_text)
-        except Exception as e:
-            print(f"[Memory Save Error] {e}")
-        # Prepare final message (answer + top results + app/team status)
-        message_parts = []
-        if final_answer:
-            message_parts.append(final_answer)
-        if retrieved:
-            list_lines = []
-            for item in retrieved[:5]:
-                title = item.get("title") or item.get("jobTitle") or item.get("globalId") or "No Title"
-                meta = item.get("companyName") or item.get("topic") or item.get("shortDescription","")
-                list_lines.append(f"- **{title}** | {meta}")
-            if list_lines:
-                message_parts.append("\n\n**Top results:**\n" + "\n".join(list_lines))
-        if wants_apply:
-            message_parts.append("\n\n**Application status:** " + app_summary)
-            if generated_cover:
-                message_parts.append("\n\n**Generated Cover Letter:**\n" + generated_cover)
-        if team_created_msg:
-            message_parts.append("\n\n" + team_created_msg)
-        final_message_to_user = "\n\n".join([p for p in message_parts if p])
-        # Update history
-        user_message_for_history = user_text
-        if doc_info and doc_info.get("filename"):
-            user_message_for_history += f"\n\n*📎 [File Attached: {doc_info.get('filename')}] *"
-        history.append({"role": "user", "content": user_message_for_history})
-        history.append({"role": "assistant", "content": final_message_to_user or "عذراً، لم أجد إجابة مناسبة الآن."})
-        # log interaction
-        try:
-            log_interaction(user_text, route, final_message_to_user)
-        except Exception:
-            pass
-        # Return values: clear input field, updated html, updated history, status, clear file uploader, keep user_id
-        return "", format_chat_html(history), history, status_text, None, user_id
-    def clear_chat():
-        return "", [], "Status: Ready.", None, "default_user"
-    # Bind events
     send_btn.click(
-        respond,
-        inputs=[msg, file_uploader, chat_history_state, audience_dd, user_id_state],
-        outputs=[msg, chatbot_html, chat_history_state, status, file_uploader, user_id_state],
         queue=True
     )
-    msg.submit(
-        respond,
-        inputs=[msg, file_uploader, chat_history_state, audience_dd, user_id_state],
-        outputs=[msg, chatbot_html, chat_history_state, status, file_uploader, user_id_state],
         queue=True
     )
     clear_btn.click(
-        clear_chat,
-        outputs=[msg, chatbot_html, chat_history_state, status, file_uploader, user_id_state],
         queue=False
     )
 if __name__ == "__main__":
     demo.launch(debug=True)

 # if __name__ == "__main__":
 #     demo.launch(debug=True)
+اقراء الكود التاني
 from __future__ import annotations
 import os
 import re
 import uuid
+import json
+import time
+import fitz  # PyMuPDF
+import docx
+import markdown
+from datetime import datetime, timezone
 from typing import List, Dict, Any, Optional
+from dataclasses import dataclass
 import gradio as gr
 from openai import OpenAI
 import weaviate
 from weaviate.classes.init import Auth
 from weaviate.classes.config import Configure, Property, DataType
+from weaviate.classes.query import Filter
 # -------------------- Configuration --------------------
 MODEL_NAME = os.getenv("MODEL_NAME", "openai/gpt-oss-120b")
 WEAVIATE_API_KEY = os.getenv("WEAVIATE_API_KEY", "ZUd6clB5WmYzVGkxeU40cl96NTY5UkViUlVzY05Md3IzQ0JKelBZQmxGZHRPeGpCeGdxS1FUNnlYUkFFPV92MjAw")
 MEMORY_FILE = os.getenv("MEMORY_FILE", "chat_memory.json")
+LOG_FILE = os.getenv("LOG_FILE", "interaction_logs.json")
 # -------------------- Clients --------------------
 llm_client = OpenAI(api_key=DEEPINFRA_API_KEY, base_url=BASE_URL)
 weaviate_client = weaviate.connect_to_weaviate_cloud(
     cluster_url=WEAVIATE_URL,
     auth_credentials=Auth.api_key(WEAVIATE_API_KEY),
 )
+# -------------------- Helpers --------------------
 SYSTEM_PROMPT_BASE = (
     "You are **EduNatives Assistant**, a helpful, friendly, and precise academic/career guide. "
     "- Ensure that all generated prompts are phrased using positive reinforcement."
 )
+def get_rfc3339_time() -> str:
+    """Return current UTC time in RFC3339 format"""
+    return datetime.now(UTC).isoformat().replace('+00:00', 'Z')
+# --- CV Skills Extraction (Regex baseline, can replace with NLP model later) ---
+_SKILL_REGEX = re.compile(r"\b(Natural Language Processing|Building Information Modeling|Search Engine Optimization|Search Engine Marketing|Aerospace Engineering & Management|Computational Fluid Dynamics|Kotlin Multiplatform|Google Cloud Platform|Social Media Marketing|Aerospace Engineering|Microsoft SQL Server|Amazon Web Services|Finite Element Analysis|Technology-based Management|Autodesk Inventor|Emotional Intelligence|Aerospace Engineering & Operations Management|Content Marketing|Presentation Skills|Interpersonal Skills|Critical Thinking|Financial Modeling|Decision Making|Process Improvement|Time Management|Lean Manufacturing|Project Management|Microsoft Excel|Data Visualization|Computer Vision|Machine Learning|Deep Learning|Attention to Detail|Six Sigma|Risk Analysis|Data Analysis|Data Science|Communication|Collaboration|Teamwork|Leadership|Management|Adaptability|Creativity|Innovation|Negotiation|Android|Angular|Ansible|Apache|ArcGIS|Arduino|Asana|ASP\.NET|AutoCAD|Azure|Bash|BIM|Business Analysis|C\+\+|C#|CAM|Cassandra|CATIA|CentOS|Chef|CI/CD|Civil 3D|Content Marketing|CRM|CSS|Data Mining|Django|Docker|Elasticsearch|Email Marketing|ERP|ETABS|ETL|Express\.js|Facebook Ads|Firebase|Flask|Flutter|FPGA|Fusion 360|GCP|Git|GitHub|GitLab|Go|Google Ads|Google Analytics|GraphQL|Hadoop|HTML|HubSpot|iOS|Java|JavaScript|Jenkins|Jira|Jupyter Notebook|Kanban|Keras|Kotlin|Kubernetes|LabVIEW|Laravel|LESS|Linux|Lua|macOS|Marketo|MATLAB|Matplotlib|MongoDB|Multisim|MySQL|Nginx|NLP|Node\.js|NoSQL|Nuxt\.js|NumPy|Next\.js|Objective-C|Oracle Database|Oracle|OrCAD|Pandas|Perl|PHP|PLC|Plotly|PostgreSQL|Power BI|PowerShell|Problem Solving|Puppet|PSpice|Python|PyTorch|Raspberry Pi|React Native|React|Red Hat|Redis|Revit|Ruby on Rails|Ruby|Rust|Salesforce|SAP2000|SAP|Sass|SCADA|Scala|Scikit-learn|Scrum|Seaborn|SEM|SEO|Simulink|SketchUp|Slack|SolidWorks|Spring Boot|SQL|SQLAlchemy|SwiftUI|Swift|Tableau|Terraform|TensorFlow|Trello|TypeScript|Ubuntu|Verilog|VHDL|Vue\.js|Waterfall|Windows|WordPress|Xamarin|Analytical Skills)\b", re.IGNORECASE)
+def extract_skills_from_text(cv_text: str) -> List[str]:
+    skills = list({m.group(0).lower() for m in _SKILL_REGEX.finditer(cv_text)})
+    return [s.capitalize() for s in skills]
+# --- Process uploaded file (PDF, DOCX, TXT) ---
+def process_uploaded_file(file_obj: Any) -> dict | None:
+    if not file_obj:
+        return None
+    file_path = file_obj.name
+    filename = os.path.basename(file_path)
+    text_content = ""
+    try:
+        if filename.lower().endswith(".pdf"):
+            with fitz.open(file_path) as doc:
+                for page in doc:
+                    text_content += page.get_text()
+        elif filename.lower().endswith(".docx"):
+            docp = docx.Document(file_path)
+            for p in docp.paragraphs:
+                text_content += p.text + "\n"
+        elif filename.lower().endswith(".txt"):
+            with open(file_path, "r", encoding="utf-8") as f:
+                text_content = f.read()
+        else:
+            return {"error": f"Unsupported file type: {filename}"}
+        skills = extract_skills_from_text(text_content)
+        return {"content": text_content.strip(), "skills": skills, "filename": filename}
+    except Exception as e:
+        return {"error": f"Error processing file {filename}: {e}"}
 ARABIC_RANGE = (
     (0x0600, 0x06FF), (0x0750, 0x077F), (0x08A0, 0x08FF),
     (0xFB50, 0xFDFF), (0xFE70, 0xFEFF), (0x1EE00, 0x1EEFF)
                 return True
     return False
+# --- Chat history HTML formatter (for Gradio) ---
 def format_chat_html(history: List[Dict[str, str]]) -> str:
     html = "<div class='chatbot'>"
+    for msg in history:
+        role = msg["role"]
+        content = msg["content"]
         if role == "user":
             html += f"<div class='user-bubble'>{content}</div>"
+        else:
             html_content = markdown.markdown(content, extensions=['tables'])
             html += f"<div class='bot-bubble'>{html_content}</div>"
     html += "</div>"
     return html
+# ================================
+# Part 2 — Weaviate Collections + Query + RAG
+# ================================
+# -------------------- Ensure collections --------------------
+def ensure_collections():
+    # Application collection
     if not weaviate_client.collections.exists("Application"):
         weaviate_client.collections.create(
             name="Application",
             properties=[
                 Property(name="applicationId", data_type=DataType.TEXT),
                 Property(name="jobId", data_type=DataType.TEXT),
                 Property(name="applicantName", data_type=DataType.TEXT),
                 Property(name="applicantEmail", data_type=DataType.TEXT),
                 Property(name="coverLetter", data_type=DataType.TEXT),
                 Property(name="cvText", data_type=DataType.TEXT),
+                Property(name="skills", data_type=DataType.TEXT_ARRAY),
                 Property(name="createdAt", data_type=DataType.DATE),
             ],
             vectorizer_config=Configure.Vectorizer.none()
         )
+    # Team collection
+    if not weaviate_client.collections.exists("Team"):
+        weaviate_client.collections.create(
+            name="Team",
+            properties=[
+                Property(name="teamId", data_type=DataType.TEXT),
+                Property(name="name", data_type=DataType.TEXT),
+                Property(name="projectId", data_type=DataType.TEXT),
+                Property(name="members", data_type=DataType.TEXT_ARRAY),
+                Property(name="skills", data_type=DataType.TEXT_ARRAY),
+                Property(name="createdAt", data_type=DataType.DATE),
+                Property(name="creatorId", data_type=DataType.TEXT),
+            ],
+            vectorizer_config=Configure.Vectorizer.none()
+        )
+    # Memory collection
     if not weaviate_client.collections.exists("Memory"):
         weaviate_client.collections.create(
             name="Memory",
             vectorizer_config=Configure.Vectorizer.none()
         )
+ensure_collections()
+# -------------------- Query Weaviate --------------------
 def query_weaviate_collection(class_name: str, query_text: str, limit: int = 5) -> List[dict]:
     try:
         collection = weaviate_client.collections.get(class_name)
+        # BM25 keyword search
+        response = collection.query.bm25(query=query_text, limit=limit)
+        items = [obj.properties for obj in response.objects]
+        # fallback filter if nothing found
         if not items:
+            filters = Filter.any_of([
+                Filter.by_property("title").like(f"*{query_text}*"),
+                Filter.by_property("skills").like(f"*{query_text}*")
+            ])
+            response_fallback = collection.query.fetch_objects(limit=limit, filters=filters)
+            items = [obj.properties for obj in response_fallback.objects]
         return items
     except Exception as e:
+        print(f"[Weaviate Query Error] {e}")
         return []
+# -------------------- RAG Prompt Builder --------------------
 def build_rag_prompt(user_question: str, retrieved_items: List[dict], class_name: str) -> str:
+    context_parts = []
     for i, item in enumerate(retrieved_items, 1):
         if class_name == "Job":
+            details = {
+                "Title": item.get("title"),
+                "Company": item.get("companyName"),
+                "Job Type": item.get("jobType"),
+                "Employment": ", ".join(item.get("employmentType", [])),
+                "Location": item.get("workplaceType"),
+                "Description": item.get("description"),
+                "Skills": item.get("skills", []),
+                "Requirements": item.get("requirements"),
+                "Salary": str(item.get("salaryDetails", {})),
+            }
         else:
+            details = {k: str(v) for k, v in item.items()}
+        item_str = f"--- Record {i} ---\n{json.dumps(details, indent=2, ensure_ascii=False)}"
+        context_parts.append(item_str)
+    context_block = "\n\n".join(context_parts)
+    return f"""
+    User Question: "{user_question}"
+    You are an expert AI assistant and a skilled data analyst. Your primary mission is to take structured data (in JSON format), analyze it completely, and present all its information to the user in a clear, comprehensive, and conversational summary.
+    **Primary Directive:** Your ONLY source of information for this task is the structured JSON data provided below under "Retrieved Data". If the data section is empty, you must state that no results were found that match the search and stop. Do not use your general knowledge under any circumstances.
+    **Your Core Instructions:**
+    1.  **Analyze the Entire Object:** When you receive a JSON object, your first step is to read and understand every single key and value, including nested objects and arrays. Do not ignore any piece of information.
+    2.  **Group Related Information:** Organize your output logically. For example, group company details together, role requirements together, dates and deadlines together, etc. Use clear Markdown headings (`###`) for these logical groups to improve readability.
+    3.  **Convert Data into Natural Language:** Do not just list the data. Convert it into readable, engaging sentences. For example, instead of `workplaceType: "HYBRID"`, say "This is a hybrid role, which offers the flexibility of working both remotely and from the office."
+    4.  **Handle All Data Types Intelligently:**
+        * For **arrays** (like `skills` or `categories`), list them as clear bullet points or integrate them into a sentence.
+        * For **nested objects** (like `salaryDetails` or `careerLevel`), explain the contents of the object clearly.
+        * For **booleans** (true/false), explain their meaning in context (e.g., `published: true` should be "This position is currently published and accepting applications.").
+    5.  **Add a Concluding Call to Action:** After presenting all the details, conclude with a helpful "Next Steps" or "How to Apply" section. For a job, this should be a practical guide. For a project, it might be "How to Get Involved."
+    """
+# -------------------- RAG Answer --------------------
 def rag_answer(user_question: str, class_name: str, top_k: int = 5) -> (str, List[dict]):
     retrieved = query_weaviate_collection(class_name, user_question, limit=top_k)
     if not retrieved:
         return "", []
     prompt = build_rag_prompt(user_question, retrieved, class_name)
     try:
         resp = llm_client.chat.completions.create(
             model=MODEL_NAME,
                 {"role": "system", "content": SYSTEM_PROMPT_BASE},
                 {"role": "user", "content": prompt}
             ],
+            temperature=0.3,
+            max_tokens=4096
         )
         answer = resp.choices[0].message.content or ""
     except Exception as e:
         print(f"[RAG LLM Error] {e}")
         answer = ""
     return answer, retrieved
+# ================================
+# ================================
+# Part 3 — Conversation State Machine + Embedding Recommendations
+# ================================
+import numpy as np  # used for cosine similarity in recommendations
+# -------------------- Embedding helpers --------------------
+def compute_embedding(text: str) -> List[float]:
+    """
+    Compute embedding using the OpenAI-compatible client (DeepInfra).
+    Returns list[float] or empty list on failure.
+    """
     try:
+        resp = llm_client.embeddings.create(
+            model="Qwen/Qwen3-Embedding-8B",
+            input=text,
+            encoding_format="float"
+        )
+        # resp may be a dict-like object; handle safe access
+        if isinstance(resp, dict):
+            data = resp.get("data", [])
+            if data and isinstance(data[0], dict):
+                return data[0].get("embedding", [])
+        # some clients return objects with attributes
+        if hasattr(resp, "data") and resp.data:
+            return resp.data[0].embedding
     except Exception as e:
+        print("[compute_embedding] error:", e)
+    return []
+def cosine_similarity(a: List[float], b: List[float]) -> float:
     try:
+        va = np.array(a, dtype=float)
+        vb = np.array(b, dtype=float)
+        if va.size == 0 or vb.size == 0:
+            return 0.0
+        denom = (np.linalg.norm(va) * np.linalg.norm(vb))
+        if denom == 0:
+            return 0.0
+        return float(np.dot(va, vb) / denom)
     except Exception as e:
+        print("[cosine_similarity] error:", e)
+        return 0.0
+# -------------------- Recommendations by embedding --------------------
+def recommend_jobs_by_embedding(cv_text: str, top_k: int = 5, jobs_fetch_limit: int = 200) -> str:
     """
+    1) Extract a short user representation (skills or first 200 chars)
+    2) Compute user embedding
+    3) Fetch Job objects from Weaviate (BM25 or fetch_objects)
+    4) For each job build a short text (skills + description), compute embedding, score by cosine
+    5) Return formatted list with full job details (title, company, skills, salary, description, score)
+    Note: This routine computes embeddings on-the-fly for jobs; for large scale you should precompute and store job embeddings.
     """
+    # prepare user text
+    skills = extract_skills_from_text(cv_text or "")
+    user_text = " ".join(skills) if skills else (cv_text or "")[:500]
+    user_emb = compute_embedding(user_text)
+    if not user_emb:
+        return "⚠️ Unable to compute embedding for your CV. Try again or check API keys."
+    # fetch jobs from weaviate
     try:
+        jobs_col = weaviate_client.collections.get("Job")
+        fetched = jobs_col.query.fetch_objects(limit=jobs_fetch_limit)
+        if not fetched.objects:
+            return "⚠️ No jobs found in the database."
     except Exception as e:
+        print("[recommend_jobs_by_embedding] Weaviate fetch error:", e)
+        return "⚠️ Could not fetch jobs from the database."
+    scored_jobs = []
+    for obj in fetched.objects:
+        props = obj.properties
+        # build job text for embedding: skills + title + description (truncate to reasonable length)
+        job_text_parts = []
+        if props.get("skills"):
+            job_text_parts.append(" ".join(props.get("skills")))
+        if props.get("title"):
+            job_text_parts.append(props.get("title"))
+        if props.get("description"):
+            job_text_parts.append((props.get("description") or "")[:2000])
+        job_text = " ".join(job_text_parts).strip() or (props.get("title") or "")
+        job_emb = compute_embedding(job_text)
+        if not job_emb:
+            # skip if embedding failed
+            continue
+        score = cosine_similarity(user_emb, job_emb)
+        scored_jobs.append((score, props))
+    if not scored_jobs:
+        return "⚠️ No jobs could be embedded / compared."
+    # sort and pick top_k
+    scored_jobs.sort(key=lambda x: x[0], reverse=True)
+    top = scored_jobs[:top_k]
+    # format rich output with full details
+    lines = []
+    for score, props in top:
+        title = props.get("title", "No title")
+        company = props.get("companyName", "Unknown company")
+        job_id = props.get("jobId", "")
+        salary = props.get("salary") or props.get("salaryDetails") or "Not specified"
+        skills_list = props.get("skills") or []
+        description = (props.get("description") or "").strip()
+        # include a truncated description and the full skills list
+        lines.append(
+            f"**{title}** at *{company}*  \n"
+            f"- Job ID: `{job_id}`  \n"
+            f"- Score: {score:.3f}  \n"
+            f"- Salary: {salary}  \n"
+            f"- Skills: {skills_list}  \n"
+            f"- Description: {description[:600]}{'...' if len(description)>600 else ''}  \n"
+            f"---"
         )
+    return "\n\n".join(lines)
+# -------------------- Conversation Session helpers --------------------
+def initial_session() -> dict:
+    """
+    structure:
+    {
+      "state": "idle" | "apply_name" | "apply_email" | "apply_cover" | "apply_wait_cv" | "apply_jobtitle" | "apply_confirm" |
+               "team_action" | "team_create_name" | "team_create_owner" | "team_create_skills" | "team_create_course" | "team_create_idea" |
+               "team_join_name" | "team_join_member" | "team_join_skills" |
+               "recommend_wait_cv"
+      "data": { ... collected fields ... }
+    }
+    """
+    return {"state": "idle", "data": {}}
+def handle_uploaded_cv_for_session(session: dict, uploaded_file: Any) -> (str, dict):
+    """
+    Called when user uploads a CV while in a certain flow.
+    Returns (bot_message, updated_session)
+    """
+    if not uploaded_file:
+        return "⚠️ No file received.", session
+    doc_info = process_uploaded_file(uploaded_file)
+    if not doc_info or "error" in (doc_info or {}):
+        return f"⚠️ Error processing uploaded CV: {doc_info.get('error') if doc_info else 'unknown error'}", session
+    # store processed text & skills in session
+    session["data"]["cvText"] = doc_info.get("content", "")
+    session["data"]["cvSkills"] = doc_info.get("profile", {}).get("skills", [])
+    # If session state expects next step, return appropriate prompt
+    st = session.get("state")
+    if st == "apply_wait_cv":
+        session["state"] = "apply_jobtitle"
+        detected = session["data"]["cvSkills"]
+        return f"CV received. Detected skills: {detected}. Which job title do you want to apply for? (type job title or 'any')", session
+    if st == "recommend_wait_cv":
+        # compute recommendations and finish the flow
+        rec_text = recommend_jobs_by_embedding(session["data"]["cvText"], top_k=5)
+        session = initial_session()
+        return f"Here are recommended jobs based on your CV:\n\n{rec_text}", session
+    # default
+    return "CV uploaded and processed. What would you like to do next?", session
+# -------------------- Main message handler (state machine) --------------------
+def handle_user_message(session: dict, user_text: str, uploaded_file: Any = None) -> (str, dict, bool):
+    """
+    Main conversation handler.
+    Returns (bot_reply, new_session, show_file_uploader).
+    """
+    session = session or initial_session()
+    st = session.get("state", "idle")
+    text = (user_text or "").strip()
+    # quick reset
+    if text.lower() in ("cancel", "exit", "quit", "restart", "reset"):
+        return "Conversation reset. How can I help you now?", initial_session(), False
+    # file upload
+    if uploaded_file:
+        bot_msg, new_session = handle_uploaded_cv_for_session(session, uploaded_file)
+        return bot_msg, new_session, False
+    # ========== IDLE STATE ==========
+    if st == "idle":
+        low = text.lower()
+        # 1) greetings
+        if low in ("hi", "hello", "hey", "مرحبا", "ازيك", "السلام عليكم"):
+            return "👋 Hello! How can I support you today? You can ask about jobs, teams, or recommendations.", session, False
+        if low in ["who are you?", "who are you", "انت مين", "من انت"]:
+            return ("👋 I am EduNatives Assistant — your friendly academic and career guide. ""I help students, universities, and companies connect through opportunities, projects, and mentoring.",
+                    session,
+                    False
+                   )
+        route = route_intent(text)
+        kb_ans = kb_fallback(route)
+        if kb_ans:
+            return kb_ans, session, False
+        try:
+            rag_ans, _ = rag_answer(text, "Job", top_k=5)
+            if rag_ans:
+                return rag_ans, session, False
+        except Exception as e:
+            print("[handle_user_message] rag error:", e)
+        try:
+            resp = llm_client.chat.completions.create(
+                model=MODEL_NAME,
+                messages=[
+                    {"role": "system", "content": SYSTEM_PROMPT_BASE},
+                    {"role": "user", "content": text}
+                    ],
+                temperature=0.3,
+                max_tokens=4096
+                )
+        except Exception as e:
+            print("[handle_user_message] free LLM error:", e)
+            return "⚠️ Sorry, I couldn't process that. Try again later.", session, False
+        # 2) flows
+        if any(k in low for k in ["apply", "i want to apply", "i'd like to apply", "أريد التقديم", "عايز اقدم", "اريد التقديم"]):
+            session["state"] = "apply_name"
+            session["data"] = {}
+            return "Okay — let's start your application. What's your full name?", session, False
+        if any(k in low for k in ["team", "create team", "join team", "create", "join", "انضم", "انشاء فريق"]):
+            session["state"] = "team_action"
+            session["data"] = {}
+            return "Do you want to create a team or join an existing team? (reply 'create' or 'join')", session, False
+        if any(k in low for k in ["recommend", "recommendation", "jobs for me", "رشح", "ترشيح", "recommend me jobs"]):
+            session["state"] = "recommend_wait_cv"
+            session["data"] = {}
+            return "Please upload your CV to get job recommendations (use the Upload button).", session, True
+        # 3) Knowledge Base fallback
+        route = route_intent(text)
+        kb_answer = kb_fallback(route)
+        if kb_answer:
+            return kb_answer, session, False
+        # 4) RAG (jobs search)
         try:
+            rag_ans, _ = rag_answer(text, "Job", top_k=5)
+            if rag_ans:
+                return rag_ans, session, False
         except Exception as e:
+            print("[handle_user_message] rag error:", e)
+        # 5) ultimate fallback
+        return "Sorry — I didn't understand that. You can say 'apply', 'create team', 'join team' or 'recommend'.", session, False
+    # ========== APPLY FLOW ==========
+    if st == "apply_name":
+        session["data"]["applicantName"] = text or "Applicant"
+        session["state"] = "apply_email"
+        return "Thanks. What's your email address?", session, False
+    if st == "apply_email":
+        m = re.search(r"([a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+)", text)
+        session["data"]["applicantEmail"] = m.group(1) if m else text
+        session["state"] = "apply_cover"
+        return "Got it. Please type a short cover letter (or type 'skip' to skip).", session, False
+    if st == "apply_cover":
+        if text.lower() != "skip":
+            session["data"]["coverLetter"] = text
+        else:
+            session["data"]["coverLetter"] = ""
+        session["state"] = "apply_wait_cv"
+        return "Please upload your CV now (use the Upload button).", session, True
+    if st == "apply_jobtitle":
+        session["data"]["targetJobTitle"] = text
+        found = query_weaviate_collection("Job", text, limit=3)
+        cv_skills = [s.lower() for s in session["data"].get("cvSkills", [])]
+        if found:
+            job = found[0]
+            job_skills = [s.lower() for s in (job.get("skills") or [])]
+            overlap = len([s for s in cv_skills if s in job_skills])
+            session["data"]["targetJobId"] = job.get("jobId")
+            session["state"] = "apply_confirm"
+            if overlap > 0:
+                return (f"I found a job: {job.get('title')} at {job.get('companyName')}. "
+                        f"Detected {overlap} overlapping skills. Do you want to confirm application? (yes/no)"), session, False
             else:
+                return (f"I found {job.get('title')} at {job.get('companyName')}, but your CV skills do not overlap. "
+                        "Do you still want to proceed? (yes/no)"), session, False
+        else:
+            session["data"]["targetJobId"] = None
+            session["state"] = "apply_confirm"
+            return f"I couldn't find a job with that title. Do you want to apply for '{text}' anyway? (yes/no)", session, False
+    if st == "apply_confirm":
+        if text.lower() in ("yes", "y", "نعم"):
+            app = {
+                "applicationId": str(uuid.uuid4()),
+                "jobId": session["data"].get("targetJobId"),
+                "applicantName": session["data"].get("applicantName"),
+                "applicantEmail": session["data"].get("applicantEmail"),
+                "coverLetter": session["data"].get("coverLetter", ""),
+                "cvText": session["data"].get("cvText", ""),
+                "skills": session["data"].get("cvSkills", []),
+                "createdAt": get_rfc3339_time()
+            }
+            ok = save_application_to_weaviate(app)
+            session = initial_session()
+            return ("🎉 Your application has been submitted successfully. Good luck!" if ok
+                    else "⚠️ Failed to save application. Please try again later."), session, False
+        else:
+            session = initial_session()
+            return "Application cancelled. If you want to do something else, tell me.", session, False
+    # ========== TEAM FLOW ==========
+    if st == "team_action":
+        low = text.lower()
+        if "create" in low or "إنشاء" in low:
+            session["state"] = "team_create_name"
+            session["data"] = {}
+            return "Great — what's the team name?", session, False
+        if "join" in low or "انضم" in low:
+            session["state"] = "team_join_name"
+            session["data"] = {}
+            return "Okay — what's the name of the team you want to join?", session, False
+        return "Please say 'create' to create a team or 'join' to join a team.", session, False
+    if st == "team_create_name":
+        session["data"]["team_name"] = text
+        session["state"] = "team_create_owner"
+        return "Team name saved. Who is the team owner (your name)?", session, False
+    if st == "team_create_owner":
+        session["data"]["owner"] = text
+        session["state"] = "team_create_skills"
+        return "Owner saved. Please list the team's skills (comma-separated).", session, False
+    if st == "team_create_skills":
+        session["data"]["skills"] = [s.strip() for s in text.split(",") if s.strip()]
+        session["state"] = "team_create_course"
+        return "Skills saved. (Optional) Enter course/subject name or type 'skip'.", session, False
+    if st == "team_create_course":
+        session["data"]["course"] = "" if text.lower() == "skip" else text
+        session["state"] = "team_create_idea"
+        return "Please write a short idea/description for the project.", session, False
+    if st == "team_create_idea":
+        session["data"]["idea"] = text
+        team_props = {
+            "teamId": str(uuid.uuid4()),
+            "name": session["data"].get("team_name"),
+            "projectId": None,
+            "members": [session["data"].get("owner")],
+            "skills": session["data"].get("skills", []),
+            "creatorId": session["data"].get("owner"),
+            "createdAt": get_rfc3339_time(),
+            "idea": session["data"].get("idea", "")
+        }
+        saved = save_team_to_weaviate(team_props)
+        session = initial_session()
+        return (f"🎉 Team '{team_props['name']}' created! Members: {team_props['members']}" if saved
+                else "⚠️ Failed to create team. Try again later."), session, False
+    if st == "team_join_name":
+        session["data"]["team_name"] = text
+        session["state"] = "team_join_member"
+        return "What's your name (to add you to the team)?", session, False
+    if st == "team_join_member":
+        session["data"]["member_name"] = text
+        session["state"] = "team_join_skills"
+        return "Enter your skills (comma-separated).", session, False
+    if st == "team_join_skills":
+        skills = [s.strip() for s in text.split(",") if s.strip()]
+        resp = update_team_add_member(session["data"].get("team_name"), session["data"].get("member_name"), skills)
+        session = initial_session()
+        return resp, session, False
+    # ========== RECOMMEND FLOW ==========
+    if st == "recommend_wait_cv":
+        return "Please upload your CV (use the Upload button).", session, True
+    # fallback
+    return "Sorry — I didn't understand that. You can say 'apply', 'create team', 'join team' or 'recommend'.", session, False
+# ================================
+# Part 4 — Gradio Chat UI wiring
+# ================================
+import atexit
+# ensure Weaviate connection closes when the app exits
+atexit.register(lambda: weaviate_client.close())
+# initial session state per user
+def create_initial_session_for_state():
+    return initial_session()
+# helper to append to chat history (list of dicts)
+def append_to_history(history: List[Dict[str, str]], role: str, content: str) -> List[Dict[str, str]]:
+    history = history or []
+    history.append({"role": role, "content": content})
+    return history
+# UI
+with gr.Blocks(css="""
+.chatbot {height: 520px; overflow: auto;}
+.user-bubble {background-color: #DCF8C6; padding: 10px; border-radius: 12px; max-width: 75%; float: right; clear: both; margin: 5px; word-wrap: break-word;}
+.bot-bubble {background-color: #F1F0F0; padding: 10px; border-radius: 12px; max-width: 75%; float: left; clear: both; margin: 5px; word-wrap: break-word;}
+.chatbox-container {display: flex; gap: 8px; margin-top: 10px;}
+""") as demo:
+    gr.Markdown("# 💬 EduNatives — Conversational Job Portal")
+    # chat HTML (we use custom formatted HTML)
+    chat_html = gr.HTML(format_chat_html([]))
+    # input row
+    with gr.Row(elem_classes="chatbox-container"):
+        user_input = gr.Textbox(placeholder="Type your message here (e.g. 'apply', 'create team', 'recommend')", lines=2)
+        send_btn = gr.Button("Send", variant="primary")
+    # file upload row (initially hidden). We'll show/hide it dynamically.
+    with gr.Row(visible=False) as file_row:
+        cv_uploader = gr.File(label="Upload CV (.pdf/.docx/.txt)", file_count="single", file_types=[".pdf", ".docx", ".txt"], visible=False)
+        upload_btn = gr.Button("Upload CV", visible=False)
+    # control buttons
+    with gr.Row():
+        clear_btn = gr.Button("Reset Conversation")
+        instructions = gr.Markdown("Commands: `apply`, `create team`, `join team`, `recommend` — the bot will guide you step-by-step.")
+    # persistent state across turns
+    chat_history_state = gr.State([])
+    session_state = gr.State(create_initial_session_for_state())
+    # -------------------- handlers --------------------
+    def handle_send(message: str, history: List[Dict[str, str]], session: dict):
+        """
+        Called when the user presses Send.
+        - calls handle_user_message(session, message, uploaded_file=None)
+        - updates history, session, and indicates whether uploader should be shown
+        """
+        history = history or []
+        session = session or initial_session()
+        # append user message
+        if message and message.strip():
+            history = append_to_history(history, "user", message.strip())
+        bot_reply, new_session, show_uploader = handle_user_message(session, message or "" , uploaded_file=None)
+        history = append_to_history(history, "assistant", bot_reply or "…")
+        # Render HTML
+        html = format_chat_html(history)
+        # update session state
+        return "", html, history, new_session, gr.update(visible=show_uploader), gr.update(visible=show_uploader)
+    def handle_upload(file_obj, history: List[Dict[str, str]], session: dict):
+        """
+        Called when the user presses Upload CV (after selecting a file).
+        The session should be in a state that expects a CV (e.g. apply_wait_cv or recommend_wait_cv).
+        """
+        history = history or []
+        session = session or initial_session()
+        # Show the filename in user message
+        filename = getattr(file_obj, "name", "uploaded_file")
+        history = append_to_history(history, "user", f"📎 Uploaded file: {filename}")
+        # route file into the handler: pass file to handle_user_message
+        bot_reply, new_session, show_uploader = handle_user_message(session, "", uploaded_file=file_obj)
+        history = append_to_history(history, "assistant", bot_reply or "…")
+        html = format_chat_html(history)
+        # after upload we usually hide uploader (unless the bot again asks for more files)
+        return html, history, new_session, gr.update(visible=show_uploader), gr.update(visible=show_uploader)
+    def handle_reset(history, session):
+        # clear everything
+        new_hist = []
+        new_session = initial_session()
+        html = format_chat_html(new_hist)
+        return html, new_hist, new_session, gr.update(visible=False), gr.update(visible=False)
+    # -------------------- event wiring --------------------
     send_btn.click(
+        fn=handle_send,
+        inputs=[user_input, chat_history_state, session_state],
+        outputs=[user_input, chat_html, chat_history_state, session_state, cv_uploader, upload_btn],
         queue=True
     )
+    # upload button is shown/hidden by the send handler; user selects a file in cv_uploader then presses Upload CV
+    upload_btn.click(
+        fn=handle_upload,
+        inputs=[cv_uploader, chat_history_state, session_state],
+        outputs=[chat_html, chat_history_state, session_state, cv_uploader, upload_btn],
         queue=True
     )
     clear_btn.click(
+        fn=handle_reset,
+        inputs=[chat_history_state, session_state],
+        outputs=[chat_html, chat_history_state, session_state, cv_uploader, upload_btn],
         queue=False
     )
+# launch
 if __name__ == "__main__":
     demo.launch(debug=True)