Spaces:

mhuseyina
/

Egitbot

Sleeping

App Files Files Community

mhuseyina commited on Oct 14, 2025

Commit

5477294

verified ·

1 Parent(s): 16cbcf1

Upload 2 files

Browse files

Files changed (2) hide show

app.py +142 -252
requirements.txt +1 -2

app.py CHANGED Viewed

@@ -1,110 +1,73 @@
-# RAG Temelli Eğitim Chatbot (EğitBot)
 import os
-# Hugging Face cache klasörlerini uygulama dizini içine yönlendir
-os.environ["HF_HOME"] = "./cache"
-os.environ["HF_DATASETS_CACHE"] = "./cache/hf_datasets"
-os.environ["TRANSFORMERS_CACHE"] = "./cache/transformers"
-os.environ["SENTENCE_TRANSFORMERS_HOME"] = "./cache/sentence_transformers"
-# Gerekli kütüphaneleri ekliyoruz.
-import os
-import requests
-import streamlit as st
 from datasets import load_dataset
 from langchain_huggingface import HuggingFaceEmbeddings
 from langchain.text_splitter import TokenTextSplitter
 from langchain_community.vectorstores import FAISS
-from langchain.text_splitter import CharacterTextSplitter
 from langchain.chains import RetrievalQA
 from langchain.prompts import PromptTemplate
 from langchain_google_genai import ChatGoogleGenerativeAI
-import datetime
-# Streamlit secrets üzerinden API anahtarını al
 GOOGLE_API_KEY = os.getenv("GOOGLE_API_KEY")
 HUGGINGFACEHUB_API_TOKEN = os.getenv("HUGGINGFACEHUB_API_TOKEN")
 MODEL_NAME = "models/gemini-2.5-pro"
-# -----------------------------
-# 📄 VERİ SETİ & VEKTÖR VERİTABANI HAZIRLAMA
-# -----------------------------
-# Veri hazırlama işlemi de sadece bir kez yapılır.
-# Burda 4 farklı veri seti ekliyoruz.
-# Veri setlerinden math_word problem tarzı sorular için
-                 # math_hard daha derin işlemler için
-                 # edu eğitim temalı genel soru-cevap için
-                 # wiki_sum bu veri setide tarih ve fen alanında daha verimli cevaplar için kullanılmıştır.
-@st.cache_resource
 def prepare_retriever():
-    try:
-        dataset_math_word = load_dataset("duxx/orca-math-word-problems-tr", split="train[:2000]")
-        dataset_math_hard = load_dataset("Karayel-DDI/Turkce_Lighteval_MATH-Hard", split="train[:2000]")
-        dataset_edu = load_dataset("korkmazemin1/turkish-education-dataset", split="train[:2000]")
-        dataset_wiki_sum = load_dataset("musabg/wikipedia-tr-summarization", split="train[:2000]")
-        documents = []
-         # 1. Orca Math Word Problems
-        for item in dataset_math_word:
-            question = item.get("question", "").strip()
-            answer = item.get("answer", "").strip()
-            if question and answer:
-                documents.append(f"Soru: {question}\nCevap: {answer}")
-        # 2. Karayel-DDI Math Hard
-        for item in dataset_math_hard:
-            question = item.get("question", "").strip()
-            answer = item.get("solution", "").strip()
-            if question and answer:
-                documents.append(f"Soru: {question}\nCevap: {answer}")
-        # 3. Korkmazemin1 Turkish Education Dataset
-        for item in dataset_edu:
-            question = item.get("soru", "").strip()
-            answer = item.get("cevap", "").strip()
-            if question and answer:
-                documents.append(f"Soru: {question}\nCevap: {answer}")
-         # 4. Musabg Wikipedia Turkish Summarization Dataset
-        for item in dataset_wiki_sum:
-            text = item.get("text", "").strip()
-            summary = item.get("summary", "").strip()
-            if text and summary:
-                documents.append(f"Metin: {text}\nÖzet: {summary}")
-         # Metinleri parçalara ayıralım
-        text_splitter = TokenTextSplitter(chunk_size=1000, chunk_overlap=100)
-        docs = text_splitter.create_documents(documents)
-        # Embedding modeli
-        embedding_model = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
-        # FAISS dizini
-        FAISS_PATH = "faiss_index"
-        # Daha önce kayıtlı FAISS varsa onu yükle
-        if os.path.exists(FAISS_PATH):
-            vectorstore = FAISS.load_local(FAISS_PATH, embedding_model, allow_dangerous_deserialization=True)
-        else:
-            vectorstore = FAISS.from_documents(docs, embedding_model)
-            vectorstore.save_local(FAISS_PATH)
-        return vectorstore.as_retriever(search_kwargs={"k": 3})
-    except Exception as e:
-        st.error(f"Veri seti hazırlanırken hata oluştu: {e}")
-        return None
-# Eğer retriever None dönerse uygulamayı durdurabilirsin
 retriever = prepare_retriever()
-if retriever is None:
-    st.stop()
-# -----------------------------
-# 🔗 ÖZEL PROMPT OLUŞTURMA
-# -----------------------------
-# Burada modelden gelen bilgiyi nasıl kullanacağını söylüyoruz.
 prompt_template = """
 Sadece sorulan soruya net ve kısa cevap ver. Gereksiz ek açıklama yapma.
 Sadece yukarıdaki soruya cevap ver. Başka konulara girmeyin veya yeni sorular sormayın.
@@ -123,18 +86,11 @@ PROMPT = PromptTemplate(
     input_variables=["context", "question"]
 )
-# -----------------------------
-# 🔗 Gemini LLM (LangChain üzerinden)
-# -----------------------------
 llm = ChatGoogleGenerativeAI(
     model=MODEL_NAME,
     google_api_key=GOOGLE_API_KEY
 )
-# -----------------------------
-# 🔗 LangChain QA Zinciri Kurulumu
-# -----------------------------
-# LLM ve retriever’ı bağlayarak "Soru-Cevap" zinciri oluşturuyoruz.
 qa_chain = RetrievalQA.from_chain_type(
     llm=llm,
     retriever=retriever,
@@ -143,26 +99,7 @@ qa_chain = RetrievalQA.from_chain_type(
     chain_type_kwargs={"prompt": PROMPT}
 )
-# -----------------------------
-# 🖥️ Streamlit Arayüzü (EğitBot)
-# -----------------------------
-# Sayfa başlığı, simgesi ve genişlik ayarlandı
-st.set_page_config(page_title="📘 EğitBot - Eğitim Asistanı", page_icon="🎓", layout="wide")
-# -----------------------------
-# 👤 Oturum Durumu: Sohbet Geçmişi ve İstatistikler Başlatma
-# -----------------------------
-# Streamlit session_state ile kalıcı sohbet geçmişi ve sayaçları tutuyoruz.
-if "chat_history" not in st.session_state:
-    st.session_state.chat_history = []
-if "total_questions" not in st.session_state:
-    st.session_state.total_questions = 0
-if "total_answers" not in st.session_state:
-    st.session_state.total_answers = 0
-# Örnek sorular veri yapısı
 EXAMPLE_QUESTIONS = {
     "İlkokul": {
         "Matematik": [
@@ -256,139 +193,92 @@ EXAMPLE_QUESTIONS = {
     }
 }
-# -----------------------------
-# 📚 Sidebar - İstatistikler, Butonlar ve Örnek Sorular
-# -----------------------------
-with st.sidebar:
-    st.title("📚 Örnek Sorular & Kontroller")
-    # İstatistikler
-    st.markdown(f"- Toplam Sorulan Soru: **{st.session_state.get('total_questions', 0)}**")
-    st.markdown(f"- Toplam Alınan Cevap: **{st.session_state.get('total_answers', 0)}**")
-    st.markdown("---")
-    # "Geçmişi Temizle" butonu, tıklanınca tüm sohbeti ve sayacı sıfırlıyor
-    if st.button("♻️ Geçmişi Temizle", key="clear_history"):
-        st.session_state.chat_history = []
-        st.session_state.total_questions = 0
-        st.session_state.total_answers = 0
-    # Sohbet geçmişini dosya olarak kaydetmek için fonksiyon
-    def save_chat_history():
-        now = datetime.datetime.now().strftime("%Y-%m-%d_%H-%M-%S")
-        filename = f"chat_history_{now}.txt"
-        with open(filename, "w", encoding="utf-8") as f:
-            for sender, msg in st.session_state.get("chat_history", []):
-                f.write(f"{'Kullanıcı' if sender == 'user' else 'Bot'}: {msg}\n")
-        return filename
-    # "Sohbeti Kaydet" butonuna basıldığında sohbet dosyasını oluşturup indirilebilir yapıyoruz
-    if st.button("💾 Sohbeti Kaydet", key="save_chat"):
-        filename = save_chat_history()
-        with open(filename, "rb") as f:
-            st.download_button(
-                label="⬇️ Dosyayı İndir",
-                data=f,
-                file_name=filename,
-                mime="text/plain"
-            )
-    # Örnek sorular için seçimler
-    grade = st.selectbox("Sınıf Seviyesi Seçiniz:", options=list(EXAMPLE_QUESTIONS.keys()), key="grade_select")
-    subjects = list(EXAMPLE_QUESTIONS[grade].keys())
-    subject = st.selectbox("Konu Seçiniz:", options=subjects, key="subject_select")
-    # Liste olarak örnek soruları göster
-    example_questions = EXAMPLE_QUESTIONS[grade][subject]
-    st.markdown("### Örnek Sorular:")
-    for idx, question in enumerate(example_questions, 1):
-        st.markdown(f"{idx}. {question}")
-# Ana sayfa başlığı
-st.title("📘 EğitBot - Eğitim Asistanı")
-# Kullanıcının sorusunu al
-user_question = st.text_input("Sorunuzu buraya yazınız veya yukarıdaki örnek sorulardan birini yazabilirsiniz:", key="user_question_input")
-# Gönder butonu
-if st.button("Gönder", key="send_question"):
-    if user_question.strip() == "":
-        st.warning("Lütfen bir soru yazınız veya örnek sorulardan birini kullanınız.")
-    else:
-        with st.spinner("Cevap aranıyor..."):
-            try:
-                answer = qa_chain.run(user_question)
-                st.session_state.chat_history.append(("user", user_question))
-                st.session_state.chat_history.append(("bot", answer))
-                st.session_state.total_questions += 1
-                st.session_state.total_answers += 1
-            except Exception as e:
-                st.error(f"Cevap alınırken hata oluştu: {e}")
-# Sohbet geçmişi balonlar halinde gösterimi
-def render_message(sender, message):
-    if sender == "user":
-        color = "#DCF8C6"  # Açık yeşil (Kullanıcı için)
-        align = "flex-end"
-        border_radius = "15px 15px 0 15px"
-    else:
-        color = "#EAEAEA"  # Açık gri (Bot için)
-        align = "flex-start"
-        border_radius = "15px 15px 15px 0"
-    st.markdown(
-        f"""
-        <div style="
-            display: flex;
-            justify-content: {align};
-            margin: 5px 0;
-        ">
-            <div style="
-                background-color: {color};
-                padding: 10px 15px;
-                border-radius: {border_radius};
-                max-width: 70%;
-                box-shadow: 0 1px 3px rgba(0,0,0,0.1);
-                ">
-                {message}
-            </div>
         </div>
-        """,
-        unsafe_allow_html=True
-    )
-if st.session_state.chat_history:
-    st.markdown("---")
-    st.subheader("💬 Sohbet Geçmişi")
-    for sender, message in reversed(st.session_state.chat_history):
-        if sender == "user":
-            st.markdown(
-                f"""
-                <div style="
-                    background-color: #A3C4F3;  /* Soft mavi */
-                    padding: 12px;
-                    border-radius: 15px;
-                    margin: 5px 0px;
-                    max-width: 80%;
-                    color: black;   /* Yazı siyah */
-                    ">
-                    <b>Kullanıcı:</b> {message}
-                </div>
-                """,
-                unsafe_allow_html=True
-            )
-        else:
-            st.markdown(
-                f"""
-                <div style="
-                    background-color: #8FBC8F;  /* Soft yeşil */
-                    padding: 12px;
-                    border-radius: 15px;
-                    margin: 5px 0px;
-                    max-width: 80%;
-                    color: black;  /* Yazı siyah */
-                    ">
-                    <b>Bot:</b> {message}
-                </div>
-                """,
-                unsafe_allow_html=True
-            )

 import os
+import datetime
+import gradio as gr
 from datasets import load_dataset
 from langchain_huggingface import HuggingFaceEmbeddings
 from langchain.text_splitter import TokenTextSplitter
 from langchain_community.vectorstores import FAISS
 from langchain.chains import RetrievalQA
 from langchain.prompts import PromptTemplate
 from langchain_google_genai import ChatGoogleGenerativeAI
+# Cache klasör ayarları
+os.environ["HF_HOME"] = "./cache"
+os.environ["HF_DATASETS_CACHE"] = "./cache/hf_datasets"
+os.environ["TRANSFORMERS_CACHE"] = "./cache/transformers"
+os.environ["SENTENCE_TRANSFORMERS_HOME"] = "./cache/sentence_transformers"
+# API anahtarları ortam değişkenlerinden alınmalı
 GOOGLE_API_KEY = os.getenv("GOOGLE_API_KEY")
 HUGGINGFACEHUB_API_TOKEN = os.getenv("HUGGINGFACEHUB_API_TOKEN")
 MODEL_NAME = "models/gemini-2.5-pro"
+# Veri hazırlama fonksiyonu (aynı)
 def prepare_retriever():
+    dataset_math_word = load_dataset("duxx/orca-math-word-problems-tr", split="train[:2000]")
+    dataset_math_hard = load_dataset("Karayel-DDI/Turkce_Lighteval_MATH-Hard", split="train[:2000]")
+    dataset_edu = load_dataset("korkmazemin1/turkish-education-dataset", split="train[:2000]")
+    dataset_wiki_sum = load_dataset("musabg/wikipedia-tr-summarization", split="train[:2000]")
+    documents = []
+    for item in dataset_math_word:
+        question = item.get("question", "").strip()
+        answer = item.get("answer", "").strip()
+        if question and answer:
+            documents.append(f"Soru: {question}\nCevap: {answer}")
+    for item in dataset_math_hard:
+        question = item.get("question", "").strip()
+        answer = item.get("solution", "").strip()
+        if question and answer:
+            documents.append(f"Soru: {question}\nCevap: {answer}")
+    for item in dataset_edu:
+        question = item.get("soru", "").strip()
+        answer = item.get("cevap", "").strip()
+        if question and answer:
+            documents.append(f"Soru: {question}\nCevap: {answer}")
+    for item in dataset_wiki_sum:
+        text = item.get("text", "").strip()
+        summary = item.get("summary", "").strip()
+        if text and summary:
+            documents.append(f"Metin: {text}\nÖzet: {summary}")
+    text_splitter = TokenTextSplitter(chunk_size=1000, chunk_overlap=100)
+    docs = text_splitter.create_documents(documents)
+    embedding_model = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
+    FAISS_PATH = "faiss_index"
+    if os.path.exists(FAISS_PATH):
+        vectorstore = FAISS.load_local(FAISS_PATH, embedding_model, allow_dangerous_deserialization=True)
+    else:
+        vectorstore = FAISS.from_documents(docs, embedding_model)
+        vectorstore.save_local(FAISS_PATH)
+    return vectorstore.as_retriever(search_kwargs={"k": 3})
 retriever = prepare_retriever()
 prompt_template = """
 Sadece sorulan soruya net ve kısa cevap ver. Gereksiz ek açıklama yapma.
 Sadece yukarıdaki soruya cevap ver. Başka konulara girmeyin veya yeni sorular sormayın.
     input_variables=["context", "question"]
 )
 llm = ChatGoogleGenerativeAI(
     model=MODEL_NAME,
     google_api_key=GOOGLE_API_KEY
 )
 qa_chain = RetrievalQA.from_chain_type(
     llm=llm,
     retriever=retriever,
     chain_type_kwargs={"prompt": PROMPT}
 )
+# Örnek sorular yapısı
 EXAMPLE_QUESTIONS = {
     "İlkokul": {
         "Matematik": [
     }
 }
+# Fonksiyon: sohbeti cevapla ve geçmişi güncelle
+def respond(user_question, chat_history):
+    if not user_question.strip():
+        return chat_history, ""
+    try:
+        answer = qa_chain.run(user_question)
+        chat_history = chat_history + [(user_question, answer)]
+    except Exception as e:
+        answer = f"Hata: {e}"
+    return chat_history, ""
+# Sohbet geçmişini HTML ile biçimlendir
+def format_chat(chat_history):
+    chat_html = ""
+    for user_q, bot_a in chat_history[-10:]:
+        chat_html += f"""
+        <div style="background-color:#A3C4F3; padding:10px; border-radius:15px; margin:5px 0; max-width: 80%; color:black;">
+            <b>Kullanıcı:</b> {user_q}
+        </div>
+        <div style="background-color:#8FBC8F; padding:10px; border-radius:15px; margin:5px 0; max-width: 80%; color:black;">
+            <b>Bot:</b> {bot_a}
         </div>
+        """
+    return chat_html
+# Örnek sorular seçimi için fonksiyon
+def get_subjects(grade):
+    return list(EXAMPLE_QUESTIONS[grade].keys())
+def get_example_questions(grade, subject):
+    return EXAMPLE_QUESTIONS[grade][subject]
+# Sohbet geçmişini dosyaya kaydet
+def save_chat(chat_history):
+    now = datetime.datetime.now().strftime("%Y-%m-%d_%H-%M-%S")
+    filename = f"chat_history_{now}.txt"
+    with open(filename, "w", encoding="utf-8") as f:
+        for user_q, bot_a in chat_history:
+            f.write(f"Kullanıcı: {user_q}\nBot: {bot_a}\n\n")
+    return filename
+with gr.Blocks() as demo:
+    gr.Markdown("# 📘 EğitBot - Eğitim Asistanı")
+    with gr.Row():
+        with gr.Column(scale=3):
+            chatbox = gr.HTML(value="", label="Sohbet Geçmişi")
+            user_input = gr.Textbox(placeholder="Sorunuzu buraya yazınız...", label="Soru")
+            send_btn = gr.Button("Gönder")
+            # Örnek sorular dropdownları
+            grade_dropdown = gr.Dropdown(list(EXAMPLE_QUESTIONS.keys()), label="Sınıf Seviyesi")
+            subject_dropdown = gr.Dropdown(choices=[], label="Konu")
+            example_question_dropdown = gr.Dropdown(choices=[], label="Örnek Sorular")
+            # Seçilen örnek soruyu user_input'a yaz
+            def set_example_question(question):
+                return question
+            example_question_dropdown.change(set_example_question, inputs=example_question_dropdown, outputs=user_input)
+            # Sınıf seçildiğinde konuları güncelle
+            def update_subjects(grade):
+                return gr.Dropdown.update(choices=get_subjects(grade))
+            grade_dropdown.change(update_subjects, inputs=grade_dropdown, outputs=subject_dropdown)
+            # Konu seçildiğinde örnek soruları güncelle
+            def update_example_questions(subject, grade):
+                if grade is None or subject is None:
+                    return gr.Dropdown.update(choices=[])
+                return gr.Dropdown.update(choices=get_example_questions(grade, subject))
+            subject_dropdown.change(update_example_questions, inputs=[subject_dropdown, grade_dropdown], outputs=example_question_dropdown)
+            # Sohbet geçmişi ve temizleme butonu
+            clear_btn = gr.Button("♻️ Geçmişi Temizle")
+            save_btn = gr.Button("💾 Sohbeti Kaydet")
+            download_file = gr.File()
+        with gr.Column(scale=2):
+            gr.Markdown("### İstatistikler")
+            total_q = gr.Number(value=0, label="Toplam Sorulan Soru", interactive=False)
+            total_a = gr.Number(value=0, label="Toplam Alınan Cevap", interactive=False)
+    # State tutuyoruz
+    state = gr.State([])  # chat_history listesi
+    stats = gr.State({"questions": 0, "answers": 0})
+    # Buton basıldığında sohbeti güncelle
+    def on_send(user_question, chat_history, stats):

requirements.txt CHANGED Viewed

@@ -1,5 +1,4 @@
-pip
-streamlit
 python-dotenv
 langchain
 langchain-community

+gradio
 python-dotenv
 langchain
 langchain-community