Spaces:

mhuseyina
/

Egitbot

Sleeping

App Files Files Community

Egitbot / app.py

mhuseyina

Upload app.py

0c1e079 verified 2 months ago

raw

history blame contribute delete

6.95 kB

	#RAG Temelli Chatbot-EĞİTBOT

	#Gerekli kütüphaneleri ekliyoruz.
	import os
	import datetime
	import gradio as gr
	from datasets import load_dataset
	from langchain_huggingface import HuggingFaceEmbeddings
	from langchain.text_splitter import TokenTextSplitter
	from langchain_community.vectorstores import FAISS
	from langchain.chains import RetrievalQA
	from langchain.prompts import PromptTemplate
	from langchain_google_genai import ChatGoogleGenerativeAI

	# API anahtarları alınıyor.
	GOOGLE_API_KEY = os.getenv("GOOGLE_API_KEY")
	HUGGINGFACEHUB_API_TOKEN = os.getenv("HUGGINGFACEHUB_API_TOKEN")
	MODEL_NAME = "models/gemini-2.5-pro"

	# Veri hazırlama fonksiyonumuz.
	def prepare_retriever():
	dataset_math_word = load_dataset("duxx/orca-math-word-problems-tr", split="train[:10000]")
	dataset_math_hard = load_dataset("Karayel-DDI/Turkce_Lighteval_MATH-Hard", split="train[:10000]")
	dataset_edu = load_dataset("korkmazemin1/turkish-education-dataset", split="train[:5000]")
	dataset_wiki_sum = load_dataset("musabg/wikipedia-tr-summarization", split="train[:10000]")

	documents = []
	# 1. Orca Math Word Problems
	for item in dataset_math_word:
	question = item.get("question", "").strip()
	answer = item.get("answer", "").strip()
	if question and answer:
	documents.append(f"Soru: {question}\nCevap: {answer}")

	# 2. Karayel-DDI Math Hard
	for item in dataset_math_hard:
	question = item.get("question", "").strip()
	answer = item.get("solution", "").strip()
	if question and answer:
	documents.append(f"Soru: {question}\nCevap: {answer}")

	# 3. Korkmazemin1 Turkish Education Dataset
	for item in dataset_edu:
	question = item.get("soru", "").strip()
	answer = item.get("cevap", "").strip()
	if question and answer:
	documents.append(f"Soru: {question}\nCevap: {answer}")

	# 4. Musabg Wikipedia Turkish Summarization Dataset
	for item in dataset_wiki_sum:
	text = item.get("text", "").strip()
	summary = item.get("summary", "").strip()
	if text and summary:
	documents.append(f"Metin: {text}\nÖzet: {summary}")

	text_splitter = TokenTextSplitter(chunk_size=1000, chunk_overlap=100)
	docs = text_splitter.create_documents(documents)

	# Embedding modelimiz.
	embedding_model = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")

	# FAISS dizini ve daha önce kayıtlı FAISS varsa onu yükleme.
	FAISS_PATH = "faiss_index"
	if os.path.exists(FAISS_PATH):
	vectorstore = FAISS.load_local(FAISS_PATH, embedding_model, allow_dangerous_deserialization=True)
	else:
	vectorstore = FAISS.from_documents(docs, embedding_model)
	vectorstore.save_local(FAISS_PATH)

	return vectorstore.as_retriever(search_kwargs={"k": 3})

	# Fonksiyonu çağırıp retriever'ı hazırlama.
	retriever = prepare_retriever()

	# -----------------------------
	# 🔗 ÖZEL PROMPT OLUŞTURMA
	# -----------------------------
	# Burada modelden gelen bilgiyi nasıl kullanacağını belirtiyoruz.

	prompt_template = """
	Aşağıda bir öğrenci sana bir ders sorusu soruyor. Lütfen ona açık, anlaşılır ve sade bir şekilde cevap ver.
	Cevap verirken sadece gerekli bilgiyi ver, ama eğer gerekiyorsa küçük bir örnek veya açıklama ile öğrencinin konuyu anlamasına yardımcı ol.
	Cevapların çok uzun olmasın ama öğretici olsun.

	Bilgiler:
	{context}

	Soru:
	{question}

	Cevap:
	"""


	PROMPT = PromptTemplate(
	template=prompt_template,
	input_variables=["context", "question"]
	)
	# Burada, Google'ın yapay zeka tabanlı sohbet modeli ile bir bağlantı kuruyoruz.
	# Modeli çalıştırabilmek için öncelikle API anahtarımızı ve modelin adını belirtmemiz gerekiyor.

	llm = ChatGoogleGenerativeAI(
	model=MODEL_NAME,
	google_api_key=GOOGLE_API_KEY
	)
	# Burada 'llm' modelini kullanarak, dil modelinden sorulara cevap alıyoruz.
	qa_chain = RetrievalQA.from_chain_type(
	llm=llm,
	retriever=retriever,
	return_source_documents=False,
	chain_type="stuff",
	chain_type_kwargs={"prompt": PROMPT}
	)

	# Gradio UI düzeni
	with gr.Blocks() as demo:
	gr.Markdown("# 📘 EğitBot - Eğitim Asistanı")

	with gr.Row():
	with gr.Column(scale=2):
	# Soru sorma alanı
	user_input = gr.Textbox(placeholder="Sorunuzu buraya yazınız...", label="Soru")
	send_btn = gr.Button("Gönder")

	# Toplam soru sayısı
	total_q = gr.Number(value=0, label="Toplam Sorulan Soru", interactive=False)

	# Sohbet geçmişi
	chatbox = gr.HTML(value="", label="Sohbet Geçmişi")

	with gr.Column(scale=1):
	# Sohbeti kaydetme ve temizleme butonları
	clear_btn = gr.Button("♻️ Geçmişi Temizle", variant="primary")
	save_btn = gr.Button("💾 Sohbeti Kaydet", variant="primary")
	download_file = gr.File(label="İndir")

	# Sohbeti temizleme fonksiyonu
	def clear_chat():
	return "", 0

	clear_btn.click(fn=clear_chat, inputs=[], outputs=[chatbox, total_q])

	# Sohbeti kaydetme fonksiyonu
	def save_chat_to_file(chat_history):
	if not chat_history:
	return None

	# Chat geçmişini bir dosyaya kaydet
	timestamp = datetime.datetime.now().strftime("%Y%m%d_%H%M%S")
	filename = f"chat_history_{timestamp}.txt"

	with open(filename, "w") as file:
	file.write(chat_history)

	# Kullanıcıya dosya indirme bağlantısı gönder
	return filename

	save_btn.click(fn=save_chat_to_file, inputs=[chatbox], outputs=download_file)

	# Soru gönderme fonksiyonu
	def handle_question(user_question, total_questions, chat_history):
	# Soruyu kullanarak yanıt al
	result = qa_chain.run(user_question)

	# Geçmişi güncelle ve toplam soru sayısını arttır
	chat_history = f"""
	<div style="background-color:#e8f4f8; padding: 10px; border-radius: 15px; margin-bottom: 5px;">
	<b>Soru:</b> <span style="color: black;">{user_question}</span>
	</div>
	<div style="background-color:#f1f9f5; padding: 10px; border-radius: 15px; margin-bottom: 5px;">
	<b>Cevap:</b> <span style="color: black;">{result}</span>
	</div>
	""" + chat_history # Yeni soru-cevap en üstte

	total_questions += 1
	return chat_history, total_questions

	# Gönder butonuna tıklanınca soru gönderme işlemi
	send_btn.click(fn=handle_question, inputs=[user_input, total_q, chatbox],
	outputs=[chatbox, total_q])

	# Gradio UI'sini başlatma
	demo.launch(share=True)