Spaces:

VietCat
/

RAGSample

Sleeping

App Files Files Community

VietCat commited on Jun 20, 2025

Commit

c6d8421

1 Parent(s): f7b16f9

fix prompt

Browse files

Files changed (3) hide show

app.py +5 -1
rag_core/business.py +16 -7
ui.py +1 -1

app.py CHANGED Viewed

@@ -4,19 +4,23 @@ from ui import app_ui
 import gradio as gr
 import logging
 app = FastAPI()
 @app.post("/ask")
 async def ask_api(req: Request):
     data = await req.json()
     query = data.get("query", "")
     return answer_query(query)
 @app.post("/rescan")
 async def rescan_api():
     return rescan_index()
 # Mount Gradio UI vào FastAPI tại root
 app = gr.mount_gradio_app(app, app_ui, path="")
-logging.info("✅ Gradio UI đã mount vào root /")

 import gradio as gr
 import logging
+logging.info("🚀 Khởi động ứng dụng FastAPI...")
 app = FastAPI()
 @app.post("/ask")
 async def ask_api(req: Request):
     data = await req.json()
     query = data.get("query", "")
+    logging.info(f"📥 API /ask nhận query: {query}")
     return answer_query(query)
 @app.post("/rescan")
 async def rescan_api():
+    logging.info("♻️ API /rescan được gọi")
     return rescan_index()
 # Mount Gradio UI vào FastAPI tại root
 app = gr.mount_gradio_app(app, app_ui, path="")
+logging.info("✅ Gradio UI đã mount vào root /")

rag_core/business.py CHANGED Viewed

@@ -8,6 +8,8 @@ from rag_core.utils import log_timed
 retriever = Retriever()
 ready = retriever.index is not None
 def is_ready():
     return ready
@@ -18,7 +20,9 @@ def build_index():
     try:
         with open("data/raw_law.txt", "r", encoding="utf-8") as f:
             text = f.read()
         chunks = chunk_legal_text(text)
         retriever.build(chunks, get_embedding)
         ready = True
         logging.info("✅ Xây FAISS index thành công.")
@@ -38,7 +42,9 @@ def rescan_index():
         try:
             with open("data/raw_law.txt", "r", encoding="utf-8") as f:
                 text = f.read()
             chunks = chunk_legal_text(text)
             retriever.rescan_and_append(chunks, get_embedding)
             logging.info("✅ Đã cập nhật index với các chunk mới.")
             return {"status": "✅ Rescan & update thành công."}
@@ -58,16 +64,19 @@ def answer_query(query: str) -> str:
         for i, doc in enumerate(docs):
             logging.info(f"🔍 Đoạn {i+1}: {doc[:300]}{'...' if len(doc) > 300 else ''}")
-        formatted_context = "\n\n".join([f"[Văn bản {i+1}]\n{doc}" for i, doc in enumerate(docs)])
         prompt = (
-            "Bạn là một trợ lý pháp lý. Dưới đây là các trích đoạn liên quan từ văn bản luật:\n\n"
-            f"{formatted_context}\n\n"
-            "Hãy trả lời câu hỏi sau dựa trên các trích đoạn trên. "
-            "Nếu không đủ thông tin, hãy nói rõ là không tìm thấy.\n\n"
-            f"Câu hỏi: {query}\nTrả lời:"
         )
         answer = generate_answer(prompt)
         return {"answer": answer}
     except Exception as e:
         logging.error(f"❌ Lỗi khi trả lời câu hỏi: {e}")
-        return {"error": str(e)}

 retriever = Retriever()
 ready = retriever.index is not None
+logging.info("📦 Khởi tạo retriever")
 def is_ready():
     return ready
     try:
         with open("data/raw_law.txt", "r", encoding="utf-8") as f:
             text = f.read()
+        logging.info(f"📄 Đọc dữ liệu xong, độ dài: {len(text)} ký tự")
         chunks = chunk_legal_text(text)
+        logging.info(f"✂️ Chunking xong, tổng số chunk: {len(chunks)}")
         retriever.build(chunks, get_embedding)
         ready = True
         logging.info("✅ Xây FAISS index thành công.")
         try:
             with open("data/raw_law.txt", "r", encoding="utf-8") as f:
                 text = f.read()
+            logging.info(f"📄 Đọc dữ liệu xong, độ dài: {len(text)} ký tự")
             chunks = chunk_legal_text(text)
+            logging.info(f"🔁 Rescan: tổng số chunk mới: {len(chunks)}")
             retriever.rescan_and_append(chunks, get_embedding)
             logging.info("✅ Đã cập nhật index với các chunk mới.")
             return {"status": "✅ Rescan & update thành công."}
         for i, doc in enumerate(docs):
             logging.info(f"🔍 Đoạn {i+1}: {doc[:300]}{'...' if len(doc) > 300 else ''}")
         prompt = (
+            "Bạn là một trợ lý AI có kiến thức pháp luật, hãy trả lời câu hỏi dựa trên các đoạn luật sau. "
+            "Chỉ sử dụng thông tin có trong các đoạn, không tự đoán.\n"
         )
+        prompt += "\n\n".join(docs)
+        prompt += f"\n\nCâu hỏi: {query}\nTrả lời:"
+        logging.info("🧠 Prompt gửi đến LLM:")
+        logging.info(prompt[:1000] + ("..." if len(prompt) > 1000 else ""))
         answer = generate_answer(prompt)
+        logging.info(f"💬 Câu trả lời từ LLM: {answer}")
         return {"answer": answer}
     except Exception as e:
         logging.error(f"❌ Lỗi khi trả lời câu hỏi: {e}")
+        return {"error": str(e)}

ui.py CHANGED Viewed

@@ -4,7 +4,6 @@ from rag_core.business import build_index, rescan_index, answer_query, retriever
 import os
 os.environ["SPACE_HOST"] = "https://vietcat-ragsample.hf.space"
 logging.info("🎨 Khởi tạo Gradio UI...")
 def handle_rebuild():
@@ -18,6 +17,7 @@ def handle_rebuild():
         return result["status"]
 def handle_query(query):
     result = answer_query(query)
     return result.get("answer", result.get("error", "❌ Lỗi không xác định."))

 import os
 os.environ["SPACE_HOST"] = "https://vietcat-ragsample.hf.space"
 logging.info("🎨 Khởi tạo Gradio UI...")
 def handle_rebuild():
         return result["status"]
 def handle_query(query):
+    logging.info(f"📨 Người dùng gửi truy vấn: {query}")
     result = answer_query(query)
     return result.get("answer", result.get("error", "❌ Lỗi không xác định."))