Spaces:

PBThuong96
/

thuong

Build error

App Files Files Community

PBThuong96 commited on Feb 24

Commit

dc011dc

verified ·

1 Parent(s): 313ed3c

Create app.py

Browse files

Files changed (1) hide show

app.py +139 -0

app.py ADDED Viewed

	@@ -0,0 +1,139 @@

+import os
+import gradio as gr
+from typing import TypedDict, Annotated, Sequence
+from langchain_core.messages import BaseMessage, HumanMessage, AIMessage
+from langchain_huggingface import HuggingFaceEndpoint, HuggingFaceEmbeddings
+from langchain_community.vectorstores import Qdrant
+from qdrant_client import QdrantClient
+from langgraph.graph import StateGraph, START, END
+from langgraph.graph.message import add_messages
+from langchain_core.prompts import PromptTemplate
+# ==========================================
+# 1. CẤU HÌNH API VÀ MÔ HÌNH (Lấy từ HF Secrets)
+# ==========================================
+HF_TOKEN = os.getenv("HF_TOKEN")
+QDRANT_URL = os.getenv("QDRANT_URL", "MOCK_URL")
+QDRANT_API_KEY = os.getenv("QDRANT_API_KEY", "MOCK_KEY")
+# Khởi tạo Mô hình Sinh văn bản (LLM) - Dùng Qwen 2.5 7B Instruct (rất tốt cho tiếng Việt & Y tế)
+# Lưu ý: Cần cấp quyền truy cập mô hình trên Hugging Face nếu mô hình bị khóa.
+llm = HuggingFaceEndpoint(
+    repo_id="Qwen/Qwen2.5-7B-Instruct",
+    task="text-generation",
+    max_new_tokens=512,
+    temperature=0.1, # Nhiệt độ thấp để đảm bảo tính chính xác y khoa
+    huggingfacehub_api_token=HF_TOKEN,
+)
+# Khởi tạo Mô hình Nhúng (Embeddings) cho Y sinh / Đa ngôn ngữ
+embeddings = HuggingFaceEmbeddings(
+    model_name="BAAI/bge-m3" # Có thể thay bằng "pritamdeka/S-PubMedBert-MS-MARCO" nếu chỉ dùng tiếng Anh
+)
+# Khởi tạo kết nối Vector DB (Qdrant Cloud)
+# Trong môi trường thực tế, bạn cần URL và API Key thật. Ở đây có cơ chế try-except để demo không bị lỗi.
+try:
+    client = QdrantClient(url=QDRANT_URL, api_key=QDRANT_API_KEY)
+    vector_store = Qdrant(
+        client=client,
+        collection_name="deepmed_documents",
+        embeddings=embeddings
+    )
+    retriever = vector_store.as_retriever(search_kwargs={"k": 3})
+except Exception as e:
+    print("Cảnh báo: Chưa kết nối được Qdrant thực tế. Sẽ dùng Mock Retriever cho mục đích Demo.")
+    retriever = None
+# ==========================================
+# 2. XÂY DỰNG LUỒNG LANGGRAPH CHO DEEPMED-AI
+# ==========================================
+# Định nghĩa trạng thái (State) của Agent
+class AgentState(TypedDict):
+    messages: Annotated[Sequence[BaseMessage], add_messages]
+    context: str
+# Node 1: Truy xuất tài liệu (Retrieval)
+def retrieve_node(state: AgentState):
+    messages = state["messages"]
+    last_message = messages[-1].content
+    if retriever:
+        docs = retriever.invoke(last_message)
+        context = "\n\n".join([doc.page_content for doc in docs])
+    else:
+        # Mock data nếu chưa có DB thật
+        context = "THÔNG TIN MÔ PHỎNG: Paracetamol liều dùng cho người lớn là 500mg - 1000mg mỗi 4-6 giờ, không quá 4000mg/ngày. Chống chỉ định với người suy gan nặng."
+    return {"context": context}
+# Node 2: Sinh câu trả lời với Guardrails Y tế (Generation)
+def generate_node(state: AgentState):
+    messages = state["messages"]
+    question = messages[-1].content
+    context = state["context"]
+    # RÀO CHẮN Y TẾ (Strict Guardrails)
+    medical_prompt = PromptTemplate.from_template(
+        """Bạn là DeepMed-AI, một chuyên gia y tế và dược lý học lâm sàng.
+Nhiệm vụ của bạn là trả lời câu hỏi của người dùng dựa TRÊN CƠ SỞ NGỮ CẢNH ĐƯỢC CUNG CẤP DƯỚI ĐÂY.
+NGỮ CẢNH Y KHOA:
+{context}
+LUẬT LỆ BẮT BUỘC (GUARDRAILS):
+1. Chỉ sử dụng thông tin từ NGỮ CẢNH Y KHOA để trả lời.
+2. NẾU NGỮ CẢNH KHÔNG CHỨA THÔNG TIN ĐỂ TRẢ LỜI, BẠN TUYỆT ĐỐI KHÔNG ĐƯỢC TỰ BỊA ĐẶT (KHÔNG HALLUCINATION). Hãy trả lời chính xác câu này: "Tôi không tìm thấy thông tin này trong cơ sở dữ liệu phác đồ và dược thư của DeepMed. Vui lòng tham khảo ý kiến bác sĩ chuyên khoa."
+3. Câu trả lời phải súc tích, chuyên nghiệp và có cảnh báo y tế ở cuối.
+CÂU HỎI CỦA NGƯỜI DÙNG: {question}
+CÂU TRẢ LỜI CỦA DEEPMED-AI:"""
+    )
+    chain = medical_prompt | llm
+    response = chain.invoke({"context": context, "question": question})
+    return {"messages": [AIMessage(content=response)]}
+# Lắp ráp Đồ thị LangGraph
+workflow = StateGraph(AgentState)
+workflow.add_node("retrieve", retrieve_node)
+workflow.add_node("generate", generate_node)
+workflow.add_edge(START, "retrieve")
+workflow.add_edge("retrieve", "generate")
+workflow.add_edge("generate", END)
+app_logic = workflow.compile()
+# ==========================================
+# 3. GIAO DIỆN NGƯỜI DÙNG VỚI GRADIO
+# ==========================================
+def chat_interface(message, history):
+    # Chuyển đổi lịch sử Gradio sang định dạng LangChain Messages
+    lc_messages = []
+    for human, ai in history:
+        lc_messages.append(HumanMessage(content=human))
+        lc_messages.append(AIMessage(content=ai))
+    lc_messages.append(HumanMessage(content=message))
+    # Chạy luồng LangGraph
+    result = app_logic.invoke({"messages": lc_messages, "context": ""})
+    # Lấy tin nhắn cuối cùng (AIMessage) để hiển thị
+    return result["messages"][-1].content
+# Giao diện web
+demo = gr.ChatInterface(
+    fn=chat_interface,
+    title="⚕️ DeepMed-AI Agentic RAG",
+    description="""Trợ lý Y tế & Dược lý học ứng dụng kiến trúc Agentic RAG.
+    *Lưu ý: Hệ thống chỉ cung cấp thông tin tham khảo dựa trên tài liệu được nạp vào. Luôn tuân thủ chỉ định của bác sĩ.*""",
+    examples=["Liều dùng tối đa của Paracetamol là bao nhiêu?", "Triệu chứng của bệnh sốt xuất huyết là gì?"],
+    theme="soft"
+)
+if __name__ == "__main__":
+    demo.launch()