Spaces:

JasonFinley0821
/

cookbook

Sleeping

App Files Files Community

JasonFinley0821 commited on Nov 21, 2025

Commit

a9e6507

1 Parent(s): 6690ca7

feat : v1

Browse files

Files changed (9) hide show

.env.example +1 -0
.gitignore +37 -0
Dockerfile +36 -0
app.py +54 -0
data/recipes.jsonl +2 -0
db/chroma_init.py +35 -0
models/model_wrapper.py +10 -0
rag.py +122 -0
requirements.txt +13 -0

.env.example ADDED Viewed

	@@ -0,0 +1 @@


1	+ GOOGLE_API_KEY=your_google_ai_api_key

.gitignore ADDED Viewed

	@@ -0,0 +1,37 @@

+# 1. 虛擬環境目錄
+.venv
+venv/
+env/
+/site-packages
+.env
+# 2. Python 編譯快取
+__pycache__/*
+*.pyc
+*.pyd
+*.so
+# 3. 測試和文件
+.pytest_cache/
+htmlcov/
+.coverage
+# 4. 編輯器/IDE 檔案 (可選，依據您使用的工具)
+.idea/          # PyCharm/IntelliJ 專案檔案
+.vscode/
+.vscode/*        # VS Code 設定 (如果不想共享)
+*.swp           # Vim 臨時檔案
+# 5. 您的靜態/媒體檔案 (保持原樣，但使用更精確的模式)
+/static/       # 忽略整個 static 資料夾
+/logs/         # 日誌檔案
+*.log
+*.sqlite3      # 如果使用 SQLite 資料庫
+# 6. db
+/chroma_db/*
+*.pth
+*.pt
+*.ckpt

Dockerfile ADDED Viewed

	@@ -0,0 +1,36 @@

+# ============================================
+# Base
+# ============================================
+FROM python:3.10-slim
+# ============================================
+# System-level deps
+# ============================================
+RUN apt-get update && apt-get install -y --no-install-recommends \
+    build-essential \
+    && rm -rf /var/lib/apt/lists/*
+# ============================================
+# Working directory
+# ============================================
+WORKDIR /app
+# ============================================
+# Install Python dependencies
+# --------------------------------------------
+# COPY requirements first for better caching
+# ============================================
+COPY requirements.txt .
+RUN pip install --upgrade pip && \
+    pip install --no-cache-dir -r requirements.txt
+# ============================================
+# Copy application source code
+# ============================================
+COPY . .
+# ============================================
+# Run FastAPI server
+# ============================================
+CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "7860"]

app.py ADDED Viewed

	@@ -0,0 +1,54 @@

+# app.py
+import os
+import uvicorn
+from fastapi import FastAPI, HTTPException
+from pydantic import BaseModel
+from dotenv import load_dotenv
+from rag import build_rag_chain
+from db.chroma_init import load_recipes_to_chroma
+load_dotenv()
+app = FastAPI(
+    title="Recipe RAG API (Gemini 2.0)",
+    description="使用 FastAPI + LangChain + Chroma + HuggingFace Embeddings 的服務",
+    version="1.0.0"
+)
+# 啟動時若 Chroma 尚未建立，嘗試載入 sample data（可按需註解）
+CHROMA_DIR = "./chroma_db"
+if not os.path.exists(CHROMA_DIR) or not os.listdir(CHROMA_DIR):
+    try:
+        print("load : chroma init")
+        load_recipes_to_chroma()
+    except Exception as e:
+        print("Warning: chroma init failed:", e)
+# 建立 RAG chain（可共用）
+RAG_CHAIN = build_rag_chain(k=4)
+class RecipeRequest(BaseModel):
+    query: str
+@app.get("/")
+def root():
+    return {"message": "COOK BOOK API ready!"}
+@app.post("/recipe")
+def generate_recipe(req: RecipeRequest):
+    if not req.query or req.query.strip() == "":
+        raise HTTPException(status_code=400, detail="query 必填")
+    try:
+        # 使用 LangChain chain 呼叫
+        output = RAG_CHAIN( req.query )
+        # output 結構通常包含 'result' 和 'source_documents'
+        result_text = output.get("result") or output.get("output_text") or str(output)
+        sources = []
+        for d in output.get("source_documents", []):
+            sources.append({"content": d.page_content, "meta": getattr(d, "metadata", {})})
+        return {"query": req.query, "recipe": result_text, "sources": sources}
+    except Exception as e:
+        raise HTTPException(status_code=500, detail=str(e))
+if __name__ == "__main__":
+    uvicorn.run("app:app", host="0.0.0.0", port=7860, reload=False)

data/recipes.jsonl ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ {"title":"番茄炒蛋","ingredients":"番茄、雞蛋、蔥、鹽、糖、油","steps":"1. 番茄切塊 2. 打蛋 3. 炒蛋 4. 加番茄同炒至熟 5. 調味"}
2	+ {"title":"三杯雞","ingredients":"雞腿、米酒、醬油、麻油、糖、九層塔","steps":"1. 雞腿切塊 2. 爆香 3. 加調味料悶煮 4. 收汁 5. 起鍋加九層塔"}

db/chroma_init.py ADDED Viewed

	@@ -0,0 +1,35 @@

+# db/chroma_init.py
+from langchain_chroma import Chroma
+from langchain_huggingface import HuggingFaceEmbeddings
+CHROMA_DIR = "./chroma_db"
+MODEL_NAME="sentence-transformers/all-MiniLM-L6-v2"
+def load_recipes_to_chroma(texts):
+    # 使用 HuggingFace Embeddings（推薦）
+    embeddings = HuggingFaceEmbeddings(
+        model_name=MODEL_NAME
+    )
+    # 建立 Chroma DB
+    db = Chroma.from_texts(
+        texts=texts,
+        embedding=embeddings,
+        persist_directory=CHROMA_DIR
+    )
+    db.persist()
+    return db
+# --- 建立 Chroma DB ---
+def get_vectordb():
+    embeddings = HuggingFaceEmbeddings(
+        model_name=MODEL_NAME
+    )
+    db = Chroma(
+        persist_directory=CHROMA_DIR,
+        embedding_function=embeddings
+    )
+    return db

models/model_wrapper.py ADDED Viewed

	@@ -0,0 +1,10 @@

+import os
+from dotenv import load_dotenv
+from langchain_google_genai import ChatGoogleGenerativeAI
+GENAI_MODEL = "gemini-2.0-flash"
+def get_llm():
+    # LangChain 的 Google Generative API 封裝
+    llm = ChatGoogleGenerativeAI(model=GENAI_MODEL)
+    return llm

rag.py ADDED Viewed

	@@ -0,0 +1,122 @@

+# rag.py
+import os
+from dotenv import load_dotenv
+# 新增：用於定義結構化輸出格式
+from typing import List, Dict, Any
+from pydantic import BaseModel, Field
+from langchain_core.prompts import SystemMessagePromptTemplate, HumanMessagePromptTemplate
+from langchain_core.prompts import PromptTemplate # 確保導入這個，用於 HumanMessage 的子模板
+from langchain_core.prompts import ChatPromptTemplate
+from models.model_wrapper import get_llm
+from db.chroma_init import get_vectordb
+from langchain_core.exceptions import OutputParserException
+# --- 🎯 食譜 Pydantic 結構定義 ---
+class Ingredient(BaseModel):
+    name: str = Field(description="材料名稱，例如：豬五花肉")
+    amount: str = Field(description="份量/數量，例如：300克 或 2大匙")
+class Recipe(BaseModel):
+    """用於儲存完整食譜的 JSON 結構"""
+    title: str = Field(description="食譜的繁體中文名稱")
+    ingredients: List[Ingredient] = Field(description="所有材料的清單")
+    steps: List[str] = Field(description="詳細的步驟說明")
+    notes: List[str] = Field(description="食譜的額外提醒或替代食材建議")
+# 定義一個包含多個 Recipe 的容器
+class RecipeList(BaseModel):
+    """用於儲存多個完整食譜的列表結構"""
+    recipes: List[Recipe] = Field(
+        description="一個包含多個食譜物件（Recipe）的列表。"
+    )
+# -----------------------------------
+# --- 將 PROMPT_TMPL 內容拆分 ---
+# 1. 系統提示 (System Prompt) - 放置角色、格式和主要限制
+SYS_TMPL = """
+你是一位專業中文料理師傅。
+請生成一個完整、易懂的繁體中文菜譜。
+請嚴格以 **純 JSON 格式** 輸出，且內容必須符合指定的 Schema。
+以下是輸出限制：
+- 優先使用資料庫中的資訊
+- 禁止憑空編造不存在的材料
+- 若必要，請在 notes 加上替代食材建議
+"""
+# 2. 用戶/輸入提示 (Human Prompt) - 放置變量輸入
+HUMAN_TMPL = """
+使用者需求：{query}
+請根據需求和資料庫上下文，生成**兩個**不同的食譜。
+資料庫上下文：
+{context}
+"""
+# --- 建立 ChatPromptTemplate ---
+# A. 建立 System Message Template
+system_message_prompt = SystemMessagePromptTemplate.from_template(SYS_TMPL)
+# B. 建立 Human Message Template (使用 PromptTemplate 包裝變量)
+human_message_prompt = HumanMessagePromptTemplate(
+    prompt=PromptTemplate(
+        input_variables=["query", "context"],
+        template=HUMAN_TMPL
+    )
+)
+# C. 組合 ChatPromptTemplate
+base_prompt = ChatPromptTemplate.from_messages([
+    system_message_prompt,
+    human_message_prompt
+])
+# --- 建立 RAG function ---
+def build_rag_chain(k=4):
+    db = get_vectordb()
+    llm = get_llm()
+    retriever = db.as_retriever(search_kwargs={"k": k})
+    structured_llm = llm.with_structured_output(RecipeList)
+    def get_context_and_query(query: str):
+        docs = retriever.invoke(query)
+        context = "\n".join([d.page_content for d in docs])
+        return {"context": context, "query": query, "docs": docs}
+    # 調整 rag 函式以返回更清晰的結果
+    def rag(query: str):
+        # ----------------------------------------------------
+        # 1. 執行檢索 (RunnableLambda 讓我們在 LCEL 外執行並拿到中間結果)
+        try:
+            input_data = get_context_and_query(query)
+            docs = input_data.pop("docs")
+        # ----------------------------------------------------
+        # 2. 建立 PromptValue
+            prompt_value = base_prompt.invoke(input_data)
+        # ----------------------------------------------------
+        # 3. 呼叫 LLM 並解析 JSON 輸出
+            answer = structured_llm.invoke(prompt_value)
+            result_dict = answer.dict()
+            final_list = result_dict.get('recipes', [])
+            return {"result": final_list, "source_documents": docs}
+        except OutputParserException as e:
+            return {"result": {"error": "LLM 輸出格式錯誤，無法解析 JSON"}, "source_documents": docs}
+        except Exception as e:
+            return {"result": {"error": f"LLM 呼叫失敗: {e}"}, "source_documents": docs}
+        # ----------------------------------------------------
+    return rag

requirements.txt ADDED Viewed

	@@ -0,0 +1,13 @@

+fastapi
+uvicorn[standard]
+langchain
+langchain-core
+langchain-community
+langchain-google-genai
+langchain-huggingface
+langchain-chroma
+chromadb
+sentence-transformers
+huggingface-hub
+python-dotenv
+pydantic