Spaces:

Corin1998
/

IR_PR_PilotPro

Sleeping

App Files Files Community

Corin1998 commited on Sep 17, 2025

Commit

3f322c7

verified ·

1 Parent(s): 04baeca

Update app/deps.py

Browse files

Files changed (1) hide show

app/deps.py +16 -9

app/deps.py CHANGED Viewed

@@ -4,10 +4,10 @@ import faiss, os, pickle, torch
 from app.config import settings
-# --- data ディレクトリの存在を保証（初回起動での書き込み失敗を防止） ---
 os.makedirs(settings.DATA_DIR, exist_ok=True)
-# Embeddings (multilingual-e5)
 emb_model = SentenceTransformer(settings.EMB_MODEL)
 # FAISS index (create or load)
@@ -20,9 +20,9 @@ if os.path.exists(index_path) and os.path.exists(store_path):
         store = pickle.load(f)
 else:
     index = faiss.IndexFlatIP(emb_model.get_sentence_embedding_dimension())
-    store = []  # list[dict]: {text, source_url, title, doc_id, chunk_id, score...}
-# Generation model (Japanese-capable small model by default)
 tok = AutoTokenizer.from_pretrained(settings.GEN_MODEL)
 model = AutoModelForCausalLM.from_pretrained(
     settings.GEN_MODEL,
@@ -30,15 +30,12 @@ model = AutoModelForCausalLM.from_pretrained(
     device_map="auto",
     low_cpu_mem_usage=True
 )
-gen = pipeline("text-generation", model=model, tokenizer=tok, max_new_tokens=800)
 def embed_texts(texts: list[str]):
-    v = emb_model.encode(texts, normalize_embeddings=True, convert_to_numpy=True, show_progress_bar=False)
-    return v
 def add_to_index(records: list[dict]):
-    # records: [{"text":..., "source_url":..., "title":..., "doc_id":..., "chunk_id":...}]
     vecs = embed_texts([r["text"] for r in records])
     index.add(vecs)
     store.extend(records)
@@ -57,3 +54,13 @@ def search(query: str, top_k=8):
         rec["score"] = float(scores[0][rank])
         hits.append(rec)
     return hits

 from app.config import settings
+# data ディレクトリの存在を保証
 os.makedirs(settings.DATA_DIR, exist_ok=True)
+# Embeddings
 emb_model = SentenceTransformer(settings.EMB_MODEL)
 # FAISS index (create or load)
         store = pickle.load(f)
 else:
     index = faiss.IndexFlatIP(emb_model.get_sentence_embedding_dimension())
+    store = []  # [{text, source_url, title, doc_id, chunk_id, ...}]
+# Text-generation model
 tok = AutoTokenizer.from_pretrained(settings.GEN_MODEL)
 model = AutoModelForCausalLM.from_pretrained(
     settings.GEN_MODEL,
     device_map="auto",
     low_cpu_mem_usage=True
 )
+gen = pipeline("text-generation", model=model, tokenizer=tok)
 def embed_texts(texts: list[str]):
+    return emb_model.encode(texts, normalize_embeddings=True, convert_to_numpy=True, show_progress_bar=False)
 def add_to_index(records: list[dict]):
     vecs = embed_texts([r["text"] for r in records])
     index.add(vecs)
     store.extend(records)
         rec["score"] = float(scores[0][rank])
         hits.append(rec)
     return hits
+def generate_chat(messages: list[dict], max_new_tokens=800, temperature=0.2):
+    """
+    messages: [{"role":"system"/"user"/"assistant", "content":"..."}]
+    """
+    prompt = tok.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
+    out = gen(prompt, do_sample=(temperature > 0.0), temperature=temperature, max_new_tokens=max_new_tokens)[0]["generated_text"]
+    # pipelineは入力+生成を返すことがあるため、プロンプトを取り除く
+    generated = out[len(prompt):].strip()
+    return generated or out