Spaces:

Geoeasy
/

CVchat

Running

App Files Files Community

Geoeasy commited on Jul 29, 2025

Commit

f1092dc

verified ·

1 Parent(s): 721f21e

Update app.py

Browse files

Files changed (1) hide show

app.py +10 -54

app.py CHANGED Viewed

@@ -8,63 +8,18 @@ from langchain_community.document_loaders import PyPDFLoader
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 # ----------------------------
-# NVIDIA API Key (via Space Variables & Secrets)
 # ----------------------------
-NV_API_KEY = os.environ.get("NV_API_KEY")
-if not NV_API_KEY:
-    raise RuntimeError(
-        "🔒 NV_API_KEY not set. Configure it under Settings → Variables & Secrets."
-    )
-# NVIDIA-compatible OpenAI client for chat & embeddings
-client = OpenAI(
-    base_url="https://integrate.api.nvidia.com/v1",
-    api_key=NV_API_KEY
-)
-CHAT_MODEL  = "meta/llama3-8b-instruct"
-EMBED_MODEL = "nvidia/embedding-1"
-# ----------------------------
-# App Configuration
-# ----------------------------
-APP_TITLE = "CVchat – Ronaldo Menezes"
-INTRO = (
-    "👋 Olá! Eu sou o CVchat do Ronaldo Menezes.\n"
-    "Converse sobre minha experiência, projetos, tecnologias, resultados e muito mais.\n\n"
-    "Exemplos de perguntas:\n"
-    "• Quem é o Ronaldo Menezes\n"
-    "• Resuma sua experiência com Process Mining.\n"
-    "• Que linguagens e ferramentas você domina?\n"
-    "• Fale de um projeto com financiamento público que você liderou.\n"
-)
-SUGGESTION_QUESTIONS = [
-    "Links & exemplos de trabalhos",
-    "Quais tecnologias você mais usa?",
-    "Resuma sua experiência com Machine Learning.",
-    "Artigo sobre Landsat ou Sentinel?",
-    "Você já trabalhou com mainframe/COBOL?",
-    "Certificações?",
-]
-# Paths for files generated by build_index.py
-INDEX_FILE  = "r_docs.index"
-CHUNKS_FILE = "r_chunks.npy"
-PDF_PATH    = "CV-Ronaldo_Menezes_2025_06.pdf"
-# verify index files exist
-if not Path(INDEX_FILE).exists() or not Path(CHUNKS_FILE).exists():
-    raise FileNotFoundError(
-        "Index not found. Please run first:\n  python build_index.py"
-    )
-# load FAISS index and chunks
-tmp_index = faiss.read_index(INDEX_FILE)
-chunks    = np.load(CHUNKS_FILE, allow_pickle=True)
-# ----------------------------
-# Context retrieval via NVIDIA Embeddings API
-# ----------------------------
 def retrieve_context(query: str, k: int = 4) -> str:
     # call NVIDIA embeddings
     try:
         resp = client.embeddings.create(
@@ -183,3 +138,4 @@ with gr.Blocks(title=APP_TITLE, css=custom_css, theme=gr.themes.Base()) as demo:
 if __name__ == "__main__":
     demo.launch(server_name="0.0.0.0", server_port=7860)

 from langchain.text_splitter import RecursiveCharacterTextSplitter
 # ----------------------------
+# Context retrieval using local SentenceTransformer embeddings
 # ----------------------------
+# Embedding model for context retrieval (local)
+embedding_model = SentenceTransformer('all-MiniLM-L6-v2')
 def retrieve_context(query: str, k: int = 4) -> str:
+    # encode locally
+    q_emb = embedding_model.encode([query], convert_to_numpy=True)
+    _, I = index.search(q_emb, k)
+    return "
+---
+".join(chunks[i] for i in I[0])(query: str, k: int = 4) -> str:
     # call NVIDIA embeddings
     try:
         resp = client.embeddings.create(
 if __name__ == "__main__":
     demo.launch(server_name="0.0.0.0", server_port=7860)