Spaces:

Malaji71
/

Quoota_RAG

Running

App Files Files Community

Malaji71 commited on Dec 4, 2025

Commit

585c7bd

verified ·

1 Parent(s): c62dd51

Update rag7.py

Browse files

Files changed (1) hide show

rag7.py +8 -5

rag7.py CHANGED Viewed

@@ -6,19 +6,17 @@ import os
 from sentence_transformers import SentenceTransformer
 from huggingface_hub import InferenceClient
-# === CONFIGURACIÓN ===
 MODEL_NAME = "openai/gpt-oss-20b"
 HF_TOKEN = os.getenv("HF_TOKEN")
 if not HF_TOKEN:
     raise RuntimeError("❌ HF_TOKEN no encontrado en rag7.py")
-# === CARGAR FAISS RAG7 ===
 index_path = "nlp_index.faiss"
 docs_path = "nlp_docs.pkl"
 if not os.path.exists(index_path) or not os.path.exists(docs_path):
-    raise FileNotFoundError("❌ Faltan archivos de RAG7: nlp_index.faiss o nlp_docs.pkl")
 index = faiss.read_index(index_path)
 with open(docs_path, "rb") as f:
@@ -28,7 +26,8 @@ with open(docs_path, "rb") as f:
 embedding_model = SentenceTransformer('all-MiniLM-L6-v2')
-def retrieve_context(query: str, k: int = 2) -> str:
     try:
         emb = embedding_model.encode([query], convert_to_numpy=True).astype('float32')
         emb = emb / np.linalg.norm(emb)
@@ -39,6 +38,10 @@ def retrieve_context(query: str, k: int = 2) -> str:
 def generate_practical_guide(message: str, temperature=0.7, top_p=0.95, max_tokens=2048) -> str:
     context = retrieve_context(message)
     if context:
         full_prompt = (
             f"Responde usando únicamente la siguiente información de contexto. Si el contexto no responde la pregunta, usa tu conocimiento general pero sé honesto sobre sus límites.\n\n"
@@ -50,7 +53,7 @@ def generate_practical_guide(message: str, temperature=0.7, top_p=0.95, max_toke
     client = InferenceClient(token=HF_TOKEN, model=MODEL_NAME, timeout=60)
     messages = [
-        {"role": "system", "content": "Eres un asistente experto en desarrollo humano. Responde con claridad, profundidad y empatía, citando conceptos de los libros si es relevante."},
         {"role": "user", "content": full_prompt}
     ]

 from sentence_transformers import SentenceTransformer
 from huggingface_hub import InferenceClient
 MODEL_NAME = "openai/gpt-oss-20b"
 HF_TOKEN = os.getenv("HF_TOKEN")
 if not HF_TOKEN:
     raise RuntimeError("❌ HF_TOKEN no encontrado en rag7.py")
 index_path = "nlp_index.faiss"
 docs_path = "nlp_docs.pkl"
 if not os.path.exists(index_path) or not os.path.exists(docs_path):
+    raise FileNotFoundError("❌ Faltan archivos de RAG7")
 index = faiss.read_index(index_path)
 with open(docs_path, "rb") as f:
 embedding_model = SentenceTransformer('all-MiniLM-L6-v2')
+def retrieve_context(query: str, k: int = 3) -> str:
+    """Recupera los 3 fragmentos más relevantes (aumentado de 2 a 3 para más contexto)"""
     try:
         emb = embedding_model.encode([query], convert_to_numpy=True).astype('float32')
         emb = emb / np.linalg.norm(emb)
 def generate_practical_guide(message: str, temperature=0.7, top_p=0.95, max_tokens=2048) -> str:
     context = retrieve_context(message)
+    # ✅ Prompt del sistema idéntico al de tu Space público
+    system_message = "Eres un asistente experto en desarrollo humano. Responde con claridad, profundidad y empatía, citando conceptos de los libros si es relevante."
     if context:
         full_prompt = (
             f"Responde usando únicamente la siguiente información de contexto. Si el contexto no responde la pregunta, usa tu conocimiento general pero sé honesto sobre sus límites.\n\n"
     client = InferenceClient(token=HF_TOKEN, model=MODEL_NAME, timeout=60)
     messages = [
+        {"role": "system", "content": system_message},
         {"role": "user", "content": full_prompt}
     ]