Spaces:

IA2
/

IA2_model

Sleeping

App Files Files Community

AshenClock commited on Sep 8

Commit

d72ce3d

verified ·

1 Parent(s): 4388f57

Update app.py

Browse files

Files changed (1) hide show

app.py +29 -17

app.py CHANGED Viewed

@@ -7,6 +7,11 @@ import rdflib
 from rdflib.plugins.sparql.parser import parseQuery
 from huggingface_hub import InferenceClient
 import re
 # ---------------------------------------------------------------------------
 # CONFIGURAZIONE LOGGING
 # ---------------------------------------------------------------------------
@@ -23,12 +28,20 @@ logger = logging.getLogger(__name__)
 # Nota: HF_API_KEY deve essere impostata a una chiave valida di Hugging Face.
 HF_API_KEY = os.getenv("HF_API_KEY")
 if not HF_API_KEY:
-    # Se la chiave API non è impostata, solleva un errore
     logger.error("HF_API_KEY non impostata.")
     raise EnvironmentError("HF_API_KEY non impostata.")
 # Nome del modello Hugging Face per generare query SPARQL e risposte finali
-HF_MODEL = "meta-llama/Llama-3.3-70B-Instruct"
 # Nome del modello Hugging Face per rilevamento lingua
 LANG_DETECT_MODEL = "papluca/xlm-roberta-base-language-detection"
@@ -46,11 +59,8 @@ continuamente nuovi oggetti InferenceClient a ogni chiamata delle funzioni.
 - lang_detect_client: per rilevare la lingua della domanda e della risposta
 """
 try:
-    logger.info("[Startup] Inizializzazione client HF per generazione (modello di LLM).")
-    hf_generation_client = InferenceClient(
-        token=HF_API_KEY,
-        model=HF_MODEL
-    )
     logger.info("[Startup] Inizializzazione client HF per rilevamento lingua.")
     lang_detect_client = InferenceClient(
         token=HF_API_KEY,
@@ -390,15 +400,16 @@ def assistant_endpoint(req: AssistantRequest):
     # Chiamata al modello per generare la query SPARQL
     try:
         logger.debug("[assistant_endpoint] Chiamata HF per generare la query SPARQL...")
-        gen_sparql_output = hf_generation_client.chat.completions.create(
-            messages=[
-                {"role": "system", "content": system_prompt_sparql},
-                {"role": "user", "content": user_message}
-            ],
-            max_tokens=512,       # max_tokens per la generazione della query
-            temperature=0.2       # temperatura bassa per avere risposte più "deterministiche"
         )
-        possible_query = gen_sparql_output["choices"][0]["message"]["content"].strip()
         logger.info(f"[assistant_endpoint] Query generata dal modello: {possible_query}")
     except Exception as ex:
         logger.error(f"Errore nella generazione della query SPARQL: {ex}")
@@ -483,7 +494,8 @@ def assistant_endpoint(req: AssistantRequest):
     # Chiamata finale al modello per la risposta "guida museale"
     try:
         logger.debug("[assistant_endpoint] Chiamata HF per generare la risposta finale...")
-        final_output = hf_generation_client.chat.completions.create(
             messages=[
                 {"role": "system", "content": second_prompt},
                 {"role": "user", "content": "Fornisci la risposta finale."}
@@ -491,7 +503,7 @@ def assistant_endpoint(req: AssistantRequest):
             max_tokens=512,
             temperature=0.5
         )
-        final_answer = final_output["choices"][0]["message"]["content"].strip()
         logger.info(f"[assistant_endpoint] Risposta finale generata: {final_answer}")
     except Exception as ex:
         logger.error(f"Errore nella generazione della risposta finale: {ex}")

 from rdflib.plugins.sparql.parser import parseQuery
 from huggingface_hub import InferenceClient
 import re
+from openai import OpenAI
+from dotenv import load_dotenv, find_dotenv
+# Carica variabili da .env (senza sovrascrivere variabili già presenti nell'ambiente)
+load_dotenv(find_dotenv(), override=False)
 # ---------------------------------------------------------------------------
 # CONFIGURAZIONE LOGGING
 # ---------------------------------------------------------------------------
 # Nota: HF_API_KEY deve essere impostata a una chiave valida di Hugging Face.
 HF_API_KEY = os.getenv("HF_API_KEY")
 if not HF_API_KEY:
     logger.error("HF_API_KEY non impostata.")
     raise EnvironmentError("HF_API_KEY non impostata.")
+DEEPSEEK_API_KEY = os.getenv("DEEPSEEK_API_KEY")
+if not DEEPSEEK_API_KEY:
+    logger.error("DEEPSEEK_API_KEY non impostata.")
+    raise EnvironmentError("DEEPSEEK_API_KEY non impostata.")
+DEEPSEEK_MODEL = os.getenv("DEEPSEEK_MODEL", "deepseek-chat")
 # Nome del modello Hugging Face per generare query SPARQL e risposte finali
+logger.info(f"DeepSeek model: {DEEPSEEK_MODEL}")
+logger.info(f"HF key loaded: {'OK' if HF_API_KEY else 'MISSING'}")
+logger.info(f"DeepSeek key loaded: {'OK' if DEEPSEEK_API_KEY else 'MISSING'}")
 # Nome del modello Hugging Face per rilevamento lingua
 LANG_DETECT_MODEL = "papluca/xlm-roberta-base-language-detection"
 - lang_detect_client: per rilevare la lingua della domanda e della risposta
 """
 try:
+    logger.info("[Startup] Inizializzazione client DeepSeek (OpenAI SDK).")
+    deepseek_client = OpenAI(api_key=DEEPSEEK_API_KEY, base_url="https://api.deepseek.com/v1")
     logger.info("[Startup] Inizializzazione client HF per rilevamento lingua.")
     lang_detect_client = InferenceClient(
         token=HF_API_KEY,
     # Chiamata al modello per generare la query SPARQL
     try:
         logger.debug("[assistant_endpoint] Chiamata HF per generare la query SPARQL...")
+        gen_sparql_output = deepseek_client.chat.completions.create(
+        model=DEEPSEEK_MODEL,
+        messages=[
+            {"role": "system", "content": system_prompt_sparql},
+            {"role": "user", "content": user_message}
+        ],
+        max_tokens=512,
+        temperature=0.2
         )
+        possible_query = gen_sparql_output.choices[0].message.content.strip()
         logger.info(f"[assistant_endpoint] Query generata dal modello: {possible_query}")
     except Exception as ex:
         logger.error(f"Errore nella generazione della query SPARQL: {ex}")
     # Chiamata finale al modello per la risposta "guida museale"
     try:
         logger.debug("[assistant_endpoint] Chiamata HF per generare la risposta finale...")
+        final_output = deepseek_client.chat.completions.create(
+            model=DEEPSEEK_MODEL,
             messages=[
                 {"role": "system", "content": second_prompt},
                 {"role": "user", "content": "Fornisci la risposta finale."}
             max_tokens=512,
             temperature=0.5
         )
+        final_answer = final_output.choices[0].message.content.strip()
         logger.info(f"[assistant_endpoint] Risposta finale generata: {final_answer}")
     except Exception as ex:
         logger.error(f"Errore nella generazione della risposta finale: {ex}")