Spaces:

Subhadip007
/

researchpilot-api

Running

Subhadip007 commited on Apr 13

Commit

944fb90

1 Parent(s): 5951bbe

fix: pass HF_API_KEY as HF_TOKEN to avoid Hub rate limits when loading models

Files changed (1) hide show

config/settings.py CHANGED Viewed

@@ -78,9 +78,10 @@ TOP_K_RERANK = 5                                    # Keep top 5 after reranking
 # ------------------------------------------
 # LLM SETTINGS
-# ------------------------------------------
 GROQ_API_KEY = os.getenv('GROQ_API_KEY')            # Loaded from .env
 HF_API_KEY = os.getenv('HF_API_KEY')
 LLM_MODEL_NAME = 'llama-3.3-70b-versatile'          # Groq model ID
 LLM_TEMPERATURE = 0.1                               # Low = More factual/consistent
 LLM_MAX_TOKENS = 2048                               # Max response tokens

 # ------------------------------------------
 # LLM SETTINGS
 GROQ_API_KEY = os.getenv('GROQ_API_KEY')            # Loaded from .env
 HF_API_KEY = os.getenv('HF_API_KEY')
+if HF_API_KEY:
+    os.environ["HF_TOKEN"] = HF_API_KEY
 LLM_MODEL_NAME = 'llama-3.3-70b-versatile'          # Groq model ID
 LLM_TEMPERATURE = 0.1                               # Low = More factual/consistent
 LLM_MAX_TOKENS = 2048                               # Max response tokens