Spaces:

RayMelius
/

soci2

Running

RayMelius Claude Sonnet 4.6 commited on 16 days ago

Commit

24aef56

1 Parent(s): ecac5f6

Fix HF provider: require token, hide from menu if absent, fix stuck provider

- HFInferenceClient.__init__ now raises ValueError if no token found
(checks HF_TOKEN, HUGGINGFACE_TOKEN, HF_API_TOKEN); prevents silently
creating a broken client that gets stuck as active provider
- /llm/providers: HF models only shown when token is available
- /llm/provider: ValueError from missing credentials returns 400 not 500
- Fix Gemini label: "1.5 Flash" (matches actual default model)

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>

Files changed (2) hide show

src/soci/api/routes.py +13 -5
src/soci/engine/llm.py +9 -3

src/soci/api/routes.py CHANGED Viewed

@@ -279,11 +279,17 @@ async def get_llm_providers():
     if os.environ.get("GROQ_API_KEY"):
         providers.append({"id": "groq",    "label": "Groq Llama 8B",       "icon": "⚡", "model": ""})
     if os.environ.get("GEMINI_API_KEY"):
-        providers.append({"id": "gemini",  "label": "Gemini 2.0 Flash",    "icon": "✦", "model": ""})
-    providers.append({"id": "hf", "model": "HuggingFaceH4/zephyr-7b-beta",           "label": "HF Zephyr 7B",    "icon": "🤗"})
-    providers.append({"id": "hf", "model": "Qwen/Qwen2.5-7B-Instruct",               "label": "HF Qwen 2.5 7B",  "icon": "🤗"})
-    providers.append({"id": "hf", "model": "meta-llama/Llama-3.2-3B-Instruct",       "label": "HF Llama 3.2 3B", "icon": "🤗"})
-    providers.append({"id": "hf", "model": "mistralai/Mistral-7B-Instruct-v0.3",     "label": "HF Mistral 7B",   "icon": "🤗"})
     providers.append({"id": "ollama", "label": "Ollama (local)",           "icon": "🦙", "model": ""})
     return {"current": current, "current_model": current_model, "providers": providers}
@@ -318,6 +324,8 @@ async def set_llm_provider(req: SwitchProviderRequest):
     try:
         await switch_llm_provider(req.provider, model=req.model or None)
         return {"ok": True, "provider": req.provider, "model": req.model}
     except Exception as e:
         raise HTTPException(status_code=500, detail=str(e))

     if os.environ.get("GROQ_API_KEY"):
         providers.append({"id": "groq",    "label": "Groq Llama 8B",       "icon": "⚡", "model": ""})
     if os.environ.get("GEMINI_API_KEY"):
+        providers.append({"id": "gemini",  "label": "Gemini 1.5 Flash",    "icon": "✦", "model": ""})
+    has_hf = bool(
+        os.environ.get("HF_TOKEN")
+        or os.environ.get("HUGGINGFACE_TOKEN")
+        or os.environ.get("HF_API_TOKEN")
+    )
+    if has_hf:
+        providers.append({"id": "hf", "model": "HuggingFaceH4/zephyr-7b-beta",           "label": "HF Zephyr 7B",    "icon": "🤗"})
+        providers.append({"id": "hf", "model": "Qwen/Qwen2.5-7B-Instruct",               "label": "HF Qwen 2.5 7B",  "icon": "🤗"})
+        providers.append({"id": "hf", "model": "meta-llama/Llama-3.2-3B-Instruct",       "label": "HF Llama 3.2 3B", "icon": "🤗"})
+        providers.append({"id": "hf", "model": "mistralai/Mistral-7B-Instruct-v0.3",     "label": "HF Mistral 7B",   "icon": "🤗"})
     providers.append({"id": "ollama", "label": "Ollama (local)",           "icon": "🦙", "model": ""})
     return {"current": current, "current_model": current_model, "providers": providers}
     try:
         await switch_llm_provider(req.provider, model=req.model or None)
         return {"ok": True, "provider": req.provider, "model": req.model}
+    except ValueError as e:
+        raise HTTPException(status_code=400, detail=str(e))
     except Exception as e:
         raise HTTPException(status_code=500, detail=str(e))

src/soci/engine/llm.py CHANGED Viewed

@@ -951,10 +951,16 @@ class HFInferenceClient:
         default_model: str = MODEL_HF_SMOL,
         max_retries: int = 3,
     ) -> None:
-        self.api_key = api_key or os.environ.get("HF_TOKEN", "")
         if not self.api_key:
-            logger.warning(
-                "HF_TOKEN is not set — HF Inference will not make LLM calls."
             )
         self.default_model = default_model
         self.max_retries = max_retries

         default_model: str = MODEL_HF_SMOL,
         max_retries: int = 3,
     ) -> None:
+        self.api_key = (
+            api_key
+            or os.environ.get("HF_TOKEN", "")
+            or os.environ.get("HUGGINGFACE_TOKEN", "")
+            or os.environ.get("HF_API_TOKEN", "")
+        )
         if not self.api_key:
+            raise ValueError(
+                "No HuggingFace token found. Set HF_TOKEN (or HUGGINGFACE_TOKEN) "
+                "to a token with 'Inference Providers (Write)' permission."
             )
         self.default_model = default_model
         self.max_retries = max_retries