Spaces:

build-small-hackathon
/

tinybard

Sleeping

Hermes Bot commited on 23 days ago

Commit

780d3c3

unverified ·

1 Parent(s): 46f4d3a

fix: revert default model to Qwen/Qwen2.5-1.5B-Instruct

Qwen 2.5 7B requires paid Inference Providers on this account.
Revert to 1.5B free-tier model; users can override via config modal.

Files changed (1) hide show

shared/inference_client.py CHANGED Viewed

@@ -31,7 +31,7 @@ log = logging.getLogger("inference")
 # The HF model id used for text generation (VibeThinker 1.5B, Gemma 4 12B, etc.)
 INFERENCE_MODEL = os.environ.get(
     "INFERENCE_MODEL",
-    "Qwen/Qwen2.5-7B-Instruct",  # 7B, strong storytelling, HF Inference compatible
 )
 # Provider: "hf-inference" (free serverless), "together", "fal-ai", "replicate"

 # The HF model id used for text generation (VibeThinker 1.5B, Gemma 4 12B, etc.)
 INFERENCE_MODEL = os.environ.get(
     "INFERENCE_MODEL",
+    "Qwen/Qwen2.5-1.5B-Instruct",  # 1.5B, fast, free-tier friendly
 )
 # Provider: "hf-inference" (free serverless), "together", "fal-ai", "replicate"