Spaces:

sharktide
/

lightning

Running

App Files Files Community

sharktide commited on 5 days ago

Commit

8a11f7f

verified ·

1 Parent(s): a3c6658

Update gen.py

Browse files

Files changed (1) hide show

gen.py +18 -16

gen.py CHANGED Viewed

@@ -521,6 +521,8 @@ MODEL_MAP = {
     "gpt-4o-mini": "OpenAI GPT 4o Mini",
     "gpt-4.1": "OpenAI GPT 4.1",
     "nemotron-3-super": "NVIDIA Nemotron 3 Super",
     "openai/gpt-oss-120b": "OpenAI GPT-OSS 120B",
     "openai/gpt-oss-20b": "OpenAI GPT-OSS 20B",
     "qwen-3-235b-a22b-instruct-2507": "Qwen3 Instruct",
@@ -597,8 +599,8 @@ async def generate_text(
                 chosen_model = "nemotron-3-super"
                 provider = "navy"
             elif score >= 4:
-                chosen_model = "openai/gpt-oss-120b"
-                provider = "groq"
             else:
                 chosen_model = "openai/gpt-oss-20b"
                 provider = "groq"
@@ -610,11 +612,11 @@ async def generate_text(
                 provider = "navy"
             elif score >= 4:
-                chosen_model = "llama-3.3-70b-versatile"
-                provider = "groq"
         elif score >= 4:
-            chosen_model = "meta-llama/llama-4-scout-17b-16e-instruct"
             provider = "groq"
         elif score >= 6:
@@ -624,8 +626,8 @@ async def generate_text(
         if provider == "groq" and (
             total_chars > MAX_GROQ_PROMPT_CHARS or total_bytes > MAX_GROQ_PROMPT_BYTES
         ):
-            provider = "navy"
-            chosen_model = "gpt-4o-mini"
     await check_chat_rate_limit(request, authorization, x_client_id)
@@ -883,12 +885,12 @@ async def analyze_prompt(
         if kw in prompt_text:
             score += 1
-    chosen_model = "llama-3.3-70b-versatil"
     provider = "groq"
     has_images = contains_images(messages)
     if has_images:
-        chosen_model = "gpt-4o-mini"
         provider = "navy vision"
     else:
         if score > 10:
@@ -898,8 +900,8 @@ async def analyze_prompt(
                 chosen_model = "nemotron-3-super"
                 provider = "navy"
             elif score >= 4:
-                chosen_model = "openai/gpt-oss-120b"
-                provider = "groq"
             else:
                 chosen_model = "openai/gpt-oss-20b"
                 provider = "groq"
@@ -911,11 +913,11 @@ async def analyze_prompt(
                 provider = "navy"
             elif score >= 4:
-                chosen_model = "llama-3.3-70b-versatile"
-                provider = "groq"
         elif score >= 4:
-            chosen_model = "meta-llama/llama-4-scout-17b-16e-instruct"
             provider = "groq"
         elif score >= 6:
@@ -925,8 +927,8 @@ async def analyze_prompt(
         if provider == "groq" and (
             total_chars > MAX_GROQ_PROMPT_CHARS or total_bytes > MAX_GROQ_PROMPT_BYTES
         ):
-            provider = "navy"
-            chosen_model = "gpt-4o-mini"
     return { MODEL_MAP[chosen_model] }

     "gpt-4o-mini": "OpenAI GPT 4o Mini",
     "gpt-4.1": "OpenAI GPT 4.1",
     "nemotron-3-super": "NVIDIA Nemotron 3 Super",
+    "gpt-oss-120b"; "OpenAI GPT-OSS 120B",
+    "zai-glm-4.7": "Z.AI GLM 4.7",
     "openai/gpt-oss-120b": "OpenAI GPT-OSS 120B",
     "openai/gpt-oss-20b": "OpenAI GPT-OSS 20B",
     "qwen-3-235b-a22b-instruct-2507": "Qwen3 Instruct",
                 chosen_model = "nemotron-3-super"
                 provider = "navy"
             elif score >= 4:
+                chosen_model = "gpt-oss-120b"
+                provider = "cerebras"
             else:
                 chosen_model = "openai/gpt-oss-20b"
                 provider = "groq"
                 provider = "navy"
             elif score >= 4:
+                chosen_model = "zai-glm-4.7"
+                provider = "cerebras"
         elif score >= 4:
+            chosen_model = "openai/gpt-oss-120b"
             provider = "groq"
         elif score >= 6:
         if provider == "groq" and (
             total_chars > MAX_GROQ_PROMPT_CHARS or total_bytes > MAX_GROQ_PROMPT_BYTES
         ):
+            provider = "cerebras"
+            chosen_model = "gpt-oss-120b"
     await check_chat_rate_limit(request, authorization, x_client_id)
         if kw in prompt_text:
             score += 1
+    chosen_model = "llama-3.3-70b-versatile"
     provider = "groq"
     has_images = contains_images(messages)
     if has_images:
+        chosen_model = "gpt-4.1"
         provider = "navy vision"
     else:
         if score > 10:
                 chosen_model = "nemotron-3-super"
                 provider = "navy"
             elif score >= 4:
+                chosen_model = "gpt-oss-120b"
+                provider = "cerebras"
             else:
                 chosen_model = "openai/gpt-oss-20b"
                 provider = "groq"
                 provider = "navy"
             elif score >= 4:
+                chosen_model = "zai-glm-4.7"
+                provider = "cerebras"
         elif score >= 4:
+            chosen_model = "openai/gpt-oss-120b"
             provider = "groq"
         elif score >= 6:
         if provider == "groq" and (
             total_chars > MAX_GROQ_PROMPT_CHARS or total_bytes > MAX_GROQ_PROMPT_BYTES
         ):
+            provider = "cerebras"
+            chosen_model = "gpt-oss-120b"
     return { MODEL_MAP[chosen_model] }