Spaces:

arshenoy
/

somAI

Runtime error

App Files Files Community

arshenoy commited on Dec 3, 2025

Commit

e5bb0d3

verified ·

1 Parent(s): 04c9599

Update services/geminiService.ts

Browse files

Files changed (1) hide show

services/geminiService.ts +7 -7

services/geminiService.ts CHANGED Viewed

@@ -29,11 +29,11 @@ const ai = new GoogleGenAI({ apiKey: API_KEY });
 // --- TIERED MODEL STRATEGY ---
 // 1. Primary: Gemini 2.5 Flash (Highest Quality/Speed Balance)
-// 2. Secondary: Gemini Flash Lite (Quota Rescue)
 // 3. Tertiary: Local/HuggingFace Backends (Privacy/Offline/No-Quota Fallback)
 const MODEL_PRIMARY = 'gemini-2.5-flash';
-const MODEL_SECONDARY = 'gemini-flash-lite-latest';
-const MODEL_TTS = 'gemini-2.5-flash-preview-tts';
 // --- UTILITIES ---
 const cleanText = (text: string) => {
@@ -139,14 +139,14 @@ async function executePipeline<T>(
     try {
         // 1. Primary Model
-        if (onStatus) onStatus("⚡ Using Gemini Flash...");
         return await geminiTask(MODEL_PRIMARY);
     } catch (error: any) {
         // Check for Quota/Rate Limits or Model Overload
         if (error.toString().includes('429') || error.toString().includes('Quota') || error.toString().includes('503')) {
             try {
                 // 2. Secondary Model
-                if (onStatus) onStatus("⚠️ Quota limit. Switching to Flash-Lite...");
                 return await geminiTask(MODEL_SECONDARY);
             } catch (secondaryError) {
                 console.warn("Secondary model failed:", secondaryError);
@@ -295,7 +295,7 @@ export const analyzeRisk = async (
     });
     const parsed = parseRiskResponse(response.text || "{}", calculatedScore);
-    return { ...parsed, source: model === MODEL_PRIMARY ? 'Gemini 2.5 Flash' : 'Gemini Flash Lite' };
   };
   const fallbackTask = async () => {
@@ -329,7 +329,7 @@ export const generateChatResponse = async (
   contents.push({ role: 'user', parts: [{ text: context + "\nUser: " + currentMessage }, ...(image ? [{ inlineData: { mimeType: 'image/jpeg', data: image.split('base64,')[1] } }] : [])] });
   const geminiTask = async (model: string) => {
-    onSource(model === MODEL_PRIMARY ? 'Gemini 2.5 Flash' : 'Gemini Flash Lite');
     const response = await ai.models.generateContent({
         model: model,
         contents: contents,

 // --- TIERED MODEL STRATEGY ---
 // 1. Primary: Gemini 2.5 Flash (Highest Quality/Speed Balance)
+// 2. Secondary: Gemini 2.5 Flash Lite (Quota Rescue / Higher Throughput)
 // 3. Tertiary: Local/HuggingFace Backends (Privacy/Offline/No-Quota Fallback)
 const MODEL_PRIMARY = 'gemini-2.5-flash';
+const MODEL_SECONDARY = 'gemini-2.5-flash-lite';
+const MODEL_TTS = 'gemini-2.5-flash-tts';
 // --- UTILITIES ---
 const cleanText = (text: string) => {
     try {
         // 1. Primary Model
+        if (onStatus) onStatus("⚡ Using Gemini 2.5 Flash...");
         return await geminiTask(MODEL_PRIMARY);
     } catch (error: any) {
         // Check for Quota/Rate Limits or Model Overload
         if (error.toString().includes('429') || error.toString().includes('Quota') || error.toString().includes('503')) {
             try {
                 // 2. Secondary Model
+                if (onStatus) onStatus("⚠️ Quota limit. Switching to 2.5 Flash Lite...");
                 return await geminiTask(MODEL_SECONDARY);
             } catch (secondaryError) {
                 console.warn("Secondary model failed:", secondaryError);
     });
     const parsed = parseRiskResponse(response.text || "{}", calculatedScore);
+    return { ...parsed, source: model === MODEL_PRIMARY ? 'Gemini 2.5 Flash' : 'Gemini 2.5 Flash Lite' };
   };
   const fallbackTask = async () => {
   contents.push({ role: 'user', parts: [{ text: context + "\nUser: " + currentMessage }, ...(image ? [{ inlineData: { mimeType: 'image/jpeg', data: image.split('base64,')[1] } }] : [])] });
   const geminiTask = async (model: string) => {
+    onSource(model === MODEL_PRIMARY ? 'Gemini 2.5 Flash' : 'Gemini 2.5 Flash Lite');
     const response = await ai.models.generateContent({
         model: model,
         contents: contents,