Spaces:

Yermek68
/

eroha-agentapi

Running

App Files Files Community

Yermek68 commited on 4 days ago

Commit

c5f1e55

verified ·

1 Parent(s): e08a706

Create core/models.py

Browse files

Files changed (1) hide show

core/models.py +93 -12

core/models.py CHANGED Viewed

@@ -1,15 +1,96 @@
 import requests
-def query_hf_model(prompt: str, model: str = "microsoft/phi-3.5-mini-instruct") -> str:
-    api_url = f"https://api-inference.huggingface.co/models/{model}"
-    response = requests.post(api_url, headers={"Content-Type": "application/json"}, json={"inputs": prompt})
-    if response.status_code == 200:
-        try:
             data = response.json()
-            if isinstance(data, list) and len(data) > 0 and "generated_text" in data[0]:
-                return data[0]["generated_text"].strip()
-            return data
-        except Exception:
-            return response.text
-    else:
-        return f"⚠️ Ошибка модели: {response.status_code} — {response.text}"

 import requests
+import random
+import time
+# ===============================
+# 🤖 Eroha AgentAPI — Auto Model Selector (Guru+ Edition)
+# ===============================
+# 🧠 Основные доступные модели (все работают через бесплатный HF Inference API)
+AVAILABLE_MODELS = {
+    "mistralai/Mistral-7B-Instruct-v0.2": {
+        "desc": "Универсальная reasoning-модель с высокой точностью ответов",
+        "tier": "balanced"
+    },
+    "google/gemma-2b-it": {
+        "desc": "Быстрая и лёгкая модель, подходит для коротких ответов и диалогов",
+        "tier": "fast"
+    },
+    "tiiuae/falcon-7b-instruct": {
+        "desc": "Разговорная модель с нейтральным стилем",
+        "tier": "chat"
+    },
+    "meta-llama/Llama-3-8b-instruct": {
+        "desc": "Очень сильная reasoning-модель, но может быть медленной при cold start",
+        "tier": "guru"
+    }
+}
+# 🌐 Hugging Face Inference API базовый URL
+HF_API_BASE = "https://api-inference.huggingface.co/models/"
+def auto_select_model(prompt: str) -> str:
+    """
+    Автоматически выбирает модель в зависимости от типа запроса.
+    """
+    p = prompt.lower()
+    if any(x in p for x in ["почему", "объясни", "анализ", "расскажи подробно", "compare", "explain"]):
+        return "mistralai/Mistral-7B-Instruct-v0.2"  # аналитические вопросы
+    if any(x in p for x in ["коротко", "в двух словах", "summary", "резюме", "описание"]):
+        return "google/gemma-2b-it"  # быстрые ответы
+    if any(x in p for x in ["напиши", "создай", "придумай", "творческий", "creative"]):
+        return "tiiuae/falcon-7b-instruct"  # креатив
+    # fallback (по умолчанию “гуру”)
+    return "meta-llama/Llama-3-8b-instruct"
+def query_hf_model(prompt: str) -> str:
+    """
+    Отправляет запрос в Hugging Face Inference API с автоматическим выбором модели.
+    """
+    model = auto_select_model(prompt)
+    api_url = f"{HF_API_BASE}{model}"
+    headers = {"Content-Type": "application/json"}
+    payload = {"inputs": prompt, "options": {"wait_for_model": True}}
+    print(f"🧠 Выбрана модель: {model}")
+    try:
+        response = requests.post(api_url, headers=headers, json=payload, timeout=90)
+        if response.status_code == 200:
             data = response.json()
+            if isinstance(data, list) and len(data) > 0:
+                if "generated_text" in data[0]:
+                    return data[0]["generated_text"].strip()
+                elif isinstance(data[0], str):
+                    return data[0].strip()
+            elif isinstance(data, dict):
+                return data.get("generated_text", str(data))
+            return str(data)
+        elif response.status_code == 503:
+            return "⏳ Модель просыпается... подожди несколько секунд и повтори запрос."
+        elif response.status_code == 401:
+            return "🔒 Требуется Hugging Face API Token — добавь его в настройки Space."
+        elif response.status_code == 404:
+            return f"⚠️ Модель {model} временно недоступна. Попробуй снова или измени запрос."
+        else:
+            return f"⚠️ Ошибка API ({response.status_code}): {response.text[:200]}"
+    except Exception as e:
+        return f"❌ Ошибка соединения с HF API: {str(e)}"
+if __name__ == "__main__":
+    # 🔧 Тест при локальном запуске
+    test_prompt = "Объясни, как работает квантовая суперпозиция"
+    print("🧩 Ответ:", query_hf_model(test_prompt))