Spaces:
Sleeping
Sleeping
Update README.md
Browse files
README.md
CHANGED
|
@@ -1,129 +1,52 @@
|
|
| 1 |
-
|
| 2 |
-
title: Eroha AgentAPI v5.8
|
| 3 |
-
emoji: 🤖
|
| 4 |
-
colorFrom: indigo
|
| 5 |
-
colorTo: purple
|
| 6 |
-
sdk: gradio
|
| 7 |
-
sdk_version: 4.44.1
|
| 8 |
-
app_file: app.py
|
| 9 |
-
pinned: false
|
| 10 |
-
license: mit
|
| 11 |
-
---
|
| 12 |
-
|
| 13 |
-
# 🤖 Eroha AgentAPI v5.8 — AutoRecovery + Smart Dashboard Edition
|
| 14 |
-
|
| 15 |
-
> **Production-grade AI Infrastructure built for Hugging Face Spaces**
|
| 16 |
-
> Разработано архитектурой уровня Enterprise для полной автономности и стабильности.
|
| 17 |
-
|
| 18 |
-
---
|
| 19 |
-
|
| 20 |
-
## 🚀 Ключевые особенности
|
| 21 |
-
|
| 22 |
-
✅ **Auto Token Recovery** — автоматическая проверка и восстановление токена Hugging Face
|
| 23 |
-
✅ **Circuit Breaker FSM** — защита от каскадных ошибок Router API
|
| 24 |
-
✅ **Watchdog Monitoring** — автоматический health-check каждые 5 минут
|
| 25 |
-
✅ **Fallback Engine** — локальная резервная модель (offline backup)
|
| 26 |
-
✅ **Smart Dashboard** — визуальный контроль всех системных метрик
|
| 27 |
-
✅ **REST API + Gradio UI** — единая точка входа для пользователя и API
|
| 28 |
-
|
| 29 |
-
---
|
| 30 |
-
|
| 31 |
-
## 🧩 Архитектура
|
| 32 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 33 |
|
| 34 |
---
|
| 35 |
|
| 36 |
-
##
|
| 37 |
-
|
| 38 |
-
### 1️⃣ Создай или открой Space
|
| 39 |
-
Тип: **Gradio SDK**
|
| 40 |
|
| 41 |
-
|
| 42 |
-
|
| 43 |
-
- `requirements.txt`
|
| 44 |
-
- `README.md` — этот файл (с YAML-конфигурацией сверху)
|
| 45 |
|
| 46 |
-
|
| 47 |
-
|
| 48 |
-
|
| 49 |
-
|
| 50 |
-
|
| 51 |
-
|
| 52 |
-
- 🌐 `/ui` — Gradio интерфейс
|
| 53 |
-
- 💓 `/health` — состояние системы
|
| 54 |
-
- ⚙️ `/inference` — REST API
|
| 55 |
|
| 56 |
---
|
| 57 |
|
| 58 |
-
##
|
| 59 |
-
|
| 60 |
-
| Endpoint | Описание | Метод |
|
| 61 |
-
|-----------|-----------|--------|
|
| 62 |
-
| `/health` | Проверка токена, памяти и Circuit Breaker | GET |
|
| 63 |
-
| `/inference` | Основной API-интерфейс (Router → Fallback) | POST |
|
| 64 |
-
| `/metrics` | Prometheus метрики | GET |
|
| 65 |
-
| `/ui` | Основной Gradio интерфейс | WEB |
|
| 66 |
-
|
| 67 |
-
---
|
| 68 |
-
|
| 69 |
-
## 🧰 Пример запроса
|
| 70 |
-
|
| 71 |
-
```bash
|
| 72 |
-
curl -X POST https://hf.space/your-space-name/inference \
|
| 73 |
-
-H "Content-Type: application/json" \
|
| 74 |
-
-d '{
|
| 75 |
-
"prompt": "Расскажи фантастическую историю про ИИ",
|
| 76 |
-
"model": "microsoft/phi-3-mini-4k-instruct"
|
| 77 |
-
}'
|
| 78 |
-
|
| 79 |
-
| Индикатор | Цвет | Значение | Действие |
|
| 80 |
-
| ------------------------- | ------- | ---------------------------------- | --------------------------- |
|
| 81 |
-
| 🟢 **Token Valid** | Зеленый | Токен активен и проходит проверку | ✅ Всё в порядке |
|
| 82 |
-
| 🔴 **Token Invalid** | Красный | Токен просрочен или недействителен | 🔁 Проверить HF_TOKEN |
|
| 83 |
-
| 🟢 **Circuit: CLOSED** | Зеленый | API стабилен | ✅ Работа нормальная |
|
| 84 |
-
| 🟡 **Circuit: HALF_OPEN** | Желтый | Тест восстановления после сбоя | ⚠️ Наблюдать |
|
| 85 |
-
| 🔴 **Circuit: OPEN** | Красный | API отключен из-за ошибок | 🧠 Активирован fallback |
|
| 86 |
-
| 🟢 **Memory < 85%** | Зеленый | Ресурсы в норме | ✅ Нормальная загрузка |
|
| 87 |
-
| 🔴 **Memory > 90%** | Красный | Перегрузка памяти | ⚙️ Перезапуск рекомендуется |
|
| 88 |
-
| 🟢 **Watchdog Active** | Зеленый | Автоматические проверки активны | ✅ Работа стабильна |
|
| 89 |
-
|
| 90 |
-
🧱 Архитектурные преимущества
|
| 91 |
-
|
| 92 |
-
Асинхронная модель (FastAPI + aiohttp)
|
| 93 |
-
|
| 94 |
-
Отказоустойчивость (fallback + circuit breaker)
|
| 95 |
-
|
| 96 |
-
Локальная tiny модель — всегда доступна
|
| 97 |
-
|
| 98 |
-
Безопасное хранение секретов (через Hugging Face Secrets)
|
| 99 |
-
|
| 100 |
-
Zero-downtime обновления и автопроверка
|
| 101 |
-
|
| 102 |
-
🔗 Полезные ссылки
|
| 103 |
-
|
| 104 |
-
Spaces SDK Reference
|
| 105 |
-
|
| 106 |
-
Transformers Documentation
|
| 107 |
-
|
| 108 |
-
Gradio API Docs
|
| 109 |
-
|
| 110 |
-
🧠 Автор и лицензия
|
| 111 |
-
|
| 112 |
-
Автор: Eroha Systems
|
| 113 |
-
Архитектор: AI Infrastructure Architect (DevOps/ML Engineering, 30+ лет опыта)
|
| 114 |
-
Лицензия: MIT
|
| 115 |
-
Версия: v5.8 Stable AutoRecovery
|
| 116 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 117 |
|
| 118 |
---
|
| 119 |
|
| 120 |
-
|
| 121 |
-
|
| 122 |
-
|
| 123 |
-
|
| 124 |
-
|
| 125 |
-
5. Через 1–2 минуты Space соберётся и запустится без ошибок
|
| 126 |
|
| 127 |
---
|
| 128 |
|
| 129 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
# 🤖 Eroha AgentAPI v5.9 — Enterprise Edition
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 2 |
|
| 3 |
+
Production-grade AI Gateway with:
|
| 4 |
+
- Auto Token Recovery
|
| 5 |
+
- Smart Fallback 2.0
|
| 6 |
+
- Circuit Breaker
|
| 7 |
+
- Prometheus Metrics
|
| 8 |
+
- Self-Healing Router
|
| 9 |
+
- Offline Caching (via Docker)
|
| 10 |
|
| 11 |
---
|
| 12 |
|
| 13 |
+
## 🚀 Deploy on Hugging Face Spaces
|
|
|
|
|
|
|
|
|
|
| 14 |
|
| 15 |
+
1. Add secret:
|
| 16 |
+
HF_TOKEN=hf_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
|
|
|
|
|
|
|
| 17 |
|
| 18 |
+
2. Upload files:
|
| 19 |
+
- app.py
|
| 20 |
+
- requirements.txt
|
| 21 |
+
- Dockerfile
|
| 22 |
+
3. Select SDK: **Docker**
|
| 23 |
+
4. Runtime: **Always On**
|
|
|
|
|
|
|
|
|
|
| 24 |
|
| 25 |
---
|
| 26 |
|
| 27 |
+
## 🔍 Endpoints
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 28 |
|
| 29 |
+
| Endpoint | Description |
|
| 30 |
+
|-----------|--------------|
|
| 31 |
+
| `/` | Status Page |
|
| 32 |
+
| `/ui` | Gradio Chat + Dashboard |
|
| 33 |
+
| `/health` | System Health (RAM, token, latency) |
|
| 34 |
+
| `/metrics` | Prometheus metrics |
|
| 35 |
+
| `/inference` | POST inference endpoint |
|
| 36 |
|
| 37 |
---
|
| 38 |
|
| 39 |
+
## 🧠 Offline Recovery
|
| 40 |
+
When router is down:
|
| 41 |
+
- fallback model `sshleifer/tiny-gpt2` will be used
|
| 42 |
+
- circuit breaker prevents overload
|
| 43 |
+
- watchdog reloads token every 3 minutes
|
|
|
|
| 44 |
|
| 45 |
---
|
| 46 |
|
| 47 |
+
## 🛡️ Enterprise Stability
|
| 48 |
+
- Auto memory management
|
| 49 |
+
- Background health loop
|
| 50 |
+
- Self-healing async routines
|
| 51 |
+
- Secure token reload
|
| 52 |
+
- Optimized Docker image (Python 3.10-slim)
|