Spaces:
Sleeping
Sleeping
Create README.md
Browse files
README.md
CHANGED
|
@@ -9,16 +9,121 @@ app_file: app.py
|
|
| 9 |
pinned: false
|
| 10 |
license: mit
|
| 11 |
---
|
| 12 |
-
|
| 13 |
-
|
| 14 |
-
|
| 15 |
-
-
|
| 16 |
-
|
| 17 |
-
|
| 18 |
-
|
| 19 |
-
|
| 20 |
-
|
| 21 |
-
|
| 22 |
-
|
| 23 |
-
|
| 24 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 9 |
pinned: false
|
| 10 |
license: mit
|
| 11 |
---
|
| 12 |
+
|
| 13 |
+
# 🤖 Eroha AgentAPI v5.8 — AutoRecovery + Smart Dashboard Edition
|
| 14 |
+
|
| 15 |
+
> **Production-grade AI Infrastructure built for Hugging Face Spaces**
|
| 16 |
+
> Разработано архитектурой уровня Enterprise для полной автономности и стабильности.
|
| 17 |
+
|
| 18 |
+
---
|
| 19 |
+
|
| 20 |
+
## 🚀 Ключевые особенности
|
| 21 |
+
|
| 22 |
+
✅ **Auto Token Recovery** — автоматическая проверка и восстановление токена Hugging Face
|
| 23 |
+
✅ **Circuit Breaker FSM** — защита от каскадных ошибок Router API
|
| 24 |
+
✅ **Watchdog Monitoring** — автоматический health-check каждые 5 минут
|
| 25 |
+
✅ **Fallback Engine** — локальная резервная модель (offline backup)
|
| 26 |
+
✅ **Smart Dashboard** — визуальный контроль всех системных метрик
|
| 27 |
+
✅ **REST API + Gradio UI** — единая точка входа для пользователя и API
|
| 28 |
+
|
| 29 |
+
---
|
| 30 |
+
|
| 31 |
+
## 🧩 Архитектура
|
| 32 |
+
|
| 33 |
+
|
| 34 |
+
---
|
| 35 |
+
|
| 36 |
+
## ⚙️ Установка и запуск
|
| 37 |
+
|
| 38 |
+
### 1️⃣ Создай или открой Space
|
| 39 |
+
Тип: **Gradio SDK**
|
| 40 |
+
|
| 41 |
+
### 2️⃣ Загрузите файлы:
|
| 42 |
+
- `app.py` — основной код API (версия 5.8)
|
| 43 |
+
- `requirements.txt`
|
| 44 |
+
- `README.md` — этот файл (с YAML-конфигурацией сверху)
|
| 45 |
+
|
| 46 |
+
### 3️⃣ Добавь токен:
|
| 47 |
+
В **Settings → Repository secrets** добавь переменную:
|
| 48 |
+
|
| 49 |
+
### 4️⃣ Запуск:
|
| 50 |
+
Через 1–2 минуты появится статус: ✅ **Running**
|
| 51 |
+
Интерфейсы:
|
| 52 |
+
- 🌐 `/ui` — Gradio интерфейс
|
| 53 |
+
- 💓 `/health` — состояние системы
|
| 54 |
+
- ⚙️ `/inference` — REST API
|
| 55 |
+
|
| 56 |
+
---
|
| 57 |
+
|
| 58 |
+
## 🧠 REST API Endpoints
|
| 59 |
+
|
| 60 |
+
| Endpoint | Описание | Метод |
|
| 61 |
+
|-----------|-----------|--------|
|
| 62 |
+
| `/health` | Проверка токена, памяти и Circuit Breaker | GET |
|
| 63 |
+
| `/inference` | Основной API-интерфейс (Router → Fallback) | POST |
|
| 64 |
+
| `/metrics` | Prometheus метрики | GET |
|
| 65 |
+
| `/ui` | Основной Gradio интерфейс | WEB |
|
| 66 |
+
|
| 67 |
+
---
|
| 68 |
+
|
| 69 |
+
## 🧰 Пример запроса
|
| 70 |
+
|
| 71 |
+
```bash
|
| 72 |
+
curl -X POST https://hf.space/your-space-name/inference \
|
| 73 |
+
-H "Content-Type: application/json" \
|
| 74 |
+
-d '{
|
| 75 |
+
"prompt": "Расскажи фантастическую историю про ИИ",
|
| 76 |
+
"model": "microsoft/phi-3-mini-4k-instruct"
|
| 77 |
+
}'
|
| 78 |
+
|
| 79 |
+
| Индикатор | Цвет | Значение | Действие |
|
| 80 |
+
| ------------------------- | ------- | ---------------------------------- | --------------------------- |
|
| 81 |
+
| 🟢 **Token Valid** | Зеленый | Токен активен и проходит проверку | ✅ Всё в порядке |
|
| 82 |
+
| 🔴 **Token Invalid** | Красный | Токен просрочен или недействителен | 🔁 Проверить HF_TOKEN |
|
| 83 |
+
| 🟢 **Circuit: CLOSED** | Зеленый | API стабилен | ✅ Работа нормальная |
|
| 84 |
+
| 🟡 **Circuit: HALF_OPEN** | Желтый | Тест восстановления после сбоя | ⚠️ Наблюдать |
|
| 85 |
+
| 🔴 **Circuit: OPEN** | Красный | API отключен из-за ошибок | 🧠 Активирован fallback |
|
| 86 |
+
| 🟢 **Memory < 85%** | Зеленый | Ресурсы в норме | ✅ Нормальная загрузка |
|
| 87 |
+
| 🔴 **Memory > 90%** | Красный | Перегрузка памяти | ⚙️ Перезапуск рекомендуется |
|
| 88 |
+
| 🟢 **Watchdog Active** | Зеленый | Автоматические проверки активны | ✅ Работа стабильна |
|
| 89 |
+
|
| 90 |
+
🧱 Архитектурные преимущества
|
| 91 |
+
|
| 92 |
+
Асинхронная модель (FastAPI + aiohttp)
|
| 93 |
+
|
| 94 |
+
Отказоустойчивость (fallback + circuit breaker)
|
| 95 |
+
|
| 96 |
+
Локальная tiny модель — всегда доступна
|
| 97 |
+
|
| 98 |
+
Безопасное хранение секретов (через Hugging Face Secrets)
|
| 99 |
+
|
| 100 |
+
Zero-downtime обновления и автопроверка
|
| 101 |
+
|
| 102 |
+
🔗 Полезные ссылки
|
| 103 |
+
|
| 104 |
+
Spaces SDK Reference
|
| 105 |
+
|
| 106 |
+
Transformers Documentation
|
| 107 |
+
|
| 108 |
+
Gradio API Docs
|
| 109 |
+
|
| 110 |
+
🧠 Автор и лицензия
|
| 111 |
+
|
| 112 |
+
Автор: Eroha Systems
|
| 113 |
+
Архитектор: AI Infrastructure Architect (DevOps/ML Engineering, 30+ лет опыта)
|
| 114 |
+
Лицензия: MIT
|
| 115 |
+
Версия: v5.8 Stable AutoRecovery
|
| 116 |
+
|
| 117 |
+
|
| 118 |
+
---
|
| 119 |
+
|
| 120 |
+
✅ **Как использовать:**
|
| 121 |
+
1. Перейди во вкладку **Files → README.md**
|
| 122 |
+
2. Нажми **Edit**
|
| 123 |
+
3. Вставь этот файл полностью
|
| 124 |
+
4. Сохрани (**Commit changes**)
|
| 125 |
+
5. Через 1–2 минуты Space соберётся и запустится без ошибок
|
| 126 |
+
|
| 127 |
+
---
|
| 128 |
+
|
| 129 |
+
Хочешь, я сделаю **production-версию README+Config bundle** (с интегрированным `.env` шаблоном и auto-refresh описанием), чтобы просто залить одним архивом в Space?
|