Yermek68 commited on
Commit
a1a9227
·
verified ·
1 Parent(s): 00972f9

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +36 -113
README.md CHANGED
@@ -1,129 +1,52 @@
1
- ---
2
- title: Eroha AgentAPI v5.8
3
- emoji: 🤖
4
- colorFrom: indigo
5
- colorTo: purple
6
- sdk: gradio
7
- sdk_version: 4.44.1
8
- app_file: app.py
9
- pinned: false
10
- license: mit
11
- ---
12
-
13
- # 🤖 Eroha AgentAPI v5.8 — AutoRecovery + Smart Dashboard Edition
14
-
15
- > **Production-grade AI Infrastructure built for Hugging Face Spaces**
16
- > Разработано архитектурой уровня Enterprise для полной автономности и стабильности.
17
-
18
- ---
19
-
20
- ## 🚀 Ключевые особенности
21
-
22
- ✅ **Auto Token Recovery** — автоматическая проверка и восстановление токена Hugging Face
23
- ✅ **Circuit Breaker FSM** — защита от каскадных ошибок Router API
24
- ✅ **Watchdog Monitoring** — автоматический health-check каждые 5 минут
25
- ✅ **Fallback Engine** — локальная резервная модель (offline backup)
26
- ✅ **Smart Dashboard** — визуальный контроль всех системных метрик
27
- ✅ **REST API + Gradio UI** — единая точка входа для пользователя и API
28
-
29
- ---
30
-
31
- ## 🧩 Архитектура
32
 
 
 
 
 
 
 
 
33
 
34
  ---
35
 
36
- ## ⚙️ Установка и запуск
37
-
38
- ### 1️⃣ Создай или открой Space
39
- Тип: **Gradio SDK**
40
 
41
- ### 2️⃣ Загрузите файлы:
42
- - `app.py` — основной код API (версия 5.8)
43
- - `requirements.txt`
44
- - `README.md` — этот файл (с YAML-конфигурацией сверху)
45
 
46
- ### 3️⃣ Добавь токен:
47
- В **Settings → Repository secrets** добавь переменную:
48
-
49
- ### 4️⃣ Запуск:
50
- Через 1–2 минуты появится статус: ✅ **Running**
51
- Интерфейсы:
52
- - 🌐 `/ui` — Gradio интерфейс
53
- - 💓 `/health` — состояние системы
54
- - ⚙️ `/inference` — REST API
55
 
56
  ---
57
 
58
- ## 🧠 REST API Endpoints
59
-
60
- | Endpoint | Описание | Метод |
61
- |-----------|-----------|--------|
62
- | `/health` | Проверка токена, памяти и Circuit Breaker | GET |
63
- | `/inference` | Основной API-интерфейс (Router → Fallback) | POST |
64
- | `/metrics` | Prometheus метрики | GET |
65
- | `/ui` | Основной Gradio интерфейс | WEB |
66
-
67
- ---
68
-
69
- ## 🧰 Пример запроса
70
-
71
- ```bash
72
- curl -X POST https://hf.space/your-space-name/inference \
73
- -H "Content-Type: application/json" \
74
- -d '{
75
- "prompt": "Расскажи фантастическую историю про ИИ",
76
- "model": "microsoft/phi-3-mini-4k-instruct"
77
- }'
78
-
79
- | Индикатор | Цвет | Значение | Действие |
80
- | ------------------------- | ------- | ---------------------------------- | --------------------------- |
81
- | 🟢 **Token Valid** | Зеленый | Токен активен и проходит проверку | ✅ Всё в порядке |
82
- | 🔴 **Token Invalid** | Красный | Токен просрочен или недействителен | 🔁 Проверить HF_TOKEN |
83
- | 🟢 **Circuit: CLOSED** | Зеленый | API стабилен | ✅ Работа нормальная |
84
- | 🟡 **Circuit: HALF_OPEN** | Желтый | Тест восстановления после сбоя | ⚠️ Наблюдать |
85
- | 🔴 **Circuit: OPEN** | Красный | API отключен из-за ошибок | 🧠 Активирован fallback |
86
- | 🟢 **Memory < 85%** | Зеленый | Ресурсы в норме | ✅ Нормальная загрузка |
87
- | 🔴 **Memory > 90%** | Красный | Перегрузка памяти | ⚙️ Перезапуск рекомендуется |
88
- | 🟢 **Watchdog Active** | Зеленый | Автоматические проверки активны | ✅ Работа стабильна |
89
-
90
- 🧱 Архитектурные преимущества
91
-
92
- Асинхронная модель (FastAPI + aiohttp)
93
-
94
- Отказоустойчивость (fallback + circuit breaker)
95
-
96
- Локальная tiny модель — всегда доступна
97
-
98
- Безопасное хранение секретов (через Hugging Face Secrets)
99
-
100
- Zero-downtime обновления и автопроверка
101
-
102
- 🔗 Полезные ссылки
103
-
104
- Spaces SDK Reference
105
-
106
- Transformers Documentation
107
-
108
- Gradio API Docs
109
-
110
- 🧠 Автор и лицензия
111
-
112
- Автор: Eroha Systems
113
- Архитектор: AI Infrastructure Architect (DevOps/ML Engineering, 30+ лет опыта)
114
- Лицензия: MIT
115
- Версия: v5.8 Stable AutoRecovery
116
 
 
 
 
 
 
 
 
117
 
118
  ---
119
 
120
- **Как использовать:**
121
- 1. Перейди во вкладку **Files → README.md**
122
- 2. Нажми **Edit**
123
- 3. Вставь этот файл полностью
124
- 4. Сохрани (**Commit changes**)
125
- 5. Через 1–2 минуты Space соберётся и запустится без ошибок
126
 
127
  ---
128
 
129
- Хочешь, я сделаю **production-версию README+Config bundle** (с интегрированным `.env` шаблоном и auto-refresh описанием), чтобы просто залить одним архивом в Space?
 
 
 
 
 
 
1
+ # 🤖 Eroha AgentAPI v5.9 — Enterprise Edition
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
2
 
3
+ Production-grade AI Gateway with:
4
+ - Auto Token Recovery
5
+ - Smart Fallback 2.0
6
+ - Circuit Breaker
7
+ - Prometheus Metrics
8
+ - Self-Healing Router
9
+ - Offline Caching (via Docker)
10
 
11
  ---
12
 
13
+ ## 🚀 Deploy on Hugging Face Spaces
 
 
 
14
 
15
+ 1. Add secret:
16
+ HF_TOKEN=hf_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
 
 
17
 
18
+ 2. Upload files:
19
+ - app.py
20
+ - requirements.txt
21
+ - Dockerfile
22
+ 3. Select SDK: **Docker**
23
+ 4. Runtime: **Always On**
 
 
 
24
 
25
  ---
26
 
27
+ ## 🔍 Endpoints
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
28
 
29
+ | Endpoint | Description |
30
+ |-----------|--------------|
31
+ | `/` | Status Page |
32
+ | `/ui` | Gradio Chat + Dashboard |
33
+ | `/health` | System Health (RAM, token, latency) |
34
+ | `/metrics` | Prometheus metrics |
35
+ | `/inference` | POST inference endpoint |
36
 
37
  ---
38
 
39
+ ## 🧠 Offline Recovery
40
+ When router is down:
41
+ - fallback model `sshleifer/tiny-gpt2` will be used
42
+ - circuit breaker prevents overload
43
+ - watchdog reloads token every 3 minutes
 
44
 
45
  ---
46
 
47
+ ## 🛡️ Enterprise Stability
48
+ - Auto memory management
49
+ - Background health loop
50
+ - Self-healing async routines
51
+ - Secure token reload
52
+ - Optimized Docker image (Python 3.10-slim)