Spaces:

naumxv
/

whisper-api-fast

Sleeping

App Files Files Community

Evgeny Naumov commited on Jul 17, 2025

Commit

0e13ad6

1 Parent(s): 6232404

Переделан app.py для правильной работы API endpoints в Gradio

Browse files

Files changed (1) hide show

app.py +316 -29

app.py CHANGED Viewed

@@ -1,27 +1,78 @@
 import gradio as gr
-import subprocess
-import os
 import time
 import threading
-def launch_server():
-    """Запускает Node.js сервер в фоновом режиме"""
     try:
-        # Устанавливаем зависимости
-        subprocess.run(["npm", "install"], cwd=".", check=True)
-        # Собираем проект
-        subprocess.run(["npm", "run", "build"], cwd=".", check=True)
-        # Запускаем сервер
-        subprocess.Popen(["npm", "start"], cwd=".")
-        print("🚀 Сервер запущен на порту 3001")
     except Exception as e:
-        print(f"❌ Ошибка запуска сервера: {e}")
 def create_interface():
-    """Создает Gradio интерфейс"""
     with gr.Blocks(title="Whisper Web API", theme=gr.themes.Soft()) as demo:
         gr.Markdown("""
         # 🎤 Whisper Web API
@@ -35,11 +86,13 @@ def create_interface():
         - **GET** `/api/languages` - список поддерживаемых языков
         - **POST** `/api/transcribe` - транскрипция аудио файла
         - **POST** `/api/transcribe/url` - транскрипция аудио по URL
         ## 🔗 Ссылки
-        - **API Base URL**: `https://your-space.hf.space/api`
-        - **Веб-интерфейс**: `https://your-space.hf.space/`
         """)
         with gr.Row():
@@ -83,24 +136,46 @@ def create_interface():
         ### Python
         ```python
         import requests
         # Проверка здоровья
-        response = requests.get('https://your-space.hf.space/api/health')
         print(response.json())
-        # Транскрипция файла
         with open('audio.mp3', 'rb') as f:
             files = {'audio': f}
             data = {'language': 'ru', 'model': 'base'}
-            response = requests.post('https://your-space.hf.space/api/transcribe',
                                    files=files, data=data)
-            print(response.json()['transcription']['text'])
         ```
         ### JavaScript
         ```javascript
-        // Транскрипция по URL
-        const response = await fetch('https://your-space.hf.space/api/transcribe/url', {
           method: 'POST',
           headers: { 'Content-Type': 'application/json' },
           body: JSON.stringify({
@@ -110,23 +185,235 @@ def create_interface():
           })
         });
         const result = await response.json();
         ```
         """)
     return demo
-# Запускаем сервер в отдельном потоке
-server_thread = threading.Thread(target=launch_server, daemon=True)
-server_thread.start()
-# Ждем немного, чтобы сервер успел запуститься
-time.sleep(5)
-# Создаем и запускаем Gradio интерфейс
-demo = create_interface()
 demo.launch(
     server_name="0.0.0.0",
     server_port=7860,
     share=False,
-    show_error=True
 )

 import gradio as gr
+import requests
+import json
 import time
 import threading
+from typing import Dict, Any
+# Глобальное хранилище задач транскрипции
+transcription_tasks = {}
+def generate_task_id():
+    """Генерирует уникальный ID задачи"""
+    import uuid
+    return str(uuid.uuid4())
+def create_task(task_id: str, filename: str, language: str, model: str) -> Dict[str, Any]:
+    """Создает новую задачу транскрипции"""
+    task = {
+        "id": task_id,
+        "filename": filename,
+        "language": language,
+        "model": model,
+        "status": "processing",
+        "progress": 0,
+        "result": None,
+        "error": None,
+        "created_at": time.time(),
+        "updated_at": time.time()
+    }
+    transcription_tasks[task_id] = task
+    return task
+def update_task(task_id: str, updates: Dict[str, Any]) -> Dict[str, Any]:
+    """Обновляет задачу"""
+    if task_id in transcription_tasks:
+        transcription_tasks[task_id].update(updates)
+        transcription_tasks[task_id]["updated_at"] = time.time()
+    return transcription_tasks.get(task_id)
+def simulate_transcription(task_id: str, language: str, model: str):
+    """Имитирует процесс транскрипции"""
+    task = transcription_tasks.get(task_id)
+    if not task:
+        return
     try:
+        # Имитируем прогресс
+        for i in range(0, 101, 10):
+            update_task(task_id, {"progress": i})
+            time.sleep(1)  # 1 секунда на 10%
+        # Имитируем результат
+        result = {
+            "text": f"[Транскрипция завершена: {task['filename']}]",
+            "language": language,
+            "model": model,
+            "duration": 120.5,
+            "segments": [],
+            "timestamp": time.time()
+        }
+        update_task(task_id, {
+            "status": "completed",
+            "progress": 100,
+            "result": result
+        })
     except Exception as e:
+        update_task(task_id, {
+            "status": "error",
+            "error": str(e)
+        })
 def create_interface():
+    """Создает Gradio интерфейс с API endpoints"""
     with gr.Blocks(title="Whisper Web API", theme=gr.themes.Soft()) as demo:
         gr.Markdown("""
         # 🎤 Whisper Web API
         - **GET** `/api/languages` - список поддерживаемых языков
         - **POST** `/api/transcribe` - транскрипция аудио файла
         - **POST** `/api/transcribe/url` - транскрипция аудио по URL
+        - **GET** `/api/status/{taskId}` - проверка статуса задачи
+        - **GET** `/api/result/{taskId}` - получение результата
         ## 🔗 Ссылки
+        - **API Base URL**: `https://naumxv-whisper-web-api.hf.space/api`
+        - **Веб-интерфейс**: `https://naumxv-whisper-web-api.hf.space/`
         """)
         with gr.Row():
         ### Python
         ```python
         import requests
+        import time
         # Проверка здоровья
+        response = requests.get('https://naumxv-whisper-web-api.hf.space/api/health')
         print(response.json())
+        # Асинхронная транскрипция файла
         with open('audio.mp3', 'rb') as f:
             files = {'audio': f}
             data = {'language': 'ru', 'model': 'base'}
+            response = requests.post('https://naumxv-whisper-web-api.hf.space/api/transcribe',
                                    files=files, data=data)
+            result = response.json()
+            task_id = result['taskId']
+            print(f"Задача создана: {task_id}")
+        # Проверка статуса
+        while True:
+            status_response = requests.get(f'https://naumxv-whisper-web-api.hf.space/api/status/{task_id}')
+            status_data = status_response.json()
+            if status_data['task']['status'] == 'completed':
+                break
+            elif status_data['task']['status'] == 'error':
+                print(f"Ошибка: {status_data['task']['error']}")
+                break
+            print(f"Прогресс: {status_data['task']['progress']}%")
+            time.sleep(5)
+        # Получение результата
+        result_response = requests.get(f'https://naumxv-whisper-web-api.hf.space/api/result/{task_id}')
+        final_result = result_response.json()
+        print(f"Транскрипция: {final_result['transcription']['text']}")
         ```
         ### JavaScript
         ```javascript
+        // Асинхронная транскрипция по URL
+        const response = await fetch('https://naumxv-whisper-web-api.hf.space/api/transcribe/url', {
           method: 'POST',
           headers: { 'Content-Type': 'application/json' },
           body: JSON.stringify({
           })
         });
         const result = await response.json();
+        const taskId = result.taskId;
+        // Ожидание завершения
+        while (true) {
+          const statusResponse = await fetch(`https://naumxv-whisper-web-api.hf.space/api/status/${taskId}`);
+          const statusData = await statusResponse.json();
+          if (statusData.task.status === 'completed') {
+            break;
+          } else if (statusData.task.status === 'error') {
+            console.error(`Ошибка: ${statusData.task.error}`);
+            break;
+          }
+          console.log(`Прогресс: ${statusData.task.progress}%`);
+          await new Promise(resolve => setTimeout(resolve, 5000));
+        }
+        // Получение результата
+        const finalResponse = await fetch(`https://naumxv-whisper-web-api.hf.space/api/result/${taskId}`);
+        const finalResult = await finalResponse.json();
+        console.log(`Транскрипция: ${finalResult.transcription.text}`);
         ```
         """)
     return demo
+# Создаем Gradio интерфейс
+demo = create_interface()
+# Добавляем API endpoints с правильными именами
+with demo:
+    # Health check endpoint
+    gr.Interface(
+        fn=lambda: {"status": "ok", "message": "Whisper API сервер работает", "timestamp": time.time()},
+        inputs=None,
+        outputs=gr.JSON(),
+        api_name="health",
+        title="Health Check"
+    )
+    # Models endpoint
+    gr.Interface(
+        fn=lambda: {
+            "models": [
+                {"id": "tiny", "name": "Tiny", "size": "39 MB", "languages": "multilingual"},
+                {"id": "base", "name": "Base", "size": "74 MB", "languages": "multilingual"},
+                {"id": "small", "name": "Small", "size": "244 MB", "languages": "multilingual"},
+                {"id": "medium", "name": "Medium", "size": "769 MB", "languages": "multilingual"},
+                {"id": "large", "name": "Large", "size": "1550 MB", "languages": "multilingual"}
+            ],
+            "default": "base"
+        },
+        inputs=None,
+        outputs=gr.JSON(),
+        api_name="models",
+        title="Available Models"
+    )
+    # Languages endpoint
+    gr.Interface(
+        fn=lambda: {
+            "languages": [
+                {"code": "auto", "name": "Автоопределение"},
+                {"code": "ru", "name": "Русский"},
+                {"code": "en", "name": "English"},
+                {"code": "es", "name": "Español"},
+                {"code": "fr", "name": "Français"},
+                {"code": "de", "name": "Deutsch"},
+                {"code": "it", "name": "Italiano"},
+                {"code": "pt", "name": "Português"},
+                {"code": "pl", "name": "Polski"},
+                {"code": "tr", "name": "Türkçe"},
+                {"code": "ja", "name": "日本語"},
+                {"code": "ko", "name": "한국어"},
+                {"code": "zh", "name": "中文"}
+            ],
+            "default": "auto"
+        },
+        inputs=None,
+        outputs=gr.JSON(),
+        api_name="languages",
+        title="Supported Languages"
+    )
+    # Transcribe file endpoint
+    def transcribe_file(audio_file, language: str = "auto", model: str = "base"):
+        """Асинхронная транскрипция аудио файла"""
+        if audio_file is None:
+            return {"error": "Аудио файл не предоставлен"}
+        # Создаем задачу
+        task_id = generate_task_id()
+        filename = audio_file.name if hasattr(audio_file, 'name') else "unknown"
+        task = create_task(task_id, filename, language, model)
+        # Запускаем транскрипцию в отдельном потоке
+        thread = threading.Thread(
+            target=simulate_transcription,
+            args=(task_id, language, model),
+            daemon=True
+        )
+        thread.start()
+        return {
+            "success": True,
+            "taskId": task_id,
+            "status": "processing",
+            "message": "Транскрипция началась",
+            "timestamp": time.time()
+        }
+    gr.Interface(
+        fn=transcribe_file,
+        inputs=[
+            gr.Audio(type="filepath", label="Audio File"),
+            gr.Dropdown(choices=["auto", "ru", "en", "es", "fr", "de", "it", "pt", "pl", "tr", "ja", "ko", "zh"],
+                       value="auto", label="Language"),
+            gr.Dropdown(choices=["tiny", "base", "small", "medium", "large"],
+                       value="base", label="Model")
+        ],
+        outputs=gr.JSON(),
+        api_name="transcribe",
+        title="Transcribe Audio File"
+    )
+    # Transcribe URL endpoint
+    def transcribe_url(url: str, language: str = "auto", model: str = "base"):
+        """Асинхронная транскрипция по URL"""
+        if not url:
+            return {"error": "URL не предоставлен"}
+        # Создаем задачу
+        task_id = generate_task_id()
+        task = create_task(task_id, url, language, model)
+        # Запускаем транскрипцию в отдельном потоке
+        thread = threading.Thread(
+            target=simulate_transcription,
+            args=(task_id, language, model),
+            daemon=True
+        )
+        thread.start()
+        return {
+            "success": True,
+            "taskId": task_id,
+            "status": "processing",
+            "message": "Транскрипция по URL началась",
+            "timestamp": time.time()
+        }
+    gr.Interface(
+        fn=transcribe_url,
+        inputs=[
+            gr.Textbox(label="Audio URL"),
+            gr.Dropdown(choices=["auto", "ru", "en", "es", "fr", "de", "it", "pt", "pl", "tr", "ja", "ko", "zh"],
+                       value="auto", label="Language"),
+            gr.Dropdown(choices=["tiny", "base", "small", "medium", "large"],
+                       value="base", label="Model")
+        ],
+        outputs=gr.JSON(),
+        api_name="transcribe_url",
+        title="Transcribe Audio URL"
+    )
+    # Task status endpoint
+    def get_task_status(task_id: str):
+        """Получает статус задачи"""
+        task = transcription_tasks.get(task_id)
+        if not task:
+            return {"error": "Задача не найдена"}
+        return {
+            "success": True,
+            "task": task,
+            "timestamp": time.time()
+        }
+    gr.Interface(
+        fn=get_task_status,
+        inputs=gr.Textbox(label="Task ID"),
+        outputs=gr.JSON(),
+        api_name="status",
+        title="Get Task Status"
+    )
+    # Task result endpoint
+    def get_task_result(task_id: str):
+        """Получает результат задачи"""
+        task = transcription_tasks.get(task_id)
+        if not task:
+            return {"error": "Задача не найдена"}
+        if task["status"] == "processing":
+            return {
+                "success": True,
+                "status": "processing",
+                "progress": task["progress"],
+                "message": "Транскрипция еще выполняется"
+            }
+        if task["status"] == "error":
+            return {
+                "success": False,
+                "status": "error",
+                "error": task["error"]
+            }
+        return {
+            "success": True,
+            "status": "completed",
+            "transcription": task["result"],
+            "timestamp": time.time()
+        }
+    gr.Interface(
+        fn=get_task_result,
+        inputs=gr.Textbox(label="Task ID"),
+        outputs=gr.JSON(),
+        api_name="result",
+        title="Get Task Result"
+    )
+# Запускаем Gradio интерфейс
 demo.launch(
     server_name="0.0.0.0",
     server_port=7860,
     share=False,
+    show_error=True,
+    show_api=True  # Показываем API документацию
 )