Spaces:

PacoFYM
/

Transcribe

Configuration error

App Files Files Community

PacoFYM commited on May 14, 2025

Commit

d9f3843

verified ·

1 Parent(s): 5c74135

Upload 3 files

Browse files

Files changed (3) hide show

README.md +23 -13
app.py +37 -0
requirements.txt +6 -0

README.md CHANGED Viewed

@@ -1,13 +1,23 @@
----
-title: Transcribe
-emoji: 🚀
-colorFrom: green
-colorTo: blue
-sdk: gradio
-sdk_version: 5.29.0
-app_file: app.py
-pinned: false
-short_description: Transcribe your audio with diarization
----
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

+# Web-приложение: Транскрибация и диаризация аудио с адаптацией под мобильные устройства
+## Возможности
+- Загрузка аудио с мобильного или ПК
+- WhisperX: транскрибация + диаризация
+- Вывод пофразно с указанием спикеров
+- Готово к размещению на Hugging Face Spaces
+## Запуск локально
+```bash
+pip install -r requirements.txt
+python app.py
+```
+## Размещение на Hugging Face Spaces
+1. Создайте новое Space на [huggingface.co/spaces](https://huggingface.co/spaces)
+2. Выберите SDK: Gradio
+3. Загрузите все файлы проекта (app.py, requirements.txt, README.md)
+4. Нажмите «Deploy»
+Приложение автоматически адаптировано для мобильных экранов.

app.py ADDED Viewed

	@@ -0,0 +1,37 @@

+import gradio as gr
+import whisperx
+import os
+# Загрузка модели один раз
+model = whisperx.load_model("small", device="cpu")
+# Основная функция транскрибации и диаризации
+def transcribe_with_diarization(audio_path):
+    result = model.transcribe(audio_path, diarize=True)
+    segments = result["segments"]
+    # Формируем вывод с возможностью редактирования
+    text_output = ""
+    for seg in segments:
+        speaker = seg.get("speaker", "SPEAKER_00")
+        start = seg["start"]
+        end = seg["end"]
+        text = seg["text"]
+        text_output += f"[{speaker}] ({start:.2f} - {end:.2f}): {text}\n\n"
+    return text_output
+# Интерфейс
+with gr.Blocks() as demo:
+    gr.Markdown("# 📱🎤 Транскрибация и диаризация аудио")
+    gr.Markdown("Загрузите аудиофайл, прослушайте сегменты, отредактируйте спикеров и выгрузите результат.")
+    with gr.Row():
+        audio_input = gr.Audio(source="upload", type="filepath", label="Загрузите аудиофайл")
+    transcribe_btn = gr.Button("▶️ Транскрибировать")
+    transcript_output = gr.Textbox(label="Результат транскрипции", lines=20)
+    transcribe_btn.click(fn=transcribe_with_diarization, inputs=audio_input, outputs=transcript_output)
+demo.launch()

requirements.txt ADDED Viewed

	@@ -0,0 +1,6 @@

+gradio
+whisperx
+torch
+torchaudio
+transformers
+ffmpeg-python