Spaces:

mi55th
/

421_space

Paused

App Files Files Community

mi55th commited on 15 days ago

Commit

1973bad

verified ·

1 Parent(s): 5756d2b

Update app.py

Browse files

Files changed (1) hide show

app.py +2 -69

app.py CHANGED Viewed

@@ -197,75 +197,9 @@ def image_retrieval(images, query):
 # Создаем интерфейс Gradio
 with gr.Blocks(title="Multimodal AI Demo", theme=gr.themes.Soft()) as demo:
-    gr.Markdown("# 🎯 Мультимодальные AI модели")
-    gr.Markdown("Демонстрация различных задач компьютерного зрения и обработки звука с использованием Hugging Face Transformers")
-    with gr.Tab("🎵 Классификация аудио"):
-        gr.Markdown("## Zero-Shot Audio Classification")
-        with gr.Row():
-            with gr.Column():
-                audio_input = gr.Audio(label="Загрузите аудиофайл", type="filepath")
-                audio_model_dropdown = gr.Dropdown(
-                    choices=["audio_classifier", "emotion_classifier"],
-                    label="Выберите модель",
-                    value="audio_classifier",
-                    info="audio_classifier - общая классификация, emotion_classifier - эмоции в речи"
-                )
-                classify_btn = gr.Button("Классифицировать")
-            with gr.Column():
-                audio_output = gr.Textbox(label="Результаты классификации", lines=10)
-        classify_btn.click(
-            fn=audio_classification,
-            inputs=[audio_input, audio_model_dropdown],
-            outputs=audio_output
-        )
-    with gr.Tab("🗣️ Распознавание речи"):
-        gr.Markdown("## Automatic Speech Recognition (ASR)")
-        with gr.Row():
-            with gr.Column():
-                asr_audio_input = gr.Audio(label="Загрузите аудио с речью", type="filepath")
-                asr_model_dropdown = gr.Dropdown(
-                    choices=["whisper", "wav2vec2"],
-                    label="Выберите модель",
-                    value="whisper",
-                    info="whisper - многоязычная, wav2vec2 - специализированная для русского"
-                )
-                transcribe_btn = gr.Button("Транскрибировать")
-            with gr.Column():
-                asr_output = gr.Textbox(label="Транскрипция", lines=5)
-        transcribe_btn.click(
-            fn=speech_recognition,
-            inputs=[asr_audio_input, asr_model_dropdown],
-            outputs=asr_output
-        )
-    with gr.Tab("🔊 Синтез речи"):
-        gr.Markdown("## Text-to-Speech (TTS)")
-        with gr.Row():
-            with gr.Column():
-                tts_text_input = gr.Textbox(
-                    label="Введите текст для синтеза",
-                    placeholder="Введите текст на русском языке...",
-                    lines=3
-                )
-                tts_model_dropdown = gr.Dropdown(
-                    choices=["silero", "gtts", "mms"],
-                    label="Выберите модель",
-                    value="silero",
-                    info="silero - высокое качество, gtts - Google TTS, mms - Facebook MMS"
-                )
-                synthesize_btn = gr.Button("Синтезировать речь")
-            with gr.Column():
-                tts_output = gr.Audio(label="Синтезированная речь")
-        synthesize_btn.click(
-            fn=text_to_speech,
-            inputs=[tts_text_input, tts_model_dropdown],
-            outputs=tts_output
-        )
     with gr.Tab("📦 Детекция объектов"):
         gr.Markdown("## Object Detection")
@@ -379,7 +313,6 @@ with gr.Blocks(title="Multimodal AI Demo", theme=gr.themes.Soft()) as demo:
     gr.Markdown("---")
     gr.Markdown("### 📊 Поддерживаемые задачи:")
     gr.Markdown("""
-    - **🎵 Аудио**: Классификация, распознавание речи, синтез речи
     - **👁️ Компьютерное зрение**: Детекция объектов, сегментация, описание изображений
     - **🤖 Мультимодальные**: Визуальные вопросы, zero-shot классификация, поиск по изображениям
     """)

 # Создаем интерфейс Gradio
 with gr.Blocks(title="Multimodal AI Demo", theme=gr.themes.Soft()) as demo:
+    gr.Markdown("# Нестеров Владимир ")
+    gr.Markdown("Демонстрация различных задач компьютерного зрения с использованием Hugging Face Transformers")
     with gr.Tab("📦 Детекция объектов"):
         gr.Markdown("## Object Detection")
     gr.Markdown("---")
     gr.Markdown("### 📊 Поддерживаемые задачи:")
     gr.Markdown("""
     - **👁️ Компьютерное зрение**: Детекция объектов, сегментация, описание изображений
     - **🤖 Мультимодальные**: Визуальные вопросы, zero-shot классификация, поиск по изображениям
     """)