Spaces:
Running
Running
File size: 2,143 Bytes
652cea1 245e7db 0bf01ee 652cea1 245e7db |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 |
---
title: Persian Whisper ASR
emoji: 🇮🇷🎙️
colorFrom: pink
colorTo: blue
sdk: streamlit
app_file: app.py
pinned: false
---
# 🇮🇷 اپلیکیشن تبدیل گفتار به نوشتار فارسی (Whisper)
این یک نسخه نمایشی (Demo) برای مدل قدرتمند **`vhdm/whisper-large-fa-v1`** است که برای تشخیص و رونویسی گفتار به زبان فارسی طراحی شده است.
شما میتوانید فایلهای صوتی خود را آپلود کرده یا به صورت زنده از میکروفون ضبط کنید تا متن آن را دریافت نمایید.
## 📝 نحوه استفاده
1. **آپلود یا ضبط صدا**: فایل صوتی خود را (با فرمتهای رایج مانند `mp3`, `wav`, `flac` و غیره) در کادر ورودی آپلود کنید، یا روی **Record from microphone** کلیک کرده و صدای خود را ضبط کنید.
2. **ارسال**: روی دکمه **Submit** کلیک کنید.
3. **دریافت نتیجه**: پس از چند لحظه، متن رونویسی شده در کادر خروجی نمایش داده خواهد شد.
## 🤖 اطلاعات مدل
این اپلیکیشن از مدل **`vhdm/whisper-large-fa-v1`** استفاده میکند که توسط **Vahid Mahmoudian** آموزش داده شده است. این مدل بر روی مجموعه داده بزرگ **[Persian-Voice-v1](https://huggingface.co/datasets/vhdm/persian-voice-v1)** تنظیم دقیق (fine-tune) شده و دقت بالایی در تبدیل گفتار فارسی به متن دارد.
- **[صفحه مدل در هاگینگ فیس](https://huggingface.co/vhdm/whisper-large-fa-v1)**
## ⚙️ جزئیات فنی
- این برنامه با استفاده از کتابخانههای **Gradio** و **Transformers** ساخته شده است.
- این نسخه بر روی سختافزار **CPU** رایگان هاگینگ فیس اجرا میشود، بنابراین ممکن است پردازش فایلهای صوتی طولانی کمی زمانبر باشد.
--- |