File size: 2,143 Bytes
652cea1
245e7db
 
 
 
0bf01ee
652cea1
 
 
 
245e7db
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
---
title: Persian Whisper ASR
emoji: 🇮🇷🎙️
colorFrom: pink
colorTo: blue
sdk: streamlit  
app_file: app.py
pinned: false
---

# 🇮🇷 اپلیکیشن تبدیل گفتار به نوشتار فارسی (Whisper)

این یک نسخه نمایشی (Demo) برای مدل قدرتمند **`vhdm/whisper-large-fa-v1`** است که برای تشخیص و رونویسی گفتار به زبان فارسی طراحی شده است.

شما می‌توانید فایل‌های صوتی خود را آپلود کرده یا به صورت زنده از میکروفون ضبط کنید تا متن آن را دریافت نمایید.

## 📝 نحوه استفاده

1.  **آپلود یا ضبط صدا**: فایل صوتی خود را (با فرمت‌های رایج مانند `mp3`, `wav`, `flac` و غیره) در کادر ورودی آپلود کنید، یا روی **Record from microphone** کلیک کرده و صدای خود را ضبط کنید.
2.  **ارسال**: روی دکمه **Submit** کلیک کنید.
3.  **دریافت نتیجه**: پس از چند لحظه، متن رونویسی شده در کادر خروجی نمایش داده خواهد شد.

## 🤖 اطلاعات مدل

این اپلیکیشن از مدل **`vhdm/whisper-large-fa-v1`** استفاده می‌کند که توسط **Vahid Mahmoudian** آموزش داده شده است. این مدل بر روی مجموعه داده بزرگ **[Persian-Voice-v1](https://huggingface.co/datasets/vhdm/persian-voice-v1)** تنظیم دقیق (fine-tune) شده و دقت بالایی در تبدیل گفتار فارسی به متن دارد.

- **[صفحه مدل در هاگینگ فیس](https://huggingface.co/vhdm/whisper-large-fa-v1)**

## ⚙️ جزئیات فنی

- این برنامه با استفاده از کتابخانه‌های **Gradio** و **Transformers** ساخته شده است.
- این نسخه بر روی سخت‌افزار **CPU** رایگان هاگینگ فیس اجرا می‌شود، بنابراین ممکن است پردازش فایل‌های صوتی طولانی کمی زمان‌بر باشد.

---