meem2525 commited on
Commit
bb1c63c
·
verified ·
1 Parent(s): 29d319a

Add README

Browse files
Files changed (1) hide show
  1. README.md +134 -0
README.md ADDED
@@ -0,0 +1,134 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ license: mit
3
+ language:
4
+ - ar
5
+ - en
6
+ - es
7
+ - fr
8
+ - de
9
+ - it
10
+ - tr
11
+ - ru
12
+ - zh
13
+ - ja
14
+ - ko
15
+ - pt
16
+ - hi
17
+ pipeline_tag: translation
18
+ tags:
19
+ - translation
20
+ - dubbing
21
+ - video
22
+ - whisper
23
+ - nllb
24
+ ---
25
+
26
+ # 🎬 Video Dubbing Models
27
+
28
+ مجموعة موديلات AI لدبلجة الفيديوهات تلقائياً بـ 13 لغة.
29
+
30
+ ## 📦 المحتويات
31
+
32
+ ### 1. Whisper-medium
33
+ - **الحجم:** 1.42 GB
34
+ - **الوظيفة:** تحويل الصوت إلى نص (Speech-to-Text)
35
+ - **اللغات:** 99+ لغة
36
+ - **الدقة:** ~95% للعربية والإنجليزية
37
+ - **المصدر:** [OpenAI Whisper](https://github.com/openai/whisper)
38
+
39
+ ### 2. NLLB-200-distilled-600M
40
+ - **الحجم:** 2.33 GB
41
+ - **الوظيفة:** ترجمة النصوص
42
+ - **اللغات:** 200 لغة
43
+ - **الدقة:** عالية للأزواج الشائعة
44
+ - **المصدر:** [Meta NLLB](https://huggingface.co/facebook/nllb-200-distilled-600M)
45
+
46
+ ## 🚀 الاستخدام
47
+
48
+ ### تحميل سريع:
49
+
50
+ ```python
51
+ from huggingface_hub import snapshot_download
52
+ import whisper
53
+ from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
54
+ import torch
55
+
56
+ # تحميل الموديلات
57
+ repo_id = "meem2525/video-dubbing-models"
58
+ local_dir = snapshot_download(repo_id, cache_dir="./models")
59
+
60
+ # Whisper
61
+ whisper_model = whisper.load_model("medium", download_root=f"{local_dir}/whisper")
62
+
63
+ # NLLB
64
+ device = "cuda" if torch.cuda.is_available() else "cpu"
65
+ tokenizer = AutoTokenizer.from_pretrained(f"{local_dir}/nllb")
66
+ translator = AutoModelForSeq2SeqLM.from_pretrained(f"{local_dir}/nllb").to(device)
67
+
68
+ print("✅ جاهز للاستخدام!")
69
+ ```
70
+
71
+ ### مثال كامل:
72
+
73
+ ```python
74
+ # 1. تفريغ الصوت
75
+ result = whisper_model.transcribe("audio.mp3", language="en")
76
+ text = result["text"]
77
+
78
+ # 2. ترجمة
79
+ tokenizer.src_lang = "eng_Latn"
80
+ inputs = tokenizer(text, return_tensors="pt").to(device)
81
+ outputs = translator.generate(
82
+ **inputs,
83
+ forced_bos_token_id=tokenizer.lang_code_to_id["ara_Arab"]
84
+ )
85
+ translated = tokenizer.decode(outputs[0], skip_special_tokens=True)
86
+
87
+ print(f"Original: {text}")
88
+ print(f"Translated: {translated}")
89
+ ```
90
+
91
+ ## 🌐 اللغات المدعومة
92
+
93
+ العربية 🇸🇦 • الإنجليزية 🇬🇧 • الإسبانية 🇪🇸 • الفرنسية 🇫🇷 • الألمانية 🇩🇪 •
94
+ الإيطالية 🇮🇹 • التركية 🇹🇷 • الروسية 🇷🇺 • الصينية 🇨🇳 • اليابانية 🇯🇵 •
95
+ الكورية 🇰🇷 • البرتغالية 🇧🇷 • الهندية 🇮🇳
96
+
97
+ ## 📊 المتطلبات
98
+
99
+ ```bash
100
+ pip install transformers torch torchaudio openai-whisper huggingface_hub
101
+ ```
102
+
103
+ ## 💻 متطلبات النظام
104
+
105
+ - **الذاكرة:** 8GB RAM (16GB موصى)
106
+ - **GPU:** اختياري (يسرّع المعالجة 10x)
107
+ - **المساحة:** ~4GB للموديلات
108
+
109
+ ## 🔧 الأداء
110
+
111
+ | المهمة | CPU | GPU (T4) |
112
+ |--------|-----|----------|
113
+ | تفريغ دقيقة صوت | ~30s | ~5s |
114
+ | ترجمة 100 كلمة | ~2s | ~0.3s |
115
+
116
+ ## 📄 الترخيص
117
+
118
+ MIT License - استخدام حر للأغراض التجارية وغير التجارية
119
+
120
+ ## 🙏 الشكر
121
+
122
+ - OpenAI Whisper Team
123
+ - Meta NLLB Team
124
+ - Hugging Face Community
125
+
126
+ ## 📞 الدعم
127
+
128
+ للإبلاغ عن مشاكل أو اقتراحات: [GitHub Issues](https://github.com/meem2525/video-dubbing-models/issues)
129
+
130
+ ---
131
+
132
+ **تم الإنشاء بـ ❤️ لخدمة المحتوى العربي**
133
+
134
+ **تاريخ الرفع:** 2026-01-17