Za6na commited on
Commit
57e6b48
·
verified ·
1 Parent(s): 2103752

Delete app.py

Browse files
Files changed (1) hide show
  1. app.py +0 -61
app.py DELETED
@@ -1,61 +0,0 @@
1
- import gradio as gr
2
- from transformers import AutoModelForSpeechSeq2Seq, AutoProcessor, pipeline
3
- import torch
4
- import librosa
5
- import numpy as np
6
-
7
- # ١. دیاریکردنی جۆری ئامێر (Device)
8
- device = "cuda:0" if torch.cuda.is_available() else "cpu"
9
- torch_dtype = torch.float16 if torch.cuda.is_available() else torch.float32
10
-
11
- # ٢. بارکردنی مۆدێلەکە لە ڕێپۆکەی خۆتەوە
12
- model_id = "Za6na/sorani2"
13
-
14
- model = AutoModelForSpeechSeq2Seq.from_pretrained(
15
- model_id,
16
- torch_dtype=torch_dtype,
17
- low_cpu_mem_usage=True,
18
- use_safetensors=True
19
- )
20
- model.to(device)
21
-
22
- processor = AutoProcessor.from_pretrained(model_id)
23
-
24
- # ٣. دروستکردنی پیمپلاین (Pipeline)
25
- pipe = pipeline(
26
- "automatic-speech-recognition",
27
- model=model,
28
- tokenizer=processor.tokenizer,
29
- feature_extractor=processor.feature_extractor,
30
- max_new_tokens=128,
31
- chunk_length_s=30,
32
- batch_size=16,
33
- return_timestamps=True,
34
- torch_dtype=torch_dtype,
35
- device=device,
36
- )
37
-
38
- # ٤. فەنکشن بۆ وەرگێڕانی دەنگ
39
- def transcribe(audio):
40
- if audio is None:
41
- return "تکایە دەنگێک تۆمار بکە یان فایلێک بار بکە."
42
-
43
- # خوێندنەوەی دەنگەکە
44
- sr, y = audio
45
- y = y.astype(np.float32)
46
- y /= np.max(np.abs(y))
47
-
48
- # ناردن بۆ مۆدێل
49
- result = pipe(y, generate_kwargs={"language": "persian"}) # یان "kurdish" ئەگەر پشتگیری بکات
50
- return result["text"]
51
-
52
- # ٥. دروستکردنی ڕووکاری Gradio
53
- iface = gr.Interface(
54
- fn=transcribe,
55
- inputs=gr.Audio(sources=["microphone", "upload"], type="numpy", label="دەنگەکەت لێرە تۆمار بکە"),
56
- outputs="text",
57
- title="تێستکردنی مۆدێلی سۆرانی (Za6na/sorani2)",
58
- description="فەرموو قسە بکە، مۆدێلەکە دەیکات بە نووسین.",
59
- )
60
-
61
- iface.launch()