fix gradio bug

Browse files

Files changed (3) hide show

.gitignore +2 -1
gradio_demo.py +4 -10
server.py +1 -1

.gitignore CHANGED Viewed

	@@ -1 +1,2 @@
1	- __pycache__


1	+ __pycache__
2	+ .gradio

gradio_demo.py CHANGED Viewed

@@ -6,7 +6,7 @@ from print_utils import rich_transcription_postprocess
 from download_utils import download_model
 use_itn = True # 标点符号预测
-max_len = 68
 model_path = os.path.join("sensevoice_ax650", "sensevoice.axmodel")
 bpemodel = "chn_jpn_yue_eng_ko_spectok.bpe.model"
@@ -19,7 +19,7 @@ pipeline = SenseVoiceAx(model_path,
                         language="auto",
                         use_itn=use_itn,
                         tokenizer=tokenizer)
-# 你实现的语言转文本函数
 def speech_to_text(audio_path, lang):
     """
     audio_path: 音频文件路径
@@ -31,8 +31,7 @@ def speech_to_text(audio_path, lang):
     pipeline.choose_language(language=lang)
     asr_res = pipeline.infer(audio_path, print_rtf=True)
     res = " ".join([rich_transcription_postprocess(i) for i in asr_res])
-    # TODO: 这里写你的语音识别逻辑
-    # 返回一个示例文本
     return res
@@ -47,7 +46,7 @@ def main():
         with gr.Row():
             audio_input = gr.Audio(
-                sources=["microphone"],
                 type="filepath",
                 label="录制或上传音频",
                 format="mp3"
@@ -58,9 +57,6 @@ def main():
                 label="选择音频语言"
             )
         audio_input.change(
             fn=speech_to_text,
             inputs=[audio_input, lang_dropdown],
@@ -69,8 +65,6 @@ def main():
     demo.launch(
             server_name="0.0.0.0",
-            server_port=7860,
-            ssl_certfile="./cert.pem", ssl_keyfile="./key.pem", ssl_verify=False
         )
 if __name__ == "__main__":

 from download_utils import download_model
 use_itn = True # 标点符号预测
+max_len = 256
 model_path = os.path.join("sensevoice_ax650", "sensevoice.axmodel")
 bpemodel = "chn_jpn_yue_eng_ko_spectok.bpe.model"
                         language="auto",
                         use_itn=use_itn,
                         tokenizer=tokenizer)
 def speech_to_text(audio_path, lang):
     """
     audio_path: 音频文件路径
     pipeline.choose_language(language=lang)
     asr_res = pipeline.infer(audio_path, print_rtf=True)
     res = " ".join([rich_transcription_postprocess(i) for i in asr_res])
     return res
         with gr.Row():
             audio_input = gr.Audio(
+                sources=["upload"],
                 type="filepath",
                 label="录制或上传音频",
                 format="mp3"
                 label="选择音频语言"
             )
         audio_input.change(
             fn=speech_to_text,
             inputs=[audio_input, lang_dropdown],
     demo.launch(
             server_name="0.0.0.0",
         )
 if __name__ == "__main__":

server.py CHANGED Viewed

@@ -32,7 +32,7 @@ async def load_model():
         # 模型加载
         language = "auto"
         use_itn = True # 标点符号预测
-        max_len = 68
         model_path = os.path.join("sensevoice_ax650", "sensevoice.axmodel")
         bpemodel = "chn_jpn_yue_eng_ko_spectok.bpe.model"

         # 模型加载
         language = "auto"
         use_itn = True # 标点符号预测
+        max_len = 256
         model_path = os.path.join("sensevoice_ax650", "sensevoice.axmodel")
         bpemodel = "chn_jpn_yue_eng_ko_spectok.bpe.model"