sovits3

Runtime error

App Files Files Community

mzltest commited on Apr 10, 2023

Commit

bc9184f

1 Parent(s): 55ae045

Update app.py

Browse files

Files changed (1) hide show

app.py +15 -3

app.py CHANGED Viewed

@@ -10,6 +10,7 @@ import logging
 from logmmse import logmmse
 from typing import Tuple
 import time
 logging.getLogger('numba').setLevel(logging.WARNING)
@@ -34,7 +35,7 @@ class YukieGradio:
                                            "plw"], value="plw", interactive=True)
                     self.dev = gr.Dropdown(label="设备（云端一般请勿切换，使用默认值即可）", choices=[
                                            "cuda", "cpu"], value="cpu", interactive=True)
-                    self.inMic = gr.Microphone(label="录音")
                     self.inAudio = gr.Audio(label="上传音频")
                     self.needLogmmse = gr.Checkbox(label="是否使用自带降噪")
                     self.slice_db = gr.Slider(label="切片阈值(较嘈杂时-30，保留呼吸声时-50，一般默认-40)",
@@ -55,13 +56,24 @@ class YukieGradio:
                     self.vcSubmit.click(infer, inputs=[self.inMic, self.inAudio, self.vcTransform, self.slice_db, self.needLogmmse, self.sid, self.dev], outputs=[
                         self.outVcText, self.outAudio, self.f0_image],api_name="go")
 def infer(inMic, inAudio, transform, slice_db, lm, sid, dev):
     if inAudio != None:
         sampling_rate, inaudio = inAudio
     else:
         if inMic != None:
-            sampling_rate, inaudio = inMic
         else:
             return "请上传一段音频后再次尝试", None

 from logmmse import logmmse
 from typing import Tuple
 import time
+import requests
 logging.getLogger('numba').setLevel(logging.WARNING)
                                            "plw"], value="plw", interactive=True)
                     self.dev = gr.Dropdown(label="设备（云端一般请勿切换，使用默认值即可）", choices=[
                                            "cuda", "cpu"], value="cpu", interactive=True)
+                    self.inMic = gr.Textbox(label='url')
                     self.inAudio = gr.Audio(label="上传音频")
                     self.needLogmmse = gr.Checkbox(label="是否使用自带降噪")
                     self.slice_db = gr.Slider(label="切片阈值(较嘈杂时-30，保留呼吸声时-50，一般默认-40)",
                     self.vcSubmit.click(infer, inputs=[self.inMic, self.inAudio, self.vcTransform, self.slice_db, self.needLogmmse, self.sid, self.dev], outputs=[
                         self.outVcText, self.outAudio, self.f0_image],api_name="go")
+def download_audio(url):
+    # 发送请求
+    response = requests.get(url)
+    # 将响应内容读入内存
+    audio_bytes = BytesIO(response.content)
+    # 使用numpy将音频数据转为int16类型数组
+    audio_data = np.frombuffer(audio_bytes.read(), dtype=np.int16)
+    # 获取音频采样率
+    sample_rate = response.headers.get('Sample-Rate')
+    # 返回Tuple(int, numpy.array)
+    return int(sample_rate), audio_data
 def infer(inMic, inAudio, transform, slice_db, lm, sid, dev):
     if inAudio != None:
         sampling_rate, inaudio = inAudio
     else:
         if inMic != None:
+            sampling_rate, inaudio=download_audio(inMic)
         else:
             return "请上传一段音频后再次尝试", None