Spaces:

TUHs
/

CN-SambertPersonalTTS

Sleeping

App Files Files Community

TUHs commited on Dec 14, 2023

Commit

7627fc7

1 Parent(s): 8127559

Update app.py

Browse files

Files changed (1) hide show

app.py +94 -12

app.py CHANGED Viewed

@@ -336,7 +336,7 @@ def FRCRN_De_Noise(noise_wav, noisemic_wav):
   ans = pipeline(
     Tasks.acoustic_noise_suppression,
-    model='/home/user/app/damo/speech_frcrn_ans_cirm_16k')
   # 生成文件名
   now = datetime.datetime.now()
@@ -346,8 +346,40 @@ def FRCRN_De_Noise(noise_wav, noisemic_wav):
   result = ans(
     noise_audio,
-    output_path= filename + "denoise.wav" )
   return filename + "denoise.wav"
@@ -382,6 +414,19 @@ with app:
             btn2.click(train, inp2, out2)
             btn3.click(infer, inp3, out3)
             btn4.click(save_model, out1, out4) # 保存模型到 trained_model 文件夹
         with gr.TabItem("声音合成"):
             with gr.Row():
@@ -398,6 +443,16 @@ with app:
             btn21.click(update_model_dropdown, inp21, inp21)
             btn22.click(infer_custom, [inp21, inp23, inp22], out21) # 根据选择的模型和输入的文本进行推理
         with gr.TabItem("模型修改"):
             with gr.Row():
@@ -412,18 +467,42 @@ with app:
               btn32 = gr.Button("重命名", variant="primary") # 重命名模型
             btn31.click(update_model_dropdown, inp31, inp31)
-            btn32.click(rename_model, [inp31, inp32], out31)
         with gr.TabItem("AI降噪"):
             with gr.Row():
               with gr.Column():
                 inp41 = gr.Audio(type="filepath", sources="upload", label="方案一：请从本地上传一段语音")
-                inp_micro41 = gr.Audio(type="filepath", sources="microphone", label="方案二：请用麦克风录制您的声音")
               with gr.Column():
-                out41 = gr.Audio(type="filepath", label="AI降噪后的音频", interactive=False)
-                btn41 = gr.Button("一键AI降噪", variant="primary")
-            btn41.click(FRCRN_De_Noise, [inp41, inp_micro41], out41)
         with gr.TabItem("缓存清理"): # 创建一个 gr.Blocks() 组件，命名为 "加载和推理"
             with gr.Row():
@@ -444,13 +523,15 @@ with app:
-    with gr.Accordion("📒 使用指南", open=True):
         _ = f""" 如何使用此程序:
-            * 第一步，选择 [方案一] 或 [方案二] 上传一分钟左右的音频，注意要吐字清晰、感情饱满、音色纯净不含杂音
-            * 第二步，点击“标注数据”，等到提示标注成功后，选择合适的训练步数，点击“开始训练”等待训练完成
-            * 第三步，耐心等待训练成功后，在文本框内输入想要生成的文字，点击“一键生成”按钮，生成克隆后的语音
             * ！！注意！！  不要生成会对个人以及组织造成侵害的内容
-            * 如果您需要用方案二录制您的声音，以下是一段长度合适的文本，供您朗读并录制：
             记得春天的时候，小草就转出地面，树上的叶子也抽出来了，大地一片绿色，就像穿上了一件绿衣裳。我就与小孩子一起到田野去捉蜻蜓，玩游戏，比如老鹰合作小鸡或是捉迷藏，又或是跳格子。到了夏天，天气热了，我就会与小孩子到水库里面游泳，那时候水库的安全系数还不是很高，几乎每年都会有事故发生，所以父母都不会让我去游泳的，被发现之后当然就是处罚或是责骂了。可是那时候自己真的很叛逆，也不知道什么是危险，被处罚之后下一次还是回去的。到了秋天，田野一片金黄，山上的野果也成熟了，我就会与自己的伙伴拿着篮子到上山去采，采回来了还要跟自己的好朋友一起分享。
@@ -466,4 +547,5 @@ with app:
         </div>
     ''')
 app.launch(show_error=True, share=False)

   ans = pipeline(
     Tasks.acoustic_noise_suppression,
+    model='/home/yiho/Personal-TTS-v3/damo/speech_frcrn_ans_cirm_16k')
   # 生成文件名
   now = datetime.datetime.now()
   result = ans(
     noise_audio,
+    output_path= filename + "AIdenoise.wav" )
+  return filename + "AIdenoise.wav"
+#使用傅里叶变换降噪
+def Normal_De_Noise(noise_wav, noisemic_wav, noise_level):
+  if noisemic_wav is not None:
+      noise_audio = noisemic_wav
+  else:
+      noise_audio = noise_wav
+    # 生成文件名
+  now = datetime.datetime.now()
+  date_str = now.strftime("%Y%m%d%H%M%S")
+  rand_num = random.randint(1000, 9999)
+  filename = date_str + str(rand_num)
+    # 读取音频文件
+  y, sr = librosa.load(noise_audio)
+    # 计算短时傅里叶变换
+  S = librosa.stft(y)
+    # 计算噪声的均值和标准差
+  noise = S[np.abs(S) < np.percentile(S, 95)]
+  noise_mean, noise_std = np.mean(noise), np.std(noise)
+    # 创建滤波器
+  filter_ = np.ones_like(S)
+  filter_[np.abs(S) < noise_mean + noise_level * noise_std] = 0
+    # 应用滤波器
+  filtered_S = filter_ * S
+    # 反转傅里叶变换
+  filtered_y = librosa.istft(filtered_S)
+    # 保存降噪后的音频文件
+  sf.write(filename + "denoise.wav", filtered_y, sr)
   return filename + "denoise.wav"
             btn2.click(train, inp2, out2)
             btn3.click(infer, inp3, out3)
             btn4.click(save_model, out1, out4) # 保存模型到 trained_model 文件夹
+            with gr.Accordion("📒 训练教程", open=True):
+              _ = f""" 如何开始训练:
+                  * 第一步，选择 [方案一] 或 [方案二] 上传一分钟左右的音频，注意要吐字清晰、感情饱满、音色纯净不含杂音
+                  * 第二步，点击“标注数据”，等到提示标注成功后，选择合适的训练步数，点击“开始训练”等待训练完成
+                  * 第三步，耐心等待训练成功后，在文本框内输入想要生成的文字，点击“一键生成”按钮，生成克隆后的语音
+                  * ！！注意！！  不要生成会对个人以及组织造成侵害的内容
+                  * 如果您的训练素材比较嘈杂，您可以在[AI降噪]选项卡上传或录制训练音频，降噪后再上传到训练界面
+                  * 如果您需要用方案二录制您的声音，以下是一段长度合适的文本，供您朗读并录制：
+                  记得春天的时候，小草就转出地面，树上的叶子也抽出来了，大地一片绿色，就像穿上了一件绿衣裳。我就与小孩子一起到田野去捉蜻蜓，玩游戏，比如老鹰合作小鸡或是捉迷藏，又或是跳格子。到了夏天，天气热了，我就会与小孩子到水库里面游泳，那时候水库的安全系数还不是很高，几乎每年都会有事故发生，所以父母都不会让我去游泳的，被发现之后当然就是处罚或是责骂了。可是那时候自己真的很叛逆，也不知道什么是危险，被处罚之后下一次还是回去的。到了秋天，田野一片金黄，山上的野果也成熟了，我就会与自己的伙伴拿着篮子到上山去采，采回来了还要跟自己的好朋友一起分享。
+                  """
+              gr.Markdown(dedent(_))
         with gr.TabItem("声音合成"):
             with gr.Row():
             btn21.click(update_model_dropdown, inp21, inp21)
             btn22.click(infer_custom, [inp21, inp23, inp22], out21) # 根据选择的模型和输入的文本进行推理
+            with gr.Accordion("📒 推理教程", open=True):
+              _ = f""" 如何推理声音:
+                  * 第一步，选择一个你想要使用的模型，如果训练后保存的模型无法找到请点击“刷新模型列表”
+                  * 第二步，在文本框处输入你想要生成的文本，选择降噪强度，如果无需降噪请将强度设为0
+                  * 第三步，点击“一键生成”按钮，生成克隆后的语音
+                  * ！！注意！！  不要生成会对个人以及组织造成侵害的内容
+                  * 此处使用的降噪算法为机械降噪，非AI降噪，如需AI降噪可以将生成的音频下载后转到“AI降噪”选项卡进行AI降噪
+                  """
+              gr.Markdown(dedent(_))
         with gr.TabItem("模型修改"):
             with gr.Row():
               btn32 = gr.Button("重命名", variant="primary") # 重命名模型
             btn31.click(update_model_dropdown, inp31, inp31)
+            btn32.click(rename_model, [inp31, inp32], out31)
+            with gr.Accordion("📒 推理教程", open=True):
+              _ = f""" 如何修改模型名称:
+                  * 第一步，选择一个你想要修改的模型，如果训练后保存的模型无法找到请点击“刷新模型列表”
+                  * 第二步，在文本框处输入你想要修改的模型名称，推荐以“[训练步数]时间-名称”来命名
+                  * 第三步，点击“重命名”按钮对模型重命名
+                  """
+              gr.Markdown(dedent(_))
         with gr.TabItem("AI降噪"):
             with gr.Row():
               with gr.Column():
                 inp41 = gr.Audio(type="filepath", sources="upload", label="方案一：请从本地上传一段语音")
+                inp_micro42 = gr.Audio(type="filepath", sources="microphone", label="方案二：请用麦克风录制您的声音")
               with gr.Column():
+                out41 = gr.Audio(type="filepath", label="降噪后的音频", interactive=False)
+                inp43 = gr.Slider(label="机械降噪强度(非AI降噪)", minimum=0, maximum=3, value=2)
+                btn41 = gr.Button("机械降噪")
+                btn42 = gr.Button("一键AI降噪", variant="primary")
+            btn41.click(Normal_De_Noise, [inp41, inp_micro42, inp43], out41)
+            btn42.click(FRCRN_De_Noise, [inp41, inp_micro42], out41)
+            with gr.Accordion("📒 AI降噪", open=True):
+              _ = f""" 如何使用AI降噪:
+                  * 第一步，在[方案一]上传你想要降噪的音频，或者在[方案二]录制音频
+                  * 第二步，点击“一键AI降噪”进行降噪
+                  * 第三步，下载降噪后的音频
+                  * 如果您的训练素材比较嘈杂，您可以在此处上传或录制训练音频，降噪后再上传到训练界面
+                  * 如果您需要用方案二录制您的声音，以下是一段长度合适的文本，供您朗读并录制：
+                  记得春天的时候，小草就转出地面，树上的叶子也抽出来了，大地一片绿色，就像穿上了一件绿衣裳。我就与小孩子一起到田野去捉蜻蜓，玩游戏，比如老鹰合作小鸡或是捉迷藏，又或是跳格子。到了夏天，天气热了，我就会与小孩子到水库里面游泳，那时候水库的安全系数还不是很高，几乎每年都会有事故发生，所以父母都不会让我去游泳的，被发现之后当然就是处罚或是责骂了。可是那时候自己真的很叛逆，也不知道什么是危险，被处罚之后下一次还是回去的。到了秋天，田野一片金黄，山上的野果也成熟了，我就会与自己的伙伴拿着篮子到上山去采，采回来了还要跟自己的好朋友一起分享。
+                  * AI降噪与机械降噪的不同：机械降噪主要是移除声音的激波，会对人声造成一定的破坏，而AI降噪主要是移除声音中的非人声部分，可以处理复杂的背景音频环境，但是对人声本身质量问题处理的效果一般
+                  """
+              gr.Markdown(dedent(_))
         with gr.TabItem("缓存清理"): # 创建一个 gr.Blocks() 组件，命名为 "加载和推理"
             with gr.Row():
+    with gr.Accordion("📒 使用指南", open=False):
         _ = f""" 如何使用此程序:
+            * [一键训练] ： 上传或录制音频，程序会自动标注音频，一键训练模型，支持训练后推理试听，支持模型保存
+            * [声音合成] ： 在这里可以选择已保存的模型进行推理，自带可调机械降噪，可以任意选择已训练的音频进行推理
+            * [模型修改] ： 在这里可以选择已保存的模型进行重命名，方便日后推理使用
+            * [ AI降噪 ] :  在这里可以上传音频进行AI降噪，一键去除噪音杂声
+            * [缓存清理] ： 如果训��时出现报错可以尝试缓存清理，每次保存模型会自动清理缓存，如果未保存就重新开始训练需要清理缓存
             * ！！注意！！  不要生成会对个人以及组织造成侵害的内容
+            * 如果您需要录制您的声音，以下是一段长度合适的文本，供您朗读并录制：
             记得春天的时候，小草就转出地面，树上的叶子也抽出来了，大地一片绿色，就像穿上了一件绿衣裳。我就与小孩子一起到田野去捉蜻蜓，玩游戏，比如老鹰合作小鸡或是捉迷藏，又或是跳格子。到了夏天，天气热了，我就会与小孩子到水库里面游泳，那时候水库的安全系数还不是很高，几乎每年都会有事故发生，所以父母都不会让我去游泳的，被发现之后当然就是处罚或是责骂了。可是那时候自己真的很叛逆，也不知道什么是危险，被处罚之后下一次还是回去的。到了秋天，田野一片金黄，山上的野果也成熟了，我就会与自己的伙伴拿着篮子到上山去采，采回来了还要跟自己的好朋友一起分享。
         </div>
     ''')
 app.launch(show_error=True, share=False)