Spaces:

chaore
/

ttsedge

Sleeping

App Files Files Community

ttsedge / gradio_app.py

chaore

Upload gradio_app.py

49e81b2 verified 3 months ago

raw

history blame contribute delete

4.76 kB

	import gradio as gr
	import edge_tts
	import asyncio
	import os

	# 定义生成音频的异步函数
	async def generate_audio(text, voice, rate, volume, pitch):
	try:
	# 创建输出文件路径
	output_path = "output.mp3"

	# 使用edge-tts生成音频
	communicate = edge_tts.Communicate(text, voice, rate=rate, volume=volume, pitch=pitch)
	await communicate.save(output_path)

	return output_path
	except Exception as e:
	print(f"生成音频失败: {e}")
	raise gr.Error(f"生成音频失败: {str(e)}")

	# 定义Gradio界面的主函数
	def text_to_speech(text, voice, rate, volume, pitch):
	try:
	# 将rate和volume参数转换为edge-tts需要的格式
	rate_str = f"+{int(rate)}%" if rate >= 0 else f"{int(rate)}%"
	volume_str = f"+{int(volume)}%" if volume >= 0 else f"{int(volume)}%"
	pitch_str = f"+{int(pitch)}Hz" if pitch >= 0 else f"{int(pitch)}Hz"

	# 调用异步函数生成音频
	loop = asyncio.new_event_loop()
	asyncio.set_event_loop(loop)
	output_path = loop.run_until_complete(generate_audio(text, voice, rate_str, volume_str, pitch_str))
	loop.close()

	return output_path
	except Exception as e:
	print(f"文本转语音失败: {e}")
	raise gr.Error(f"文本转语音失败: {str(e)}")

	# 异步获取所有可用语音
	def get_voices():
	try:
	loop = asyncio.new_event_loop()
	asyncio.set_event_loop(loop)
	voices = loop.run_until_complete(edge_tts.list_voices())
	loop.close()

	# 过滤出支持的语音，并按语言分组
	voice_options = []
	for voice in voices:
	short_name = voice.get("ShortName", "")
	friendly_name = voice.get("FriendlyName", short_name)
	locale = voice.get("Locale", "")
	voice_options.append((f"{friendly_name} ({locale})", short_name))

	# 按友好名称排序
	voice_options.sort(key=lambda x: x[0])

	return voice_options
	except Exception as e:
	# 如果获取语音列表失败，返回默认的语音列表
	print(f"获取语音列表失败: {e}")
	return [
	("中文女声 (zh-CN)", "zh-CN-YunxiNeural"),
	("中文男声 (zh-CN)", "zh-CN-YunxiNeural"),
	("英文女声 (en-US)", "en-US-JennyNeural"),
	("英文男声 (en-US)", "en-US-GuyNeural")
	]

	# 获取所有可用语音
	voice_options = get_voices()

	# 创建Gradio界面
	with gr.Blocks(title="Edge TTS 配音工具") as demo:
	gr.Markdown("# Edge TTS 配音工具")
	gr.Markdown("输入文本，选择语音，调节语速、音量和语调，然后点击合成按钮生成音频。")

	with gr.Row():
	with gr.Column(scale=2):
	# 文本输入框
	text_input = gr.Textbox(
	label="输入文本",
	placeholder="请输入要转换为语音的文本...",
	lines=5,
	max_lines=10
	)

	# 语音选择下拉菜单
	voice_dropdown = gr.Dropdown(
	label="选择语音",
	choices=voice_options,
	value="zh-CN-YunxiNeural"
	)

	# 语速滑块
	rate_slider = gr.Slider(
	label="语速",
	minimum=-50,
	maximum=50,
	step=5,
	value=0,
	info="-50% 到 +50%"
	)

	# 音量滑块
	volume_slider = gr.Slider(
	label="音量",
	minimum=-50,
	maximum=50,
	step=5,
	value=0,
	info="-50% 到 +50%"
	)

	# 语调滑块
	pitch_slider = gr.Slider(
	label="语调",
	minimum=-50,
	maximum=50,
	step=5,
	value=0,
	info="-50Hz 到 +50Hz"
	)

	# 合成按钮
	generate_button = gr.Button("合成语音", variant="primary")

	with gr.Column(scale=1):
	# 音频输出
	audio_output = gr.Audio(
	label="合成音频",
	type="filepath"
	)

	# 设置按钮点击事件
	generate_button.click(
	fn=text_to_speech,
	inputs=[text_input, voice_dropdown, rate_slider, volume_slider, pitch_slider],
	outputs=audio_output
	)

	# 启动Gradio应用
	if __name__ == "__main__":
	demo.launch(server_name="0.0.0.0", server_port=7860)