chenjgtea commited on
Commit ·
5419e79
1
Parent(s): 02e3b7f
提交代码
Browse files- web/app.py +14 -5
web/app.py
CHANGED
|
@@ -170,13 +170,22 @@ def main(args):
|
|
| 170 |
logger.info("元素初始化完成,启动gradio服务=======")
|
| 171 |
|
| 172 |
# 运行gradio服务
|
| 173 |
-
demo.launch(
|
| 174 |
-
server_name=args.server_name,
|
| 175 |
-
server_port=args.server_port,
|
| 176 |
-
inbrowser=True,
|
| 177 |
-
show_api=False)
|
| 178 |
|
| 179 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 180 |
@spaces.GPU
|
| 181 |
def get_chat_infer_audio(chat_txt,
|
| 182 |
temperature_slider,
|
|
|
|
| 170 |
logger.info("元素初始化完成,启动gradio服务=======")
|
| 171 |
|
| 172 |
# 运行gradio服务
|
| 173 |
+
demo.launch()
|
|
|
|
|
|
|
|
|
|
|
|
|
| 174 |
|
| 175 |
|
| 176 |
+
'''
|
| 177 |
+
top_K: "top_K"(K个最高得分)是指在所有可能的生成结果中,模型会选取前K个得分最高的结果。这个设置常常用于基于概率的生成任务,例如语言模型中的词或句子生成。当你设置top_K为K时,你要求模型选择得分最高的K个选项,这样输出通常会有一定的多样性,但仍然是基于模型的前K个预测。
|
| 178 |
+
|
| 179 |
+
top_P: "top_P"(概率阈值)则是一个连续的值,而不是离散的整数。它代表的是一个概率阈值,模型会生成所有得分高于该阈值的概率的项目。换句话说,top_P会生成那些概率大于等于给定值的所有生成结果。这个设置更为灵活,可以根据实际需求调整生成内容的不确定性,高频选项被生成的概率较高,而低频可能性则可能根据阈值随机出现。
|
| 180 |
+
|
| 181 |
+
在实际应用中,选择top_K还是top_P取决于具体任务需求,如是否希望生成内容有一定程度的多样化(top_K),还是希望生成的内容更接近于最可能发生的选项(top_P)。较高的top_P可能会引入更多的随机性和创新,而较低的top_K则更倾向于保守的选择。
|
| 182 |
+
|
| 183 |
+
spk_embedding(Speaker Embedding): 这个术语一般用于语音识别或者多说话者模型中。"spk_embedding"指的是每个说话人的身份或特征向量,或者说是用户标识的嵌入表示。在对话系统中,它能帮助模型区分不同的说话者,比如在多轮对话中区分是同一个用户的不同回复,或者是不同用户的交互。这个嵌入可能包含了说话人的个性、语调、口音等信息,有助于提高对话的连贯性和自然性。
|
| 184 |
+
|
| 185 |
+
temperature: 通常在语言模型的生成(如基于概率的softmax)中使用。"temperature"是一个正数,用于控制生成内容的随机性和多样性。当温度较低(如0.1)时,模型倾向于生成最可能的结果,文字更保守,少有创新;当温度较高(如1或更高)时,模型将更倾向于产生多样化的内容,但可能性较大的选项将被稀释。因此,temperature调整是一个常用的平衡方法,使得生成更具创造性或是更符合预期。
|
| 186 |
+
|
| 187 |
+
简而言之,"spk_embedding"关注的是对话参与者的身份特征,而"temperature"是用于调整生成文本不确定性的一个超参数。
|
| 188 |
+
'''
|
| 189 |
@spaces.GPU
|
| 190 |
def get_chat_infer_audio(chat_txt,
|
| 191 |
temperature_slider,
|