liumaolin commited on
Commit
d289ad0
·
1 Parent(s): 4c23586

添加热词文件路径配置,并在生成模型时使用热词参数。

Browse files
config.py CHANGED
@@ -83,4 +83,4 @@ LLM_SYS_PROMPT_EN = """
83
  你是一个英中文翻译专家,将用户输入的英文翻译成中文,用户可以向助手发送需要翻译的内容,助手会回答相应的翻译结果,并确保符合英文语言习惯,你可以调整语气和风格,并考虑到某些词语的文化内涵和地区差异。同时作为翻译家,需将英文翻译成具有信达雅标准的中文。"信" 即忠实于原文的内容与意图;"达" 意味着译文应通顺易懂,表达清晰;"雅" 则追求译文的文化审美和语言的优美。目标是创作出既忠于原作精神,又符合目标语言文化和读者审美的翻译。
84
  """
85
 
86
-
 
83
  你是一个英中文翻译专家,将用户输入的英文翻译成中文,用户可以向助手发送需要翻译的内容,助手会回答相应的翻译结果,并确保符合英文语言习惯,你可以调整语气和风格,并考虑到某些词语的文化内涵和地区差异。同时作为翻译家,需将英文翻译成具有信达雅标准的中文。"信" 即忠实于原文的内容与意图;"达" 意味着译文应通顺易懂,表达清晰;"雅" 则追求译文的文化审美和语言的优美。目标是创作出既忠于原作精神,又符合目标语言文化和读者审美的翻译。
84
  """
85
 
86
+ hotwords_file = MODEL_DIR / 'hotwords.txt'
moyoyo_asr_models/hotwords.txt ADDED
File without changes
transcribe/helpers/funasr.py CHANGED
@@ -1,10 +1,7 @@
1
- import time
2
- import uuid
3
  from logging import getLogger
4
 
5
  import numpy as np
6
  from funasr import AutoModel
7
- import soundfile as sf
8
 
9
  import config
10
 
@@ -24,13 +21,13 @@ class FunASR:
24
  def warmup(self, warmup_steps=1):
25
  warmup_soundfile = f"{config.ASSERT_DIR}/jfk.flac"
26
  for _ in range(warmup_steps):
27
- self.model.generate(input=warmup_soundfile, disable_pbar=True)
28
 
29
  def transcribe(self, audio_buffer: bytes, language):
30
  audio_frames = np.frombuffer(audio_buffer, dtype=np.float32)
31
  # sf.write(f'{config.ASSERT_DIR}/{time.time()}.wav', audio_frames, samplerate=16000)
32
  try:
33
- output = self.model.generate(input=audio_frames, disable_pbar=True)
34
  return output
35
  except Exception as e:
36
  logger.error(e)
 
 
 
1
  from logging import getLogger
2
 
3
  import numpy as np
4
  from funasr import AutoModel
 
5
 
6
  import config
7
 
 
21
  def warmup(self, warmup_steps=1):
22
  warmup_soundfile = f"{config.ASSERT_DIR}/jfk.flac"
23
  for _ in range(warmup_steps):
24
+ self.model.generate(input=warmup_soundfile, disable_pbar=True, hotword=config.hotwords_file.as_posix())
25
 
26
  def transcribe(self, audio_buffer: bytes, language):
27
  audio_frames = np.frombuffer(audio_buffer, dtype=np.float32)
28
  # sf.write(f'{config.ASSERT_DIR}/{time.time()}.wav', audio_frames, samplerate=16000)
29
  try:
30
+ output = self.model.generate(input=audio_frames, disable_pbar=True, hotword=config.hotwords_file.as_posix())
31
  return output
32
  except Exception as e:
33
  logger.error(e)