liumaolin
commited on
Commit
·
d289ad0
1
Parent(s):
4c23586
添加热词文件路径配置,并在生成模型时使用热词参数。
Browse files- config.py +1 -1
- moyoyo_asr_models/hotwords.txt +0 -0
- transcribe/helpers/funasr.py +2 -5
config.py
CHANGED
|
@@ -83,4 +83,4 @@ LLM_SYS_PROMPT_EN = """
|
|
| 83 |
你是一个英中文翻译专家,将用户输入的英文翻译成中文,用户可以向助手发送需要翻译的内容,助手会回答相应的翻译结果,并确保符合英文语言习惯,你可以调整语气和风格,并考虑到某些词语的文化内涵和地区差异。同时作为翻译家,需将英文翻译成具有信达雅标准的中文。"信" 即忠实于原文的内容与意图;"达" 意味着译文应通顺易懂,表达清晰;"雅" 则追求译文的文化审美和语言的优美。目标是创作出既忠于原作精神,又符合目标语言文化和读者审美的翻译。
|
| 84 |
"""
|
| 85 |
|
| 86 |
-
|
|
|
|
| 83 |
你是一个英中文翻译专家,将用户输入的英文翻译成中文,用户可以向助手发送需要翻译的内容,助手会回答相应的翻译结果,并确保符合英文语言习惯,你可以调整语气和风格,并考虑到某些词语的文化内涵和地区差异。同时作为翻译家,需将英文翻译成具有信达雅标准的中文。"信" 即忠实于原文的内容与意图;"达" 意味着译文应通顺易懂,表达清晰;"雅" 则追求译文的文化审美和语言的优美。目标是创作出既忠于原作精神,又符合目标语言文化和读者审美的翻译。
|
| 84 |
"""
|
| 85 |
|
| 86 |
+
hotwords_file = MODEL_DIR / 'hotwords.txt'
|
moyoyo_asr_models/hotwords.txt
ADDED
|
File without changes
|
transcribe/helpers/funasr.py
CHANGED
|
@@ -1,10 +1,7 @@
|
|
| 1 |
-
import time
|
| 2 |
-
import uuid
|
| 3 |
from logging import getLogger
|
| 4 |
|
| 5 |
import numpy as np
|
| 6 |
from funasr import AutoModel
|
| 7 |
-
import soundfile as sf
|
| 8 |
|
| 9 |
import config
|
| 10 |
|
|
@@ -24,13 +21,13 @@ class FunASR:
|
|
| 24 |
def warmup(self, warmup_steps=1):
|
| 25 |
warmup_soundfile = f"{config.ASSERT_DIR}/jfk.flac"
|
| 26 |
for _ in range(warmup_steps):
|
| 27 |
-
self.model.generate(input=warmup_soundfile, disable_pbar=True)
|
| 28 |
|
| 29 |
def transcribe(self, audio_buffer: bytes, language):
|
| 30 |
audio_frames = np.frombuffer(audio_buffer, dtype=np.float32)
|
| 31 |
# sf.write(f'{config.ASSERT_DIR}/{time.time()}.wav', audio_frames, samplerate=16000)
|
| 32 |
try:
|
| 33 |
-
output = self.model.generate(input=audio_frames, disable_pbar=True)
|
| 34 |
return output
|
| 35 |
except Exception as e:
|
| 36 |
logger.error(e)
|
|
|
|
|
|
|
|
|
|
| 1 |
from logging import getLogger
|
| 2 |
|
| 3 |
import numpy as np
|
| 4 |
from funasr import AutoModel
|
|
|
|
| 5 |
|
| 6 |
import config
|
| 7 |
|
|
|
|
| 21 |
def warmup(self, warmup_steps=1):
|
| 22 |
warmup_soundfile = f"{config.ASSERT_DIR}/jfk.flac"
|
| 23 |
for _ in range(warmup_steps):
|
| 24 |
+
self.model.generate(input=warmup_soundfile, disable_pbar=True, hotword=config.hotwords_file.as_posix())
|
| 25 |
|
| 26 |
def transcribe(self, audio_buffer: bytes, language):
|
| 27 |
audio_frames = np.frombuffer(audio_buffer, dtype=np.float32)
|
| 28 |
# sf.write(f'{config.ASSERT_DIR}/{time.time()}.wav', audio_frames, samplerate=16000)
|
| 29 |
try:
|
| 30 |
+
output = self.model.generate(input=audio_frames, disable_pbar=True, hotword=config.hotwords_file.as_posix())
|
| 31 |
return output
|
| 32 |
except Exception as e:
|
| 33 |
logger.error(e)
|