MoYoYoTech
/

Translator

Model card Files Files and versions

Translator / transcribe /translator.py

daihui.zhang

add frontend demo

2a2d4ba about 1 year ago

1.32 kB

	from logging import getLogger
	from llama_cpp import Llama
	import time

	logger = getLogger(__name__)

	class QwenTranslator:
	def __init__(self, model_path, system_prompt="") -> None:
	self.llm = Llama(
	model_path=model_path,
	# n_gpu_layers=-1, # Uncomment to use GPU acceleration
	# seed=1337, # Uncomment to set a specific seed
	# n_ctx=2048, # Uncomment to increase the context window
	chat_format="chatml",
	verbose=False
	)
	self.sys_prompt = system_prompt

	def to_message(self, prompt, src_lang, dst_lang):
	"""构造提示词"""
	return [
	{"role": "system", "content": self.sys_prompt.format(src_lang=src_lang, dst_lang=dst_lang)},
	{"role": "user", "content": prompt},
	]


	def translate(self, prompt, src_lang, dst_lang) -> str:
	message = self.to_message(prompt, src_lang, dst_lang)
	start_time = time.monotonic()
	output = self.llm.create_chat_completion(messages=message, temperature=0.9)
	logger.info(f"Translate time: {time.monotonic() - start_time:.2f}s.")
	return output['choices'][0]['message']['content']

	def __call__(self, prompt,args, *kwargs):
	return self.llm(
	prompt,
	*args,
	**kwargs
	)