RickyGM15
/

vit5-gec

Model card Files Files and versions

vit5-gec / app.py

RickyGM15's picture

Upload app.py

a1cce87 verified 11 months ago

history blame contribute delete

1.3 kB

	import gradio as gr
	from transformers import AutoTokenizer, AutoModelForSeq2SeqLM

	# Load model từ Hugging Face Hub
	model_name = "RickyGM15/vit5-gec"
	tokenizer = AutoTokenizer.from_pretrained(model_name)
	model = AutoModelForSeq2SeqLM.from_pretrained(model_name)

	def correct_text(input_text):
	if not input_text.strip():
	return ""

	inputs = tokenizer(
	input_text,
	return_tensors="pt",
	truncation=True,
	padding=True,
	max_length=128
	)

	outputs = model.generate(
	**inputs,
	max_length=128,
	num_beams=5,
	repetition_penalty=1.2,
	no_repeat_ngram_size=2,
	length_penalty=0.9,
	early_stopping=True
	)

	corrected = tokenizer.decode(outputs[0], skip_special_tokens=True)
	return corrected

	# Gradio UI
	demo = gr.Interface(
	fn=correct_text,
	inputs=gr.Textbox(lines=3, placeholder="Nhập câu cần sửa lỗi chính tả..."),
	outputs="text",
	title="📝 ViT5 - Chỉnh sửa lỗi chính tả tiếng Việt",
	description="Dựa trên mô hình ViT5 huấn luyện riêng.",
	examples=[
	["A ko bik gì hết"],
	["Toi dang di hoc trua"],
	["Mai e đi học về"],
	]
	)

	demo.launch()