vit5-gec / app.py
RickyGM15's picture
Upload app.py
a1cce87 verified
import gradio as gr
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
# Load model từ Hugging Face Hub
model_name = "RickyGM15/vit5-gec"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
def correct_text(input_text):
if not input_text.strip():
return ""
inputs = tokenizer(
input_text,
return_tensors="pt",
truncation=True,
padding=True,
max_length=128
)
outputs = model.generate(
**inputs,
max_length=128,
num_beams=5,
repetition_penalty=1.2,
no_repeat_ngram_size=2,
length_penalty=0.9,
early_stopping=True
)
corrected = tokenizer.decode(outputs[0], skip_special_tokens=True)
return corrected
# Gradio UI
demo = gr.Interface(
fn=correct_text,
inputs=gr.Textbox(lines=3, placeholder="Nhập câu cần sửa lỗi chính tả..."),
outputs="text",
title="📝 ViT5 - Chỉnh sửa lỗi chính tả tiếng Việt",
description="Dựa trên mô hình ViT5 huấn luyện riêng.",
examples=[
["A ko bik gì hết"],
["Toi dang di hoc trua"],
["Mai e đi học về"],
]
)
demo.launch()