Spaces:

vanhai123
/

VietDescriberAI

Sleeping

App Files Files Community

vanhai123 commited on May 26, 2025

Commit

6a4da27

verified ·

1 Parent(s): a283bc6

Create app.py

Browse files

Files changed (1) hide show

app.py +36 -0

app.py ADDED Viewed

	@@ -0,0 +1,36 @@

+import gradio as gr
+from transformers import BlipProcessor, BlipForConditionalGeneration, AutoTokenizer, AutoModelForSeq2SeqLM
+from PIL import Image
+import torch
+# Load model 1: English image captioning
+blip_processor = BlipProcessor.from_pretrained("Salesforce/blip-image-captioning-base")
+blip_model = BlipForConditionalGeneration.from_pretrained("Salesforce/blip-image-captioning-base")
+# Load model 2: Translate EN → VI
+translator_tokenizer = AutoTokenizer.from_pretrained("facebook/nllb-200-distilled-600M")
+translator_model = AutoModelForSeq2SeqLM.from_pretrained("facebook/nllb-200-distilled-600M")
+lang_code = "vie_Latn"
+def caption_translate(image):
+    # Step 1: Get English caption
+    inputs = blip_processor(image, return_tensors="pt")
+    out = blip_model.generate(**inputs)
+    eng_caption = blip_processor.decode(out[0], skip_special_tokens=True)
+    # Step 2: Translate to Vietnamese
+    inputs = translator_tokenizer(eng_caption, return_tensors="pt", src_lang="eng_Latn", tgt_lang=lang_code)
+    translated = translator_model.generate(**inputs, max_length=100)
+    vi_caption = translator_tokenizer.decode(translated[0], skip_special_tokens=True)
+    return f"📷 Mô tả: {vi_caption}\n\n(English: {eng_caption})"
+iface = gr.Interface(
+    fn=caption_translate,
+    inputs=gr.Image(type="pil"),
+    outputs="text",
+    title="🧠 AI Mô Tả Hình Ảnh Bằng Tiếng Việt",
+    description="Upload ảnh, hệ thống sẽ mô tả nội dung bằng tiếng Việt bằng cách kết hợp 2 mô hình: caption → translate"
+)
+iface.launch()