Spaces:

snjev310
/

eng_angika_translation

Paused

App Files Files Community

snjev310 commited on Mar 20

Commit

a6311ff

verified ·

1 Parent(s): 7a44fae

Update app.py

Browse files

Files changed (1) hide show

app.py +71 -32

app.py CHANGED Viewed

@@ -1,65 +1,104 @@
 import gradio as gr
 import torch
 import spaces
-from transformers import AutoModelForSeq2SeqLM, AutoTokenizer, BitsAndBytesConfig
 from peft import PeftModel
-# Configuration
 BASE_MODEL_ID = "CohereForAI/aya-101"
-ADAPTER_ID = "snjev310/aya-101-english-angika"
-# Tokenizer can stay global (it's small)
 tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL_ID)
-@spaces.GPU(duration=60) # Increased duration for the large model load
-def translate(text):
     if not text.strip():
-        return ""
-    # 1. Use 4-bit quantization to fit the model easily
-    quant_config = BitsAndBytesConfig(
-        load_in_4bit=True,
-        bnb_4bit_compute_dtype=torch.float16,
-        bnb_4bit_use_double_quant=True,
-        bnb_4bit_quant_type="nf4"
-    )
-    # 2. Load model INSIDE the function for ZeroGPU
     base_model = AutoModelForSeq2SeqLM.from_pretrained(
         BASE_MODEL_ID,
-        quantization_config=quant_config,
         device_map="auto"
     )
-    model = PeftModel.from_pretrained(base_model, ADAPTER_ID)
-    # 3. Inference
-    input_text = f"translate English to Angika: {text}"
-    inputs = tokenizer(input_text, return_tensors="pt").to(model.device)
     with torch.no_grad():
         outputs = model.generate(
             **inputs,
-            max_new_tokens=128,
             temperature=0.3,
-            do_sample=True
         )
-    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    # Optional: Clean up to free memory immediately
     del model
     del base_model
     torch.cuda.empty_cache()
-    return response
-# UI remains the same
 with gr.Blocks(theme=gr.themes.Soft()) as demo:
-    gr.Markdown("# 🗣️ Angika Translator (Aya-101)")
-    input_box = gr.Textbox(label="English Input")
-    output_box = gr.Textbox(label="Angika Translation")
-    btn = gr.Button("Translate", variant="primary")
-    btn.click(fn=translate, inputs=input_box, outputs=output_box)
 demo.launch()

 import gradio as gr
 import torch
 import spaces
+from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
 from peft import PeftModel
+# --- Configuration ---
 BASE_MODEL_ID = "CohereForAI/aya-101"
+# Map the dropdown options to your 3 Hugging Face Model IDs
+MODEL_MAP = {
+    "English to Angika": "snjev310/aya-101-english-angika",
+    "Hindi to Angika": "snjev310/aya-101-hindi-angika",
+    "Angika to English": "snjev310/aya-101-angika-english"
+}
+# Load Tokenizer globally (it's small and stays in CPU RAM)
 tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL_ID)
+@spaces.GPU(duration=180) # 3 minutes to allow for 13B model loading + inference
+def translate(text, model_choice):
     if not text.strip():
+        return "Please enter text to translate."
+    adapter_id = MODEL_MAP[model_choice]
+    # 1. Load Base Model in bfloat16 (Standard for Aya-101)
+    # Pro ZeroGPU has ~70GB VRAM, so we don't need 4-bit quantization
     base_model = AutoModelForSeq2SeqLM.from_pretrained(
         BASE_MODEL_ID,
+        torch_dtype=torch.bfloat16,
+        low_cpu_mem_usage=True,
         device_map="auto"
     )
+    # 2. Load the specific PEFT Adapter
+    model = PeftModel.from_pretrained(base_model, adapter_id)
+    model.eval()
+    # 3. Prepare Input
+    # Using a prompt format helps the model understand the task
+    prompt = f"{model_choice}: {text}"
+    inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
+    # 4. Generate
     with torch.no_grad():
         outputs = model.generate(
             **inputs,
+            max_new_tokens=256,
+            do_sample=True,
             temperature=0.3,
+            top_p=0.9
         )
+    result = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    # 5. Cleanup (CRITICAL for ZeroGPU to release resources)
     del model
     del base_model
     torch.cuda.empty_cache()
+    return result
+# --- Gradio UI ---
 with gr.Blocks(theme=gr.themes.Soft()) as demo:
+    gr.Markdown("# 🗣️ Angika Multi-Translator")
+    gr.Markdown("Powered by **Aya-101** and **ZeroGPU**. Select your translation direction below.")
+    with gr.Row():
+        with gr.Column():
+            model_dropdown = gr.Dropdown(
+                choices=list(MODEL_MAP.keys()),
+                value="English to Angika",
+                label="Select Translation Mode"
+            )
+            input_text = gr.Textbox(
+                label="Input Text",
+                placeholder="Type here...",
+                lines=5
+            )
+            submit_btn = gr.Button("Translate", variant="primary")
+        with gr.Column():
+            output_text = gr.Textbox(
+                label="Translated Text",
+                lines=5,
+                interactive=False
+            )
+    submit_btn.click(
+        fn=translate,
+        inputs=[input_text, model_dropdown],
+        outputs=output_text
+    )
+    gr.Examples(
+        examples=[
+            ["How are you doing today?", "English to Angika"],
+            ["आप कैसे हैं?", "Hindi to Angika"],
+        ],
+        inputs=[input_text, model_dropdown]
+    )
 demo.launch()