Spaces:

hereoncollab
/

llama

Runtime error

App Files Files

hereoncollab commited on Sep 17, 2024

Commit

eed0648

verified ·

1 Parent(s): b7bdd8f

Update app.py

Browse files

Files changed (1) hide show

app.py +71 -13

app.py CHANGED Viewed

@@ -1,6 +1,7 @@
 import os
 import gradio as gr
-from transformers import pipeline
 from huggingface_hub import login
 # Read the token from the environment variable
@@ -12,23 +13,80 @@ if HUGGINGFACE_TOKEN:
 else:
     raise ValueError("Hugging Face token not found in environment variables.")
-# Initialize the text generation pipeline
-pipe = pipeline("text-generation", model="FacebookAI/xlm-roberta-base")
-def generate_response(user_input):
-    # Generate text based on the user's input
-    response = pipe(user_input, max_length=100, num_return_sequences=1)
-    # Extract the generated text
-    generated_text = response[0]['generated_text']
-    return generated_text
 # Create the Gradio interface
 interface = gr.Interface(
-    fn=generate_response,
-    inputs=gr.Textbox(label="prompt:", lines=2, placeholder="prompt"),
     outputs="text",
-    title="Gemma",
-    description="Prompt gemma-2b"
 )
 # Launch the Gradio app

 import os
+import torch
 import gradio as gr
+from transformers import MarianMTModel, MarianTokenizer, pipeline, AutoTokenizer
 from huggingface_hub import login
 # Read the token from the environment variable
 else:
     raise ValueError("Hugging Face token not found in environment variables.")
+# Define model and tokenizer for translation between Romanian, French, and English
+rfr_md = "Helsinki-NLP/opus-mt-ro-fr"
+frr_md = "Helsinki-NLP/opus-mt-fr-en"
+enr_md = "Helsinki-NLP/opus-mt-en-ro"
+rfr_token = MarianTokenizer.from_pretrained(rfr_md)
+rfr_model = MarianMTModel.from_pretrained(rfr_md)
+fren_token = MarianTokenizer.from_pretrained(frr_md)
+fren_model = MarianMTModel.from_pretrained(frr_md)
+enr_token = MarianTokenizer.from_pretrained(enr_md)
+enr_model = MarianMTModel.from_pretrained(enr_md)
+# Load the Gemma model for text generation, ensuring it runs on CPU
+gemma_model = "google/gemma-2-2b-it"
+gemma_tokenizer = AutoTokenizer.from_pretrained(gemma_model)
+pipe = pipeline(
+    "text-generation",
+    model=gemma_model,
+    tokenizer=gemma_tokenizer,
+    device="cpu"  # Use CPU
+)
+# Function to split text into smaller blocks for translation
+def char_split(text, tokenizer, max_length=498):
+    tokens = tokenizer(text, return_tensors="pt", truncation=False, padding=False)["input_ids"][0]
+    blocks_ = []
+    start = 0
+    while start < len(tokens):
+        end = min(start + max_length, len(tokens))
+        blocks_.append(tokens[start:end])
+        start = end
+    return blocks_
+# Function to translate the text block by block
+def translate(text, model, tokenizer, max_length=500):
+    token_blocks = char_split(text, tokenizer, max_length)
+    text_en = ""
+    for blk_ in token_blocks:
+        blk_char = tokenizer.decode(blk_, skip_special_tokens=True)
+        translated = model.generate(**tokenizer(blk_char, return_tensors="pt", padding=True, truncation=True))
+        text_en += tokenizer.decode(translated[0], skip_special_tokens=True) + " "
+    return text_en.strip()
+# Function to remove formatting symbols
+def rm_rf(text):
+    import re
+    return re.sub(r'\*+', '', text)
+# Generate text based on Romanian input
+def generate(text):
+    fr_txt = translate(text, rfr_model, rfr_token)
+    en_txt = translate(fr_txt, fren_model, fren_token)
+    sequences = pipe(
+        en_txt,
+        max_new_tokens=2048,
+        do_sample=True,
+        return_full_text=False,
+    )
+    generated_text = sequences[0]['generated_text']
+    cl_txt = rm_rf(generated_text)
+    ro_txt = translate(cl_txt, enr_model, enr_token)
+    return ro_txt
 # Create the Gradio interface
 interface = gr.Interface(
+    fn=generate,
+    inputs=gr.Textbox(label="prompt:", lines=2, placeholder="prompt..."),
     outputs="text",
+    title="Gemma Romanian",
+    description="romanian gemma using nlps."
 )
 # Launch the Gradio app