Spaces:

Wedyan2023
/

Data_Generation_LabelingCopy

Sleeping

App Files Files

Wedyan2023 commited on Apr 30, 2025

Commit

0b8c1dd

verified ·

1 Parent(s): bca2f9e

Update app104.py

Browse files

Files changed (1) hide show

app104.py +90 -6

app104.py CHANGED Viewed

@@ -12,6 +12,9 @@ from openai import OpenAI
 from dotenv import load_dotenv
 import warnings
 warnings.filterwarnings('ignore')
 os.getenv("OAUTH_CLIENT_ID")
@@ -23,6 +26,79 @@ client = OpenAI(
     base_url="https://api-inference.huggingface.co/v1",
     api_key=os.environ.get('TOKEN2') # Hugging Face API token
 )
 ####new
 # from openai import OpenAI
@@ -168,13 +244,21 @@ with st.sidebar:
             mime="application/pdf"
         )
-    selected_model = st.selectbox(
-        "Select Model",
-        ["meta-llama/Meta-Llama-3-8B-Instruct-Turbo", "meta-llama/Llama-3.3-70B-Instruct", "meta-llama/Llama-3.2-3B-Instruct","meta-llama/Llama-4-Scout-17B-16E-Instruct", "meta-llama/Meta-Llama-3-8B-Instruct",
-         "meta-llama/Llama-3.1-70B-Instruct"],
-        key='model_select'
-    )
     temperature = st.slider(
         "Temperature",
         0.0, 1.0, 0.7,

 from dotenv import load_dotenv
 import warnings
+from transformers import AutoModelForCausalLM, AutoTokenizer
+import torch
 warnings.filterwarnings('ignore')
 os.getenv("OAUTH_CLIENT_ID")
     base_url="https://api-inference.huggingface.co/v1",
     api_key=os.environ.get('TOKEN2') # Hugging Face API token
 )
+##########################################################3
+# import streamlit as st
+# from transformers import AutoModelForCausalLM, AutoTokenizer
+# import torch
+# Model selection dropdown
+selected_model = st.selectbox(
+    "Select Model",
+    ["meta-llama/Meta-Llama-3-8B-Instruct-Turbo",
+     "meta-llama/Llama-3.3-70B-Instruct",
+     "meta-llama/Llama-3.2-3B-Instruct",
+     "meta-llama/Llama-4-Scout-17B-16E-Instruct",
+     "meta-llama/Meta-Llama-3-8B-Instruct",
+     "meta-llama/Llama-3.1-70B-Instruct"],
+    key='model_select'
+)
+@st.cache_resource  # Cache the model to prevent reloading
+def load_model(model_name):
+    try:
+        # Optimized model loading configuration
+        model = AutoModelForCausalLM.from_pretrained(
+            model_name,
+            torch_dtype=torch.float16,        # Use half precision
+            device_map="auto",                # Automatic device mapping
+            load_in_8bit=True,               # Enable 8-bit quantization
+            low_cpu_mem_usage=True,          # Optimize CPU memory usage
+            max_memory={0: "10GB"}           # Limit GPU memory usage
+        )
+        tokenizer = AutoTokenizer.from_pretrained(
+            model_name,
+            padding_side="left",
+            truncation_side="left"
+        )
+        return model, tokenizer
+    except Exception as e:
+        st.error(f"Error loading model: {str(e)}")
+        return None, None
+# Load the selected model with optimizations
+if selected_model:
+    model, tokenizer = load_model(selected_model)
+    # Check if model loaded successfully
+    if model is not None:
+        st.success(f"Successfully loaded {selected_model}")
+    else:
+        st.warning("Please select a different model or check your hardware capabilities")
+# Function to generate text
+def generate_response(prompt, model, tokenizer):
+    try:
+        inputs = tokenizer(prompt, return_tensors="pt", truncation=True, max_length=512)
+        with torch.no_grad():
+            outputs = model.generate(
+                inputs["input_ids"],
+                max_length=256,
+                num_return_sequences=1,
+                temperature=0.7,
+                do_sample=True,
+                pad_token_id=tokenizer.pad_token_id
+            )
+        response = tokenizer.decode(outputs[0], skip_special_tokens=True)
+        return response
+    except Exception as e:
+        return f"Error generating response: {str(e)}"
+############################################################
 ####new
 # from openai import OpenAI
             mime="application/pdf"
         )
+    # selected_model = st.selectbox(
+    #     "Select Model",
+    #     ["meta-llama/Meta-Llama-3-8B-Instruct-Turbo", "meta-llama/Llama-3.3-70B-Instruct", "meta-llama/Llama-3.2-3B-Instruct","meta-llama/Llama-4-Scout-17B-16E-Instruct", "meta-llama/Meta-Llama-3-8B-Instruct",
+    #      "meta-llama/Llama-3.1-70B-Instruct"],
+    #     key='model_select'
+    # )
+# model = AutoModelForCausalLM.from_pretrained(
+#     "meta-llama/Meta-Llama-3-8B-Instruct",
+#     torch_dtype=torch.float16,  # Use half precision
+#     device_map="auto",          # Automatic device mapping
+#     load_in_8bit=True          # Load in 8-bit precision
+# )
     temperature = st.slider(
         "Temperature",
         0.0, 1.0, 0.7,