Spaces:

anupbth1
/

Ved-Code7b

Runtime error

anupbth1 commited on 10 days ago

Commit

5a1400a

verified ·

1 Parent(s): 190268c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,11 +1,11 @@
 import gradio as gr
 import torch
 from unsloth import FastLanguageModel
-import spaces # Ye line ZeroGPU ke liye zaroori hai
 model_id = "anupbth1/Ved-Code-7B"
-# 1. Model loading (Global)
 model, tokenizer = FastLanguageModel.from_pretrained(
     model_name = model_id,
     max_seq_length = 2048,
@@ -13,19 +13,22 @@ model, tokenizer = FastLanguageModel.from_pretrained(
 )
 FastLanguageModel.for_inference(model)
-# 2. GPU Function
-@spaces.GPU # Ye decorator model ko GPU power deta hai
-def generate_code(message, history):
     messages = [{"role": "user", "content": message}]
     inputs = tokenizer.apply_chat_template(
         messages,
         add_generation_prompt = True,
         return_tensors = "pt"
-    ).to("cuda") # Force to CUDA
     outputs = model.generate(**inputs, max_new_tokens=512)
-    response = tokenizer.decode(outputs[0][len(inputs[0]):], skip_special_tokens=True)
-    return response
-# 3. Chat Interface
-gr.ChatInterface(generate_code).launch()

 import gradio as gr
 import torch
 from unsloth import FastLanguageModel
+import spaces # Ye ZeroGPU ke liye zaroori hai
 model_id = "anupbth1/Ved-Code-7B"
+# Model ko 4-bit mein load karna (RAM bachane ke liye)
 model, tokenizer = FastLanguageModel.from_pretrained(
     model_name = model_id,
     max_seq_length = 2048,
 )
 FastLanguageModel.for_inference(model)
+# ZeroGPU access ke liye decorator
+@spaces.GPU(duration=60)
+def generate(message, history):
     messages = [{"role": "user", "content": message}]
     inputs = tokenizer.apply_chat_template(
         messages,
         add_generation_prompt = True,
         return_tensors = "pt"
+    ).to("cuda")
     outputs = model.generate(**inputs, max_new_tokens=512)
+    return tokenizer.decode(outputs[0][len(inputs[0]):], skip_special_tokens=True)
+# UI Layout
+gr.ChatInterface(
+    generate,
+    title="Ved-Code-7B 🚀",
+    description="Custom Coding Assistant by anupbth1"
+).launch()