Spaces:

devNaam
/

aivakil

Runtime error

devNaam commited on Mar 14

Commit

65b3a86

1 Parent(s): 3df68a4

Fix base model

Files changed (2) hide show

app.py CHANGED Viewed

@@ -4,14 +4,13 @@ import torch
 from transformers import AutoTokenizer, AutoModelForCausalLM
 from peft import PeftModel
-BASE_MODEL = "meta-llama/Llama-3.2-3B"
 ADAPTER_MODEL = "devNaam/vakilai-llama32-3b-v1"
 tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
 model = AutoModelForCausalLM.from_pretrained(
     BASE_MODEL,
-    torch_dtype=torch.float16,
     device_map="auto"
 )
@@ -23,22 +22,18 @@ def vakil_ai(prompt):
     output = model.generate(
         **inputs,
-        max_new_tokens=300,
-        temperature=0.7,
-        top_p=0.9
     )
-    response = tokenizer.decode(output[0], skip_special_tokens=True)
-    return response
 demo = gr.Interface(
     fn=vakil_ai,
-    inputs=gr.Textbox(lines=4, placeholder="Ask your legal question..."),
     outputs="text",
-    title="AI Vakil – Legal Assistant",
-    description="VakilAI powered by Llama 3.2"
 )
 demo.launch()

 from transformers import AutoTokenizer, AutoModelForCausalLM
 from peft import PeftModel
+BASE_MODEL = "unsloth/llama-3.2-3b-bnb-4bit"
 ADAPTER_MODEL = "devNaam/vakilai-llama32-3b-v1"
 tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
 model = AutoModelForCausalLM.from_pretrained(
     BASE_MODEL,
     device_map="auto"
 )
     output = model.generate(
         **inputs,
+        max_new_tokens=200,
+        temperature=0.7
     )
+    return tokenizer.decode(output[0], skip_special_tokens=True)
 demo = gr.Interface(
     fn=vakil_ai,
+    inputs=gr.Textbox(lines=4),
     outputs="text",
+    title="AI Vakil"
 )
 demo.launch()

requirements.txt CHANGED Viewed

@@ -3,4 +3,5 @@ torch
 accelerate
 peft
 sentencepiece
-gradio

 accelerate
 peft
 sentencepiece
+gradio
+bitsandbytes