alphatech77
/

brad-ai-1.12.2x

Model card Files Files and versions

jowilke77 commited on 21 days ago

Commit

abddbd7

·

verified ·

1 Parent(s): 3c95cd1

Update inference.py

Files changed (1) hide show

inference.py +13 -16

inference.py CHANGED Viewed

@@ -1,32 +1,29 @@
 from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
-MODEL_NAME = "distilgpt2"
-tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
-model = AutoModelForCausalLM.from_pretrained(MODEL_NAME)
 with open("prompt.txt", "r") as f:
     SYSTEM_PROMPT = f.read().strip()
-def generate(user_input):
     prompt = f"{SYSTEM_PROMPT}\n\nUser: {user_input}\nBrad AI:"
     inputs = tokenizer(prompt, return_tensors="pt")
     with torch.no_grad():
-        outputs = model.generate(
             **inputs,
-            max_new_tokens=150,
-            temperature=0.7,
-            top_p=0.9,
             do_sample=True
         )
-    return tokenizer.decode(outputs[0], skip_special_tokens=True)
-if __name__ == "__main__":
-    while True:
-        user = input("You: ")
-        if user.lower() in ["exit", "quit"]:
-            break
-        print(generate(user))

+import json
 from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
+with open("config.json", "r") as f:
+    cfg = json.load(f)
+BASE_MODEL = cfg["base_model"]
+tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
+model = AutoModelForCausalLM.from_pretrained(BASE_MODEL)
 with open("prompt.txt", "r") as f:
     SYSTEM_PROMPT = f.read().strip()
+def chat(user_input):
     prompt = f"{SYSTEM_PROMPT}\n\nUser: {user_input}\nBrad AI:"
     inputs = tokenizer(prompt, return_tensors="pt")
     with torch.no_grad():
+        output = model.generate(
             **inputs,
+            max_new_tokens=cfg["max_new_tokens"],
+            temperature=cfg["temperature"],
+            top_p=cfg["top_p"],
             do_sample=True
         )
+    return tokenizer.decode(output[0], skip_special_tokens=True)