grenishrai
/

brainrot-gemma

Model card Files Files and versions

grenishrai commited on Dec 8, 2025

Commit

943e809

·

verified ·

1 Parent(s): beb8cbe

Create inference.py

Files changed (1) hide show

inference.py +23 -0

inference.py ADDED Viewed

	@@ -0,0 +1,23 @@

+from transformers import AutoTokenizer, AutoModelForCausalLM
+import torch
+class Model:
+    def __init__(self):
+        device = "cuda" if torch.cuda.is_available() else "cpu"
+        self.tokenizer = AutoTokenizer.from_pretrained(".")
+        self.model = AutoModelForCausalLM.from_pretrained(
+            ".",
+            torch_dtype=torch.float16 if device == "cuda" else torch.float32,
+            device_map="auto"
+        )
+    def __call__(self, prompt: str):
+        inputs = self.tokenizer(prompt, return_tensors="pt").to(self.model.device)
+        output_ids = self.model.generate(
+            **inputs,
+            max_new_tokens=128,
+            temperature=0.7,
+            do_sample=True
+        )
+        return self.tokenizer.decode(output_ids[0], skip_special_tokens=True)