michaelbzhu
/

test-3.2B-base

custom-mbz-test

model_hub_mixin

pytorch_model_hub_mixin

Model card Files Files and versions

michaelbzhu commited on Aug 31, 2025

Commit

b07a847

·

verified ·

1 Parent(s): d3a2364

Update README.md

Files changed (1) hide show

README.md +18 -0

README.md CHANGED Viewed

@@ -25,4 +25,22 @@ Model config:
 "n_heads": 64,
 "n_layers": 3,
 "n_vocab": 50257
 ```

 "n_heads": 64,
 "n_layers": 3,
 "n_vocab": 50257
+```
+Usage:
+```
+from transformers import AutoTokenizer, AutoModelForCausalLM
+import torch
+model = AutoModelForCausalLM.from_pretrained("michaelbzhu/test-3.2B-base", trust_remote_code=True)
+model = model.cuda()
+tokenizer = AutoTokenizer.from_pretrained("michaelbzhu/test-3.2B-base", trust_remote_code=True)
+prompt = "The future of AI is"
+input_ids = tokenizer.encode(prompt, return_tensors="pt").to(model.device)
+for _ in range(20):
+    logits = model(input_ids).logits[0, -1, :]
+    next_token = torch.multinomial(torch.softmax(logits, dim=-1), 1).unsqueeze(0)
+    input_ids = torch.cat([input_ids, next_token], dim=1)
+print(tokenizer.decode(input_ids[0]))
 ```