blackhole33
/

gemma-cqa-9b

Model card Files Files and versions

blackhole33 commited on Aug 7, 2024

Commit

343fa25

·

verified ·

1 Parent(s): f8a6765

Update README.md

Files changed (1) hide show

README.md +19 -0

README.md CHANGED Viewed

@@ -45,3 +45,22 @@ outputs = model.generate(**inputs, max_new_tokens = 64, use_cache = True)
 tokenizer.batch_decode(outputs)
 ```

 tokenizer.batch_decode(outputs)
 ```
+# Streamly generate response:
+```
+FastLanguageModel.for_inference(model) # Enable native 2x faster inference
+inputs = tokenizer(
+[
+    alpaca_prompt.format(
+        "Continue the fibonnaci sequence.", # instruction
+        "1, 1, 2, 3, 5, 8", # input
+        "", # output - leave this blank for generation!
+    )
+], return_tensors = "pt").to("cuda")
+from transformers import TextStreamer
+text_streamer = TextStreamer(tokenizer)
+_ = model.generate(**inputs, streamer = text_streamer, max_new_tokens = 128)
+```