Spaces:

Heit39
/

iris

Sleeping

IST199655 commited on Dec 3, 2024

Commit

12b9045

1 Parent(s): f63e352

a

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,7 +5,7 @@ from huggingface_hub import InferenceClient
 Copied from inference in colab notebook
 """
-from transformers import AutoTokenizer , AutoModelForCausalLM , TextStreamer
 import torch
 from threading import Thread
@@ -101,7 +101,7 @@ def respond(
         return_tensors = "pt",
     )
     # Generate tokens incrementally
-    streamer = TextStreamer(tokenizer, skip_prompt=True)
     generation_kwargs = {
         "input_ids": inputs,
         "max_new_tokens": max_tokens,

 Copied from inference in colab notebook
 """
+from transformers import AutoTokenizer , AutoModelForCausalLM , TextIteratorStreamer
 import torch
 from threading import Thread
         return_tensors = "pt",
     )
     # Generate tokens incrementally
+    streamer = TextIteratorStreamer(tokenizer, skip_prompt=True)
     generation_kwargs = {
         "input_ids": inputs,
         "max_new_tokens": max_tokens,