Spaces:

amrn
/

misty

Paused

am commited on Sep 2, 2025

Commit

c39b808

1 Parent(s): aa123d5

1

Files changed (1) hide show

app.py CHANGED Viewed

@@ -117,21 +117,22 @@ def model_inference(
     # Generate
     streamer = TextIteratorStreamer(processor, skip_prompt=True, skip_special_tokens=True)
     generation_args = dict(inputs, streamer=streamer, max_new_tokens=2048)
-    generated_text = ""
-    thread = Thread(target=model.generate, kwargs=generation_args)
-    thread.start()
-    yield "..."
-    buffer = ""
-    for new_text in streamer:
-      buffer += new_text
-    #   generated_text_without_prompt = buffer#[len(ext_buffer):]
-    #   time.sleep(0.01)
-    #   print(f"buffer: {buffer}")
-      yield buffer
 examples=[

     # Generate
     streamer = TextIteratorStreamer(processor, skip_prompt=True, skip_special_tokens=True)
     generation_args = dict(inputs, streamer=streamer, max_new_tokens=2048)
+    # generated_text = ""
+    with torch.inference_mode():
+        thread = Thread(target=model.generate, kwargs=generation_args)
+        thread.start()
+        yield "..."
+        buffer = ""
+        for new_text in streamer:
+            buffer += new_text
+            #   generated_text_without_prompt = buffer#[len(ext_buffer):]
+            #   time.sleep(0.01)
+            #   print(f"buffer: {buffer}")
+            yield buffer
 examples=[