Spaces:

Sigurdur
/

icechat

Sleeping

Sigurdur commited on Mar 16, 2024

Commit

8708772

verified ·

1 Parent(s): 0dd2361

Create app.py

Files changed (1) hide show

app.py ADDED Viewed

+import gradio as gr
+from transformers import AutoModelForCausalLM, AutoTokenizer, TextIteratorStreamer
+from threading import Thread
+model = AutoModelForCausalLM.from_pretrained("icechat")
+tokenizer = AutoTokenizer.from_pretrained("icechat")
+def streaming_respond(question, history):
+    input_ids = tokenizer.encode("### Question: " + question, return_tensors="pt")
+    streamer = TextIteratorStreamer(
+        tokenizer, timeout=10.0, skip_prompt=True, skip_special_tokens=True
+    )
+    generate_kwargs = dict(
+        {"input_ids": input_ids},
+        streamer=streamer,
+        max_new_tokens=10,
+        num_beams=1,
+    )
+    t = Thread(target=model.generate, kwargs=generate_kwargs)
+    t.start()
+    outputs = []
+    for text in streamer:
+        outputs.append(text)
+        yield "".join(outputs)
+gr.ChatInterface(streaming_respond).launch()