Spaces:

moriire
/

OpenGenAI

Sleeping

moriire commited on Apr 5, 2024

Commit

a05fde6

verified ·

1 Parent(s): 59d5db4

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -12,8 +12,8 @@ llama = llama_cpp.Llama.from_pretrained(
     tokenizer=llama_cpp.llama_tokenizer.LlamaHFTokenizer.from_pretrained("Qwen/Qwen1.5-0.5B"),
     verbose=False,
      n_ctx=4096,
-        n_threads=4,
         n_gpu_layers=0,
 )
 # Logger setup
 logging.basicConfig(level=logging.INFO)
@@ -74,7 +74,11 @@ async def complete(
             ],
             temperature=temperature,
             seed=seed,
         )
         et = time()
         output["time"] = et - st
         return output

     tokenizer=llama_cpp.llama_tokenizer.LlamaHFTokenizer.from_pretrained("Qwen/Qwen1.5-0.5B"),
     verbose=False,
      n_ctx=4096,
         n_gpu_layers=0,
+    chat_format="llama-2"
 )
 # Logger setup
 logging.basicConfig(level=logging.INFO)
             ],
             temperature=temperature,
             seed=seed,
+            echo=True,
+            stream=True
         )
+        for item in output:
+            print(item['choices'][0]['text'], end='')
         et = time()
         output["time"] = et - st
         return output