llamacpp-flan-t5-large-grammar-synthesis

Sleeping

Akjava commited on Mar 19

Commit

25a7a48

verified ·

1 Parent(s): 4581798

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -284,7 +284,8 @@ def respond(
     repeat_penalty: float,
 ):
     llama = Llama("models/madlad400-3b-mt-q8_0.gguf")
-    tokens = llama.tokenize(f"{message}".encode('utf-8'))
     llama.encode(tokens)
     tokens = [llama.decoder_start_token()]
     for token in llama.generate(tokens, top_k=40, top_p=0.95, temp=1, repeat_penalty=1.0):

     repeat_penalty: float,
 ):
     llama = Llama("models/madlad400-3b-mt-q8_0.gguf")
+    #tokens = llama.tokenize(f"{message}".encode('utf-8'))#
+    tokens = llama.tokenize(b"What is the capital of France?")
     llama.encode(tokens)
     tokens = [llama.decoder_start_token()]
     for token in llama.generate(tokens, top_k=40, top_p=0.95, temp=1, repeat_penalty=1.0):