Spaces:

operablepattern
/

chat-with-gemma-2b

Sleeping

operablepattern commited on Mar 7, 2024

Commit

0934e21

verified ·

1 Parent(s): b12a44a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,21 +6,19 @@ try:
         repo_id="operablepattern/gemma-2b-it-Q",
         filename="*Q5_K_M.gguf",
         chat_format="gemma",
-        max_tokens=32,
         verbose=True
     )
 except:
     llm = Llama(
         model_path="./gemma-2b-it-Q5_K_M.gguf",
         chat_format="gemma",
-        max_tokens=32,
         verbose=True
     )
 def response(message, history):
     print(message)
     print(history)
-    output = llm(message)
     print(output)
     return message

         repo_id="operablepattern/gemma-2b-it-Q",
         filename="*Q5_K_M.gguf",
         chat_format="gemma",
         verbose=True
     )
 except:
     llm = Llama(
         model_path="./gemma-2b-it-Q5_K_M.gguf",
         chat_format="gemma",
         verbose=True
     )
 def response(message, history):
     print(message)
     print(history)
+    output = llm(message,max_tokens=32)
     print(output)
     return message