Spaces:

operablepattern
/

chat-with-gemma-2b

Sleeping

operablepattern commited on Mar 7, 2024

Commit

8a7e475

verified ·

1 Parent(s): c8af86a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,12 +4,14 @@ from llama_cpp import Llama
 try:
     llm = Llama.from_pretrained(
         repo_id="operablepattern/gemma-2b-it-Q",
-        filename="*Q4_K_M.gguf",
         verbose=True
     )
 except:
     llm = Llama(
         model_path="./gemma-2b-it-Q5_K_M.gguf",
         verbose=True
     )
@@ -21,5 +23,4 @@ def response(message, history):
 gr.ChatInterface(
     fn=response,
     title="Chat with Gemma",
-    theme='sky'
 ).queue().launch()

 try:
     llm = Llama.from_pretrained(
         repo_id="operablepattern/gemma-2b-it-Q",
+        filename="*Q5_K_M.gguf",
+        max_tokens=32,
         verbose=True
     )
 except:
     llm = Llama(
         model_path="./gemma-2b-it-Q5_K_M.gguf",
+        max_tokens=32,
         verbose=True
     )
 gr.ChatInterface(
     fn=response,
     title="Chat with Gemma",
 ).queue().launch()