Spaces:

h1r41
/

ELYZA-Chat

Runtime error

h1r41 commited on Sep 5, 2023

Commit

965f814

1 Parent(s): 813eb9d

Update: コンテキスト長を拡張

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,22 +10,23 @@ model_name_or_path = "mmnga/ELYZA-japanese-Llama-2-7b-fast-instruct-gguf"
 model_basename = "ELYZA-japanese-Llama-2-7b-fast-instruct-q5_K_M.gguf"
 model_path = hf_hub_download(repo_id=model_name_or_path, filename=model_basename, revision="main")
-llama = Llama(model_path)
 def predict(messages):
     # Llamaでの回答を取得（ストリーミングオン）
-    streamer = llama.create_chat_completion(messages, stream=True)
     partial_message = ""
     for msg in streamer:
         message = msg['choices'][0]['delta']
         if 'content' in message:
             partial_message += message['content']
             yield partial_message
 def main():
-    st.title("Chat with ChatGPT Clone!")
     # Session state for retaining messages
     if 'messages' not in st.session_state:

 model_basename = "ELYZA-japanese-Llama-2-7b-fast-instruct-q5_K_M.gguf"
 model_path = hf_hub_download(repo_id=model_name_or_path, filename=model_basename, revision="main")
+llama = Llama(model_path, n_ctx=5120)
 def predict(messages):
     # Llamaでの回答を取得（ストリーミングオン）
+    streamer = llama.create_chat_completion(messages, stream=True, max_tokens=512)
     partial_message = ""
     for msg in streamer:
         message = msg['choices'][0]['delta']
+        print(f"message: {message}")
         if 'content' in message:
             partial_message += message['content']
             yield partial_message
 def main():
+    st.title("Chat with Elyza!")
     # Session state for retaining messages
     if 'messages' not in st.session_state: