Spaces:

N-Bot-Int
/

OpenElla-GGUF

Sleeping

ItsMeDevRoland commited on Mar 26, 2025

Commit

99d1dcd

verified ·

1 Parent(s): 56b07de

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -134,16 +134,14 @@ def respond(
     # Generate response
     try:
-        response = ""
-        for chunk in llm_model.generate(
             full_prompt,
-            max_tokens=max_tokens,
             stop=["User:", "\n"],  # Stop on new user input
             temperature=temperature,
-            top_p=top_p,
-            stream=True
-        ):
-            response += chunk
         return response
     except Exception as e:

     # Generate response
     try:
+        # Use the correct method signature for llama-cpp-python
+        response = llm_model(
             full_prompt,
+            max_new_tokens=max_tokens,  # Changed from max_tokens to max_new_tokens
             stop=["User:", "\n"],  # Stop on new user input
             temperature=temperature,
+            top_p=top_p
+        )['choices'][0]['text']
         return response
     except Exception as e: