Spaces:

digitaldev2024
/

allma

Sleeping

pakito312 commited on Jan 15

Commit

26cacf3

1 Parent(s): 08a825e

update

Files changed (1) hide show

api.py CHANGED Viewed

@@ -203,7 +203,25 @@ class ModelManager:
         if self.llm is None:
             self.load_model()
-        return self.llm.generate(prompt, temperature, max_tokens, top_p)
     def chat(self, messages: List[dict], temperature: float = 0.2, max_tokens: int = 256):
         """Chat conversationnel"""

         if self.llm is None:
             self.load_model()
+        # Si c'est le DummyLLM, appeler la méthode factice
+        if isinstance(self.llm, DummyLLM):
+            return self.llm.generate(prompt, temperature, max_tokens, top_p)
+        # Pour Llama réel
+        try:
+            response = self.llm.generate(
+                prompt=prompt,
+                max_tokens=max_tokens,
+                temperature=temperature,
+                top_p=top_p,
+                stop=None,  # ou ['\n\n'] selon ton usage
+                echo=False
+            )
+            # Extraire le texte généré
+            return response['choices'][0]['text']
+        except Exception as e:
+            # Fallback en cas d'erreur
+            return f"# Fallback response\n\nPrompt: {prompt}\n\nError: {str(e)[:100]}"
     def chat(self, messages: List[dict], temperature: float = 0.2, max_tokens: int = 256):
         """Chat conversationnel"""