CanerDedeoglu
/

Rapid_ECG

@@ -259,7 +259,7 @@ def add_message(message_text, image_input=None):
     """Add a message to the conversation"""
     return {"status": "success", "message": "Message added"}
-def generate_response(message_text, image_input, temperature=0.05, top_p=1.0, max_output_tokens=4096):
     """Generate response for the given message and image"""
     if not LLAVA_AVAILABLE:
         return {"error": "LLaVA modules not available"}
@@ -340,6 +340,7 @@ def generate_response(message_text, image_input, temperature=0.05, top_p=1.0, ma
                 temperature=temperature,
                 top_p=top_p,
                 max_new_tokens=max_output_tokens,
                 use_cache=False,
                 stopping_criteria=[stopping_criteria],
             )
@@ -479,23 +480,43 @@ def query(payload):
             return {"error": "Model initialization failed"}
     try:
-        # Extract parameters from payload
-        message_text = payload.get("message", "")
-        image_input = payload.get("image", None)
-        temperature = payload.get("temperature", 0.05)
-        top_p = payload.get("top_p", 1.0)
-        max_output_tokens = payload.get("max_output_tokens", 4096)
-        if not message_text or not image_input:
-            return {"error": "Both 'message' and 'image' are required in the payload"}
-        # Generate response
         result = generate_response(
             message_text=message_text,
             image_input=image_input,
             temperature=temperature,
             top_p=top_p,
-            max_output_tokens=max_output_tokens
         )
         return result

     """Add a message to the conversation"""
     return {"status": "success", "message": "Message added"}
+def generate_response(message_text, image_input, temperature=0.05, top_p=1.0, max_output_tokens=4096, repetition_penalty=1.0, conv_mode_override=None):
     """Generate response for the given message and image"""
     if not LLAVA_AVAILABLE:
         return {"error": "LLaVA modules not available"}
                 temperature=temperature,
                 top_p=top_p,
                 max_new_tokens=max_output_tokens,
+                repetition_penalty=repetition_penalty,
                 use_cache=False,
                 stopping_criteria=[stopping_criteria],
             )
             return {"error": "Model initialization failed"}
     try:
+        print(f"[DEBUG] query payload keys={list(payload.keys()) if hasattr(payload,'keys') else 'N/A'}")
+        # Extract prompt with multiple possible keys
+        message_text = (payload.get("message") or
+                       payload.get("query") or
+                       payload.get("prompt") or
+                       payload.get("istem") or "")
+        # Extract image with multiple possible keys
+        image_input = (payload.get("image") or
+                      payload.get("image_url") or
+                      payload.get("img") or None)
+        # Extract generation parameters with fallbacks
+        temperature = float(payload.get("temperature", 0.05))
+        top_p = float(payload.get("top_p", 1.0))
+        max_output_tokens = int(payload.get("max_output_tokens",
+                               payload.get("max_new_tokens",
+                               payload.get("max_tokens", 4096))))
+        repetition_penalty = float(payload.get("repetition_penalty", 1.0))
+        conv_mode_override = payload.get("conv_mode", None)
+        if not message_text or not message_text.strip():
+            return {"error": "Missing prompt text. Use 'message', 'query', 'prompt', or 'istem' key"}
+        if not image_input:
+            return {"error": "Missing image. Use 'image', 'image_url', or 'img' key"}
+        # Generate response with all parameters
         result = generate_response(
             message_text=message_text,
             image_input=image_input,
             temperature=temperature,
             top_p=top_p,
+            max_output_tokens=max_output_tokens,
+            repetition_penalty=repetition_penalty,
+            conv_mode_override=conv_mode_override
         )
         return result