Spaces:

Jiaqi-hkust
/

Robust-R1

Running on Zero

App Files Files Community

Jiaqi-hkust commited on Dec 17, 2025

Commit

38eab31

verified ·

1 Parent(s): 78ed009

Upload folder using huggingface_hub

Browse files

Files changed (1) hide show

app.py +58 -22

app.py CHANGED Viewed

@@ -196,49 +196,86 @@ def get_model_handler():
         model_handler = ModelHandler(MODEL_PATH)
     return model_handler
 @gpu_decorator
 async def respond(user_msg, history, temp, tokens):
     text = user_msg.get("text", "").strip()
     files = user_msg.get("files", [])
-    # ### <<< 修改点 3：构建正确的多模态消息格式
-    # 不能直接 append 路径字符串，要用字典 {"type": "image", "image": path}
-    user_content = []
-    for file_path in files:
-        user_content.append({"type": "image", "image": file_path})
-    if text:
-        user_content.append({"type": "text", "text": text})
-    # 构建符合 type="messages" 的用户消息
-    user_message = {"role": "user", "content": user_content}
-    history.append(user_message)
     # 此时先 yield 一次，让用户看到自己的输入
     yield history, gr.MultimodalTextbox(value=None, interactive=False)
-    history.append({"role": "assistant", "content": ""})
     try:
-        # 截取历史记录（只取之前的对话，不包含当前这一轮，避免重复）
-        previous_history = history[:-2] if len(history) >= 2 else []
         # 在这里调用 handler，此时我们在 @gpu_decorator 的保护下，可以访问 GPU
         handler = get_model_handler()
         generated_text = ""
-        # 传递原始的 user_msg 字典给 predict，或者根据需要调整 predict 的输入
-        # 注意：你的 predict 函数解析逻辑需要适配
         for chunk in handler.predict(user_msg, previous_history, temp, tokens):
             generated_text = chunk
             safe_text = generated_text.replace("<", "&lt;").replace(">", "&gt;")
-            history[-1]["content"] = safe_text
             yield history, gr.MultimodalTextbox(interactive=False)
     except Exception as e:
         import traceback
         traceback.print_exc()
-        history[-1]["content"] = f"❌ Error: {str(e)}"
         yield history, gr.MultimodalTextbox(interactive=True)
     yield history, gr.MultimodalTextbox(value=None, interactive=True)
@@ -260,8 +297,7 @@ def create_chat_ui():
                     elem_id="chatbot",
                     label="Chat",
                     avatar_images=(None, "https://api.dicebear.com/7.x/bottts/svg?seed=Qwen"),
-                    height=650,
-                    type="messages"
                 )
                 chat_input = gr.MultimodalTextbox(

         model_handler = ModelHandler(MODEL_PATH)
     return model_handler
+def _convert_history_to_messages_format(history):
+    """将旧格式的 Chatbot history 转换为新格式的 messages"""
+    messages = []
+    for pair in history:
+        if isinstance(pair, list) and len(pair) >= 2:
+            user_msg = pair[0]
+            assistant_msg = pair[1] if len(pair) > 1 else ""
+            # 处理用户消息
+            user_content = []
+            if isinstance(user_msg, str):
+                user_content.append({"type": "text", "text": user_msg})
+            elif isinstance(user_msg, tuple):
+                # 旧格式可能是 (text, image) 或 (image, text)
+                for item in user_msg:
+                    if isinstance(item, str):
+                        if os.path.exists(item) or any(item.lower().endswith(ext) for ext in ['.jpg', '.jpeg', '.png', '.gif', '.bmp', '.webp']):
+                            user_content.append({"type": "image", "image": item})
+                        else:
+                            user_content.append({"type": "text", "text": item})
+            elif isinstance(user_msg, list):
+                # 可能是新格式的内容列表
+                user_content = user_msg
+            if user_content:
+                messages.append({"role": "user", "content": user_content})
+            # 处理助手消息
+            if assistant_msg and isinstance(assistant_msg, str):
+                messages.append({"role": "assistant", "content": assistant_msg})
+        elif isinstance(pair, dict):
+            # 如果已经是新格式，直接使用
+            messages.append(pair)
+    return messages
+def _format_user_input_for_chatbot(text, files):
+    """格式化用户输入为 Chatbot 可显示的格式"""
+    if files and text:
+        # 有图片和文本，返回元组格式
+        return (text, *files)
+    elif files:
+        # 只有图片
+        return files[0] if len(files) == 1 else tuple(files)
+    else:
+        # 只有文本
+        return text
 @gpu_decorator
 async def respond(user_msg, history, temp, tokens):
     text = user_msg.get("text", "").strip()
     files = user_msg.get("files", [])
+    # 格式化用户输入用于 Chatbot 显示（旧格式）
+    user_display = _format_user_input_for_chatbot(text, files)
+    # 添加用户消息到 history（旧格式：列表的列表）
+    history.append([user_display, None])
     # 此时先 yield 一次，让用户看到自己的输入
     yield history, gr.MultimodalTextbox(value=None, interactive=False)
     try:
+        # 将旧格式的 history 转换为新格式的 messages，用于 predict 函数
+        previous_history = _convert_history_to_messages_format(history[:-1])
         # 在这里调用 handler，此时我们在 @gpu_decorator 的保护下，可以访问 GPU
         handler = get_model_handler()
         generated_text = ""
+        # 传递原始的 user_msg 字典给 predict
         for chunk in handler.predict(user_msg, previous_history, temp, tokens):
             generated_text = chunk
             safe_text = generated_text.replace("<", "&lt;").replace(">", "&gt;")
+            # 更新最后一条助手消息（旧格式）
+            history[-1][1] = safe_text
             yield history, gr.MultimodalTextbox(interactive=False)
     except Exception as e:
         import traceback
         traceback.print_exc()
+        history[-1][1] = f"❌ Error: {str(e)}"
         yield history, gr.MultimodalTextbox(interactive=True)
     yield history, gr.MultimodalTextbox(value=None, interactive=True)
                     elem_id="chatbot",
                     label="Chat",
                     avatar_images=(None, "https://api.dicebear.com/7.x/bottts/svg?seed=Qwen"),
+                    height=650
                 )
                 chat_input = gr.MultimodalTextbox(