openbmb
/

MiniCPM-V-2

Visual Question Answering

feature-extraction

Model card Files Files and versions

finalf0 commited on Jul 1, 2024

Commit

3d0e971

·

1 Parent(s): b996e5b

Support image is None

Files changed (1) hide show

modeling_minicpmv.py +17 -14

modeling_minicpmv.py CHANGED Viewed

@@ -319,21 +319,24 @@ class MiniCPMV(MiniCPMVPreTrainedModel):
             content = msg["content"]
             assert role in ["user", "assistant"]
             if i == 0:
-                assert role == "user", "The role of first msg should be user"
-                if self.config.slice_mode:
-                    images, final_placeholder = self.get_slice_image_placeholder(
-                        image, tokenizer
-                    )
-                    content = final_placeholder + "\n" + content
                 else:
-                    images = [image]
-                    content = (
-                        tokenizer.im_start
-                        + tokenizer.unk_token * self.config.query_num
-                        + tokenizer.im_end
-                        + "\n"
-                        + content
-                    )
             prompt += "<用户>" if role == "user" else "<AI>"
             prompt += content
         prompt += "<AI>"

             content = msg["content"]
             assert role in ["user", "assistant"]
             if i == 0:
+                if image is None:
+                    images = []
                 else:
+                    assert role == "user", "The role of first msg should be user"
+                    if self.config.slice_mode:
+                        images, final_placeholder = self.get_slice_image_placeholder(
+                            image, tokenizer
+                        )
+                        content = final_placeholder + "\n" + content
+                    else:
+                        images = [image]
+                        content = (
+                            tokenizer.im_start
+                            + tokenizer.unk_token * self.config.query_num
+                            + tokenizer.im_end
+                            + "\n"
+                            + content
+                        )
             prompt += "<用户>" if role == "user" else "<AI>"
             prompt += content
         prompt += "<AI>"