andrewqian123
/

LLAMA_BATCH

Visual Question Answering

Model card Files Files and versions

andrewqian123 commited on Sep 3, 2024

Commit

a0e05d2

·

verified ·

1 Parent(s): ad7a067

Update processing_minicpmv.py

Files changed (1) hide show

processing_minicpmv.py +8 -0

processing_minicpmv.py CHANGED Viewed

@@ -164,6 +164,14 @@ class MiniCPMVProcessor(ProcessorMixin):
         return input_ids.unsqueeze(0), image_bounds
     def _convert_images_texts_to_inputs(self, images, texts, do_pad=False, truncation=None, max_length=None, return_tensors=None):
         if not len(images):
             model_inputs = self.tokenizer(texts, return_tensors=return_tensors, padding=do_pad, truncation=truncation, max_length=max_length)
             return MiniCPMVBatchFeature(data={**model_inputs})

         return input_ids.unsqueeze(0), image_bounds
     def _convert_images_texts_to_inputs(self, images, texts, do_pad=False, truncation=None, max_length=None, return_tensors=None):
+        assert len(images) == len(texts)
+        batch = []
+        for ind in range(len(images)):
+            result = _convert_images_texts_to_inputs2(self, images[ind], texts[ind], do_pad, truncation, max_length, return_tensors)
+            batch.append(result)
+        return batch
+    def _convert_images_texts_to_inputs2(self, images, texts, do_pad=False, truncation=None, max_length=None, return_tensors=None):
         if not len(images):
             model_inputs = self.tokenizer(texts, return_tensors=return_tensors, padding=do_pad, truncation=truncation, max_length=max_length)
             return MiniCPMVBatchFeature(data={**model_inputs})