PengxiangLi
/

MAT

@@ -10,34 +10,6 @@ base_model:
 - openbmb/MiniCPM-V-2_6
 pipeline_tag: visual-question-answering
 ---
----
-license: cc-by-nc-sa-4.0
-datasets:
-- PengxiangLi/MAT
-language:
-- en
-metrics:
-- accuracy
-base_model:
-- openbmb/MiniCPM-V-2_6
-pipeline_tag: visual-question-answering
----
----
-pipeline_tag: image-text-to-text
-datasets:
-- openbmb/RLAIF-V-Dataset
-library_name: transformers
-language:
-- multilingual
-tags:
-- minicpm-v
-- vision
-- ocr
-- multi-image
-- video
-- custom_code
----
 <h1>Multi-modal Agent Tuning: Building a VLM-Driven Agent for Efficient Tool Usage</h1>

 - openbmb/MiniCPM-V-2_6
 pipeline_tag: visual-question-answering
 ---
 <h1>Multi-modal Agent Tuning: Building a VLM-Driven Agent for Efficient Tool Usage</h1>