luodi-7's picture
Create README.md
2e3690b verified

模型介绍

  • 微调internvl2_5-4B
  • 希望能微调模型根据一串meme文字和meme底图学会输出【文字框位置+对应位置填的文字】
  • 在一阶段的基础上,mask掉文字部分的loss,只计算预测框的loss,再进行训练希望提高预测框准确率

测试结果

  • avg_iou=0.4272
  • avg_similarity=0.9772