Update README.md
Browse files
README.md
CHANGED
|
@@ -3,15 +3,18 @@ license: apache-2.0
|
|
| 3 |
pipeline_tag: image-to-text
|
| 4 |
---
|
| 5 |
# MMAlaya
|
| 6 |
-
MMAlaya是基于大语言模型[Alaya](https://github.com/DataCanvasIO/Alaya)
|
| 7 |
|
| 8 |
MMAlaya包含以下三个模块:
|
| 9 |
<br>1,大语言模型[Alaya-7B-Chat](https://huggingface.co/DataCanvas/Alaya-7B-Chat)。
|
| 10 |
<br>2,图像文本特征编码器来自[blip2-opt-2.7b](https://huggingface.co/Salesforce/blip2-opt-2.7b)的EVA-G。
|
| 11 |
-
<br>3
|
| 12 |
|
| 13 |
模型的训练主要基于[LLaVA](https://github.com/haotian-liu/LLaVA)架构
|
| 14 |
|
| 15 |
-
|
|
|
|
|
|
|
|
|
|
| 16 |
|
| 17 |
-
推理可以参考 [inference.py](https://github.com/DataCanvasIO/MMAlaya/blob/main/inference.py)
|
|
|
|
| 3 |
pipeline_tag: image-to-text
|
| 4 |
---
|
| 5 |
# MMAlaya
|
| 6 |
+
MMAlaya是基于大语言模型[Alaya](https://github.com/DataCanvasIO/Alaya)的多模态模型,模型权重文件在[DataCanvas/MMAlaya](https://huggingface.co/DataCanvas/MMAlaya/tree/main)
|
| 7 |
|
| 8 |
MMAlaya包含以下三个模块:
|
| 9 |
<br>1,大语言模型[Alaya-7B-Chat](https://huggingface.co/DataCanvas/Alaya-7B-Chat)。
|
| 10 |
<br>2,图像文本特征编码器来自[blip2-opt-2.7b](https://huggingface.co/Salesforce/blip2-opt-2.7b)的EVA-G。
|
| 11 |
+
<br>3,图像文本特征到大预言模型的连接器,使用的是来自[blip2-opt-2.7b](https://huggingface.co/Salesforce/blip2-opt-2.7b)的Qformer和线性投影器。
|
| 12 |
|
| 13 |
模型的训练主要基于[LLaVA](https://github.com/haotian-liu/LLaVA)架构
|
| 14 |
|
| 15 |
+
OpenCompass 评测榜单,均分41.1,排名25名。
|
| 16 |
+

|
| 17 |
+
MMBench 评测榜单,开源开放的模型,中文测试集,均分58.6,排名25名。
|
| 18 |
+

|
| 19 |
|
| 20 |
+
推理可以参考 [inference.py](https://github.com/DataCanvasIO/MMAlaya/blob/main/inference.py)
|