Update README.md
Browse files
README.md
CHANGED
|
@@ -41,7 +41,7 @@ A-Vision — Visual-Language модель, адаптированная под
|
|
| 41 |
| DocVQA_EN | 94.7458 | **94.9702** |
|
| 42 |
|
| 43 |
|
| 44 |
-
В токенизаторе A-vision плотность токенизации выше, чем у Qwen2.5-VL-7B-Instruct поэтому число токенов в контексте и при генерации стало меньше для одинаковых примеров. Кроме того, размер самой модели сократился до 7.
|
| 45 |
|
| 46 |
## Где используем в продукте
|
| 47 |
|
|
@@ -116,6 +116,6 @@ print(response)
|
|
| 116 |
```
|
| 117 |
|
| 118 |
> Примечание:
|
| 119 |
-
> * Для лучшей производительности
|
| 120 |
|
| 121 |
---
|
|
|
|
| 41 |
| DocVQA_EN | 94.7458 | **94.9702** |
|
| 42 |
|
| 43 |
|
| 44 |
+
В токенизаторе A-vision плотность токенизации выше, чем у Qwen2.5-VL-7B-Instruct поэтому число токенов в контексте и при генерации стало меньше для одинаковых примеров. Кроме того, размер самой модели сократился до 7.4B при 8.3B у Qwen2.5-VL-7B-Instruct. За счет этого одинаковые русскоязычные примеры адаптированной моделью обрабатываются быстрее в среднем на 50% в сравнении с исходной Qwen2.5-VL-7B-Instruct.
|
| 45 |
|
| 46 |
## Где используем в продукте
|
| 47 |
|
|
|
|
| 116 |
```
|
| 117 |
|
| 118 |
> Примечание:
|
| 119 |
+
> * Для лучшей производительности имеет смысл подбирать `min_pixels/max_pixels`.
|
| 120 |
|
| 121 |
---
|