Update README.md
Browse files
README.md
CHANGED
|
@@ -22,7 +22,6 @@ base_model:
|
|
| 22 |
Благодаря новому токенизатору (расширенный tiktoken cl100k с помощью униграм токенизатора на 48 т. токенов) скорость генерации* русскоязычных текстов возрасла **до 100%** (в зависимости от длины контекста) по сравнению с исходной моделью.
|
| 23 |
|
| 24 |
**Под скоростью генерации подразумевается количество русскоязычных символов/слов в секунду на одинаковых текстовых последовательностях.*
|
| 25 |
-
|
| 26 |
## Важно
|
| 27 |
|
| 28 |
**Веса модели могут обновляться** по мере получения новых версий. Информацию о версиях будет в самом конце README, там же фиксируются **даты** и **коммиты** версий, чтобы всегда можно было использовать предыдущие варианты при необходимости.
|
|
@@ -39,7 +38,6 @@ In this model the tokenizer was replaced, followed by continued pre-training on
|
|
| 39 |
Thanks to the new tokenizer (an extended tiktoken cl100k, augmented with a 48 k russian tokens), the generation speed* of Russian-language texts has increased **by up to 100 %** (depending on context length) compared with the original model.
|
| 40 |
|
| 41 |
*Generation speed is understood as the number of Russian characters/words produced per second on identical text sequences.*
|
| 42 |
-
|
| 43 |
## Important
|
| 44 |
|
| 45 |
The model may be updated as new versions become available. Version information is provided at the very end of the README, where **dates** and **commits** are logged so that previous versions can always be used if necessary.
|
|
|
|
| 22 |
Благодаря новому токенизатору (расширенный tiktoken cl100k с помощью униграм токенизатора на 48 т. токенов) скорость генерации* русскоязычных текстов возрасла **до 100%** (в зависимости от длины контекста) по сравнению с исходной моделью.
|
| 23 |
|
| 24 |
**Под скоростью генерации подразумевается количество русскоязычных символов/слов в секунду на одинаковых текстовых последовательностях.*
|
|
|
|
| 25 |
## Важно
|
| 26 |
|
| 27 |
**Веса модели могут обновляться** по мере получения новых версий. Информацию о версиях будет в самом конце README, там же фиксируются **даты** и **коммиты** версий, чтобы всегда можно было использовать предыдущие варианты при необходимости.
|
|
|
|
| 38 |
Thanks to the new tokenizer (an extended tiktoken cl100k, augmented with a 48 k russian tokens), the generation speed* of Russian-language texts has increased **by up to 100 %** (depending on context length) compared with the original model.
|
| 39 |
|
| 40 |
*Generation speed is understood as the number of Russian characters/words produced per second on identical text sequences.*
|
|
|
|
| 41 |
## Important
|
| 42 |
|
| 43 |
The model may be updated as new versions become available. Version information is provided at the very end of the README, where **dates** and **commits** are logged so that previous versions can always be used if necessary.
|