Update README.md
Browse files
README.md
CHANGED
|
@@ -8,11 +8,12 @@ tags: []
|
|
| 8 |
Модель — дообученная [OuteAI/Lite-Oute-1-300M-Instruct](https://huggingface.co/OuteAI/Lite-Oute-1-300M-Instruct) на датасете [cardiffnlp/tweet_eval](https://huggingface.co/datasets/cardiffnlp/tweet_eval).
|
| 9 |
Дообучаем модель с помощью PEFT определять тональность твитов. Модель адаптируется к специфичному стилю текстов твитов по датасету.
|
| 10 |
|
| 11 |
-
|
| 12 |
|
| 13 |
* BATCH_SIZE = 128
|
| 14 |
* LEARNING_RATE = 1e-4
|
| 15 |
* NUM_EPOCHS = 1
|
|
|
|
| 16 |
|
| 17 |
Дообучение проводилось на NVIDIA A100.
|
| 18 |
|
|
|
|
| 8 |
Модель — дообученная [OuteAI/Lite-Oute-1-300M-Instruct](https://huggingface.co/OuteAI/Lite-Oute-1-300M-Instruct) на датасете [cardiffnlp/tweet_eval](https://huggingface.co/datasets/cardiffnlp/tweet_eval).
|
| 9 |
Дообучаем модель с помощью PEFT определять тональность твитов. Модель адаптируется к специфичному стилю текстов твитов по датасету.
|
| 10 |
|
| 11 |
+
Параметры:
|
| 12 |
|
| 13 |
* BATCH_SIZE = 128
|
| 14 |
* LEARNING_RATE = 1e-4
|
| 15 |
* NUM_EPOCHS = 1
|
| 16 |
+
* r=8, alpha=16, target_submodules=["k_proj", "v_proj"]
|
| 17 |
|
| 18 |
Дообучение проводилось на NVIDIA A100.
|
| 19 |
|