New model version trained on GoEmotions and Twitter dataset

by SkyWater21 - opened Jun 16, 2025

base: refs/heads/main

←

from: refs/pr/2

Discussion Files changed

+64388

-64408

Files changed (8) hide show

.gitattributes +35 -35
README.md +81 -101
config.json +50 -50
model.safetensors +1 -1
special_tokens_map.json +7 -7
tokenizer.json +0 -0
tokenizer_config.json +57 -57
vocab.txt +0 -0

.gitattributes CHANGED Viewed

@@ -1,35 +1,35 @@
-*.7z filter=lfs diff=lfs merge=lfs -text
-*.arrow filter=lfs diff=lfs merge=lfs -text
-*.bin filter=lfs diff=lfs merge=lfs -text
-*.bz2 filter=lfs diff=lfs merge=lfs -text
-*.ckpt filter=lfs diff=lfs merge=lfs -text
-*.ftz filter=lfs diff=lfs merge=lfs -text
-*.gz filter=lfs diff=lfs merge=lfs -text
-*.h5 filter=lfs diff=lfs merge=lfs -text
-*.joblib filter=lfs diff=lfs merge=lfs -text
-*.lfs.* filter=lfs diff=lfs merge=lfs -text
-*.mlmodel filter=lfs diff=lfs merge=lfs -text
-*.model filter=lfs diff=lfs merge=lfs -text
-*.msgpack filter=lfs diff=lfs merge=lfs -text
-*.npy filter=lfs diff=lfs merge=lfs -text
-*.npz filter=lfs diff=lfs merge=lfs -text
-*.onnx filter=lfs diff=lfs merge=lfs -text
-*.ot filter=lfs diff=lfs merge=lfs -text
-*.parquet filter=lfs diff=lfs merge=lfs -text
-*.pb filter=lfs diff=lfs merge=lfs -text
-*.pickle filter=lfs diff=lfs merge=lfs -text
-*.pkl filter=lfs diff=lfs merge=lfs -text
-*.pt filter=lfs diff=lfs merge=lfs -text
-*.pth filter=lfs diff=lfs merge=lfs -text
-*.rar filter=lfs diff=lfs merge=lfs -text
-*.safetensors filter=lfs diff=lfs merge=lfs -text
-saved_model/**/* filter=lfs diff=lfs merge=lfs -text
-*.tar.* filter=lfs diff=lfs merge=lfs -text
-*.tar filter=lfs diff=lfs merge=lfs -text
-*.tflite filter=lfs diff=lfs merge=lfs -text
-*.tgz filter=lfs diff=lfs merge=lfs -text
-*.wasm filter=lfs diff=lfs merge=lfs -text
-*.xz filter=lfs diff=lfs merge=lfs -text
-*.zip filter=lfs diff=lfs merge=lfs -text
-*.zst filter=lfs diff=lfs merge=lfs -text
-*tfevents* filter=lfs diff=lfs merge=lfs -text

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -1,101 +1,81 @@
----
-license: mit
-datasets:
-- AiLab-IMCS-UL/go_emotions-lv
-language:
-- lv
-base_model:
-- AiLab-IMCS-UL/lvbert
----
-Fine-tuned [LVBERT](https://huggingface.co/AiLab-IMCS-UL/lvbert) for multi-label emotion classification task.
-Model was trained on [lv_go_emotions](https://huggingface.co/datasets/SkyWater21/lv_go_emotions) dataset. This dataset is Latvian translation of [GoEmotions](https://huggingface.co/datasets/go_emotions) dataset. Google Translate was used to generate the machine translation.
-Original 26 emotions were mapped to 6 base emotions as per Dr. Ekman theory.
-Labels predicted by classifier:
-```yaml
-0: anger
-1: disgust
-2: fear
-3: joy
-4: sadness
-5: surprise
-6: neutral
-```
-Label mapping from 27 emotions from GoEmotion to 6 base emotions as per Dr. Ekman theory:
-|GoEmotion|Ekman|
-|---|---|
-| admiration | joy|
-| amusement | joy|
-| anger | anger|
-| annoyance | anger|
-| approval | joy|
-| caring | joy|
-| confusion | surprise|
-| curiosity | surprise|
-| desire | joy|
-| disappointment | sadness|
-| disapproval | anger|
-| disgust | disgust|
-| embarrassment | sadness|
-| excitement | joy|
-| fear | fear|
-| gratitude | joy|
-| grief | sadness|
-| joy | joy|
-| love | joy|
-| nervousness | fear|
-| optimism | joy|
-| pride | joy|
-| realization | surprise|
-| relief | joy|
-| remorse | sadness|
-| sadness | sadness|
-| surprise | surprise|
-| neutral | neutral|
-Seed used for random number generator is 42:
-```python
-def set_seed(seed=42):
-    random.seed(seed)
-    np.random.seed(seed)
-    torch.manual_seed(seed)
-    if torch.cuda.is_available():
-        torch.cuda.manual_seed_all(seed)
-```
-Training parameters:
-```yaml
-max_length: null
-batch_size: 32
-shuffle: True
-num_workers: 2
-pin_memory: False
-drop_last: False
-optimizer: adam
-lr: 0.00001
-weight_decay: 0
-problem_type: multi_label_classification
-num_epochs: 3
-```
-Evaluation results on test split of [lv_go_emotions](https://huggingface.co/datasets/SkyWater21/lv_go_emotions/viewer/simplified_ekman)
-|              |Precision|Recall|F1-Score|AUC-ROC|Support|
-|--------------|---------|------|--------|-------|-------|
-|anger         |     0.57|  0.40|    0.47|   0.85|   726|
-|disgust       |     0.64|  0.28|    0.39|   0.93|   123|
-|fear          |     0.63|  0.54|    0.58|   0.95|    98|
-|joy           |     0.80|  0.79|    0.79|   0.91|  2104|
-|sadness       |     0.70|  0.44|    0.54|   0.90|   379|
-|surprise      |     0.63|  0.44|    0.52|   0.89|   677|
-|neutral       |     0.65|  0.62|    0.64|   0.83|  1787|
-|micro avg     |     0.70|  0.61|    0.66|   0.93|  5894|
-|macro avg     |     0.66|  0.50|    0.56|   0.89|  5894|
-|weighted avg  |     0.69|  0.61|    0.65|   0.88|  5894|
-|samples avg   |     0.65|  0.63|    0.63|    nan|  5894|

+---
+license: mit
+datasets:
+- SkyWater21/lv_emotions
+language:
+- lv
+base_model:
+- AiLab-IMCS-UL/lvbert
+---
+Fine-tuned [LVBERT](https://huggingface.co/AiLab-IMCS-UL/lvbert) for multi-label emotion classification task.
+Model was trained on [lv_emotions](https://huggingface.co/datasets/SkyWater21/lv_emotions) dataset. This dataset is Latvian translation of [GoEmotions](https://huggingface.co/datasets/go_emotions) and [Twitter Emotions](https://huggingface.co/datasets/SkyWater21/lv_twitter_emotions) dataset. Google Translate was used to generate the machine translation.
+Original 26 emotions were mapped to 6 base emotions as per Dr. Ekman theory.
+Labels predicted by classifier:
+```yaml
+0: anger
+1: disgust
+2: fear
+3: joy
+4: sadness
+5: surprise
+6: neutral
+```
+Seed used for random number generator is 42:
+```python
+def set_seed(seed=42):
+    random.seed(seed)
+    np.random.seed(seed)
+    torch.manual_seed(seed)
+    if torch.cuda.is_available():
+        torch.cuda.manual_seed_all(seed)
+```
+Training parameters:
+```yaml
+max_length: null
+batch_size: 32
+shuffle: True
+num_workers: 4
+pin_memory: False
+drop_last: False
+optimizer: adam
+lr: 0.000005
+weight_decay: 0
+problem_type: multi_label_classification
+num_epochs: 3
+```
+Evaluation results on test split of [lv_go_emotions](https://huggingface.co/datasets/SkyWater21/lv_emotions/viewer/combined/lv_go_emotions_test)
+|              |Precision|Recall|F1-Score|Support|
+|--------------|---------|------|--------|-------|
+|anger         |     0.57|  0.36|    0.44|    726|
+|disgust       |     0.42|  0.29|    0.35|    123|
+|fear          |     0.59|  0.43|    0.50|     98|
+|joy           |     0.78|  0.80|    0.79|   2104|
+|sadness       |     0.65|  0.42|    0.51|    379|
+|surprise      |     0.62|  0.38|    0.47|    677|
+|neutral       |     0.66|  0.58|    0.62|   1787|
+|micro avg     |     0.70|  0.59|    0.64|   5894|
+|macro avg     |     0.61|  0.46|    0.52|   5894|
+|weighted avg  |     0.68|  0.59|    0.63|   5894|
+|samples avg   |     0.62|  0.61|    0.61|   5894|
+Evaluation results on test split of [lv_twitter_emotions](https://huggingface.co/datasets/SkyWater21/lv_emotions/viewer/combined/lv_twitter_emotions_test)
+|              |Precision|Recall|F1-Score|Support|
+|--------------|---------|------|--------|-------|
+|anger         |     0.94|  0.87|    0.90|  12013|
+|disgust       |     0.92|  0.92|    0.92|  14117|
+|fear          |     0.74|  0.80|    0.77|   3342|
+|joy           |     0.87|  0.88|    0.87|   5913|
+|sadness       |     0.81|  0.80|    0.81|   4786|
+|surprise      |     0.93|  0.57|    0.71|   1510|
+|neutral       |     0.00|  0.00|    0.00|      0|
+|micro avg     |     0.89|  0.87|    0.88|  41681|
+|macro avg     |     0.74|  0.69|    0.71|  41681|
+|weighted avg  |     0.89|  0.87|    0.88|  41681|
+|samples avg   |     0.86|  0.87|    0.86|  41681|

config.json CHANGED Viewed

@@ -1,50 +1,50 @@
-{
-  "_name_or_path": "AiLab-IMCS-UL/lvbert",
-  "architectures": [
-    "BertForSequenceClassification"
-  ],
-  "attention_probs_dropout_prob": 0.1,
-  "classifier_dropout": null,
-  "directionality": "bidi",
-  "hidden_act": "gelu",
-  "hidden_dropout_prob": 0.1,
-  "hidden_size": 768,
-  "id2label": {
-    "0": "anger",
-    "1": "disgust",
-    "2": "fear",
-    "3": "joy",
-    "4": "sadness",
-    "5": "surprise",
-    "6": "neutral"
-  },
-  "initializer_range": 0.02,
-  "intermediate_size": 3072,
-  "label2id": {
-    "anger": 0,
-    "disgust": 1,
-    "fear": 2,
-    "joy": 3,
-    "neutral": 6,
-    "sadness": 4,
-    "surprise": 5
-  },
-  "layer_norm_eps": 1e-12,
-  "max_position_embeddings": 512,
-  "model_type": "bert",
-  "num_attention_heads": 12,
-  "num_hidden_layers": 12,
-  "pad_token_id": 0,
-  "pooler_fc_size": 768,
-  "pooler_num_attention_heads": 12,
-  "pooler_num_fc_layers": 3,
-  "pooler_size_per_head": 128,
-  "pooler_type": "first_token_transform",
-  "position_embedding_type": "absolute",
-  "problem_type": "multi_label_classification",
-  "torch_dtype": "float32",
-  "transformers_version": "4.39.3",
-  "type_vocab_size": 2,
-  "use_cache": true,
-  "vocab_size": 32004
-}

+{
+  "_name_or_path": "AiLab-IMCS-UL/lvbert",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "directionality": "bidi",
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "anger",
+    "1": "disgust",
+    "2": "fear",
+    "3": "joy",
+    "4": "sadness",
+    "5": "surprise",
+    "6": "neutral"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "anger": 0,
+    "disgust": 1,
+    "fear": 2,
+    "joy": 3,
+    "neutral": 6,
+    "sadness": 4,
+    "surprise": 5
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "pooler_fc_size": 768,
+  "pooler_num_attention_heads": 12,
+  "pooler_num_fc_layers": 3,
+  "pooler_size_per_head": 128,
+  "pooler_type": "first_token_transform",
+  "position_embedding_type": "absolute",
+  "problem_type": "multi_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.45.1",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 32004
+}

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3fdf83f57d45707e774742a21d24d695e6222f14e18d41b5748a8c0f28a9e1d3
 size 442526732

 version https://git-lfs.github.com/spec/v1
+oid sha256:775169c1aa5b607d4d2f9200db7ffb0a6ab65da7b0f7fa4baab6ffa437407b61
 size 442526732

special_tokens_map.json CHANGED Viewed

@@ -1,7 +1,7 @@
-{
-  "cls_token": "[CLS]",
-  "mask_token": "[MASK]",
-  "pad_token": "[PAD]",
-  "sep_token": "[SEP]",
-  "unk_token": "[UNK]"
-}

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

tokenizer.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json CHANGED Viewed

@@ -1,57 +1,57 @@
-{
-  "added_tokens_decoder": {
-    "0": {
-      "content": "[PAD]",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "1": {
-      "content": "[UNK]",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "2": {
-      "content": "[CLS]",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "3": {
-      "content": "[SEP]",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "4": {
-      "content": "[MASK]",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    }
-  },
-  "clean_up_tokenization_spaces": true,
-  "cls_token": "[CLS]",
-  "do_basic_tokenize": true,
-  "do_lower_case": false,
-  "mask_token": "[MASK]",
-  "model_max_length": 1000000000000000019884624838656,
-  "never_split": null,
-  "pad_token": "[PAD]",
-  "sep_token": "[SEP]",
-  "strip_accents": null,
-  "tokenize_chinese_chars": true,
-  "tokenizer_class": "BertTokenizer",
-  "unk_token": "[UNK]"
-}

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "4": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": false,
+  "mask_token": "[MASK]",
+  "model_max_length": 1000000000000000019884624838656,
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

vocab.txt CHANGED Viewed

The diff for this file is too large to render. See raw diff