Training in progress, epoch 1

Files changed (13) hide show

.gitattributes CHANGED Viewed

@@ -32,3 +32,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+vocab.txt filter=lfs diff=lfs merge=lfs -text

config.json CHANGED Viewed

@@ -1,15 +1,13 @@
 {
-  "_name_or_path": "cointegrated/rubert-tiny",
   "architectures": [
-    "BertForSequenceClassification"
   ],
-  "attention_probs_dropout_prob": 0.1,
-  "classifier_dropout": null,
-  "emb_size": 312,
-  "gradient_checkpointing": false,
-  "hidden_act": "gelu",
-  "hidden_dropout_prob": 0.1,
-  "hidden_size": 312,
   "id2label": {
     "0": "\u0430\u0434\u0440\u0435\u0441",
     "1": "\u0431\u043b\u0430\u0433\u043e\u0434\u0430\u0440\u043d\u043e\u0441\u0442\u044c \u0432 \u0442\u0435\u043a\u0441\u0442\u0435",
@@ -39,7 +37,6 @@
     "25": "\u0448\u043b\u044e \u043f\u0440\u0438\u0432\u0435\u0442"
   },
   "initializer_range": 0.02,
-  "intermediate_size": 600,
   "label2id": {
     "LABEL_0": 0,
     "LABEL_1": 1,
@@ -68,17 +65,16 @@
     "LABEL_8": 8,
     "LABEL_9": 9
   },
-  "layer_norm_eps": 1e-12,
   "max_position_embeddings": 512,
-  "model_type": "bert",
-  "num_attention_heads": 12,
-  "num_hidden_layers": 3,
   "pad_token_id": 0,
-  "position_embedding_type": "absolute",
   "problem_type": "multi_label_classification",
   "torch_dtype": "float32",
   "transformers_version": "4.28.0",
-  "type_vocab_size": 2,
-  "use_cache": true,
-  "vocab_size": 29564
 }

 {
+  "_name_or_path": "DeepPavlov/distilrubert-tiny-cased-conversational-v1",
+  "activation": "gelu",
   "architectures": [
+    "DistilBertForSequenceClassification"
   ],
+  "attention_dropout": 0.1,
+  "dim": 264,
+  "dropout": 0.1,
+  "hidden_dim": 792,
   "id2label": {
     "0": "\u0430\u0434\u0440\u0435\u0441",
     "1": "\u0431\u043b\u0430\u0433\u043e\u0434\u0430\u0440\u043d\u043e\u0441\u0442\u044c \u0432 \u0442\u0435\u043a\u0441\u0442\u0435",
     "25": "\u0448\u043b\u044e \u043f\u0440\u0438\u0432\u0435\u0442"
   },
   "initializer_range": 0.02,
   "label2id": {
     "LABEL_0": 0,
     "LABEL_1": 1,
     "LABEL_8": 8,
     "LABEL_9": 9
   },
   "max_position_embeddings": 512,
+  "model_type": "distilbert",
+  "n_heads": 12,
+  "n_layers": 3,
   "pad_token_id": 0,
   "problem_type": "multi_label_classification",
+  "qa_dropout": 0.1,
+  "seq_classif_dropout": 0.2,
+  "sinusoidal_pos_embds": false,
   "torch_dtype": "float32",
   "transformers_version": "4.28.0",
+  "vocab_size": 30522
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:44c2d5f45d8c2e711d130dc696058379f3aeb366e0e9d80d80148ce56c6c7fd5
-size 47191583

 version https://git-lfs.github.com/spec/v1
+oid sha256:687c4a769d17b676a82cb686681404efb4c14f422e91b64853b0b246393b603a
+size 41500761

runs/May17_20-10-45_5087d5ccda57/1684354279.1151173/events.out.tfevents.1684354279.5087d5ccda57.447.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:d0c1d478bae6d594ee6c268d0007be4286c1ac77b8f6c8c92c18b61f23c3aef7
+size 5873

runs/May17_20-10-45_5087d5ccda57/events.out.tfevents.1684354279.5087d5ccda57.447.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:562292e884326b922c53015e8c14eb5ae34ff30e69a0be7a0ba50e1705b5c40c
+size 6796

runs/May17_20-18-35_5087d5ccda57/1684354718.0108151/events.out.tfevents.1684354718.5087d5ccda57.447.3 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:ba1e416a6e0f82af29ccfccfc8085d718ebbb7129d73fb0b355bf0b4e69f8d40
+size 5873

runs/May17_20-18-35_5087d5ccda57/events.out.tfevents.1684354718.5087d5ccda57.447.2 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:05e79351a6a46b7c6cde5d50625bc3bc5cba34679ffa7b03a0ffa3d3a2992d7a
+size 6797

runs/May17_20-24-44_5087d5ccda57/1684355086.4441984/events.out.tfevents.1684355086.5087d5ccda57.447.5 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:3b30c975df9a31d130634f1f2d6d8a56ca934edb95ae00daf66f6688b5327e73
+size 5873

runs/May17_20-24-44_5087d5ccda57/events.out.tfevents.1684355086.5087d5ccda57.447.4 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:ad02471a91536abf29705441973820d72068835db0c6556c9082c161f1457be6
+size 7067

tokenizer.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json CHANGED Viewed

@@ -4,12 +4,12 @@
   "do_basic_tokenize": true,
   "do_lower_case": false,
   "mask_token": "[MASK]",
-  "model_max_length": 512,
   "never_split": null,
   "pad_token": "[PAD]",
   "sep_token": "[SEP]",
   "strip_accents": null,
   "tokenize_chinese_chars": true,
-  "tokenizer_class": "BertTokenizer",
   "unk_token": "[UNK]"
 }

   "do_basic_tokenize": true,
   "do_lower_case": false,
   "mask_token": "[MASK]",
+  "model_max_length": 1000000000000000019884624838656,
   "never_split": null,
   "pad_token": "[PAD]",
   "sep_token": "[SEP]",
   "strip_accents": null,
   "tokenize_chinese_chars": true,
+  "tokenizer_class": "DistilBertTokenizer",
   "unk_token": "[UNK]"
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0b4b548516828cb634914ec5a988d40951d9d91fe13061d88f6fbc195ebfcefa
 size 3579

 version https://git-lfs.github.com/spec/v1
+oid sha256:5c1b748dd27c87cb9fb026f355dbab023cb0ed265966b9e4211adf79815dc33d
 size 3579

vocab.txt CHANGED Viewed

The diff for this file is too large to render. See raw diff