提交

Files changed (9) hide show

config.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "_name_or_path": "mgtoxd/tstw2",
-  "activation_dropout": 0.1,
   "adapter_kernel_size": 3,
   "adapter_stride": 2,
   "add_adapter": false,
@@ -47,27 +47,35 @@
   "do_stable_layer_norm": false,
   "eos_token_id": 2,
   "feat_extract_activation": "gelu",
-  "feat_extract_dropout": 0.0,
   "feat_extract_norm": "group",
   "feat_proj_dropout": 0.1,
   "feat_quantizer_dropout": 0.0,
-  "final_dropout": 0.1,
-  "gradient_checkpointing": false,
   "hidden_act": "gelu",
   "hidden_dropout": 0.1,
-  "hidden_dropout_prob": 0.1,
   "hidden_size": 768,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "layer_norm_eps": 1e-05,
-  "layerdrop": 0.1,
   "mask_feature_length": 10,
   "mask_feature_min_masks": 0,
   "mask_feature_prob": 0.0,
   "mask_time_length": 10,
   "mask_time_min_masks": 2,
   "mask_time_prob": 0.05,
   "model_type": "wav2vec2",
   "num_adapter_layers": 3,
   "num_attention_heads": 12,
   "num_codevector_groups": 2,

 {
+  "_name_or_path": "facebook/wav2vec2-base",
+  "activation_dropout": 0.0,
   "adapter_kernel_size": 3,
   "adapter_stride": 2,
   "add_adapter": false,
   "do_stable_layer_norm": false,
   "eos_token_id": 2,
   "feat_extract_activation": "gelu",
   "feat_extract_norm": "group",
   "feat_proj_dropout": 0.1,
   "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "freeze_feat_extract_train": true,
   "hidden_act": "gelu",
   "hidden_dropout": 0.1,
   "hidden_size": 768,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "layer_norm_eps": 1e-05,
+  "layerdrop": 0.0,
+  "mask_channel_length": 10,
+  "mask_channel_min_space": 1,
+  "mask_channel_other": 0.0,
+  "mask_channel_prob": 0.0,
+  "mask_channel_selection": "static",
   "mask_feature_length": 10,
   "mask_feature_min_masks": 0,
   "mask_feature_prob": 0.0,
   "mask_time_length": 10,
   "mask_time_min_masks": 2,
+  "mask_time_min_space": 1,
+  "mask_time_other": 0.0,
   "mask_time_prob": 0.05,
+  "mask_time_selection": "static",
   "model_type": "wav2vec2",
+  "no_mask_channel_overlap": false,
+  "no_mask_time_overlap": false,
   "num_adapter_layers": 3,
   "num_attention_heads": 12,
   "num_codevector_groups": 2,

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ebe516cf8e3f6ea118fbddd93ac8470c16b8944bafd2437bffb878dcd36e867b
 size 721685265

 version https://git-lfs.github.com/spec/v1
+oid sha256:7d82b346b1a1cbf09ad14b2cd28d253e62fb7311928a35ae579145ef2ca106ed
 size 721685265

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:37f80c8621c53c60e07fdc293fb8671bd23f3c69c108a537366f0c13dceee0bd
 size 377656855

 version https://git-lfs.github.com/spec/v1
+oid sha256:32a2f0295d215f2fb3eda98a12d9cd335aedaac7e75f0ee79508e4020dd2c3c8
 size 377656855

rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4ae229eaa23ea3ab390e04490b5e634a4ceafc52bb27d1ee099ebcc7a324e850
 size 14567

 version https://git-lfs.github.com/spec/v1
+oid sha256:e0c34772fbe5946ecc1c42b04eb7da3622057d7b126b15e1b2b9b8a4f1e53a9e
 size 14567

scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:715036b13c896f9739fff7fc99297bc63e28c8598be3731be660f7fe7d553229
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:4588a9d5f4713074f800905c6d8ca298069bbec10540b673f5b244c28304e686
 size 559

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:46d5a658bf4feed7551237785c3d13415d97067d7abeba64a31fd2c1cbca4a18
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:2280a900bcacc0e8f5a7e6e75d396466e2d0c16f65fa69e9dbf1f1f9ae452456
 size 623

trainer_state.json CHANGED Viewed

@@ -1,22 +1,34 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.42589437819420783,
-  "global_step": 500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 0.43,
-      "learning_rate": 4.94e-05,
-      "loss": 5.9403,
       "step": 500
     }
   ],
   "max_steps": 34046,
   "num_train_epochs": 29,
-  "total_flos": 1.453175312744448e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.2776831345826234,
+  "global_step": 1500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 0.43,
+      "learning_rate": 4.97e-05,
+      "loss": 3.8516,
       "step": 500
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 9.970000000000001e-05,
+      "loss": 1.5797,
+      "step": 1000
+    },
+    {
+      "epoch": 1.28,
+      "learning_rate": 9.849603582884465e-05,
+      "loss": 0.8674,
+      "step": 1500
     }
   ],
   "max_steps": 34046,
   "num_train_epochs": 29,
+  "total_flos": 4.388752851314688e+17,
   "trial_name": null,
   "trial_params": null
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b16808d7ea3a6768a261eb157b5f29a99aeca37a79dbfcb382682591ef779da6
 size 3247

 version https://git-lfs.github.com/spec/v1
+oid sha256:549b0ff4e4321e5db62ce48db4b228cf34e5c7f6c8cd9618cfda47ceed1dbf29
 size 3247

vocab.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"s": 0, "q": 1, "x": 2, "r": 3, "h": 4, "b": 6, "a": 7, "j": 8, "n": 9, "p": 10, "k": 11, "o": 12, "g": ~~13, "m":~~ 14, "f": 15, "c": 16, "y": 17, "t": 18, "u": 19, "w": 20, "e": 21, "z": 23, "i": 24, "v": 25, "d": 26, "l": 27, "[UNK]": 28, "[PAD]": 29, "\|": 22}


1	+ {"q": 0, "j": 1, "t": 3, "o": 4, "p": 5, "a": 6, "u": 7, "b": 8, "y": 9, "d": 10, "c": 11, "h": 12, "l": 14, "r": 15, "f": 16, "i": 17, "k": 18, "s": 19, "z": 20, "m": 21, "n": 22, "v": 23, "x": 24, "e": 25, "w": 26, "g": 27, "[UNK]": 28, "[PAD]": 29, "\|": 2}