3v324v23 commited on Nov 14, 2022

Commit

79cb61b

1 Parent(s): 5835438

Model first push

Browse files

Files changed (18) hide show

checkpoint-17500/config.json +108 -0
checkpoint-17500/optimizer.pt +3 -0
checkpoint-17500/preprocessor_config.json +9 -0
checkpoint-17500/pytorch_model.bin +3 -0
checkpoint-17500/rng_state.pth +3 -0
checkpoint-17500/scheduler.pt +3 -0
checkpoint-17500/trainer_state.json +541 -0
checkpoint-17500/training_args.bin +3 -0
config.json +108 -0
optimizer.pt +3 -0
preprocessor_config.json +9 -0
pytorch_model.bin +3 -0
rng_state.pth +3 -0
runs/Nov14_01-43-39_70156f070b9c/1668390306.856677/events.out.tfevents.1668390306.70156f070b9c.85.1 +3 -0
runs/Nov14_01-43-39_70156f070b9c/events.out.tfevents.1668390306.70156f070b9c.85.0 +3 -0
scheduler.pt +3 -0
trainer_state.json +556 -0
training_args.bin +3 -0

checkpoint-17500/config.json ADDED Viewed

	@@ -0,0 +1,108 @@

+{
+  "_name_or_path": "yip-i/uaspeech-pretrained",
+  "activation_dropout": 0.0,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 256,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.0,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.0,
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.0,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.65,
+  "model_type": "wav2vec2",
+  "num_adapter_layers": 3,
+  "num_attention_heads": 12,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 12,
+  "num_negatives": 100,
+  "output_hidden_size": 768,
+  "pad_token_id": 29,
+  "proj_codevector_dim": 256,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.23.1",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 32,
+  "xvector_output_dim": 512
+}

checkpoint-17500/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:536b181a3a322aaf0b4d78d18751437c33b961e6655cc4c049ea3b207faaa6e9
+size 721685265

checkpoint-17500/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": false,
+  "sampling_rate": 16000
+}

checkpoint-17500/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1d6ff44d661cae8cb3e5d07e2957fb41f2ea18f4544836f52130d34eddfd5089
+size 377702321

checkpoint-17500/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8e06a5780cb4c5a5ab12f02e995c2100f2d68a7b1512c016d743690d9188cb6c
+size 14567

checkpoint-17500/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4f78aeb70f5e1d3045d4779dc880fe517a3726f5e89e28a06e1feee3b56dbde0
+size 623

checkpoint-17500/trainer_state.json ADDED Viewed

	@@ -0,0 +1,541 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 28.40909090909091,
+  "global_step": 17500,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.81,
+      "learning_rate": 5e-05,
+      "loss": 8.6952,
+      "step": 500
+    },
+    {
+      "epoch": 0.81,
+      "eval_loss": 3.0705761909484863,
+      "eval_runtime": 8.0191,
+      "eval_samples_per_second": 25.813,
+      "eval_steps_per_second": 3.242,
+      "eval_wer": 1.1315192743764173,
+      "step": 500
+    },
+    {
+      "epoch": 1.62,
+      "learning_rate": 0.0001,
+      "loss": 3.2723,
+      "step": 1000
+    },
+    {
+      "epoch": 1.62,
+      "eval_loss": 2.9638686180114746,
+      "eval_runtime": 8.0684,
+      "eval_samples_per_second": 25.656,
+      "eval_steps_per_second": 3.222,
+      "eval_wer": 1.0,
+      "step": 1000
+    },
+    {
+      "epoch": 2.44,
+      "learning_rate": 9.713958810068651e-05,
+      "loss": 3.2191,
+      "step": 1500
+    },
+    {
+      "epoch": 2.44,
+      "eval_loss": 3.0145716667175293,
+      "eval_runtime": 8.0711,
+      "eval_samples_per_second": 25.647,
+      "eval_steps_per_second": 3.221,
+      "eval_wer": 1.0,
+      "step": 1500
+    },
+    {
+      "epoch": 3.25,
+      "learning_rate": 9.4279176201373e-05,
+      "loss": 3.0698,
+      "step": 2000
+    },
+    {
+      "epoch": 3.25,
+      "eval_loss": 2.9972307682037354,
+      "eval_runtime": 8.0326,
+      "eval_samples_per_second": 25.77,
+      "eval_steps_per_second": 3.237,
+      "eval_wer": 1.3356009070294785,
+      "step": 2000
+    },
+    {
+      "epoch": 4.06,
+      "learning_rate": 9.14187643020595e-05,
+      "loss": 3.1918,
+      "step": 2500
+    },
+    {
+      "epoch": 4.06,
+      "eval_loss": 2.9555039405822754,
+      "eval_runtime": 8.0447,
+      "eval_samples_per_second": 25.731,
+      "eval_steps_per_second": 3.232,
+      "eval_wer": 1.0,
+      "step": 2500
+    },
+    {
+      "epoch": 4.87,
+      "learning_rate": 8.8558352402746e-05,
+      "loss": 3.0932,
+      "step": 3000
+    },
+    {
+      "epoch": 4.87,
+      "eval_loss": 2.9776482582092285,
+      "eval_runtime": 8.053,
+      "eval_samples_per_second": 25.705,
+      "eval_steps_per_second": 3.229,
+      "eval_wer": 1.0,
+      "step": 3000
+    },
+    {
+      "epoch": 5.68,
+      "learning_rate": 8.569794050343249e-05,
+      "loss": 3.2271,
+      "step": 3500
+    },
+    {
+      "epoch": 5.68,
+      "eval_loss": 3.055955410003662,
+      "eval_runtime": 8.1309,
+      "eval_samples_per_second": 25.458,
+      "eval_steps_per_second": 3.198,
+      "eval_wer": 1.3378684807256236,
+      "step": 3500
+    },
+    {
+      "epoch": 6.49,
+      "learning_rate": 8.283752860411899e-05,
+      "loss": 3.2925,
+      "step": 4000
+    },
+    {
+      "epoch": 6.49,
+      "eval_loss": 2.9724416732788086,
+      "eval_runtime": 8.0677,
+      "eval_samples_per_second": 25.658,
+      "eval_steps_per_second": 3.223,
+      "eval_wer": 1.3900226757369614,
+      "step": 4000
+    },
+    {
+      "epoch": 7.31,
+      "learning_rate": 7.99771167048055e-05,
+      "loss": 3.2195,
+      "step": 4500
+    },
+    {
+      "epoch": 7.31,
+      "eval_loss": 3.5231425762176514,
+      "eval_runtime": 8.1433,
+      "eval_samples_per_second": 25.42,
+      "eval_steps_per_second": 3.193,
+      "eval_wer": 1.0,
+      "step": 4500
+    },
+    {
+      "epoch": 8.12,
+      "learning_rate": 7.711670480549199e-05,
+      "loss": 3.3582,
+      "step": 5000
+    },
+    {
+      "epoch": 8.12,
+      "eval_loss": 3.749286413192749,
+      "eval_runtime": 8.0117,
+      "eval_samples_per_second": 25.837,
+      "eval_steps_per_second": 3.245,
+      "eval_wer": 1.0249433106575965,
+      "step": 5000
+    },
+    {
+      "epoch": 8.93,
+      "learning_rate": 7.42562929061785e-05,
+      "loss": 3.3233,
+      "step": 5500
+    },
+    {
+      "epoch": 8.93,
+      "eval_loss": 3.3524105548858643,
+      "eval_runtime": 8.2055,
+      "eval_samples_per_second": 25.227,
+      "eval_steps_per_second": 3.169,
+      "eval_wer": 1.0,
+      "step": 5500
+    },
+    {
+      "epoch": 9.74,
+      "learning_rate": 7.1395881006865e-05,
+      "loss": 3.1679,
+      "step": 6000
+    },
+    {
+      "epoch": 9.74,
+      "eval_loss": 3.186889410018921,
+      "eval_runtime": 8.0182,
+      "eval_samples_per_second": 25.816,
+      "eval_steps_per_second": 3.243,
+      "eval_wer": 1.3877551020408163,
+      "step": 6000
+    },
+    {
+      "epoch": 10.55,
+      "learning_rate": 6.853546910755149e-05,
+      "loss": 3.1393,
+      "step": 6500
+    },
+    {
+      "epoch": 10.55,
+      "eval_loss": 3.0084877014160156,
+      "eval_runtime": 8.0014,
+      "eval_samples_per_second": 25.871,
+      "eval_steps_per_second": 3.249,
+      "eval_wer": 1.2947845804988662,
+      "step": 6500
+    },
+    {
+      "epoch": 11.36,
+      "learning_rate": 6.5675057208238e-05,
+      "loss": 3.1699,
+      "step": 7000
+    },
+    {
+      "epoch": 11.36,
+      "eval_loss": 2.997206449508667,
+      "eval_runtime": 8.1145,
+      "eval_samples_per_second": 25.51,
+      "eval_steps_per_second": 3.204,
+      "eval_wer": 1.1337868480725624,
+      "step": 7000
+    },
+    {
+      "epoch": 12.18,
+      "learning_rate": 6.281464530892449e-05,
+      "loss": 3.3382,
+      "step": 7500
+    },
+    {
+      "epoch": 12.18,
+      "eval_loss": 2.9686625003814697,
+      "eval_runtime": 8.0023,
+      "eval_samples_per_second": 25.868,
+      "eval_steps_per_second": 3.249,
+      "eval_wer": 1.3877551020408163,
+      "step": 7500
+    },
+    {
+      "epoch": 12.99,
+      "learning_rate": 5.9954233409610984e-05,
+      "loss": 3.0454,
+      "step": 8000
+    },
+    {
+      "epoch": 12.99,
+      "eval_loss": 2.968928337097168,
+      "eval_runtime": 8.2051,
+      "eval_samples_per_second": 25.228,
+      "eval_steps_per_second": 3.169,
+      "eval_wer": 1.383219954648526,
+      "step": 8000
+    },
+    {
+      "epoch": 13.8,
+      "learning_rate": 5.709382151029748e-05,
+      "loss": 3.0609,
+      "step": 8500
+    },
+    {
+      "epoch": 13.8,
+      "eval_loss": 2.902815580368042,
+      "eval_runtime": 8.0338,
+      "eval_samples_per_second": 25.766,
+      "eval_steps_per_second": 3.236,
+      "eval_wer": 1.3900226757369614,
+      "step": 8500
+    },
+    {
+      "epoch": 14.61,
+      "learning_rate": 5.423340961098399e-05,
+      "loss": 3.0224,
+      "step": 9000
+    },
+    {
+      "epoch": 14.61,
+      "eval_loss": 2.9064831733703613,
+      "eval_runtime": 8.2142,
+      "eval_samples_per_second": 25.2,
+      "eval_steps_per_second": 3.165,
+      "eval_wer": 1.3877551020408163,
+      "step": 9000
+    },
+    {
+      "epoch": 15.42,
+      "learning_rate": 5.137299771167048e-05,
+      "loss": 3.0156,
+      "step": 9500
+    },
+    {
+      "epoch": 15.42,
+      "eval_loss": 2.8854894638061523,
+      "eval_runtime": 7.9943,
+      "eval_samples_per_second": 25.893,
+      "eval_steps_per_second": 3.252,
+      "eval_wer": 1.3900226757369614,
+      "step": 9500
+    },
+    {
+      "epoch": 16.23,
+      "learning_rate": 4.851258581235698e-05,
+      "loss": 3.0317,
+      "step": 10000
+    },
+    {
+      "epoch": 16.23,
+      "eval_loss": 2.8956820964813232,
+      "eval_runtime": 8.1264,
+      "eval_samples_per_second": 25.473,
+      "eval_steps_per_second": 3.199,
+      "eval_wer": 1.3900226757369614,
+      "step": 10000
+    },
+    {
+      "epoch": 17.05,
+      "learning_rate": 4.565217391304348e-05,
+      "loss": 3.0184,
+      "step": 10500
+    },
+    {
+      "epoch": 17.05,
+      "eval_loss": 2.88946270942688,
+      "eval_runtime": 8.0387,
+      "eval_samples_per_second": 25.751,
+      "eval_steps_per_second": 3.234,
+      "eval_wer": 1.3900226757369614,
+      "step": 10500
+    },
+    {
+      "epoch": 17.86,
+      "learning_rate": 4.279176201372998e-05,
+      "loss": 3.0852,
+      "step": 11000
+    },
+    {
+      "epoch": 17.86,
+      "eval_loss": 2.8936383724212646,
+      "eval_runtime": 8.1682,
+      "eval_samples_per_second": 25.342,
+      "eval_steps_per_second": 3.183,
+      "eval_wer": 1.3900226757369614,
+      "step": 11000
+    },
+    {
+      "epoch": 18.67,
+      "learning_rate": 3.993135011441648e-05,
+      "loss": 3.0017,
+      "step": 11500
+    },
+    {
+      "epoch": 18.67,
+      "eval_loss": 2.8695127964019775,
+      "eval_runtime": 8.169,
+      "eval_samples_per_second": 25.34,
+      "eval_steps_per_second": 3.183,
+      "eval_wer": 1.3900226757369614,
+      "step": 11500
+    },
+    {
+      "epoch": 19.48,
+      "learning_rate": 3.707093821510298e-05,
+      "loss": 2.9337,
+      "step": 12000
+    },
+    {
+      "epoch": 19.48,
+      "eval_loss": 2.8768134117126465,
+      "eval_runtime": 8.1024,
+      "eval_samples_per_second": 25.548,
+      "eval_steps_per_second": 3.209,
+      "eval_wer": 1.3900226757369614,
+      "step": 12000
+    },
+    {
+      "epoch": 20.29,
+      "learning_rate": 3.421052631578947e-05,
+      "loss": 3.0017,
+      "step": 12500
+    },
+    {
+      "epoch": 20.29,
+      "eval_loss": 2.8580081462860107,
+      "eval_runtime": 8.1811,
+      "eval_samples_per_second": 25.302,
+      "eval_steps_per_second": 3.178,
+      "eval_wer": 1.3900226757369614,
+      "step": 12500
+    },
+    {
+      "epoch": 21.1,
+      "learning_rate": 3.135011441647597e-05,
+      "loss": 2.9472,
+      "step": 13000
+    },
+    {
+      "epoch": 21.1,
+      "eval_loss": 2.839965343475342,
+      "eval_runtime": 8.2839,
+      "eval_samples_per_second": 24.988,
+      "eval_steps_per_second": 3.139,
+      "eval_wer": 1.3900226757369614,
+      "step": 13000
+    },
+    {
+      "epoch": 21.92,
+      "learning_rate": 2.8489702517162476e-05,
+      "loss": 3.0214,
+      "step": 13500
+    },
+    {
+      "epoch": 21.92,
+      "eval_loss": 2.856123924255371,
+      "eval_runtime": 8.1176,
+      "eval_samples_per_second": 25.5,
+      "eval_steps_per_second": 3.203,
+      "eval_wer": 1.3900226757369614,
+      "step": 13500
+    },
+    {
+      "epoch": 22.73,
+      "learning_rate": 2.562929061784897e-05,
+      "loss": 2.9336,
+      "step": 14000
+    },
+    {
+      "epoch": 22.73,
+      "eval_loss": 2.879206895828247,
+      "eval_runtime": 8.1391,
+      "eval_samples_per_second": 25.433,
+      "eval_steps_per_second": 3.194,
+      "eval_wer": 1.3900226757369614,
+      "step": 14000
+    },
+    {
+      "epoch": 23.54,
+      "learning_rate": 2.276887871853547e-05,
+      "loss": 3.0134,
+      "step": 14500
+    },
+    {
+      "epoch": 23.54,
+      "eval_loss": 2.8472487926483154,
+      "eval_runtime": 8.0887,
+      "eval_samples_per_second": 25.591,
+      "eval_steps_per_second": 3.214,
+      "eval_wer": 1.3900226757369614,
+      "step": 14500
+    },
+    {
+      "epoch": 24.35,
+      "learning_rate": 1.990846681922197e-05,
+      "loss": 2.9433,
+      "step": 15000
+    },
+    {
+      "epoch": 24.35,
+      "eval_loss": 2.8818936347961426,
+      "eval_runtime": 8.193,
+      "eval_samples_per_second": 25.266,
+      "eval_steps_per_second": 3.173,
+      "eval_wer": 1.3900226757369614,
+      "step": 15000
+    },
+    {
+      "epoch": 25.16,
+      "learning_rate": 1.7048054919908468e-05,
+      "loss": 2.8536,
+      "step": 15500
+    },
+    {
+      "epoch": 25.16,
+      "eval_loss": 2.837463140487671,
+      "eval_runtime": 8.1663,
+      "eval_samples_per_second": 25.348,
+      "eval_steps_per_second": 3.184,
+      "eval_wer": 1.3900226757369614,
+      "step": 15500
+    },
+    {
+      "epoch": 25.97,
+      "learning_rate": 1.4187643020594965e-05,
+      "loss": 2.8742,
+      "step": 16000
+    },
+    {
+      "epoch": 25.97,
+      "eval_loss": 2.857389450073242,
+      "eval_runtime": 8.194,
+      "eval_samples_per_second": 25.262,
+      "eval_steps_per_second": 3.173,
+      "eval_wer": 1.3900226757369614,
+      "step": 16000
+    },
+    {
+      "epoch": 26.79,
+      "learning_rate": 1.1327231121281464e-05,
+      "loss": 2.8298,
+      "step": 16500
+    },
+    {
+      "epoch": 26.79,
+      "eval_loss": 2.982081651687622,
+      "eval_runtime": 8.1935,
+      "eval_samples_per_second": 25.264,
+      "eval_steps_per_second": 3.173,
+      "eval_wer": 1.3900226757369614,
+      "step": 16500
+    },
+    {
+      "epoch": 27.6,
+      "learning_rate": 8.466819221967964e-06,
+      "loss": 2.7439,
+      "step": 17000
+    },
+    {
+      "epoch": 27.6,
+      "eval_loss": 3.2741587162017822,
+      "eval_runtime": 8.2267,
+      "eval_samples_per_second": 25.162,
+      "eval_steps_per_second": 3.16,
+      "eval_wer": 1.3900226757369614,
+      "step": 17000
+    },
+    {
+      "epoch": 28.41,
+      "learning_rate": 5.606407322654463e-06,
+      "loss": 2.7008,
+      "step": 17500
+    },
+    {
+      "epoch": 28.41,
+      "eval_loss": 3.365966320037842,
+      "eval_runtime": 8.203,
+      "eval_samples_per_second": 25.235,
+      "eval_steps_per_second": 3.17,
+      "eval_wer": 1.3900226757369614,
+      "step": 17500
+    }
+  ],
+  "max_steps": 18480,
+  "num_train_epochs": 30,
+  "total_flos": 3.9780154122268984e+18,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-17500/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:151803200d49964e6d9f1364dede5203d89e69881055e526220d7cecd61ffdfb
+size 3375

config.json ADDED Viewed

	@@ -0,0 +1,108 @@

+{
+  "_name_or_path": "yip-i/uaspeech-pretrained",
+  "activation_dropout": 0.0,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 256,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.0,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.0,
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.0,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.65,
+  "model_type": "wav2vec2",
+  "num_adapter_layers": 3,
+  "num_attention_heads": 12,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 12,
+  "num_negatives": 100,
+  "output_hidden_size": 768,
+  "pad_token_id": 29,
+  "proj_codevector_dim": 256,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.23.1",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 32,
+  "xvector_output_dim": 512
+}

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:16c9cd721072f1285d9a09541b16d36154b0a65769ba2304ebd3cf1a47a3ccd9
+size 721685265

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": false,
+  "sampling_rate": 16000
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c3b8ce0b861b34249acd899833cc5d17966f7c3820981c93099f3388451d2d17
+size 377702321

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:49daf610bd0be93ec34116c5dabb671af4b737094b6d5999d22a7ff4458cd59e
+size 14503

runs/Nov14_01-43-39_70156f070b9c/1668390306.856677/events.out.tfevents.1668390306.70156f070b9c.85.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0ca0942bb58cf7715bde732b0a6e3d088ea04147768ab715db2dee9de56e0a1f
+size 5471

runs/Nov14_01-43-39_70156f070b9c/events.out.tfevents.1668390306.70156f070b9c.85.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:62b5c681d69c7373b8ec47ffc5e62b6cbd4ccfd518965e2f66ceae9414986bf6
+size 22613

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b5d4a13226e6eeef330f9ea7271fdddd531065e7435f741b314c8ee6f8e1c979
+size 623

trainer_state.json ADDED Viewed

	@@ -0,0 +1,556 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 29.22077922077922,
+  "global_step": 18000,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.81,
+      "learning_rate": 5e-05,
+      "loss": 8.6952,
+      "step": 500
+    },
+    {
+      "epoch": 0.81,
+      "eval_loss": 3.0705761909484863,
+      "eval_runtime": 8.0191,
+      "eval_samples_per_second": 25.813,
+      "eval_steps_per_second": 3.242,
+      "eval_wer": 1.1315192743764173,
+      "step": 500
+    },
+    {
+      "epoch": 1.62,
+      "learning_rate": 0.0001,
+      "loss": 3.2723,
+      "step": 1000
+    },
+    {
+      "epoch": 1.62,
+      "eval_loss": 2.9638686180114746,
+      "eval_runtime": 8.0684,
+      "eval_samples_per_second": 25.656,
+      "eval_steps_per_second": 3.222,
+      "eval_wer": 1.0,
+      "step": 1000
+    },
+    {
+      "epoch": 2.44,
+      "learning_rate": 9.713958810068651e-05,
+      "loss": 3.2191,
+      "step": 1500
+    },
+    {
+      "epoch": 2.44,
+      "eval_loss": 3.0145716667175293,
+      "eval_runtime": 8.0711,
+      "eval_samples_per_second": 25.647,
+      "eval_steps_per_second": 3.221,
+      "eval_wer": 1.0,
+      "step": 1500
+    },
+    {
+      "epoch": 3.25,
+      "learning_rate": 9.4279176201373e-05,
+      "loss": 3.0698,
+      "step": 2000
+    },
+    {
+      "epoch": 3.25,
+      "eval_loss": 2.9972307682037354,
+      "eval_runtime": 8.0326,
+      "eval_samples_per_second": 25.77,
+      "eval_steps_per_second": 3.237,
+      "eval_wer": 1.3356009070294785,
+      "step": 2000
+    },
+    {
+      "epoch": 4.06,
+      "learning_rate": 9.14187643020595e-05,
+      "loss": 3.1918,
+      "step": 2500
+    },
+    {
+      "epoch": 4.06,
+      "eval_loss": 2.9555039405822754,
+      "eval_runtime": 8.0447,
+      "eval_samples_per_second": 25.731,
+      "eval_steps_per_second": 3.232,
+      "eval_wer": 1.0,
+      "step": 2500
+    },
+    {
+      "epoch": 4.87,
+      "learning_rate": 8.8558352402746e-05,
+      "loss": 3.0932,
+      "step": 3000
+    },
+    {
+      "epoch": 4.87,
+      "eval_loss": 2.9776482582092285,
+      "eval_runtime": 8.053,
+      "eval_samples_per_second": 25.705,
+      "eval_steps_per_second": 3.229,
+      "eval_wer": 1.0,
+      "step": 3000
+    },
+    {
+      "epoch": 5.68,
+      "learning_rate": 8.569794050343249e-05,
+      "loss": 3.2271,
+      "step": 3500
+    },
+    {
+      "epoch": 5.68,
+      "eval_loss": 3.055955410003662,
+      "eval_runtime": 8.1309,
+      "eval_samples_per_second": 25.458,
+      "eval_steps_per_second": 3.198,
+      "eval_wer": 1.3378684807256236,
+      "step": 3500
+    },
+    {
+      "epoch": 6.49,
+      "learning_rate": 8.283752860411899e-05,
+      "loss": 3.2925,
+      "step": 4000
+    },
+    {
+      "epoch": 6.49,
+      "eval_loss": 2.9724416732788086,
+      "eval_runtime": 8.0677,
+      "eval_samples_per_second": 25.658,
+      "eval_steps_per_second": 3.223,
+      "eval_wer": 1.3900226757369614,
+      "step": 4000
+    },
+    {
+      "epoch": 7.31,
+      "learning_rate": 7.99771167048055e-05,
+      "loss": 3.2195,
+      "step": 4500
+    },
+    {
+      "epoch": 7.31,
+      "eval_loss": 3.5231425762176514,
+      "eval_runtime": 8.1433,
+      "eval_samples_per_second": 25.42,
+      "eval_steps_per_second": 3.193,
+      "eval_wer": 1.0,
+      "step": 4500
+    },
+    {
+      "epoch": 8.12,
+      "learning_rate": 7.711670480549199e-05,
+      "loss": 3.3582,
+      "step": 5000
+    },
+    {
+      "epoch": 8.12,
+      "eval_loss": 3.749286413192749,
+      "eval_runtime": 8.0117,
+      "eval_samples_per_second": 25.837,
+      "eval_steps_per_second": 3.245,
+      "eval_wer": 1.0249433106575965,
+      "step": 5000
+    },
+    {
+      "epoch": 8.93,
+      "learning_rate": 7.42562929061785e-05,
+      "loss": 3.3233,
+      "step": 5500
+    },
+    {
+      "epoch": 8.93,
+      "eval_loss": 3.3524105548858643,
+      "eval_runtime": 8.2055,
+      "eval_samples_per_second": 25.227,
+      "eval_steps_per_second": 3.169,
+      "eval_wer": 1.0,
+      "step": 5500
+    },
+    {
+      "epoch": 9.74,
+      "learning_rate": 7.1395881006865e-05,
+      "loss": 3.1679,
+      "step": 6000
+    },
+    {
+      "epoch": 9.74,
+      "eval_loss": 3.186889410018921,
+      "eval_runtime": 8.0182,
+      "eval_samples_per_second": 25.816,
+      "eval_steps_per_second": 3.243,
+      "eval_wer": 1.3877551020408163,
+      "step": 6000
+    },
+    {
+      "epoch": 10.55,
+      "learning_rate": 6.853546910755149e-05,
+      "loss": 3.1393,
+      "step": 6500
+    },
+    {
+      "epoch": 10.55,
+      "eval_loss": 3.0084877014160156,
+      "eval_runtime": 8.0014,
+      "eval_samples_per_second": 25.871,
+      "eval_steps_per_second": 3.249,
+      "eval_wer": 1.2947845804988662,
+      "step": 6500
+    },
+    {
+      "epoch": 11.36,
+      "learning_rate": 6.5675057208238e-05,
+      "loss": 3.1699,
+      "step": 7000
+    },
+    {
+      "epoch": 11.36,
+      "eval_loss": 2.997206449508667,
+      "eval_runtime": 8.1145,
+      "eval_samples_per_second": 25.51,
+      "eval_steps_per_second": 3.204,
+      "eval_wer": 1.1337868480725624,
+      "step": 7000
+    },
+    {
+      "epoch": 12.18,
+      "learning_rate": 6.281464530892449e-05,
+      "loss": 3.3382,
+      "step": 7500
+    },
+    {
+      "epoch": 12.18,
+      "eval_loss": 2.9686625003814697,
+      "eval_runtime": 8.0023,
+      "eval_samples_per_second": 25.868,
+      "eval_steps_per_second": 3.249,
+      "eval_wer": 1.3877551020408163,
+      "step": 7500
+    },
+    {
+      "epoch": 12.99,
+      "learning_rate": 5.9954233409610984e-05,
+      "loss": 3.0454,
+      "step": 8000
+    },
+    {
+      "epoch": 12.99,
+      "eval_loss": 2.968928337097168,
+      "eval_runtime": 8.2051,
+      "eval_samples_per_second": 25.228,
+      "eval_steps_per_second": 3.169,
+      "eval_wer": 1.383219954648526,
+      "step": 8000
+    },
+    {
+      "epoch": 13.8,
+      "learning_rate": 5.709382151029748e-05,
+      "loss": 3.0609,
+      "step": 8500
+    },
+    {
+      "epoch": 13.8,
+      "eval_loss": 2.902815580368042,
+      "eval_runtime": 8.0338,
+      "eval_samples_per_second": 25.766,
+      "eval_steps_per_second": 3.236,
+      "eval_wer": 1.3900226757369614,
+      "step": 8500
+    },
+    {
+      "epoch": 14.61,
+      "learning_rate": 5.423340961098399e-05,
+      "loss": 3.0224,
+      "step": 9000
+    },
+    {
+      "epoch": 14.61,
+      "eval_loss": 2.9064831733703613,
+      "eval_runtime": 8.2142,
+      "eval_samples_per_second": 25.2,
+      "eval_steps_per_second": 3.165,
+      "eval_wer": 1.3877551020408163,
+      "step": 9000
+    },
+    {
+      "epoch": 15.42,
+      "learning_rate": 5.137299771167048e-05,
+      "loss": 3.0156,
+      "step": 9500
+    },
+    {
+      "epoch": 15.42,
+      "eval_loss": 2.8854894638061523,
+      "eval_runtime": 7.9943,
+      "eval_samples_per_second": 25.893,
+      "eval_steps_per_second": 3.252,
+      "eval_wer": 1.3900226757369614,
+      "step": 9500
+    },
+    {
+      "epoch": 16.23,
+      "learning_rate": 4.851258581235698e-05,
+      "loss": 3.0317,
+      "step": 10000
+    },
+    {
+      "epoch": 16.23,
+      "eval_loss": 2.8956820964813232,
+      "eval_runtime": 8.1264,
+      "eval_samples_per_second": 25.473,
+      "eval_steps_per_second": 3.199,
+      "eval_wer": 1.3900226757369614,
+      "step": 10000
+    },
+    {
+      "epoch": 17.05,
+      "learning_rate": 4.565217391304348e-05,
+      "loss": 3.0184,
+      "step": 10500
+    },
+    {
+      "epoch": 17.05,
+      "eval_loss": 2.88946270942688,
+      "eval_runtime": 8.0387,
+      "eval_samples_per_second": 25.751,
+      "eval_steps_per_second": 3.234,
+      "eval_wer": 1.3900226757369614,
+      "step": 10500
+    },
+    {
+      "epoch": 17.86,
+      "learning_rate": 4.279176201372998e-05,
+      "loss": 3.0852,
+      "step": 11000
+    },
+    {
+      "epoch": 17.86,
+      "eval_loss": 2.8936383724212646,
+      "eval_runtime": 8.1682,
+      "eval_samples_per_second": 25.342,
+      "eval_steps_per_second": 3.183,
+      "eval_wer": 1.3900226757369614,
+      "step": 11000
+    },
+    {
+      "epoch": 18.67,
+      "learning_rate": 3.993135011441648e-05,
+      "loss": 3.0017,
+      "step": 11500
+    },
+    {
+      "epoch": 18.67,
+      "eval_loss": 2.8695127964019775,
+      "eval_runtime": 8.169,
+      "eval_samples_per_second": 25.34,
+      "eval_steps_per_second": 3.183,
+      "eval_wer": 1.3900226757369614,
+      "step": 11500
+    },
+    {
+      "epoch": 19.48,
+      "learning_rate": 3.707093821510298e-05,
+      "loss": 2.9337,
+      "step": 12000
+    },
+    {
+      "epoch": 19.48,
+      "eval_loss": 2.8768134117126465,
+      "eval_runtime": 8.1024,
+      "eval_samples_per_second": 25.548,
+      "eval_steps_per_second": 3.209,
+      "eval_wer": 1.3900226757369614,
+      "step": 12000
+    },
+    {
+      "epoch": 20.29,
+      "learning_rate": 3.421052631578947e-05,
+      "loss": 3.0017,
+      "step": 12500
+    },
+    {
+      "epoch": 20.29,
+      "eval_loss": 2.8580081462860107,
+      "eval_runtime": 8.1811,
+      "eval_samples_per_second": 25.302,
+      "eval_steps_per_second": 3.178,
+      "eval_wer": 1.3900226757369614,
+      "step": 12500
+    },
+    {
+      "epoch": 21.1,
+      "learning_rate": 3.135011441647597e-05,
+      "loss": 2.9472,
+      "step": 13000
+    },
+    {
+      "epoch": 21.1,
+      "eval_loss": 2.839965343475342,
+      "eval_runtime": 8.2839,
+      "eval_samples_per_second": 24.988,
+      "eval_steps_per_second": 3.139,
+      "eval_wer": 1.3900226757369614,
+      "step": 13000
+    },
+    {
+      "epoch": 21.92,
+      "learning_rate": 2.8489702517162476e-05,
+      "loss": 3.0214,
+      "step": 13500
+    },
+    {
+      "epoch": 21.92,
+      "eval_loss": 2.856123924255371,
+      "eval_runtime": 8.1176,
+      "eval_samples_per_second": 25.5,
+      "eval_steps_per_second": 3.203,
+      "eval_wer": 1.3900226757369614,
+      "step": 13500
+    },
+    {
+      "epoch": 22.73,
+      "learning_rate": 2.562929061784897e-05,
+      "loss": 2.9336,
+      "step": 14000
+    },
+    {
+      "epoch": 22.73,
+      "eval_loss": 2.879206895828247,
+      "eval_runtime": 8.1391,
+      "eval_samples_per_second": 25.433,
+      "eval_steps_per_second": 3.194,
+      "eval_wer": 1.3900226757369614,
+      "step": 14000
+    },
+    {
+      "epoch": 23.54,
+      "learning_rate": 2.276887871853547e-05,
+      "loss": 3.0134,
+      "step": 14500
+    },
+    {
+      "epoch": 23.54,
+      "eval_loss": 2.8472487926483154,
+      "eval_runtime": 8.0887,
+      "eval_samples_per_second": 25.591,
+      "eval_steps_per_second": 3.214,
+      "eval_wer": 1.3900226757369614,
+      "step": 14500
+    },
+    {
+      "epoch": 24.35,
+      "learning_rate": 1.990846681922197e-05,
+      "loss": 2.9433,
+      "step": 15000
+    },
+    {
+      "epoch": 24.35,
+      "eval_loss": 2.8818936347961426,
+      "eval_runtime": 8.193,
+      "eval_samples_per_second": 25.266,
+      "eval_steps_per_second": 3.173,
+      "eval_wer": 1.3900226757369614,
+      "step": 15000
+    },
+    {
+      "epoch": 25.16,
+      "learning_rate": 1.7048054919908468e-05,
+      "loss": 2.8536,
+      "step": 15500
+    },
+    {
+      "epoch": 25.16,
+      "eval_loss": 2.837463140487671,
+      "eval_runtime": 8.1663,
+      "eval_samples_per_second": 25.348,
+      "eval_steps_per_second": 3.184,
+      "eval_wer": 1.3900226757369614,
+      "step": 15500
+    },
+    {
+      "epoch": 25.97,
+      "learning_rate": 1.4187643020594965e-05,
+      "loss": 2.8742,
+      "step": 16000
+    },
+    {
+      "epoch": 25.97,
+      "eval_loss": 2.857389450073242,
+      "eval_runtime": 8.194,
+      "eval_samples_per_second": 25.262,
+      "eval_steps_per_second": 3.173,
+      "eval_wer": 1.3900226757369614,
+      "step": 16000
+    },
+    {
+      "epoch": 26.79,
+      "learning_rate": 1.1327231121281464e-05,
+      "loss": 2.8298,
+      "step": 16500
+    },
+    {
+      "epoch": 26.79,
+      "eval_loss": 2.982081651687622,
+      "eval_runtime": 8.1935,
+      "eval_samples_per_second": 25.264,
+      "eval_steps_per_second": 3.173,
+      "eval_wer": 1.3900226757369614,
+      "step": 16500
+    },
+    {
+      "epoch": 27.6,
+      "learning_rate": 8.466819221967964e-06,
+      "loss": 2.7439,
+      "step": 17000
+    },
+    {
+      "epoch": 27.6,
+      "eval_loss": 3.2741587162017822,
+      "eval_runtime": 8.2267,
+      "eval_samples_per_second": 25.162,
+      "eval_steps_per_second": 3.16,
+      "eval_wer": 1.3900226757369614,
+      "step": 17000
+    },
+    {
+      "epoch": 28.41,
+      "learning_rate": 5.606407322654463e-06,
+      "loss": 2.7008,
+      "step": 17500
+    },
+    {
+      "epoch": 28.41,
+      "eval_loss": 3.365966320037842,
+      "eval_runtime": 8.203,
+      "eval_samples_per_second": 25.235,
+      "eval_steps_per_second": 3.17,
+      "eval_wer": 1.3900226757369614,
+      "step": 17500
+    },
+    {
+      "epoch": 29.22,
+      "learning_rate": 2.745995423340961e-06,
+      "loss": 2.7087,
+      "step": 18000
+    },
+    {
+      "epoch": 29.22,
+      "eval_loss": 3.812533140182495,
+      "eval_runtime": 8.2382,
+      "eval_samples_per_second": 25.127,
+      "eval_steps_per_second": 3.156,
+      "eval_wer": 1.3900226757369614,
+      "step": 18000
+    }
+  ],
+  "max_steps": 18480,
+  "num_train_epochs": 30,
+  "total_flos": 4.093361821503758e+18,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:151803200d49964e6d9f1364dede5203d89e69881055e526220d7cecd61ffdfb
+size 3375