niobures commited on Sep 26, 2025

Commit

f9bd03b

verified ·

1 Parent(s): 7f0ddcb

HuBERT (emotion, sequence classification, ser)

Browse files

Files changed (44) hide show

hubert-base-ch-speech-emotion-recognition-onnx/.gitattributes +35 -0
hubert-base-ch-speech-emotion-recognition-onnx/README.md +3 -0
hubert-base-ch-speech-emotion-recognition-onnx/config.json +74 -0
hubert-base-ch-speech-emotion-recognition-onnx/onnx/model_quantized.onnx +3 -0
hubert-base-ch-speech-emotion-recognition-onnx/preprocessor_config.json +9 -0
hubert-base-ch-speech-emotion-recognition-onnx/pytorch_model.bin +3 -0
hubert-base-ch-speech-emotion-recognition-onnx/source.txt +1 -0
hubert-base-ser/.gitattributes +27 -0
hubert-base-ser/.gitignore +1 -0
hubert-base-ser/README.md +135 -0
hubert-base-ser/all_results.json +9 -0
hubert-base-ser/config.json +95 -0
hubert-base-ser/preprocessor_config.json +9 -0
hubert-base-ser/pytorch_model.bin +3 -0
hubert-base-ser/runs/Mar11_15-41-09_cb56b016eade/1647013450.8462265/events.out.tfevents.1647013450.cb56b016eade.80.1 +3 -0
hubert-base-ser/runs/Mar11_15-41-09_cb56b016eade/events.out.tfevents.1647013450.cb56b016eade.80.0 +3 -0
hubert-base-ser/runs/Mar11_15-53-59_cb56b016eade/1647014059.9726503/events.out.tfevents.1647014059.cb56b016eade.80.3 +3 -0
hubert-base-ser/runs/Mar11_15-53-59_cb56b016eade/events.out.tfevents.1647014059.cb56b016eade.80.2 +3 -0
hubert-base-ser/source.txt +1 -0
hubert-base-ser/train_results.json +9 -0
hubert-base-ser/trainer_state.json +1135 -0
hubert-base-ser/training_args.bin +3 -0
hubert_emotion_onnx/.gitattributes +35 -0
hubert_emotion_onnx/Hubert_emotion.config +111 -0
hubert_emotion_onnx/Hubert_emotion.feature +9 -0
hubert_emotion_onnx/Hubert_emotion.onnx +3 -0
hubert_emotion_onnx/Hubert_emotion.yaml +22 -0
hubert_emotion_onnx/source.txt +1 -0
tiny-random-HubertForSequenceClassification-ONNX/.gitattributes +35 -0
tiny-random-HubertForSequenceClassification-ONNX/config.json +63 -0
tiny-random-HubertForSequenceClassification-ONNX/onnx/model.onnx +3 -0
tiny-random-HubertForSequenceClassification-ONNX/preprocessor_config.json +9 -0
tiny-random-HubertForSequenceClassification-ONNX/source.txt +1 -0
tiny-random-HubertForSequenceClassification-ONNX/special_tokens_map.json +6 -0
tiny-random-HubertForSequenceClassification-ONNX/tokenizer_config.json +51 -0
tiny-random-HubertForSequenceClassification-ONNX/vocab.json +34 -0
tiny-random-HubertModel-ONNX/.gitattributes +35 -0
tiny-random-HubertModel-ONNX/config.json +63 -0
tiny-random-HubertModel-ONNX/onnx/model.onnx +3 -0
tiny-random-HubertModel-ONNX/preprocessor_config.json +9 -0
tiny-random-HubertModel-ONNX/source.txt +1 -0
tiny-random-HubertModel-ONNX/special_tokens_map.json +6 -0
tiny-random-HubertModel-ONNX/tokenizer_config.json +51 -0
tiny-random-HubertModel-ONNX/vocab.json +34 -0

hubert-base-ch-speech-emotion-recognition-onnx/.gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

hubert-base-ch-speech-emotion-recognition-onnx/README.md ADDED Viewed

	@@ -0,0 +1,3 @@

+---
+license: mit
+---

hubert-base-ch-speech-emotion-recognition-onnx/config.json ADDED Viewed

	@@ -0,0 +1,74 @@

+{
+  "_name_or_path": "TencentGameMate/chinese-hubert-base",
+  "activation_dropout": 0.1,
+  "apply_spec_augment": true,
+  "architectures": [
+    "HubertForSpeechClassification"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_dropout": 0.1,
+  "classifier_proj_size": 256,
+  "conv_bias": false,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "sum",
+  "ctc_zero_infinity": false,
+  "do_stable_layer_norm": false,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_norm": "group",
+  "feat_proj_dropout": 0.0,
+  "feat_proj_layer_norm": true,
+  "final_dropout": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.1,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.05,
+  "model_type": "hubert",
+  "num_attention_heads": 12,
+  "num_class": 6,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "torch_dtype": "float32",
+  "transformers_version": "4.24.0",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 32
+}

hubert-base-ch-speech-emotion-recognition-onnx/onnx/model_quantized.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4e766adb7e81a4521c6c40f8c1c6cbfa877e37b28ebaf14ec71e76aa79d07cb8
+size 378569625

hubert-base-ch-speech-emotion-recognition-onnx/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0,
+  "return_attention_mask": false,
+  "sampling_rate": 16000
+}

hubert-base-ch-speech-emotion-recognition-onnx/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0cd2286572750ab6f4cf3d1a5283cf6c92b4a8ae9e87f38ebb515439a56c5b53
+size 379939475

hubert-base-ch-speech-emotion-recognition-onnx/source.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ https://huggingface.co/Aroganta/hubert-base-ch-speech-emotion-recognition-onnx

hubert-base-ser/.gitattributes ADDED Viewed

	@@ -0,0 +1,27 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bin.* filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zstandard filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

hubert-base-ser/.gitignore ADDED Viewed

	@@ -0,0 +1 @@


1	+ checkpoint-*/

hubert-base-ser/README.md ADDED Viewed

	@@ -0,0 +1,135 @@

+---
+license: apache-2.0
+tags:
+- generated_from_trainer
+metrics:
+- accuracy
+model-index:
+- name: hubert-base-ser
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# hubert-base-ser
+This model is a fine-tuned version of [facebook/hubert-base-ls960](https://huggingface.co/facebook/hubert-base-ls960) on the Crema dataset.
+It achieves the following results on the evaluation set:
+- Loss: 1.0105
+- Accuracy: 0.6313
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 0.0001
+- train_batch_size: 4
+- eval_batch_size: 4
+- seed: 42
+- gradient_accumulation_steps: 2
+- total_train_batch_size: 8
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- num_epochs: 1.0
+- mixed_precision_training: Native AMP
+### Training results
+| Training Loss | Epoch | Step | Validation Loss | Accuracy |
+|:-------------:|:-----:|:----:|:---------------:|:--------:|
+| 1.8106        | 0.01  | 10   | 1.7616          | 0.1974   |
+| 1.7268        | 0.03  | 20   | 1.7187          | 0.2525   |
+| 1.7269        | 0.04  | 30   | 1.6442          | 0.3096   |
+| 1.7086        | 0.05  | 40   | 1.5834          | 0.3338   |
+| 1.6983        | 0.07  | 50   | 1.6195          | 0.3600   |
+| 1.5845        | 0.08  | 60   | 1.5753          | 0.3418   |
+| 1.5744        | 0.09  | 70   | 1.5669          | 0.3707   |
+| 1.5915        | 0.11  | 80   | 1.5412          | 0.3754   |
+| 1.5105        | 0.12  | 90   | 2.0037          | 0.2612   |
+| 1.4689        | 0.13  | 100  | 1.5440          | 0.3627   |
+| 1.527         | 0.15  | 110  | 1.5400          | 0.3862   |
+| 1.6481        | 0.16  | 120  | 1.6678          | 0.3298   |
+| 1.7504        | 0.17  | 130  | 1.6078          | 0.2995   |
+| 1.3748        | 0.19  | 140  | 1.5750          | 0.3251   |
+| 1.6417        | 0.2   | 150  | 1.7034          | 0.2599   |
+| 1.6146        | 0.21  | 160  | 1.6162          | 0.3519   |
+| 1.4896        | 0.23  | 170  | 1.5245          | 0.3741   |
+| 1.4278        | 0.24  | 180  | 1.7537          | 0.2424   |
+| 1.4475        | 0.26  | 190  | 1.4769          | 0.3882   |
+| 1.5416        | 0.27  | 200  | 1.4772          | 0.3949   |
+| 1.5997        | 0.28  | 210  | 1.4428          | 0.4278   |
+| 1.4337        | 0.3   | 220  | 1.4352          | 0.4124   |
+| 1.415         | 0.31  | 230  | 1.4405          | 0.4157   |
+| 1.5196        | 0.32  | 240  | 1.4197          | 0.4043   |
+| 1.3866        | 0.34  | 250  | 1.5241          | 0.3734   |
+| 1.3041        | 0.35  | 260  | 1.5703          | 0.4043   |
+| 1.3618        | 0.36  | 270  | 1.3963          | 0.4285   |
+| 1.3293        | 0.38  | 280  | 1.3478          | 0.4506   |
+| 1.2215        | 0.39  | 290  | 1.5994          | 0.3842   |
+| 1.6618        | 0.4   | 300  | 1.7751          | 0.2277   |
+| 1.5349        | 0.42  | 310  | 1.6091          | 0.4036   |
+| 1.4037        | 0.43  | 320  | 1.4741          | 0.4446   |
+| 1.4844        | 0.44  | 330  | 1.4170          | 0.4399   |
+| 1.2806        | 0.46  | 340  | 1.2887          | 0.5050   |
+| 1.3818        | 0.47  | 350  | 1.2668          | 0.5017   |
+| 1.3491        | 0.48  | 360  | 1.4721          | 0.4594   |
+| 1.2347        | 0.5   | 370  | 1.2188          | 0.5245   |
+| 1.2182        | 0.51  | 380  | 1.3813          | 0.4567   |
+| 1.2513        | 0.52  | 390  | 1.2111          | 0.5205   |
+| 1.2447        | 0.54  | 400  | 1.2231          | 0.5460   |
+| 1.038         | 0.55  | 410  | 1.2563          | 0.5373   |
+| 1.2409        | 0.56  | 420  | 1.3448          | 0.4936   |
+| 1.2279        | 0.58  | 430  | 1.1972          | 0.5487   |
+| 1.3256        | 0.59  | 440  | 1.1706          | 0.5742   |
+| 1.2866        | 0.6   | 450  | 1.3091          | 0.5003   |
+| 1.0574        | 0.62  | 460  | 1.2075          | 0.5500   |
+| 1.2744        | 0.63  | 470  | 1.2831          | 0.5171   |
+| 1.0836        | 0.64  | 480  | 1.1768          | 0.5608   |
+| 1.135         | 0.66  | 490  | 1.1408          | 0.5776   |
+| 1.1303        | 0.67  | 500  | 1.2320          | 0.5541   |
+| 1.2068        | 0.69  | 510  | 1.1379          | 0.5796   |
+| 1.1347        | 0.7   | 520  | 1.1124          | 0.5897   |
+| 1.1846        | 0.71  | 530  | 1.1338          | 0.5803   |
+| 1.2409        | 0.73  | 540  | 1.1259          | 0.5789   |
+| 1.0664        | 0.74  | 550  | 1.0653          | 0.6038   |
+| 1.1637        | 0.75  | 560  | 1.0550          | 0.5977   |
+| 1.0707        | 0.77  | 570  | 1.0996          | 0.5715   |
+| 1.2258        | 0.78  | 580  | 1.0804          | 0.5977   |
+| 0.9256        | 0.79  | 590  | 1.1501          | 0.5809   |
+| 1.1542        | 0.81  | 600  | 1.1089          | 0.5957   |
+| 1.3931        | 0.82  | 610  | 1.1381          | 0.5856   |
+| 1.1117        | 0.83  | 620  | 1.0933          | 0.6031   |
+| 1.1433        | 0.85  | 630  | 1.0175          | 0.6219   |
+| 1.0325        | 0.86  | 640  | 0.9885          | 0.6239   |
+| 1.111         | 0.87  | 650  | 1.0048          | 0.6259   |
+| 0.8125        | 0.89  | 660  | 1.0176          | 0.6165   |
+| 1.0414        | 0.9   | 670  | 1.0290          | 0.6185   |
+| 1.0037        | 0.91  | 680  | 1.0269          | 0.6253   |
+| 0.9406        | 0.93  | 690  | 1.0301          | 0.6273   |
+| 1.0129        | 0.94  | 700  | 1.0238          | 0.6326   |
+| 1.2213        | 0.95  | 710  | 1.0181          | 0.6273   |
+| 1.2519        | 0.97  | 720  | 1.0161          | 0.6266   |
+| 0.9932        | 0.98  | 730  | 1.0112          | 0.6279   |
+| 1.0135        | 0.99  | 740  | 1.0105          | 0.6313   |
+### Framework versions
+- Transformers 4.18.0.dev0
+- Pytorch 1.10.0+cu111
+- Datasets 1.18.5.dev0
+- Tokenizers 0.11.6

hubert-base-ser/all_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 1.0,
+    "total_flos": 1.673551838186588e+17,
+    "train_loss": 1.320114940725347,
+    "train_runtime": 11616.0305,
+    "train_samples": 5953,
+    "train_samples_per_second": 0.512,
+    "train_steps_per_second": 0.064
+}

hubert-base-ser/config.json ADDED Viewed

	@@ -0,0 +1,95 @@

+{
+  "_name_or_path": "facebook/hubert-base-ls960",
+  "activation_dropout": 0.1,
+  "apply_spec_augment": true,
+  "architectures": [
+    "HubertForSpeechClassification"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "conv_bias": false,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "sum",
+  "ctc_zero_infinity": false,
+  "do_stable_layer_norm": false,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "group",
+  "feat_proj_dropout": 0.1,
+  "feat_proj_layer_norm": true,
+  "final_dropout": 0.1,
+  "finetuning_task": "wav2vec2_clf",
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "angry",
+    "1": "disgust",
+    "2": "fear",
+    "3": "happy",
+    "4": "neutral",
+    "5": "sad"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "angry": 0,
+    "disgust": 1,
+    "fear": 2,
+    "happy": 3,
+    "neutral": 4,
+    "sad": 5
+  },
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.1,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.05,
+  "model_type": "hubert",
+  "num_attention_heads": 12,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "pooling_mode": "mean",
+  "problem_type": "single_label_classification",
+  "tokenizer_class": "Wav2Vec2CTCTokenizer",
+  "torch_dtype": "float32",
+  "transformers_version": "4.18.0.dev0",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 32
+}

hubert-base-ser/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0,
+  "return_attention_mask": false,
+  "sampling_rate": 16000
+}

hubert-base-ser/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:93c415faee111a9bca19308b74153c5adce608065f00338339c211d1236e1274
+size 379953875

hubert-base-ser/runs/Mar11_15-41-09_cb56b016eade/1647013450.8462265/events.out.tfevents.1647013450.cb56b016eade.80.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e03223b76a2d563faafb5034ee177a83e5b3866885ee2c0b1ad99fa08cd96edc
+size 4840

hubert-base-ser/runs/Mar11_15-41-09_cb56b016eade/events.out.tfevents.1647013450.cb56b016eade.80.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3c2daf27bd8cab1c4f9416d4aa4b384045a5fdcfeec06e7ce4ac260b58d31245
+size 4558

hubert-base-ser/runs/Mar11_15-53-59_cb56b016eade/1647014059.9726503/events.out.tfevents.1647014059.cb56b016eade.80.3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:70aadfa20d028497358461a85db8b6599f126d4862a7dafec1d74aea9c1455ad
+size 4840

hubert-base-ser/runs/Mar11_15-53-59_cb56b016eade/events.out.tfevents.1647014059.cb56b016eade.80.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d1b8608255ffe959655af06c945656738c67ffbe23f80c2005d5e325f7c1fec5
+size 40324

hubert-base-ser/source.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ https://huggingface.co/RamiEbeid/hubert-base-ser

hubert-base-ser/train_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 1.0,
+    "total_flos": 1.673551838186588e+17,
+    "train_loss": 1.320114940725347,
+    "train_runtime": 11616.0305,
+    "train_samples": 5953,
+    "train_samples_per_second": 0.512,
+    "train_steps_per_second": 0.064
+}

hubert-base-ser/trainer_state.json ADDED Viewed

	@@ -0,0 +1,1135 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 0.9993284083277367,
+  "global_step": 744,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.01,
+      "learning_rate": 9.865591397849462e-05,
+      "loss": 1.8106,
+      "step": 10
+    },
+    {
+      "epoch": 0.01,
+      "eval_accuracy": 0.19744795560836792,
+      "eval_loss": 1.7615934610366821,
+      "eval_runtime": 134.0063,
+      "eval_samples_per_second": 11.111,
+      "eval_steps_per_second": 2.783,
+      "step": 10
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 9.731182795698925e-05,
+      "loss": 1.7268,
+      "step": 20
+    },
+    {
+      "epoch": 0.03,
+      "eval_accuracy": 0.2525184750556946,
+      "eval_loss": 1.7187447547912598,
+      "eval_runtime": 145.4077,
+      "eval_samples_per_second": 10.24,
+      "eval_steps_per_second": 2.565,
+      "step": 20
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 9.596774193548387e-05,
+      "loss": 1.7269,
+      "step": 30
+    },
+    {
+      "epoch": 0.04,
+      "eval_accuracy": 0.309603750705719,
+      "eval_loss": 1.6442092657089233,
+      "eval_runtime": 144.9066,
+      "eval_samples_per_second": 10.276,
+      "eval_steps_per_second": 2.574,
+      "step": 30
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.46236559139785e-05,
+      "loss": 1.7086,
+      "step": 40
+    },
+    {
+      "epoch": 0.05,
+      "eval_accuracy": 0.33378106355667114,
+      "eval_loss": 1.583362340927124,
+      "eval_runtime": 135.7155,
+      "eval_samples_per_second": 10.971,
+      "eval_steps_per_second": 2.748,
+      "step": 40
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.327956989247312e-05,
+      "loss": 1.6983,
+      "step": 50
+    },
+    {
+      "epoch": 0.07,
+      "eval_accuracy": 0.35997313261032104,
+      "eval_loss": 1.6194798946380615,
+      "eval_runtime": 135.5719,
+      "eval_samples_per_second": 10.983,
+      "eval_steps_per_second": 2.751,
+      "step": 50
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 9.193548387096774e-05,
+      "loss": 1.5845,
+      "step": 60
+    },
+    {
+      "epoch": 0.08,
+      "eval_accuracy": 0.34184014797210693,
+      "eval_loss": 1.575337290763855,
+      "eval_runtime": 135.8178,
+      "eval_samples_per_second": 10.963,
+      "eval_steps_per_second": 2.746,
+      "step": 60
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 9.059139784946237e-05,
+      "loss": 1.5744,
+      "step": 70
+    },
+    {
+      "epoch": 0.09,
+      "eval_accuracy": 0.3707185983657837,
+      "eval_loss": 1.5669182538986206,
+      "eval_runtime": 135.433,
+      "eval_samples_per_second": 10.994,
+      "eval_steps_per_second": 2.754,
+      "step": 70
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 8.924731182795699e-05,
+      "loss": 1.5915,
+      "step": 80
+    },
+    {
+      "epoch": 0.11,
+      "eval_accuracy": 0.3754197359085083,
+      "eval_loss": 1.5411657094955444,
+      "eval_runtime": 135.3362,
+      "eval_samples_per_second": 11.002,
+      "eval_steps_per_second": 2.756,
+      "step": 80
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 8.790322580645162e-05,
+      "loss": 1.5105,
+      "step": 90
+    },
+    {
+      "epoch": 0.12,
+      "eval_accuracy": 0.2612491548061371,
+      "eval_loss": 2.0037343502044678,
+      "eval_runtime": 135.2385,
+      "eval_samples_per_second": 11.01,
+      "eval_steps_per_second": 2.758,
+      "step": 90
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 8.655913978494624e-05,
+      "loss": 1.4689,
+      "step": 100
+    },
+    {
+      "epoch": 0.13,
+      "eval_accuracy": 0.3626595139503479,
+      "eval_loss": 1.5439659357070923,
+      "eval_runtime": 135.2487,
+      "eval_samples_per_second": 11.009,
+      "eval_steps_per_second": 2.758,
+      "step": 100
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 8.521505376344086e-05,
+      "loss": 1.527,
+      "step": 110
+    },
+    {
+      "epoch": 0.15,
+      "eval_accuracy": 0.38616520166397095,
+      "eval_loss": 1.540026068687439,
+      "eval_runtime": 135.6976,
+      "eval_samples_per_second": 10.973,
+      "eval_steps_per_second": 2.749,
+      "step": 110
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 8.387096774193549e-05,
+      "loss": 1.6481,
+      "step": 120
+    },
+    {
+      "epoch": 0.16,
+      "eval_accuracy": 0.32975152134895325,
+      "eval_loss": 1.6678365468978882,
+      "eval_runtime": 135.8659,
+      "eval_samples_per_second": 10.959,
+      "eval_steps_per_second": 2.745,
+      "step": 120
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 8.252688172043011e-05,
+      "loss": 1.7504,
+      "step": 130
+    },
+    {
+      "epoch": 0.17,
+      "eval_accuracy": 0.29952988028526306,
+      "eval_loss": 1.6077724695205688,
+      "eval_runtime": 135.8936,
+      "eval_samples_per_second": 10.957,
+      "eval_steps_per_second": 2.745,
+      "step": 130
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 8.118279569892473e-05,
+      "loss": 1.3748,
+      "step": 140
+    },
+    {
+      "epoch": 0.19,
+      "eval_accuracy": 0.32505038380622864,
+      "eval_loss": 1.5750231742858887,
+      "eval_runtime": 135.7593,
+      "eval_samples_per_second": 10.968,
+      "eval_steps_per_second": 2.748,
+      "step": 140
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 7.983870967741936e-05,
+      "loss": 1.6417,
+      "step": 150
+    },
+    {
+      "epoch": 0.2,
+      "eval_accuracy": 0.25990596413612366,
+      "eval_loss": 1.7033889293670654,
+      "eval_runtime": 140.3888,
+      "eval_samples_per_second": 10.606,
+      "eval_steps_per_second": 2.657,
+      "step": 150
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 7.849462365591398e-05,
+      "loss": 1.6146,
+      "step": 160
+    },
+    {
+      "epoch": 0.21,
+      "eval_accuracy": 0.35191404819488525,
+      "eval_loss": 1.6161645650863647,
+      "eval_runtime": 136.7498,
+      "eval_samples_per_second": 10.889,
+      "eval_steps_per_second": 2.728,
+      "step": 160
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 7.715053763440861e-05,
+      "loss": 1.4896,
+      "step": 170
+    },
+    {
+      "epoch": 0.23,
+      "eval_accuracy": 0.37407657504081726,
+      "eval_loss": 1.5245014429092407,
+      "eval_runtime": 137.1791,
+      "eval_samples_per_second": 10.854,
+      "eval_steps_per_second": 2.719,
+      "step": 170
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 7.580645161290323e-05,
+      "loss": 1.4278,
+      "step": 180
+    },
+    {
+      "epoch": 0.24,
+      "eval_accuracy": 0.24244458973407745,
+      "eval_loss": 1.7536966800689697,
+      "eval_runtime": 137.1089,
+      "eval_samples_per_second": 10.86,
+      "eval_steps_per_second": 2.72,
+      "step": 180
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 7.446236559139786e-05,
+      "loss": 1.4475,
+      "step": 190
+    },
+    {
+      "epoch": 0.26,
+      "eval_accuracy": 0.3881799876689911,
+      "eval_loss": 1.4769032001495361,
+      "eval_runtime": 136.7534,
+      "eval_samples_per_second": 10.888,
+      "eval_steps_per_second": 2.728,
+      "step": 190
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 7.311827956989248e-05,
+      "loss": 1.5416,
+      "step": 200
+    },
+    {
+      "epoch": 0.27,
+      "eval_accuracy": 0.39489591121673584,
+      "eval_loss": 1.4772460460662842,
+      "eval_runtime": 137.0691,
+      "eval_samples_per_second": 10.863,
+      "eval_steps_per_second": 2.721,
+      "step": 200
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 7.177419354838711e-05,
+      "loss": 1.5997,
+      "step": 210
+    },
+    {
+      "epoch": 0.28,
+      "eval_accuracy": 0.4278039038181305,
+      "eval_loss": 1.4428460597991943,
+      "eval_runtime": 137.003,
+      "eval_samples_per_second": 10.868,
+      "eval_steps_per_second": 2.723,
+      "step": 210
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 7.043010752688173e-05,
+      "loss": 1.4337,
+      "step": 220
+    },
+    {
+      "epoch": 0.3,
+      "eval_accuracy": 0.41235730051994324,
+      "eval_loss": 1.435219645500183,
+      "eval_runtime": 137.007,
+      "eval_samples_per_second": 10.868,
+      "eval_steps_per_second": 2.722,
+      "step": 220
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 6.908602150537635e-05,
+      "loss": 1.415,
+      "step": 230
+    },
+    {
+      "epoch": 0.31,
+      "eval_accuracy": 0.4157152473926544,
+      "eval_loss": 1.4404770135879517,
+      "eval_runtime": 137.0627,
+      "eval_samples_per_second": 10.864,
+      "eval_steps_per_second": 2.721,
+      "step": 230
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 6.774193548387096e-05,
+      "loss": 1.5196,
+      "step": 240
+    },
+    {
+      "epoch": 0.32,
+      "eval_accuracy": 0.40429818630218506,
+      "eval_loss": 1.4196510314941406,
+      "eval_runtime": 136.8253,
+      "eval_samples_per_second": 10.882,
+      "eval_steps_per_second": 2.726,
+      "step": 240
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 6.63978494623656e-05,
+      "loss": 1.3866,
+      "step": 250
+    },
+    {
+      "epoch": 0.34,
+      "eval_accuracy": 0.37340497970581055,
+      "eval_loss": 1.524086833000183,
+      "eval_runtime": 137.3465,
+      "eval_samples_per_second": 10.841,
+      "eval_steps_per_second": 2.716,
+      "step": 250
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 6.505376344086021e-05,
+      "loss": 1.3041,
+      "step": 260
+    },
+    {
+      "epoch": 0.35,
+      "eval_accuracy": 0.40429818630218506,
+      "eval_loss": 1.5703184604644775,
+      "eval_runtime": 136.9308,
+      "eval_samples_per_second": 10.874,
+      "eval_steps_per_second": 2.724,
+      "step": 260
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 6.370967741935485e-05,
+      "loss": 1.3618,
+      "step": 270
+    },
+    {
+      "epoch": 0.36,
+      "eval_accuracy": 0.4284754991531372,
+      "eval_loss": 1.3963350057601929,
+      "eval_runtime": 136.0816,
+      "eval_samples_per_second": 10.942,
+      "eval_steps_per_second": 2.741,
+      "step": 270
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 6.236559139784946e-05,
+      "loss": 1.3293,
+      "step": 280
+    },
+    {
+      "epoch": 0.38,
+      "eval_accuracy": 0.4506380259990692,
+      "eval_loss": 1.3478150367736816,
+      "eval_runtime": 135.9673,
+      "eval_samples_per_second": 10.951,
+      "eval_steps_per_second": 2.743,
+      "step": 280
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 6.102150537634409e-05,
+      "loss": 1.2215,
+      "step": 290
+    },
+    {
+      "epoch": 0.39,
+      "eval_accuracy": 0.3841504454612732,
+      "eval_loss": 1.5994166135787964,
+      "eval_runtime": 136.1871,
+      "eval_samples_per_second": 10.933,
+      "eval_steps_per_second": 2.739,
+      "step": 290
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 5.9677419354838715e-05,
+      "loss": 1.6618,
+      "step": 300
+    },
+    {
+      "epoch": 0.4,
+      "eval_accuracy": 0.2276695817708969,
+      "eval_loss": 1.7750705480575562,
+      "eval_runtime": 136.1639,
+      "eval_samples_per_second": 10.935,
+      "eval_steps_per_second": 2.739,
+      "step": 300
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 5.8467741935483876e-05,
+      "loss": 1.5349,
+      "step": 310
+    },
+    {
+      "epoch": 0.42,
+      "eval_accuracy": 0.40362659096717834,
+      "eval_loss": 1.6090513467788696,
+      "eval_runtime": 136.1264,
+      "eval_samples_per_second": 10.938,
+      "eval_steps_per_second": 2.74,
+      "step": 310
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 5.71236559139785e-05,
+      "loss": 1.4037,
+      "step": 320
+    },
+    {
+      "epoch": 0.43,
+      "eval_accuracy": 0.4445936977863312,
+      "eval_loss": 1.4741053581237793,
+      "eval_runtime": 136.0584,
+      "eval_samples_per_second": 10.944,
+      "eval_steps_per_second": 2.741,
+      "step": 320
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 5.577956989247311e-05,
+      "loss": 1.4844,
+      "step": 330
+    },
+    {
+      "epoch": 0.44,
+      "eval_accuracy": 0.4398925304412842,
+      "eval_loss": 1.4170390367507935,
+      "eval_runtime": 136.1183,
+      "eval_samples_per_second": 10.939,
+      "eval_steps_per_second": 2.74,
+      "step": 330
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 5.443548387096774e-05,
+      "loss": 1.2806,
+      "step": 340
+    },
+    {
+      "epoch": 0.46,
+      "eval_accuracy": 0.5050369501113892,
+      "eval_loss": 1.2886841297149658,
+      "eval_runtime": 136.1309,
+      "eval_samples_per_second": 10.938,
+      "eval_steps_per_second": 2.74,
+      "step": 340
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 5.309139784946236e-05,
+      "loss": 1.3818,
+      "step": 350
+    },
+    {
+      "epoch": 0.47,
+      "eval_accuracy": 0.501679003238678,
+      "eval_loss": 1.2668293714523315,
+      "eval_runtime": 135.9509,
+      "eval_samples_per_second": 10.952,
+      "eval_steps_per_second": 2.744,
+      "step": 350
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 5.174731182795699e-05,
+      "loss": 1.3491,
+      "step": 360
+    },
+    {
+      "epoch": 0.48,
+      "eval_accuracy": 0.4593687057495117,
+      "eval_loss": 1.4720617532730103,
+      "eval_runtime": 136.1018,
+      "eval_samples_per_second": 10.94,
+      "eval_steps_per_second": 2.741,
+      "step": 360
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 5.040322580645161e-05,
+      "loss": 1.2347,
+      "step": 370
+    },
+    {
+      "epoch": 0.5,
+      "eval_accuracy": 0.5245131254196167,
+      "eval_loss": 1.2187544107437134,
+      "eval_runtime": 136.1642,
+      "eval_samples_per_second": 10.935,
+      "eval_steps_per_second": 2.739,
+      "step": 370
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.905913978494624e-05,
+      "loss": 1.2182,
+      "step": 380
+    },
+    {
+      "epoch": 0.51,
+      "eval_accuracy": 0.45668232440948486,
+      "eval_loss": 1.3813459873199463,
+      "eval_runtime": 136.1044,
+      "eval_samples_per_second": 10.94,
+      "eval_steps_per_second": 2.741,
+      "step": 380
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.771505376344086e-05,
+      "loss": 1.2513,
+      "step": 390
+    },
+    {
+      "epoch": 0.52,
+      "eval_accuracy": 0.5204835534095764,
+      "eval_loss": 1.2110750675201416,
+      "eval_runtime": 136.1563,
+      "eval_samples_per_second": 10.936,
+      "eval_steps_per_second": 2.739,
+      "step": 390
+    },
+    {
+      "epoch": 0.54,
+      "learning_rate": 4.637096774193548e-05,
+      "loss": 1.2447,
+      "step": 400
+    },
+    {
+      "epoch": 0.54,
+      "eval_accuracy": 0.546004056930542,
+      "eval_loss": 1.2230509519577026,
+      "eval_runtime": 136.1489,
+      "eval_samples_per_second": 10.937,
+      "eval_steps_per_second": 2.74,
+      "step": 400
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 4.516129032258064e-05,
+      "loss": 1.038,
+      "step": 410
+    },
+    {
+      "epoch": 0.55,
+      "eval_accuracy": 0.5372733473777771,
+      "eval_loss": 1.2562698125839233,
+      "eval_runtime": 136.2823,
+      "eval_samples_per_second": 10.926,
+      "eval_steps_per_second": 2.737,
+      "step": 410
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 4.381720430107527e-05,
+      "loss": 1.2409,
+      "step": 420
+    },
+    {
+      "epoch": 0.56,
+      "eval_accuracy": 0.4936198890209198,
+      "eval_loss": 1.344766616821289,
+      "eval_runtime": 136.1885,
+      "eval_samples_per_second": 10.933,
+      "eval_steps_per_second": 2.739,
+      "step": 420
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 4.247311827956989e-05,
+      "loss": 1.2279,
+      "step": 430
+    },
+    {
+      "epoch": 0.58,
+      "eval_accuracy": 0.5486903786659241,
+      "eval_loss": 1.1971595287322998,
+      "eval_runtime": 136.416,
+      "eval_samples_per_second": 10.915,
+      "eval_steps_per_second": 2.734,
+      "step": 430
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 4.112903225806452e-05,
+      "loss": 1.3256,
+      "step": 440
+    },
+    {
+      "epoch": 0.59,
+      "eval_accuracy": 0.5742108821868896,
+      "eval_loss": 1.1706324815750122,
+      "eval_runtime": 136.371,
+      "eval_samples_per_second": 10.919,
+      "eval_steps_per_second": 2.735,
+      "step": 440
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 3.978494623655914e-05,
+      "loss": 1.2866,
+      "step": 450
+    },
+    {
+      "epoch": 0.6,
+      "eval_accuracy": 0.5003358125686646,
+      "eval_loss": 1.309117078781128,
+      "eval_runtime": 136.1709,
+      "eval_samples_per_second": 10.935,
+      "eval_steps_per_second": 2.739,
+      "step": 450
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 3.844086021505376e-05,
+      "loss": 1.0574,
+      "step": 460
+    },
+    {
+      "epoch": 0.62,
+      "eval_accuracy": 0.5500335693359375,
+      "eval_loss": 1.2074663639068604,
+      "eval_runtime": 136.5936,
+      "eval_samples_per_second": 10.901,
+      "eval_steps_per_second": 2.731,
+      "step": 460
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 3.7096774193548386e-05,
+      "loss": 1.2744,
+      "step": 470
+    },
+    {
+      "epoch": 0.63,
+      "eval_accuracy": 0.5171256065368652,
+      "eval_loss": 1.2830621004104614,
+      "eval_runtime": 136.8418,
+      "eval_samples_per_second": 10.881,
+      "eval_steps_per_second": 2.726,
+      "step": 470
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 3.575268817204301e-05,
+      "loss": 1.0836,
+      "step": 480
+    },
+    {
+      "epoch": 0.64,
+      "eval_accuracy": 0.5607790350914001,
+      "eval_loss": 1.1768107414245605,
+      "eval_runtime": 136.4906,
+      "eval_samples_per_second": 10.909,
+      "eval_steps_per_second": 2.733,
+      "step": 480
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 3.4408602150537636e-05,
+      "loss": 1.135,
+      "step": 490
+    },
+    {
+      "epoch": 0.66,
+      "eval_accuracy": 0.5775688290596008,
+      "eval_loss": 1.1407707929611206,
+      "eval_runtime": 136.5812,
+      "eval_samples_per_second": 10.902,
+      "eval_steps_per_second": 2.731,
+      "step": 490
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 3.306451612903226e-05,
+      "loss": 1.1303,
+      "step": 500
+    },
+    {
+      "epoch": 0.67,
+      "eval_accuracy": 0.5540631413459778,
+      "eval_loss": 1.2319557666778564,
+      "eval_runtime": 136.447,
+      "eval_samples_per_second": 10.913,
+      "eval_steps_per_second": 2.734,
+      "step": 500
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 3.172043010752688e-05,
+      "loss": 1.2068,
+      "step": 510
+    },
+    {
+      "epoch": 0.69,
+      "eval_accuracy": 0.5795835852622986,
+      "eval_loss": 1.1379237174987793,
+      "eval_runtime": 139.7377,
+      "eval_samples_per_second": 10.656,
+      "eval_steps_per_second": 2.669,
+      "step": 510
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 3.0376344086021508e-05,
+      "loss": 1.1347,
+      "step": 520
+    },
+    {
+      "epoch": 0.7,
+      "eval_accuracy": 0.5896574854850769,
+      "eval_loss": 1.112443447113037,
+      "eval_runtime": 135.8322,
+      "eval_samples_per_second": 10.962,
+      "eval_steps_per_second": 2.746,
+      "step": 520
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 2.9032258064516133e-05,
+      "loss": 1.1846,
+      "step": 530
+    },
+    {
+      "epoch": 0.71,
+      "eval_accuracy": 0.5802552103996277,
+      "eval_loss": 1.1337865591049194,
+      "eval_runtime": 136.0081,
+      "eval_samples_per_second": 10.948,
+      "eval_steps_per_second": 2.742,
+      "step": 530
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 2.768817204301075e-05,
+      "loss": 1.2409,
+      "step": 540
+    },
+    {
+      "epoch": 0.73,
+      "eval_accuracy": 0.5789120197296143,
+      "eval_loss": 1.1259396076202393,
+      "eval_runtime": 136.2241,
+      "eval_samples_per_second": 10.931,
+      "eval_steps_per_second": 2.738,
+      "step": 540
+    },
+    {
+      "epoch": 0.74,
+      "learning_rate": 2.6344086021505376e-05,
+      "loss": 1.0664,
+      "step": 550
+    },
+    {
+      "epoch": 0.74,
+      "eval_accuracy": 0.6037608981132507,
+      "eval_loss": 1.065294861793518,
+      "eval_runtime": 136.1781,
+      "eval_samples_per_second": 10.934,
+      "eval_steps_per_second": 2.739,
+      "step": 550
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 2.5e-05,
+      "loss": 1.1637,
+      "step": 560
+    },
+    {
+      "epoch": 0.75,
+      "eval_accuracy": 0.5977165699005127,
+      "eval_loss": 1.0549540519714355,
+      "eval_runtime": 135.9124,
+      "eval_samples_per_second": 10.956,
+      "eval_steps_per_second": 2.744,
+      "step": 560
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 2.3655913978494626e-05,
+      "loss": 1.0707,
+      "step": 570
+    },
+    {
+      "epoch": 0.77,
+      "eval_accuracy": 0.5715245008468628,
+      "eval_loss": 1.0996488332748413,
+      "eval_runtime": 136.1326,
+      "eval_samples_per_second": 10.938,
+      "eval_steps_per_second": 2.74,
+      "step": 570
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 2.2311827956989248e-05,
+      "loss": 1.2258,
+      "step": 580
+    },
+    {
+      "epoch": 0.78,
+      "eval_accuracy": 0.5977165699005127,
+      "eval_loss": 1.080415964126587,
+      "eval_runtime": 135.8671,
+      "eval_samples_per_second": 10.959,
+      "eval_steps_per_second": 2.745,
+      "step": 580
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 2.0967741935483873e-05,
+      "loss": 0.9256,
+      "step": 590
+    },
+    {
+      "epoch": 0.79,
+      "eval_accuracy": 0.580926775932312,
+      "eval_loss": 1.1501046419143677,
+      "eval_runtime": 135.8439,
+      "eval_samples_per_second": 10.961,
+      "eval_steps_per_second": 2.746,
+      "step": 590
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 1.9623655913978494e-05,
+      "loss": 1.1542,
+      "step": 600
+    },
+    {
+      "epoch": 0.81,
+      "eval_accuracy": 0.5957018136978149,
+      "eval_loss": 1.1089370250701904,
+      "eval_runtime": 137.3702,
+      "eval_samples_per_second": 10.839,
+      "eval_steps_per_second": 2.715,
+      "step": 600
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 1.827956989247312e-05,
+      "loss": 1.3931,
+      "step": 610
+    },
+    {
+      "epoch": 0.82,
+      "eval_accuracy": 0.5856279134750366,
+      "eval_loss": 1.138110876083374,
+      "eval_runtime": 135.8089,
+      "eval_samples_per_second": 10.964,
+      "eval_steps_per_second": 2.747,
+      "step": 610
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 1.693548387096774e-05,
+      "loss": 1.1117,
+      "step": 620
+    },
+    {
+      "epoch": 0.83,
+      "eval_accuracy": 0.6030893325805664,
+      "eval_loss": 1.0933294296264648,
+      "eval_runtime": 135.7612,
+      "eval_samples_per_second": 10.968,
+      "eval_steps_per_second": 2.747,
+      "step": 620
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 1.5591397849462366e-05,
+      "loss": 1.1433,
+      "step": 630
+    },
+    {
+      "epoch": 0.85,
+      "eval_accuracy": 0.6218938827514648,
+      "eval_loss": 1.0175174474716187,
+      "eval_runtime": 135.6802,
+      "eval_samples_per_second": 10.974,
+      "eval_steps_per_second": 2.749,
+      "step": 630
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 1.4247311827956991e-05,
+      "loss": 1.0325,
+      "step": 640
+    },
+    {
+      "epoch": 0.86,
+      "eval_accuracy": 0.6239086389541626,
+      "eval_loss": 0.9885073304176331,
+      "eval_runtime": 135.5378,
+      "eval_samples_per_second": 10.986,
+      "eval_steps_per_second": 2.752,
+      "step": 640
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 1.2903225806451613e-05,
+      "loss": 1.111,
+      "step": 650
+    },
+    {
+      "epoch": 0.87,
+      "eval_accuracy": 0.6259234547615051,
+      "eval_loss": 1.004755973815918,
+      "eval_runtime": 135.7521,
+      "eval_samples_per_second": 10.969,
+      "eval_steps_per_second": 2.748,
+      "step": 650
+    },
+    {
+      "epoch": 0.89,
+      "learning_rate": 1.1559139784946236e-05,
+      "loss": 0.8125,
+      "step": 660
+    },
+    {
+      "epoch": 0.89,
+      "eval_accuracy": 0.6165211796760559,
+      "eval_loss": 1.0176496505737305,
+      "eval_runtime": 135.5622,
+      "eval_samples_per_second": 10.984,
+      "eval_steps_per_second": 2.752,
+      "step": 660
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 1.0215053763440861e-05,
+      "loss": 1.0414,
+      "step": 670
+    },
+    {
+      "epoch": 0.9,
+      "eval_accuracy": 0.6185359358787537,
+      "eval_loss": 1.0289984941482544,
+      "eval_runtime": 135.9417,
+      "eval_samples_per_second": 10.953,
+      "eval_steps_per_second": 2.744,
+      "step": 670
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 8.870967741935484e-06,
+      "loss": 1.0037,
+      "step": 680
+    },
+    {
+      "epoch": 0.91,
+      "eval_accuracy": 0.625251829624176,
+      "eval_loss": 1.0268802642822266,
+      "eval_runtime": 135.7529,
+      "eval_samples_per_second": 10.968,
+      "eval_steps_per_second": 2.748,
+      "step": 680
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 7.526881720430108e-06,
+      "loss": 0.9406,
+      "step": 690
+    },
+    {
+      "epoch": 0.93,
+      "eval_accuracy": 0.6272666454315186,
+      "eval_loss": 1.0300624370574951,
+      "eval_runtime": 137.5757,
+      "eval_samples_per_second": 10.823,
+      "eval_steps_per_second": 2.711,
+      "step": 690
+    },
+    {
+      "epoch": 0.94,
+      "learning_rate": 6.182795698924732e-06,
+      "loss": 1.0129,
+      "step": 700
+    },
+    {
+      "epoch": 0.94,
+      "eval_accuracy": 0.6326393485069275,
+      "eval_loss": 1.0238244533538818,
+      "eval_runtime": 135.84,
+      "eval_samples_per_second": 10.961,
+      "eval_steps_per_second": 2.746,
+      "step": 700
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 4.838709677419355e-06,
+      "loss": 1.2213,
+      "step": 710
+    },
+    {
+      "epoch": 0.95,
+      "eval_accuracy": 0.6272666454315186,
+      "eval_loss": 1.018078088760376,
+      "eval_runtime": 135.9017,
+      "eval_samples_per_second": 10.956,
+      "eval_steps_per_second": 2.745,
+      "step": 710
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 3.4946236559139785e-06,
+      "loss": 1.2519,
+      "step": 720
+    },
+    {
+      "epoch": 0.97,
+      "eval_accuracy": 0.6265950202941895,
+      "eval_loss": 1.0160512924194336,
+      "eval_runtime": 135.809,
+      "eval_samples_per_second": 10.964,
+      "eval_steps_per_second": 2.747,
+      "step": 720
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 2.1505376344086023e-06,
+      "loss": 0.9932,
+      "step": 730
+    },
+    {
+      "epoch": 0.98,
+      "eval_accuracy": 0.6279382109642029,
+      "eval_loss": 1.0112457275390625,
+      "eval_runtime": 136.0311,
+      "eval_samples_per_second": 10.946,
+      "eval_steps_per_second": 2.742,
+      "step": 730
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 8.064516129032258e-07,
+      "loss": 1.0135,
+      "step": 740
+    },
+    {
+      "epoch": 0.99,
+      "eval_accuracy": 0.6312961578369141,
+      "eval_loss": 1.010461449623108,
+      "eval_runtime": 136.2447,
+      "eval_samples_per_second": 10.929,
+      "eval_steps_per_second": 2.738,
+      "step": 740
+    },
+    {
+      "epoch": 1.0,
+      "step": 744,
+      "total_flos": 1.673551838186588e+17,
+      "train_loss": 1.320114940725347,
+      "train_runtime": 11616.0305,
+      "train_samples_per_second": 0.512,
+      "train_steps_per_second": 0.064
+    }
+  ],
+  "max_steps": 744,
+  "num_train_epochs": 1,
+  "total_flos": 1.673551838186588e+17,
+  "trial_name": null,
+  "trial_params": null
+}

hubert-base-ser/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fd081c9c142702eef32bfee4ada80fd3b5c45c8c0d1907155a8281f8fd20d980
+size 3055

hubert_emotion_onnx/.gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

hubert_emotion_onnx/Hubert_emotion.config ADDED Viewed

	@@ -0,0 +1,111 @@

+HubertConfig {
+  "_name_or_path": "Rajaram1996/Hubert_emotion",
+  "activation_dropout": 0.1,
+  "apply_spec_augment": true,
+  "architectures": [
+    "HubertForSpeechClassification"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "conv_bias": false,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "sum",
+  "ctc_zero_infinity": false,
+  "do_stable_layer_norm": false,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "group",
+  "feat_proj_dropout": 0.1,
+  "feat_proj_layer_norm": true,
+  "final_dropout": 0.1,
+  "finetuning_task": "wav2vec2_clf",
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "female_angry",
+    "1": "female_disgust",
+    "2": "female_fear",
+    "3": "female_happy",
+    "4": "female_neutral",
+    "5": "female_sad",
+    "6": "female_surprise",
+    "7": "male_angry",
+    "8": "male_disgust",
+    "9": "male_fear",
+    "10": "male_happy",
+    "11": "male_neutral",
+    "12": "male_sad",
+    "13": "male_surprise"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "female_angry": 0,
+    "female_disgust": 1,
+    "female_fear": 2,
+    "female_happy": 3,
+    "female_neutral": 4,
+    "female_sad": 5,
+    "female_surprise": 6,
+    "male_angry": 7,
+    "male_disgust": 8,
+    "male_fear": 9,
+    "male_happy": 10,
+    "male_neutral": 11,
+    "male_sad": 12,
+    "male_surprise": 13
+  },
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.1,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.05,
+  "model_type": "hubert",
+  "num_attention_heads": 12,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "pooling_mode": "mean",
+  "problem_type": "single_label_classification",
+  "tokenizer_class": "Wav2Vec2CTCTokenizer",
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.1",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 32
+}

hubert_emotion_onnx/Hubert_emotion.feature ADDED Viewed

	@@ -0,0 +1,9 @@

+Wav2Vec2FeatureExtractor {
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0,
+  "return_attention_mask": false,
+  "sampling_rate": 16000
+}

hubert_emotion_onnx/Hubert_emotion.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f98e1c3abbd622c5d0012fbac231f52ac1abc67c82a6f7b752fc6b41d72f0120
+size 378581924

hubert_emotion_onnx/Hubert_emotion.yaml ADDED Viewed

	@@ -0,0 +1,22 @@

+feature_extractor: Wav2Vec2FeatureExtractor
+full_name: Rajaram1996/Hubert_emotion
+labels:
+  0: female_angry
+  1: female_disgust
+  2: female_fear
+  3: female_happy
+  4: female_neutral
+  5: female_sad
+  6: female_surprise
+  7: male_angry
+  8: male_disgust
+  9: male_fear
+  10: male_happy
+  11: male_neutral
+  12: male_sad
+  13: male_surprise
+model: HubertForSequenceClassification
+sampling_rate: 16000
+shape:
+- 1
+- 320000

hubert_emotion_onnx/source.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ https://huggingface.co/steveway/Hubert_emotion_onnx

tiny-random-HubertForSequenceClassification-ONNX/.gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

tiny-random-HubertForSequenceClassification-ONNX/config.json ADDED Viewed

	@@ -0,0 +1,63 @@

+{
+  "_attn_implementation_autoset": true,
+  "_name_or_path": "hf-internal-testing/tiny-random-HubertForSequenceClassification",
+  "activation_dropout": 0.1,
+  "apply_spec_augment": true,
+  "architectures": [
+    "HubertForSequenceClassification"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "conv_bias": false,
+  "conv_dim": [
+    32,
+    32,
+    32
+  ],
+  "conv_kernel": [
+    8,
+    8,
+    8
+  ],
+  "conv_pos_batch_norm": false,
+  "conv_stride": [
+    4,
+    4,
+    4
+  ],
+  "ctc_loss_reduction": "sum",
+  "ctc_zero_infinity": false,
+  "do_stable_layer_norm": false,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "group",
+  "feat_proj_dropout": 0.0,
+  "feat_proj_layer_norm": true,
+  "final_dropout": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 16,
+  "initializer_range": 0.02,
+  "intermediate_size": 20,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.1,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.05,
+  "model_type": "hubert",
+  "num_attention_heads": 2,
+  "num_conv_pos_embedding_groups": 2,
+  "num_conv_pos_embeddings": 16,
+  "num_feat_extract_layers": 3,
+  "num_hidden_layers": 4,
+  "pad_token_id": 0,
+  "transformers_version": "4.48.2",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 32
+}

tiny-random-HubertForSequenceClassification-ONNX/onnx/model.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a73f429ed854d61f207c828cf1de00ba78553e8fe8275e94f799ba15bf4e1d4a
+size 223197

tiny-random-HubertForSequenceClassification-ONNX/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0,
+  "return_attention_mask": false,
+  "sampling_rate": 16000
+}

tiny-random-HubertForSequenceClassification-ONNX/source.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ https://huggingface.co/onnx-internal-testing/tiny-random-HubertForSequenceClassification-ONNX

tiny-random-HubertForSequenceClassification-ONNX/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "bos_token": "<s>",
+  "eos_token": "</s>",
+  "pad_token": "<pad>",
+  "unk_token": "<unk>"
+}

tiny-random-HubertForSequenceClassification-ONNX/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,51 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<pad>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": true,
+      "single_word": false,
+      "special": false
+    },
+    "1": {
+      "content": "<s>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": true,
+      "single_word": false,
+      "special": false
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": true,
+      "single_word": false,
+      "special": false
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": true,
+      "single_word": false,
+      "special": false
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "do_lower_case": false,
+  "do_normalize": true,
+  "eos_token": "</s>",
+  "extra_special_tokens": {},
+  "model_max_length": 9223372036854775807,
+  "pad_token": "<pad>",
+  "processor_class": "Wav2Vec2Processor",
+  "replace_word_delimiter_char": " ",
+  "return_attention_mask": false,
+  "target_lang": null,
+  "tokenizer_class": "Wav2Vec2CTCTokenizer",
+  "unk_token": "<unk>",
+  "word_delimiter_token": "|"
+}

tiny-random-HubertForSequenceClassification-ONNX/vocab.json ADDED Viewed

	@@ -0,0 +1,34 @@

+{
+  "'": 27,
+  "</s>": 2,
+  "<pad>": 0,
+  "<s>": 1,
+  "<unk>": 3,
+  "A": 7,
+  "B": 24,
+  "C": 19,
+  "D": 14,
+  "E": 5,
+  "F": 20,
+  "G": 21,
+  "H": 11,
+  "I": 10,
+  "J": 29,
+  "K": 26,
+  "L": 15,
+  "M": 17,
+  "N": 9,
+  "O": 8,
+  "P": 23,
+  "Q": 30,
+  "R": 13,
+  "S": 12,
+  "T": 6,
+  "U": 16,
+  "V": 25,
+  "W": 18,
+  "X": 28,
+  "Y": 22,
+  "Z": 31,
+  "|": 4
+}

tiny-random-HubertModel-ONNX/.gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

tiny-random-HubertModel-ONNX/config.json ADDED Viewed

	@@ -0,0 +1,63 @@

+{
+  "_attn_implementation_autoset": true,
+  "_name_or_path": "hf-internal-testing/tiny-random-HubertModel",
+  "activation_dropout": 0.1,
+  "apply_spec_augment": true,
+  "architectures": [
+    "HubertModel"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "conv_bias": false,
+  "conv_dim": [
+    32,
+    32,
+    32
+  ],
+  "conv_kernel": [
+    8,
+    8,
+    8
+  ],
+  "conv_pos_batch_norm": false,
+  "conv_stride": [
+    4,
+    4,
+    4
+  ],
+  "ctc_loss_reduction": "sum",
+  "ctc_zero_infinity": false,
+  "do_stable_layer_norm": false,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "group",
+  "feat_proj_dropout": 0.0,
+  "feat_proj_layer_norm": true,
+  "final_dropout": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 16,
+  "initializer_range": 0.02,
+  "intermediate_size": 20,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.1,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.05,
+  "model_type": "hubert",
+  "num_attention_heads": 2,
+  "num_conv_pos_embedding_groups": 2,
+  "num_conv_pos_embeddings": 16,
+  "num_feat_extract_layers": 3,
+  "num_hidden_layers": 4,
+  "pad_token_id": 0,
+  "transformers_version": "4.48.2",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 32
+}

tiny-random-HubertModel-ONNX/onnx/model.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dab199c46a76979b627052b2b7bf32d2ec0180b942971e993f6e92e679610ead
+size 192076

tiny-random-HubertModel-ONNX/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0,
+  "return_attention_mask": false,
+  "sampling_rate": 16000
+}

tiny-random-HubertModel-ONNX/source.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ https://huggingface.co/onnx-internal-testing/tiny-random-HubertModel-ONNX

tiny-random-HubertModel-ONNX/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "bos_token": "<s>",
+  "eos_token": "</s>",
+  "pad_token": "<pad>",
+  "unk_token": "<unk>"
+}

tiny-random-HubertModel-ONNX/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,51 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<pad>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": true,
+      "single_word": false,
+      "special": false
+    },
+    "1": {
+      "content": "<s>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": true,
+      "single_word": false,
+      "special": false
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": true,
+      "single_word": false,
+      "special": false
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": true,
+      "single_word": false,
+      "special": false
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "do_lower_case": false,
+  "do_normalize": true,
+  "eos_token": "</s>",
+  "extra_special_tokens": {},
+  "model_max_length": 9223372036854775807,
+  "pad_token": "<pad>",
+  "processor_class": "Wav2Vec2Processor",
+  "replace_word_delimiter_char": " ",
+  "return_attention_mask": false,
+  "target_lang": null,
+  "tokenizer_class": "Wav2Vec2CTCTokenizer",
+  "unk_token": "<unk>",
+  "word_delimiter_token": "|"
+}

tiny-random-HubertModel-ONNX/vocab.json ADDED Viewed

	@@ -0,0 +1,34 @@

+{
+  "'": 27,
+  "</s>": 2,
+  "<pad>": 0,
+  "<s>": 1,
+  "<unk>": 3,
+  "A": 7,
+  "B": 24,
+  "C": 19,
+  "D": 14,
+  "E": 5,
+  "F": 20,
+  "G": 21,
+  "H": 11,
+  "I": 10,
+  "J": 29,
+  "K": 26,
+  "L": 15,
+  "M": 17,
+  "N": 9,
+  "O": 8,
+  "P": 23,
+  "Q": 30,
+  "R": 13,
+  "S": 12,
+  "T": 6,
+  "U": 16,
+  "V": 25,
+  "W": 18,
+  "X": 28,
+  "Y": 22,
+  "Z": 31,
+  "|": 4
+}