Tokyosaurus commited on Mar 2

Commit

9b1fede

verified ·

1 Parent(s): 8ac9e3f

Upload folder using huggingface_hub

Browse files

Files changed (27) hide show

.gitattributes +3 -0
checkpoint-340/config.json +39 -0
checkpoint-340/model.safetensors +3 -0
checkpoint-340/optimizer.pt +3 -0
checkpoint-340/rng_state.pth +3 -0
checkpoint-340/scaler.pt +3 -0
checkpoint-340/scheduler.pt +3 -0
checkpoint-340/tokenizer.json +3 -0
checkpoint-340/tokenizer_config.json +14 -0
checkpoint-340/trainer_state.json +139 -0
checkpoint-340/training_args.bin +3 -0
checkpoint-425/config.json +39 -0
checkpoint-425/model.safetensors +3 -0
checkpoint-425/optimizer.pt +3 -0
checkpoint-425/rng_state.pth +3 -0
checkpoint-425/scaler.pt +3 -0
checkpoint-425/scheduler.pt +3 -0
checkpoint-425/tokenizer.json +3 -0
checkpoint-425/tokenizer_config.json +14 -0
checkpoint-425/trainer_state.json +163 -0
checkpoint-425/training_args.bin +3 -0
comprehensive_results_binary.json +79 -0
config.json +39 -0
model.safetensors +3 -0
tokenizer.json +3 -0
tokenizer_config.json +14 -0
training_args.bin +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,6 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+checkpoint-340/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+checkpoint-425/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+tokenizer.json filter=lfs diff=lfs merge=lfs -text

checkpoint-340/config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+  "add_cross_attention": false,
+  "architectures": [
+    "XLMRobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Non-Gaslighting",
+    "1": "Gaslighting"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "is_decoder": false,
+  "label2id": {
+    "Gaslighting": 1,
+    "Non-Gaslighting": 0
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "xlm-roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "tie_word_embeddings": true,
+  "transformers_version": "5.0.0",
+  "type_vocab_size": 1,
+  "use_cache": false,
+  "vocab_size": 250002
+}

checkpoint-340/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d97a7ba9fe730fb08f6ed03685d40c26815b890d7769ff9d841ac2feeeea5e12
+size 1112204984

checkpoint-340/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:01b2cc2415077491cf41e9014296a793750913402eed3d28ce4339524ad13a5e
+size 2224530059

checkpoint-340/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e5c010487ae9edf9b823436ab5fb2c452efb3fc6d40777937dbeb8cfbfde9527
+size 14645

checkpoint-340/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c38abe1eff32667ab62564b69fac6d423a608612a979824610a5092c87721827
+size 1383

checkpoint-340/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:587757a448baa056a3ae0ede6e7f8e67137cc2957044c39d0eb0884a77eeeef8
+size 1465

checkpoint-340/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e5b633524ba90477daaba16ec27580a08a2856ae0ee8c33d9f5f9358378d3b35
+size 16781751

checkpoint-340/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "add_prefix_space": true,
+  "backend": "tokenizers",
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "is_local": false,
+  "mask_token": "<mask>",
+  "model_max_length": 512,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "XLMRobertaTokenizer",
+  "unk_token": "<unk>"
+}

checkpoint-340/trainer_state.json ADDED Viewed

	@@ -0,0 +1,139 @@

+{
+  "best_global_step": 255,
+  "best_metric": 0.9158249158249159,
+  "best_model_checkpoint": "D:/Thesis/Taglish_Gaslighting_V3\\model_outputs\\xlm-roberta_binary\\checkpoint-255",
+  "epoch": 4.0,
+  "eval_steps": 500,
+  "global_step": 340,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "grad_norm": 13.04288101196289,
+      "learning_rate": 1.8010471204188483e-05,
+      "loss": 0.6918394200942095,
+      "step": 85
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.7093425605536332,
+      "eval_f1": 0.676923076923077,
+      "eval_loss": 0.5885154604911804,
+      "eval_macro_f1": 0.7063860667634252,
+      "eval_non_gas_f1": 0.7358490566037735,
+      "eval_non_gas_precision": 0.6842105263157895,
+      "eval_non_gas_recall": 0.7959183673469388,
+      "eval_precision": 0.7457627118644068,
+      "eval_recall": 0.6197183098591549,
+      "eval_roc_auc": 0.8050445530324807,
+      "eval_runtime": 13.2767,
+      "eval_samples_per_second": 21.768,
+      "eval_steps_per_second": 1.431,
+      "step": 85
+    },
+    {
+      "epoch": 2.0,
+      "grad_norm": 11.096158981323242,
+      "learning_rate": 1.356020942408377e-05,
+      "loss": 0.5428493724149817,
+      "step": 170
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.8027681660899654,
+      "eval_f1": 0.7764705882352941,
+      "eval_loss": 0.48855453729629517,
+      "eval_macro_f1": 0.8,
+      "eval_non_gas_f1": 0.8235294117647058,
+      "eval_non_gas_precision": 0.7556818181818182,
+      "eval_non_gas_recall": 0.9047619047619048,
+      "eval_precision": 0.8761061946902655,
+      "eval_recall": 0.6971830985915493,
+      "eval_roc_auc": 0.898438248538852,
+      "eval_runtime": 13.3951,
+      "eval_samples_per_second": 21.575,
+      "eval_steps_per_second": 1.418,
+      "step": 170
+    },
+    {
+      "epoch": 3.0,
+      "grad_norm": 5.319683074951172,
+      "learning_rate": 9.109947643979057e-06,
+      "loss": 0.4088932710535386,
+      "step": 255
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9134948096885813,
+      "eval_f1": 0.9158249158249159,
+      "eval_loss": 0.2529641091823578,
+      "eval_macro_f1": 0.9134284721473334,
+      "eval_non_gas_f1": 0.9110320284697508,
+      "eval_non_gas_precision": 0.9552238805970149,
+      "eval_non_gas_recall": 0.8707482993197279,
+      "eval_precision": 0.8774193548387097,
+      "eval_recall": 0.9577464788732394,
+      "eval_roc_auc": 0.9593752994155408,
+      "eval_runtime": 13.2242,
+      "eval_samples_per_second": 21.854,
+      "eval_steps_per_second": 1.437,
+      "step": 255
+    },
+    {
+      "epoch": 4.0,
+      "grad_norm": 4.501065254211426,
+      "learning_rate": 4.712041884816754e-06,
+      "loss": 0.2737856921027688,
+      "step": 340
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.9100346020761245,
+      "eval_f1": 0.9084507042253521,
+      "eval_loss": 0.2273072451353073,
+      "eval_macro_f1": 0.9100076650378461,
+      "eval_non_gas_f1": 0.9115646258503401,
+      "eval_non_gas_precision": 0.9115646258503401,
+      "eval_non_gas_recall": 0.9115646258503401,
+      "eval_precision": 0.9084507042253521,
+      "eval_recall": 0.9084507042253521,
+      "eval_roc_auc": 0.9730765545654881,
+      "eval_runtime": 13.0718,
+      "eval_samples_per_second": 22.109,
+      "eval_steps_per_second": 1.454,
+      "step": 340
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 425,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 2,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 1
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 354673702625280.0,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-340/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fdb9630f2ec73d46c11a0a22c41425e17dd472a7f7557576b8eff38cf51da9b9
+size 5265

checkpoint-425/config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+  "add_cross_attention": false,
+  "architectures": [
+    "XLMRobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Non-Gaslighting",
+    "1": "Gaslighting"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "is_decoder": false,
+  "label2id": {
+    "Gaslighting": 1,
+    "Non-Gaslighting": 0
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "xlm-roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "tie_word_embeddings": true,
+  "transformers_version": "5.0.0",
+  "type_vocab_size": 1,
+  "use_cache": false,
+  "vocab_size": 250002
+}

checkpoint-425/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d7ac699d23a6df393b55ade26aa532b95acf638fd46911ba61f86fff5d26ea88
+size 1112204984

checkpoint-425/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:02d8430f09364201de53bb264bbc88219edd9dc9fb35969e11b930834bbfe2fc
+size 2224530059

checkpoint-425/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1ab4de3002df3f8a9f907f3b84af4619db19c85d48785e2f3a1d83c32547a1e4
+size 14645

checkpoint-425/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9b22192c62e378b4a155269efe220c2cacf478062f193bb1de8ca6293c63b3ff
+size 1383

checkpoint-425/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1843d69d836283fb093fd990cc35bcfd014eccedd2c630705f4fec60bd7ebb92
+size 1465

checkpoint-425/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e5b633524ba90477daaba16ec27580a08a2856ae0ee8c33d9f5f9358378d3b35
+size 16781751

checkpoint-425/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "add_prefix_space": true,
+  "backend": "tokenizers",
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "is_local": false,
+  "mask_token": "<mask>",
+  "model_max_length": 512,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "XLMRobertaTokenizer",
+  "unk_token": "<unk>"
+}

checkpoint-425/trainer_state.json ADDED Viewed

	@@ -0,0 +1,163 @@

+{
+  "best_global_step": 425,
+  "best_metric": 0.924187725631769,
+  "best_model_checkpoint": "D:/Thesis/Taglish_Gaslighting_V3\\model_outputs\\xlm-roberta_binary\\checkpoint-425",
+  "epoch": 5.0,
+  "eval_steps": 500,
+  "global_step": 425,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "grad_norm": 13.04288101196289,
+      "learning_rate": 1.8010471204188483e-05,
+      "loss": 0.6918394200942095,
+      "step": 85
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.7093425605536332,
+      "eval_f1": 0.676923076923077,
+      "eval_loss": 0.5885154604911804,
+      "eval_macro_f1": 0.7063860667634252,
+      "eval_non_gas_f1": 0.7358490566037735,
+      "eval_non_gas_precision": 0.6842105263157895,
+      "eval_non_gas_recall": 0.7959183673469388,
+      "eval_precision": 0.7457627118644068,
+      "eval_recall": 0.6197183098591549,
+      "eval_roc_auc": 0.8050445530324807,
+      "eval_runtime": 13.2767,
+      "eval_samples_per_second": 21.768,
+      "eval_steps_per_second": 1.431,
+      "step": 85
+    },
+    {
+      "epoch": 2.0,
+      "grad_norm": 11.096158981323242,
+      "learning_rate": 1.356020942408377e-05,
+      "loss": 0.5428493724149817,
+      "step": 170
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.8027681660899654,
+      "eval_f1": 0.7764705882352941,
+      "eval_loss": 0.48855453729629517,
+      "eval_macro_f1": 0.8,
+      "eval_non_gas_f1": 0.8235294117647058,
+      "eval_non_gas_precision": 0.7556818181818182,
+      "eval_non_gas_recall": 0.9047619047619048,
+      "eval_precision": 0.8761061946902655,
+      "eval_recall": 0.6971830985915493,
+      "eval_roc_auc": 0.898438248538852,
+      "eval_runtime": 13.3951,
+      "eval_samples_per_second": 21.575,
+      "eval_steps_per_second": 1.418,
+      "step": 170
+    },
+    {
+      "epoch": 3.0,
+      "grad_norm": 5.319683074951172,
+      "learning_rate": 9.109947643979057e-06,
+      "loss": 0.4088932710535386,
+      "step": 255
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9134948096885813,
+      "eval_f1": 0.9158249158249159,
+      "eval_loss": 0.2529641091823578,
+      "eval_macro_f1": 0.9134284721473334,
+      "eval_non_gas_f1": 0.9110320284697508,
+      "eval_non_gas_precision": 0.9552238805970149,
+      "eval_non_gas_recall": 0.8707482993197279,
+      "eval_precision": 0.8774193548387097,
+      "eval_recall": 0.9577464788732394,
+      "eval_roc_auc": 0.9593752994155408,
+      "eval_runtime": 13.2242,
+      "eval_samples_per_second": 21.854,
+      "eval_steps_per_second": 1.437,
+      "step": 255
+    },
+    {
+      "epoch": 4.0,
+      "grad_norm": 4.501065254211426,
+      "learning_rate": 4.712041884816754e-06,
+      "loss": 0.2737856921027688,
+      "step": 340
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.9100346020761245,
+      "eval_f1": 0.9084507042253521,
+      "eval_loss": 0.2273072451353073,
+      "eval_macro_f1": 0.9100076650378461,
+      "eval_non_gas_f1": 0.9115646258503401,
+      "eval_non_gas_precision": 0.9115646258503401,
+      "eval_non_gas_recall": 0.9115646258503401,
+      "eval_precision": 0.9084507042253521,
+      "eval_recall": 0.9084507042253521,
+      "eval_roc_auc": 0.9730765545654881,
+      "eval_runtime": 13.0718,
+      "eval_samples_per_second": 22.109,
+      "eval_steps_per_second": 1.454,
+      "step": 340
+    },
+    {
+      "epoch": 5.0,
+      "grad_norm": 4.042298316955566,
+      "learning_rate": 2.617801047120419e-07,
+      "loss": 0.2015650805305032,
+      "step": 425
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.9273356401384083,
+      "eval_f1": 0.924187725631769,
+      "eval_loss": 0.2408331334590912,
+      "eval_macro_f1": 0.927210141885652,
+      "eval_non_gas_f1": 0.9302325581395349,
+      "eval_non_gas_precision": 0.9090909090909091,
+      "eval_non_gas_recall": 0.9523809523809523,
+      "eval_precision": 0.9481481481481482,
+      "eval_recall": 0.9014084507042254,
+      "eval_roc_auc": 0.9746095621347131,
+      "eval_runtime": 13.1098,
+      "eval_samples_per_second": 22.045,
+      "eval_steps_per_second": 1.449,
+      "step": 425
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 425,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 2,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 443342128281600.0,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-425/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fdb9630f2ec73d46c11a0a22c41425e17dd472a7f7557576b8eff38cf51da9b9
+size 5265

comprehensive_results_binary.json ADDED Viewed

	@@ -0,0 +1,79 @@

+{
+  "val": {
+    "loss": 0.2408331334590912,
+    "accuracy": 0.9273356401384083,
+    "precision": 0.9481481481481482,
+    "recall": 0.9014084507042254,
+    "f1": 0.924187725631769,
+    "macro_f1": 0.927210141885652,
+    "roc_auc": 0.9746095621347131,
+    "non_gas_precision": 0.9090909090909091,
+    "non_gas_recall": 0.9523809523809523,
+    "non_gas_f1": 0.9302325581395349,
+    "runtime": 13.2248,
+    "samples_per_second": 21.853,
+    "steps_per_second": 1.437,
+    "confusion_matrix": [
+      [
+        140,
+        7
+      ],
+      [
+        14,
+        128
+      ]
+    ]
+  },
+  "test_id": {
+    "loss": 0.33420857787132263,
+    "accuracy": 0.8927335640138409,
+    "precision": 0.8992805755395683,
+    "recall": 0.8802816901408451,
+    "f1": 0.8896797153024911,
+    "macro_f1": 0.8926513054626934,
+    "roc_auc": 0.951806074542493,
+    "non_gas_precision": 0.8866666666666667,
+    "non_gas_recall": 0.9047619047619048,
+    "non_gas_f1": 0.8956228956228957,
+    "runtime": 13.0723,
+    "samples_per_second": 22.108,
+    "steps_per_second": 1.453,
+    "confusion_matrix": [
+      [
+        133,
+        14
+      ],
+      [
+        17,
+        125
+      ]
+    ]
+  },
+  "test_ood": {
+    "loss": 0.5717462301254272,
+    "accuracy": 0.8170289855072463,
+    "precision": 0.9970414201183432,
+    "recall": 0.7711670480549199,
+    "f1": 0.8696774193548387,
+    "macro_f1": 0.781343268947936,
+    "roc_auc": 0.9866480947169436,
+    "non_gas_precision": 0.5327102803738317,
+    "non_gas_recall": 0.991304347826087,
+    "non_gas_f1": 0.6930091185410334,
+    "runtime": 13.3686,
+    "samples_per_second": 41.291,
+    "steps_per_second": 2.618,
+    "confusion_matrix": [
+      [
+        114,
+        1
+      ],
+      [
+        100,
+        337
+      ]
+    ]
+  },
+  "delta_f1": 0.02000229594765246,
+  "delta_f1_interpretation": "\u2705 Robust generalization (minimal domain sensitivity)"
+}

config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+  "add_cross_attention": false,
+  "architectures": [
+    "XLMRobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Non-Gaslighting",
+    "1": "Gaslighting"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "is_decoder": false,
+  "label2id": {
+    "Gaslighting": 1,
+    "Non-Gaslighting": 0
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "xlm-roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "tie_word_embeddings": true,
+  "transformers_version": "5.0.0",
+  "type_vocab_size": 1,
+  "use_cache": false,
+  "vocab_size": 250002
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d7ac699d23a6df393b55ade26aa532b95acf638fd46911ba61f86fff5d26ea88
+size 1112204984

tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e5b633524ba90477daaba16ec27580a08a2856ae0ee8c33d9f5f9358378d3b35
+size 16781751

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "add_prefix_space": true,
+  "backend": "tokenizers",
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "is_local": false,
+  "mask_token": "<mask>",
+  "model_max_length": 512,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "XLMRobertaTokenizer",
+  "unk_token": "<unk>"
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fdb9630f2ec73d46c11a0a22c41425e17dd472a7f7557576b8eff38cf51da9b9
+size 5265