textsightai commited on Dec 24, 2025

Commit

caaa9d2

verified ·

1 Parent(s): f650e2f

Upload folder using huggingface_hub

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

checkpoint-114/config.json +33 -0
checkpoint-114/model.safetensors +3 -0
checkpoint-114/optimizer.pt +3 -0
checkpoint-114/rng_state.pth +3 -0
checkpoint-114/scheduler.pt +3 -0
checkpoint-114/trainer_state.json +95 -0
checkpoint-114/training_args.bin +3 -0
checkpoint-171/config.json +33 -0
checkpoint-171/model.safetensors +3 -0
checkpoint-171/optimizer.pt +3 -0
checkpoint-171/rng_state.pth +3 -0
checkpoint-171/scheduler.pt +3 -0
checkpoint-171/trainer_state.json +121 -0
checkpoint-171/training_args.bin +3 -0
checkpoint-228/config.json +33 -0
checkpoint-228/model.safetensors +3 -0
checkpoint-228/optimizer.pt +3 -0
checkpoint-228/rng_state.pth +3 -0
checkpoint-228/scheduler.pt +3 -0
checkpoint-228/trainer_state.json +154 -0
checkpoint-228/training_args.bin +3 -0
checkpoint-285/config.json +33 -0
checkpoint-285/model.safetensors +3 -0
checkpoint-285/optimizer.pt +3 -0
checkpoint-285/rng_state.pth +3 -0
checkpoint-285/scheduler.pt +3 -0
checkpoint-285/trainer_state.json +180 -0
checkpoint-285/training_args.bin +3 -0
checkpoint-342/config.json +33 -0
checkpoint-342/model.safetensors +3 -0
checkpoint-342/optimizer.pt +3 -0
checkpoint-342/rng_state.pth +3 -0
checkpoint-342/scheduler.pt +3 -0
checkpoint-342/trainer_state.json +206 -0
checkpoint-342/training_args.bin +3 -0
checkpoint-399/config.json +33 -0
checkpoint-399/model.safetensors +3 -0
checkpoint-399/optimizer.pt +3 -0
checkpoint-399/rng_state.pth +3 -0
checkpoint-399/scheduler.pt +3 -0
checkpoint-399/trainer_state.json +232 -0
checkpoint-399/training_args.bin +3 -0
checkpoint-456/config.json +33 -0
checkpoint-456/model.safetensors +3 -0
checkpoint-456/optimizer.pt +3 -0
checkpoint-456/rng_state.pth +3 -0
checkpoint-456/scheduler.pt +3 -0
checkpoint-456/trainer_state.json +265 -0
checkpoint-456/training_args.bin +3 -0
checkpoint-513/config.json +33 -0

checkpoint-114/config.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Human",
+    "1": "AI"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "AI": 1,
+    "Human": 0
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.57.3",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

checkpoint-114/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ba07e64572fb03035e6ad53dc30c7db64d902eb4157cb66935426945358712f1
+size 437958648

checkpoint-114/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2b118ab24d14452e0fcb395f1e9e76053c0ac34053f040c46497c931b9ff5b04
+size 876033163

checkpoint-114/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9f1e0d31acc437fbbd16411d0d11d500c5f4dbbc7561671dab7dbf23eb0f2c43
+size 14455

checkpoint-114/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9c25199463fa046ddd18b57985caa892648a50605fcbefcaff1fd9e9d82c8e75
+size 1465

checkpoint-114/trainer_state.json ADDED Viewed

	@@ -0,0 +1,95 @@

+{
+  "best_global_step": 114,
+  "best_metric": 0.4482758620689655,
+  "best_model_checkpoint": "./ai_detector_model_v10/checkpoint-114",
+  "epoch": 2.0,
+  "eval_steps": 500,
+  "global_step": 114,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.43859649122807015,
+      "grad_norm": 2.53117299079895,
+      "learning_rate": 1.2000000000000002e-07,
+      "loss": 0.6905,
+      "step": 25
+    },
+    {
+      "epoch": 0.8771929824561403,
+      "grad_norm": 3.241912841796875,
+      "learning_rate": 2.45e-07,
+      "loss": 0.6869,
+      "step": 50
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.5,
+      "eval_f1": 0.16666666666666666,
+      "eval_loss": 0.6886580586433411,
+      "eval_precision": 0.8,
+      "eval_recall": 0.09302325581395349,
+      "eval_runtime": 4.3688,
+      "eval_samples_per_second": 18.312,
+      "eval_steps_per_second": 2.289,
+      "step": 57
+    },
+    {
+      "epoch": 1.3157894736842106,
+      "grad_norm": 2.8000667095184326,
+      "learning_rate": 3.7e-07,
+      "loss": 0.6872,
+      "step": 75
+    },
+    {
+      "epoch": 1.7543859649122808,
+      "grad_norm": 3.0732340812683105,
+      "learning_rate": 4.95e-07,
+      "loss": 0.6721,
+      "step": 100
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6,
+      "eval_f1": 0.4482758620689655,
+      "eval_loss": 0.6631786227226257,
+      "eval_precision": 0.8666666666666667,
+      "eval_recall": 0.3023255813953488,
+      "eval_runtime": 3.4954,
+      "eval_samples_per_second": 22.887,
+      "eval_steps_per_second": 2.861,
+      "step": 114
+    }
+  ],
+  "logging_steps": 25,
+  "max_steps": 1140,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 20,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 5,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 236799949824000.0,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-114/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:63faf219838a9e56f129bb219f11f7d21de055610c1d54c74fe871a46d5bf77a
+size 5777

checkpoint-171/config.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Human",
+    "1": "AI"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "AI": 1,
+    "Human": 0
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.57.3",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

checkpoint-171/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:55009821690e917db1114dbc848baec4d7739ac9286431f21472af667a8eddf7
+size 437958648

checkpoint-171/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:09c521d9bd88b4ab3f2cf6491df2b5355f289b80dda6f61e2e3c9f6e4ba347c9
+size 876033163

checkpoint-171/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:391d01d3aeb4a35151817d446e4ba0b9c8a04084ae1b1b66eda188a30729da0a
+size 14455

checkpoint-171/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:891b886d78f6365df6b5329e3942b03490ef41cb2ce6ea4d05691c57a4531bac
+size 1465

checkpoint-171/trainer_state.json ADDED Viewed

	@@ -0,0 +1,121 @@

+{
+  "best_global_step": 171,
+  "best_metric": 0.9195402298850575,
+  "best_model_checkpoint": "./ai_detector_model_v10/checkpoint-171",
+  "epoch": 3.0,
+  "eval_steps": 500,
+  "global_step": 171,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.43859649122807015,
+      "grad_norm": 2.53117299079895,
+      "learning_rate": 1.2000000000000002e-07,
+      "loss": 0.6905,
+      "step": 25
+    },
+    {
+      "epoch": 0.8771929824561403,
+      "grad_norm": 3.241912841796875,
+      "learning_rate": 2.45e-07,
+      "loss": 0.6869,
+      "step": 50
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.5,
+      "eval_f1": 0.16666666666666666,
+      "eval_loss": 0.6886580586433411,
+      "eval_precision": 0.8,
+      "eval_recall": 0.09302325581395349,
+      "eval_runtime": 4.3688,
+      "eval_samples_per_second": 18.312,
+      "eval_steps_per_second": 2.289,
+      "step": 57
+    },
+    {
+      "epoch": 1.3157894736842106,
+      "grad_norm": 2.8000667095184326,
+      "learning_rate": 3.7e-07,
+      "loss": 0.6872,
+      "step": 75
+    },
+    {
+      "epoch": 1.7543859649122808,
+      "grad_norm": 3.0732340812683105,
+      "learning_rate": 4.95e-07,
+      "loss": 0.6721,
+      "step": 100
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6,
+      "eval_f1": 0.4482758620689655,
+      "eval_loss": 0.6631786227226257,
+      "eval_precision": 0.8666666666666667,
+      "eval_recall": 0.3023255813953488,
+      "eval_runtime": 3.4954,
+      "eval_samples_per_second": 22.887,
+      "eval_steps_per_second": 2.861,
+      "step": 114
+    },
+    {
+      "epoch": 2.192982456140351,
+      "grad_norm": 5.148472309112549,
+      "learning_rate": 6.2e-07,
+      "loss": 0.6639,
+      "step": 125
+    },
+    {
+      "epoch": 2.6315789473684212,
+      "grad_norm": 4.3272223472595215,
+      "learning_rate": 7.45e-07,
+      "loss": 0.6423,
+      "step": 150
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9125,
+      "eval_f1": 0.9195402298850575,
+      "eval_loss": 0.6100292801856995,
+      "eval_precision": 0.9090909090909091,
+      "eval_recall": 0.9302325581395349,
+      "eval_runtime": 3.5042,
+      "eval_samples_per_second": 22.829,
+      "eval_steps_per_second": 2.854,
+      "step": 171
+    }
+  ],
+  "logging_steps": 25,
+  "max_steps": 1140,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 20,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 5,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 355199924736000.0,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-171/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:63faf219838a9e56f129bb219f11f7d21de055610c1d54c74fe871a46d5bf77a
+size 5777

checkpoint-228/config.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Human",
+    "1": "AI"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "AI": 1,
+    "Human": 0
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.57.3",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

checkpoint-228/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dff874543e53030922925ea8f8650cb4f2e2a46217f2fa2a688bef7c055f9cd9
+size 437958648

checkpoint-228/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8eee46e5fb474bc5a87dd72d542443661ffebd3bcd8f64daef357d98ba3b03a8
+size 876033163

checkpoint-228/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:67627e3b026c4c5d776980914bd7f99f2f9814ae6ac5a3bd1d93ee8d2ff6784f
+size 14455

checkpoint-228/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:977b9b2e7012dd8b09d3a15f4d4c2a57908497bc25ffbbd86cffb63b01ef4771
+size 1465

checkpoint-228/trainer_state.json ADDED Viewed

	@@ -0,0 +1,154 @@

+{
+  "best_global_step": 228,
+  "best_metric": 0.945054945054945,
+  "best_model_checkpoint": "./ai_detector_model_v10/checkpoint-228",
+  "epoch": 4.0,
+  "eval_steps": 500,
+  "global_step": 228,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.43859649122807015,
+      "grad_norm": 2.53117299079895,
+      "learning_rate": 1.2000000000000002e-07,
+      "loss": 0.6905,
+      "step": 25
+    },
+    {
+      "epoch": 0.8771929824561403,
+      "grad_norm": 3.241912841796875,
+      "learning_rate": 2.45e-07,
+      "loss": 0.6869,
+      "step": 50
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.5,
+      "eval_f1": 0.16666666666666666,
+      "eval_loss": 0.6886580586433411,
+      "eval_precision": 0.8,
+      "eval_recall": 0.09302325581395349,
+      "eval_runtime": 4.3688,
+      "eval_samples_per_second": 18.312,
+      "eval_steps_per_second": 2.289,
+      "step": 57
+    },
+    {
+      "epoch": 1.3157894736842106,
+      "grad_norm": 2.8000667095184326,
+      "learning_rate": 3.7e-07,
+      "loss": 0.6872,
+      "step": 75
+    },
+    {
+      "epoch": 1.7543859649122808,
+      "grad_norm": 3.0732340812683105,
+      "learning_rate": 4.95e-07,
+      "loss": 0.6721,
+      "step": 100
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6,
+      "eval_f1": 0.4482758620689655,
+      "eval_loss": 0.6631786227226257,
+      "eval_precision": 0.8666666666666667,
+      "eval_recall": 0.3023255813953488,
+      "eval_runtime": 3.4954,
+      "eval_samples_per_second": 22.887,
+      "eval_steps_per_second": 2.861,
+      "step": 114
+    },
+    {
+      "epoch": 2.192982456140351,
+      "grad_norm": 5.148472309112549,
+      "learning_rate": 6.2e-07,
+      "loss": 0.6639,
+      "step": 125
+    },
+    {
+      "epoch": 2.6315789473684212,
+      "grad_norm": 4.3272223472595215,
+      "learning_rate": 7.45e-07,
+      "loss": 0.6423,
+      "step": 150
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9125,
+      "eval_f1": 0.9195402298850575,
+      "eval_loss": 0.6100292801856995,
+      "eval_precision": 0.9090909090909091,
+      "eval_recall": 0.9302325581395349,
+      "eval_runtime": 3.5042,
+      "eval_samples_per_second": 22.829,
+      "eval_steps_per_second": 2.854,
+      "step": 171
+    },
+    {
+      "epoch": 3.0701754385964914,
+      "grad_norm": 4.4310302734375,
+      "learning_rate": 8.699999999999999e-07,
+      "loss": 0.6113,
+      "step": 175
+    },
+    {
+      "epoch": 3.5087719298245617,
+      "grad_norm": 3.7883880138397217,
+      "learning_rate": 9.95e-07,
+      "loss": 0.587,
+      "step": 200
+    },
+    {
+      "epoch": 3.9473684210526314,
+      "grad_norm": 4.989749908447266,
+      "learning_rate": 1.12e-06,
+      "loss": 0.5664,
+      "step": 225
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.9375,
+      "eval_f1": 0.945054945054945,
+      "eval_loss": 0.5416288375854492,
+      "eval_precision": 0.8958333333333334,
+      "eval_recall": 1.0,
+      "eval_runtime": 3.3989,
+      "eval_samples_per_second": 23.537,
+      "eval_steps_per_second": 2.942,
+      "step": 228
+    }
+  ],
+  "logging_steps": 25,
+  "max_steps": 1140,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 20,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 5,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 473599899648000.0,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-228/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:63faf219838a9e56f129bb219f11f7d21de055610c1d54c74fe871a46d5bf77a
+size 5777

checkpoint-285/config.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Human",
+    "1": "AI"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "AI": 1,
+    "Human": 0
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.57.3",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

checkpoint-285/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:243655f60fd2a53b6f348a75ebbb0ac4df9a5236a4b0f72379bfa1bd3643c4f0
+size 437958648

checkpoint-285/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a569ec9245736253f61c9d622a5d3ca2ff56b2f6ad0d0669c59a5cba04e6cab2
+size 876033163

checkpoint-285/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2b652c6269b998b96ab924b2734c0818fab436c642524e13fc6cd4d9082e62b5
+size 14455

checkpoint-285/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:be42d5eaf34fdb700c80731c58d1f751f473aad4e6a622406045abb719430309
+size 1465

checkpoint-285/trainer_state.json ADDED Viewed

	@@ -0,0 +1,180 @@

+{
+  "best_global_step": 285,
+  "best_metric": 0.9662921348314607,
+  "best_model_checkpoint": "./ai_detector_model_v10/checkpoint-285",
+  "epoch": 5.0,
+  "eval_steps": 500,
+  "global_step": 285,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.43859649122807015,
+      "grad_norm": 2.53117299079895,
+      "learning_rate": 1.2000000000000002e-07,
+      "loss": 0.6905,
+      "step": 25
+    },
+    {
+      "epoch": 0.8771929824561403,
+      "grad_norm": 3.241912841796875,
+      "learning_rate": 2.45e-07,
+      "loss": 0.6869,
+      "step": 50
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.5,
+      "eval_f1": 0.16666666666666666,
+      "eval_loss": 0.6886580586433411,
+      "eval_precision": 0.8,
+      "eval_recall": 0.09302325581395349,
+      "eval_runtime": 4.3688,
+      "eval_samples_per_second": 18.312,
+      "eval_steps_per_second": 2.289,
+      "step": 57
+    },
+    {
+      "epoch": 1.3157894736842106,
+      "grad_norm": 2.8000667095184326,
+      "learning_rate": 3.7e-07,
+      "loss": 0.6872,
+      "step": 75
+    },
+    {
+      "epoch": 1.7543859649122808,
+      "grad_norm": 3.0732340812683105,
+      "learning_rate": 4.95e-07,
+      "loss": 0.6721,
+      "step": 100
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6,
+      "eval_f1": 0.4482758620689655,
+      "eval_loss": 0.6631786227226257,
+      "eval_precision": 0.8666666666666667,
+      "eval_recall": 0.3023255813953488,
+      "eval_runtime": 3.4954,
+      "eval_samples_per_second": 22.887,
+      "eval_steps_per_second": 2.861,
+      "step": 114
+    },
+    {
+      "epoch": 2.192982456140351,
+      "grad_norm": 5.148472309112549,
+      "learning_rate": 6.2e-07,
+      "loss": 0.6639,
+      "step": 125
+    },
+    {
+      "epoch": 2.6315789473684212,
+      "grad_norm": 4.3272223472595215,
+      "learning_rate": 7.45e-07,
+      "loss": 0.6423,
+      "step": 150
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9125,
+      "eval_f1": 0.9195402298850575,
+      "eval_loss": 0.6100292801856995,
+      "eval_precision": 0.9090909090909091,
+      "eval_recall": 0.9302325581395349,
+      "eval_runtime": 3.5042,
+      "eval_samples_per_second": 22.829,
+      "eval_steps_per_second": 2.854,
+      "step": 171
+    },
+    {
+      "epoch": 3.0701754385964914,
+      "grad_norm": 4.4310302734375,
+      "learning_rate": 8.699999999999999e-07,
+      "loss": 0.6113,
+      "step": 175
+    },
+    {
+      "epoch": 3.5087719298245617,
+      "grad_norm": 3.7883880138397217,
+      "learning_rate": 9.95e-07,
+      "loss": 0.587,
+      "step": 200
+    },
+    {
+      "epoch": 3.9473684210526314,
+      "grad_norm": 4.989749908447266,
+      "learning_rate": 1.12e-06,
+      "loss": 0.5664,
+      "step": 225
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.9375,
+      "eval_f1": 0.945054945054945,
+      "eval_loss": 0.5416288375854492,
+      "eval_precision": 0.8958333333333334,
+      "eval_recall": 1.0,
+      "eval_runtime": 3.3989,
+      "eval_samples_per_second": 23.537,
+      "eval_steps_per_second": 2.942,
+      "step": 228
+    },
+    {
+      "epoch": 4.385964912280702,
+      "grad_norm": 4.706058979034424,
+      "learning_rate": 1.245e-06,
+      "loss": 0.533,
+      "step": 250
+    },
+    {
+      "epoch": 4.824561403508772,
+      "grad_norm": 4.749231338500977,
+      "learning_rate": 1.37e-06,
+      "loss": 0.5036,
+      "step": 275
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.9625,
+      "eval_f1": 0.9662921348314607,
+      "eval_loss": 0.45674929022789,
+      "eval_precision": 0.9347826086956522,
+      "eval_recall": 1.0,
+      "eval_runtime": 3.3705,
+      "eval_samples_per_second": 23.735,
+      "eval_steps_per_second": 2.967,
+      "step": 285
+    }
+  ],
+  "logging_steps": 25,
+  "max_steps": 1140,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 20,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 5,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 591999874560000.0,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-285/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:63faf219838a9e56f129bb219f11f7d21de055610c1d54c74fe871a46d5bf77a
+size 5777

checkpoint-342/config.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Human",
+    "1": "AI"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "AI": 1,
+    "Human": 0
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.57.3",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

checkpoint-342/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9f72b00d2d7a1ae64b7adf1bbaf6c729c1965c99bd5f45fa684140d8892009ab
+size 437958648

checkpoint-342/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:da84ddd3ff2865d4c34a9d078b89e224d1cc0d5f04eeed698cfce024979210b5
+size 876033163

checkpoint-342/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e38e4bded6fa666a78b369223010c84f8eafdd4ce4069224aa6f2854b4222440
+size 14455

checkpoint-342/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fbb7e7c352d53a21fe634efbd24e6a75fe26234a1854ab93ea6f0ab92429f7e8
+size 1465

checkpoint-342/trainer_state.json ADDED Viewed

	@@ -0,0 +1,206 @@

+{
+  "best_global_step": 342,
+  "best_metric": 0.9772727272727273,
+  "best_model_checkpoint": "./ai_detector_model_v10/checkpoint-342",
+  "epoch": 6.0,
+  "eval_steps": 500,
+  "global_step": 342,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.43859649122807015,
+      "grad_norm": 2.53117299079895,
+      "learning_rate": 1.2000000000000002e-07,
+      "loss": 0.6905,
+      "step": 25
+    },
+    {
+      "epoch": 0.8771929824561403,
+      "grad_norm": 3.241912841796875,
+      "learning_rate": 2.45e-07,
+      "loss": 0.6869,
+      "step": 50
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.5,
+      "eval_f1": 0.16666666666666666,
+      "eval_loss": 0.6886580586433411,
+      "eval_precision": 0.8,
+      "eval_recall": 0.09302325581395349,
+      "eval_runtime": 4.3688,
+      "eval_samples_per_second": 18.312,
+      "eval_steps_per_second": 2.289,
+      "step": 57
+    },
+    {
+      "epoch": 1.3157894736842106,
+      "grad_norm": 2.8000667095184326,
+      "learning_rate": 3.7e-07,
+      "loss": 0.6872,
+      "step": 75
+    },
+    {
+      "epoch": 1.7543859649122808,
+      "grad_norm": 3.0732340812683105,
+      "learning_rate": 4.95e-07,
+      "loss": 0.6721,
+      "step": 100
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6,
+      "eval_f1": 0.4482758620689655,
+      "eval_loss": 0.6631786227226257,
+      "eval_precision": 0.8666666666666667,
+      "eval_recall": 0.3023255813953488,
+      "eval_runtime": 3.4954,
+      "eval_samples_per_second": 22.887,
+      "eval_steps_per_second": 2.861,
+      "step": 114
+    },
+    {
+      "epoch": 2.192982456140351,
+      "grad_norm": 5.148472309112549,
+      "learning_rate": 6.2e-07,
+      "loss": 0.6639,
+      "step": 125
+    },
+    {
+      "epoch": 2.6315789473684212,
+      "grad_norm": 4.3272223472595215,
+      "learning_rate": 7.45e-07,
+      "loss": 0.6423,
+      "step": 150
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9125,
+      "eval_f1": 0.9195402298850575,
+      "eval_loss": 0.6100292801856995,
+      "eval_precision": 0.9090909090909091,
+      "eval_recall": 0.9302325581395349,
+      "eval_runtime": 3.5042,
+      "eval_samples_per_second": 22.829,
+      "eval_steps_per_second": 2.854,
+      "step": 171
+    },
+    {
+      "epoch": 3.0701754385964914,
+      "grad_norm": 4.4310302734375,
+      "learning_rate": 8.699999999999999e-07,
+      "loss": 0.6113,
+      "step": 175
+    },
+    {
+      "epoch": 3.5087719298245617,
+      "grad_norm": 3.7883880138397217,
+      "learning_rate": 9.95e-07,
+      "loss": 0.587,
+      "step": 200
+    },
+    {
+      "epoch": 3.9473684210526314,
+      "grad_norm": 4.989749908447266,
+      "learning_rate": 1.12e-06,
+      "loss": 0.5664,
+      "step": 225
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.9375,
+      "eval_f1": 0.945054945054945,
+      "eval_loss": 0.5416288375854492,
+      "eval_precision": 0.8958333333333334,
+      "eval_recall": 1.0,
+      "eval_runtime": 3.3989,
+      "eval_samples_per_second": 23.537,
+      "eval_steps_per_second": 2.942,
+      "step": 228
+    },
+    {
+      "epoch": 4.385964912280702,
+      "grad_norm": 4.706058979034424,
+      "learning_rate": 1.245e-06,
+      "loss": 0.533,
+      "step": 250
+    },
+    {
+      "epoch": 4.824561403508772,
+      "grad_norm": 4.749231338500977,
+      "learning_rate": 1.37e-06,
+      "loss": 0.5036,
+      "step": 275
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.9625,
+      "eval_f1": 0.9662921348314607,
+      "eval_loss": 0.45674929022789,
+      "eval_precision": 0.9347826086956522,
+      "eval_recall": 1.0,
+      "eval_runtime": 3.3705,
+      "eval_samples_per_second": 23.735,
+      "eval_steps_per_second": 2.967,
+      "step": 285
+    },
+    {
+      "epoch": 5.2631578947368425,
+      "grad_norm": 5.614340782165527,
+      "learning_rate": 1.495e-06,
+      "loss": 0.451,
+      "step": 300
+    },
+    {
+      "epoch": 5.701754385964913,
+      "grad_norm": 3.3072502613067627,
+      "learning_rate": 1.6200000000000002e-06,
+      "loss": 0.4289,
+      "step": 325
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.975,
+      "eval_f1": 0.9772727272727273,
+      "eval_loss": 0.3828332722187042,
+      "eval_precision": 0.9555555555555556,
+      "eval_recall": 1.0,
+      "eval_runtime": 3.3562,
+      "eval_samples_per_second": 23.836,
+      "eval_steps_per_second": 2.98,
+      "step": 342
+    }
+  ],
+  "logging_steps": 25,
+  "max_steps": 1140,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 20,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 5,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 710399849472000.0,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-342/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:63faf219838a9e56f129bb219f11f7d21de055610c1d54c74fe871a46d5bf77a
+size 5777

checkpoint-399/config.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Human",
+    "1": "AI"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "AI": 1,
+    "Human": 0
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.57.3",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

checkpoint-399/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3c6be057716b0865c0670b59edfdfba482333cdf657324e9764ca2b22f71596d
+size 437958648

checkpoint-399/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dc94edb2f9de087f036df04a8f8e77a07959e3b8de6476bc1d82ec96638399a5
+size 876033163

checkpoint-399/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f13fa096c82c4698939c19f78b0766bd5c2a2142c49acdf650aabfa34b99d7f1
+size 14455

checkpoint-399/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0a608ccd4279d7f75d5dec35e3fdfbc4a49180b3b225e3a554b45081a544a1e5
+size 1465

checkpoint-399/trainer_state.json ADDED Viewed

	@@ -0,0 +1,232 @@

+{
+  "best_global_step": 399,
+  "best_metric": 1.0,
+  "best_model_checkpoint": "./ai_detector_model_v10/checkpoint-399",
+  "epoch": 7.0,
+  "eval_steps": 500,
+  "global_step": 399,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.43859649122807015,
+      "grad_norm": 2.53117299079895,
+      "learning_rate": 1.2000000000000002e-07,
+      "loss": 0.6905,
+      "step": 25
+    },
+    {
+      "epoch": 0.8771929824561403,
+      "grad_norm": 3.241912841796875,
+      "learning_rate": 2.45e-07,
+      "loss": 0.6869,
+      "step": 50
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.5,
+      "eval_f1": 0.16666666666666666,
+      "eval_loss": 0.6886580586433411,
+      "eval_precision": 0.8,
+      "eval_recall": 0.09302325581395349,
+      "eval_runtime": 4.3688,
+      "eval_samples_per_second": 18.312,
+      "eval_steps_per_second": 2.289,
+      "step": 57
+    },
+    {
+      "epoch": 1.3157894736842106,
+      "grad_norm": 2.8000667095184326,
+      "learning_rate": 3.7e-07,
+      "loss": 0.6872,
+      "step": 75
+    },
+    {
+      "epoch": 1.7543859649122808,
+      "grad_norm": 3.0732340812683105,
+      "learning_rate": 4.95e-07,
+      "loss": 0.6721,
+      "step": 100
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6,
+      "eval_f1": 0.4482758620689655,
+      "eval_loss": 0.6631786227226257,
+      "eval_precision": 0.8666666666666667,
+      "eval_recall": 0.3023255813953488,
+      "eval_runtime": 3.4954,
+      "eval_samples_per_second": 22.887,
+      "eval_steps_per_second": 2.861,
+      "step": 114
+    },
+    {
+      "epoch": 2.192982456140351,
+      "grad_norm": 5.148472309112549,
+      "learning_rate": 6.2e-07,
+      "loss": 0.6639,
+      "step": 125
+    },
+    {
+      "epoch": 2.6315789473684212,
+      "grad_norm": 4.3272223472595215,
+      "learning_rate": 7.45e-07,
+      "loss": 0.6423,
+      "step": 150
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9125,
+      "eval_f1": 0.9195402298850575,
+      "eval_loss": 0.6100292801856995,
+      "eval_precision": 0.9090909090909091,
+      "eval_recall": 0.9302325581395349,
+      "eval_runtime": 3.5042,
+      "eval_samples_per_second": 22.829,
+      "eval_steps_per_second": 2.854,
+      "step": 171
+    },
+    {
+      "epoch": 3.0701754385964914,
+      "grad_norm": 4.4310302734375,
+      "learning_rate": 8.699999999999999e-07,
+      "loss": 0.6113,
+      "step": 175
+    },
+    {
+      "epoch": 3.5087719298245617,
+      "grad_norm": 3.7883880138397217,
+      "learning_rate": 9.95e-07,
+      "loss": 0.587,
+      "step": 200
+    },
+    {
+      "epoch": 3.9473684210526314,
+      "grad_norm": 4.989749908447266,
+      "learning_rate": 1.12e-06,
+      "loss": 0.5664,
+      "step": 225
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.9375,
+      "eval_f1": 0.945054945054945,
+      "eval_loss": 0.5416288375854492,
+      "eval_precision": 0.8958333333333334,
+      "eval_recall": 1.0,
+      "eval_runtime": 3.3989,
+      "eval_samples_per_second": 23.537,
+      "eval_steps_per_second": 2.942,
+      "step": 228
+    },
+    {
+      "epoch": 4.385964912280702,
+      "grad_norm": 4.706058979034424,
+      "learning_rate": 1.245e-06,
+      "loss": 0.533,
+      "step": 250
+    },
+    {
+      "epoch": 4.824561403508772,
+      "grad_norm": 4.749231338500977,
+      "learning_rate": 1.37e-06,
+      "loss": 0.5036,
+      "step": 275
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.9625,
+      "eval_f1": 0.9662921348314607,
+      "eval_loss": 0.45674929022789,
+      "eval_precision": 0.9347826086956522,
+      "eval_recall": 1.0,
+      "eval_runtime": 3.3705,
+      "eval_samples_per_second": 23.735,
+      "eval_steps_per_second": 2.967,
+      "step": 285
+    },
+    {
+      "epoch": 5.2631578947368425,
+      "grad_norm": 5.614340782165527,
+      "learning_rate": 1.495e-06,
+      "loss": 0.451,
+      "step": 300
+    },
+    {
+      "epoch": 5.701754385964913,
+      "grad_norm": 3.3072502613067627,
+      "learning_rate": 1.6200000000000002e-06,
+      "loss": 0.4289,
+      "step": 325
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.975,
+      "eval_f1": 0.9772727272727273,
+      "eval_loss": 0.3828332722187042,
+      "eval_precision": 0.9555555555555556,
+      "eval_recall": 1.0,
+      "eval_runtime": 3.3562,
+      "eval_samples_per_second": 23.836,
+      "eval_steps_per_second": 2.98,
+      "step": 342
+    },
+    {
+      "epoch": 6.140350877192983,
+      "grad_norm": 4.262056827545166,
+      "learning_rate": 1.745e-06,
+      "loss": 0.3868,
+      "step": 350
+    },
+    {
+      "epoch": 6.578947368421053,
+      "grad_norm": 2.7170867919921875,
+      "learning_rate": 1.8699999999999999e-06,
+      "loss": 0.3527,
+      "step": 375
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 1.0,
+      "eval_f1": 1.0,
+      "eval_loss": 0.3189076781272888,
+      "eval_precision": 1.0,
+      "eval_recall": 1.0,
+      "eval_runtime": 3.349,
+      "eval_samples_per_second": 23.888,
+      "eval_steps_per_second": 2.986,
+      "step": 399
+    }
+  ],
+  "logging_steps": 25,
+  "max_steps": 1140,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 20,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 5,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 828799824384000.0,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-399/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:63faf219838a9e56f129bb219f11f7d21de055610c1d54c74fe871a46d5bf77a
+size 5777

checkpoint-456/config.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Human",
+    "1": "AI"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "AI": 1,
+    "Human": 0
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.57.3",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

checkpoint-456/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8b2e953bb67f488c7a1107df218ca62baef18561db4745cb5444166fb8b41d55
+size 437958648

checkpoint-456/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:567989590572f110b4143eddfe2b7e09da0392fa8d4223d8d622fd32c7945f55
+size 876033163

checkpoint-456/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b46fdb450f07235e10b0a3cbfc22c5b992fc3bc85e2c60f4f801ecd647891c56
+size 14455

checkpoint-456/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2d6bbc54a1bfa58ad2f93c0f3c37d1fed1cefc747af9e48c028e8caf5b9c0a05
+size 1465

checkpoint-456/trainer_state.json ADDED Viewed

	@@ -0,0 +1,265 @@

+{
+  "best_global_step": 399,
+  "best_metric": 1.0,
+  "best_model_checkpoint": "./ai_detector_model_v10/checkpoint-399",
+  "epoch": 8.0,
+  "eval_steps": 500,
+  "global_step": 456,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.43859649122807015,
+      "grad_norm": 2.53117299079895,
+      "learning_rate": 1.2000000000000002e-07,
+      "loss": 0.6905,
+      "step": 25
+    },
+    {
+      "epoch": 0.8771929824561403,
+      "grad_norm": 3.241912841796875,
+      "learning_rate": 2.45e-07,
+      "loss": 0.6869,
+      "step": 50
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.5,
+      "eval_f1": 0.16666666666666666,
+      "eval_loss": 0.6886580586433411,
+      "eval_precision": 0.8,
+      "eval_recall": 0.09302325581395349,
+      "eval_runtime": 4.3688,
+      "eval_samples_per_second": 18.312,
+      "eval_steps_per_second": 2.289,
+      "step": 57
+    },
+    {
+      "epoch": 1.3157894736842106,
+      "grad_norm": 2.8000667095184326,
+      "learning_rate": 3.7e-07,
+      "loss": 0.6872,
+      "step": 75
+    },
+    {
+      "epoch": 1.7543859649122808,
+      "grad_norm": 3.0732340812683105,
+      "learning_rate": 4.95e-07,
+      "loss": 0.6721,
+      "step": 100
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6,
+      "eval_f1": 0.4482758620689655,
+      "eval_loss": 0.6631786227226257,
+      "eval_precision": 0.8666666666666667,
+      "eval_recall": 0.3023255813953488,
+      "eval_runtime": 3.4954,
+      "eval_samples_per_second": 22.887,
+      "eval_steps_per_second": 2.861,
+      "step": 114
+    },
+    {
+      "epoch": 2.192982456140351,
+      "grad_norm": 5.148472309112549,
+      "learning_rate": 6.2e-07,
+      "loss": 0.6639,
+      "step": 125
+    },
+    {
+      "epoch": 2.6315789473684212,
+      "grad_norm": 4.3272223472595215,
+      "learning_rate": 7.45e-07,
+      "loss": 0.6423,
+      "step": 150
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9125,
+      "eval_f1": 0.9195402298850575,
+      "eval_loss": 0.6100292801856995,
+      "eval_precision": 0.9090909090909091,
+      "eval_recall": 0.9302325581395349,
+      "eval_runtime": 3.5042,
+      "eval_samples_per_second": 22.829,
+      "eval_steps_per_second": 2.854,
+      "step": 171
+    },
+    {
+      "epoch": 3.0701754385964914,
+      "grad_norm": 4.4310302734375,
+      "learning_rate": 8.699999999999999e-07,
+      "loss": 0.6113,
+      "step": 175
+    },
+    {
+      "epoch": 3.5087719298245617,
+      "grad_norm": 3.7883880138397217,
+      "learning_rate": 9.95e-07,
+      "loss": 0.587,
+      "step": 200
+    },
+    {
+      "epoch": 3.9473684210526314,
+      "grad_norm": 4.989749908447266,
+      "learning_rate": 1.12e-06,
+      "loss": 0.5664,
+      "step": 225
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.9375,
+      "eval_f1": 0.945054945054945,
+      "eval_loss": 0.5416288375854492,
+      "eval_precision": 0.8958333333333334,
+      "eval_recall": 1.0,
+      "eval_runtime": 3.3989,
+      "eval_samples_per_second": 23.537,
+      "eval_steps_per_second": 2.942,
+      "step": 228
+    },
+    {
+      "epoch": 4.385964912280702,
+      "grad_norm": 4.706058979034424,
+      "learning_rate": 1.245e-06,
+      "loss": 0.533,
+      "step": 250
+    },
+    {
+      "epoch": 4.824561403508772,
+      "grad_norm": 4.749231338500977,
+      "learning_rate": 1.37e-06,
+      "loss": 0.5036,
+      "step": 275
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.9625,
+      "eval_f1": 0.9662921348314607,
+      "eval_loss": 0.45674929022789,
+      "eval_precision": 0.9347826086956522,
+      "eval_recall": 1.0,
+      "eval_runtime": 3.3705,
+      "eval_samples_per_second": 23.735,
+      "eval_steps_per_second": 2.967,
+      "step": 285
+    },
+    {
+      "epoch": 5.2631578947368425,
+      "grad_norm": 5.614340782165527,
+      "learning_rate": 1.495e-06,
+      "loss": 0.451,
+      "step": 300
+    },
+    {
+      "epoch": 5.701754385964913,
+      "grad_norm": 3.3072502613067627,
+      "learning_rate": 1.6200000000000002e-06,
+      "loss": 0.4289,
+      "step": 325
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.975,
+      "eval_f1": 0.9772727272727273,
+      "eval_loss": 0.3828332722187042,
+      "eval_precision": 0.9555555555555556,
+      "eval_recall": 1.0,
+      "eval_runtime": 3.3562,
+      "eval_samples_per_second": 23.836,
+      "eval_steps_per_second": 2.98,
+      "step": 342
+    },
+    {
+      "epoch": 6.140350877192983,
+      "grad_norm": 4.262056827545166,
+      "learning_rate": 1.745e-06,
+      "loss": 0.3868,
+      "step": 350
+    },
+    {
+      "epoch": 6.578947368421053,
+      "grad_norm": 2.7170867919921875,
+      "learning_rate": 1.8699999999999999e-06,
+      "loss": 0.3527,
+      "step": 375
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 1.0,
+      "eval_f1": 1.0,
+      "eval_loss": 0.3189076781272888,
+      "eval_precision": 1.0,
+      "eval_recall": 1.0,
+      "eval_runtime": 3.349,
+      "eval_samples_per_second": 23.888,
+      "eval_steps_per_second": 2.986,
+      "step": 399
+    },
+    {
+      "epoch": 7.017543859649122,
+      "grad_norm": 1.8840763568878174,
+      "learning_rate": 1.995e-06,
+      "loss": 0.3292,
+      "step": 400
+    },
+    {
+      "epoch": 7.456140350877193,
+      "grad_norm": 2.5557754039764404,
+      "learning_rate": 2.12e-06,
+      "loss": 0.3073,
+      "step": 425
+    },
+    {
+      "epoch": 7.894736842105263,
+      "grad_norm": 2.818211555480957,
+      "learning_rate": 2.245e-06,
+      "loss": 0.2884,
+      "step": 450
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 1.0,
+      "eval_f1": 1.0,
+      "eval_loss": 0.2968425154685974,
+      "eval_precision": 1.0,
+      "eval_recall": 1.0,
+      "eval_runtime": 3.4168,
+      "eval_samples_per_second": 23.414,
+      "eval_steps_per_second": 2.927,
+      "step": 456
+    }
+  ],
+  "logging_steps": 25,
+  "max_steps": 1140,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 20,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 5,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 1
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 947199799296000.0,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-456/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:63faf219838a9e56f129bb219f11f7d21de055610c1d54c74fe871a46d5bf77a
+size 5777

checkpoint-513/config.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "dtype": "float32",
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Human",
+    "1": "AI"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "AI": 1,
+    "Human": 0
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.57.3",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}