karths commited on Mar 6, 2024

Commit

444c870

verified ·

1 Parent(s): 6fe10f7

Upload folder using huggingface_hub

Browse files

Files changed (29) hide show

.gitattributes +3 -0
.ipynb_checkpoints/detailed_confusion_matrix-checkpoint.png +0 -0
checkpoint-11820/config.json +28 -0
checkpoint-11820/model.safetensors +3 -0
checkpoint-11820/optimizer.pt +3 -0
checkpoint-11820/rng_state.pth +3 -0
checkpoint-11820/scheduler.pt +3 -0
checkpoint-11820/trainer_state.json +157 -0
checkpoint-11820/training_args.bin +3 -0
classification_report.json +1 -0
config.json +28 -0
confusion_matrix.png +0 -0
detailed_confusion_matrix.png +0 -0
fold_results.json +67 -0
metrics.json +1 -0
metrics_all_fold.json +44 -0
metrics_ci_bounds.json +26 -0
metrics_mean.json +8 -0
metrics_std.json +8 -0
metrics_visualisation.png +0 -0
model.safetensors +3 -0
precision_recall_curve.png +0 -0
reduced_main_data.csv +3 -0
roc_curve.png +0 -0
test_data_for_future_evaluation.csv +3 -0
test_top_repo_data.csv +3 -0
top_repo_data.csv +0 -0
tracker_carbon_statistics.json +33 -0
training_args.bin +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,6 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+reduced_main_data.csv filter=lfs diff=lfs merge=lfs -text
+test_data_for_future_evaluation.csv filter=lfs diff=lfs merge=lfs -text
+test_top_repo_data.csv filter=lfs diff=lfs merge=lfs -text

.ipynb_checkpoints/detailed_confusion_matrix-checkpoint.png ADDED Viewed

checkpoint-11820/config.json ADDED Viewed

	@@ -0,0 +1,28 @@

+{
+  "_name_or_path": "distilroberta-base",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 6,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.35.0",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

checkpoint-11820/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a95ee069d4168c7d3365ca440c2f16dfcdc7efb7878bce98630282f3270c1705
+size 328492280

checkpoint-11820/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:89498c10c03f1e59d20960ce7c236a3eeac91ee106d5a75011e577bb8e8d619b
+size 657047610

checkpoint-11820/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:42a857b2650ab34daa84fc2c4f4b26d82e60286eaaac7fa6aea552c562bc7d21
+size 14244

checkpoint-11820/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4ad0ea4cfce17d6a2282b50064bfecae906fddcc08a2ba9a7d833a963696e368
+size 1064

checkpoint-11820/trainer_state.json ADDED Viewed

	@@ -0,0 +1,157 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 4.998942694015648,
+  "eval_steps": 500,
+  "global_step": 11820,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.21,
+      "learning_rate": 4.9800000000000004e-05,
+      "loss": 0.0466,
+      "step": 500
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 4.976161211704926e-05,
+      "loss": 0.0691,
+      "step": 1000
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 4.9047204098004095e-05,
+      "loss": 0.0741,
+      "step": 1500
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 4.7870506066506904e-05,
+      "loss": 0.0763,
+      "step": 2000
+    },
+    {
+      "epoch": 1.06,
+      "learning_rate": 4.62541391865573e-05,
+      "loss": 0.0716,
+      "step": 2500
+    },
+    {
+      "epoch": 1.27,
+      "learning_rate": 4.422917693605373e-05,
+      "loss": 0.0591,
+      "step": 3000
+    },
+    {
+      "epoch": 1.48,
+      "learning_rate": 4.183454774177651e-05,
+      "loss": 0.0632,
+      "step": 3500
+    },
+    {
+      "epoch": 1.69,
+      "learning_rate": 3.91162866086904e-05,
+      "loss": 0.0608,
+      "step": 4000
+    },
+    {
+      "epoch": 1.9,
+      "learning_rate": 3.613286279641655e-05,
+      "loss": 0.0622,
+      "step": 4500
+    },
+    {
+      "epoch": 2.11,
+      "learning_rate": 3.292969207944561e-05,
+      "loss": 0.0533,
+      "step": 5000
+    },
+    {
+      "epoch": 2.33,
+      "learning_rate": 2.9574078798457334e-05,
+      "loss": 0.0498,
+      "step": 5500
+    },
+    {
+      "epoch": 2.54,
+      "learning_rate": 2.613053217868765e-05,
+      "loss": 0.0479,
+      "step": 6000
+    },
+    {
+      "epoch": 2.75,
+      "learning_rate": 2.2672159813612203e-05,
+      "loss": 0.0445,
+      "step": 6500
+    },
+    {
+      "epoch": 2.96,
+      "learning_rate": 1.925835994414427e-05,
+      "loss": 0.0429,
+      "step": 7000
+    },
+    {
+      "epoch": 3.17,
+      "learning_rate": 1.5948030836583748e-05,
+      "loss": 0.0348,
+      "step": 7500
+    },
+    {
+      "epoch": 3.38,
+      "learning_rate": 1.2811719253897084e-05,
+      "loss": 0.032,
+      "step": 8000
+    },
+    {
+      "epoch": 3.59,
+      "learning_rate": 9.909718505639284e-06,
+      "loss": 0.0335,
+      "step": 8500
+    },
+    {
+      "epoch": 3.81,
+      "learning_rate": 7.302717325477024e-06,
+      "loss": 0.0334,
+      "step": 9000
+    },
+    {
+      "epoch": 4.02,
+      "learning_rate": 5.030401317985792e-06,
+      "loss": 0.0309,
+      "step": 9500
+    },
+    {
+      "epoch": 4.23,
+      "learning_rate": 3.141986323924076e-06,
+      "loss": 0.0269,
+      "step": 10000
+    },
+    {
+      "epoch": 4.44,
+      "learning_rate": 1.6737757483597487e-06,
+      "loss": 0.0311,
+      "step": 10500
+    },
+    {
+      "epoch": 4.65,
+      "learning_rate": 6.539948719738204e-07,
+      "loss": 0.0303,
+      "step": 11000
+    },
+    {
+      "epoch": 4.86,
+      "learning_rate": 1.0287606124971538e-07,
+      "loss": 0.0325,
+      "step": 11500
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 11820,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "total_flos": 1.0019728060420915e+17,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-11820/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9b446cc14a4826cf3da183f238854503e14c55fce6c9fd91ae844a33bde459d0
+size 4664

classification_report.json ADDED Viewed

	@@ -0,0 +1 @@

+ {"0": {"precision": 0.9958119568631557, "recall": 0.9931084890884411, "f1-score": 0.9944583856127144, "support": 19154}, "1": {"precision": 0.9929502243110446, "recall": 0.9957155098543273, "f1-score": 0.9943309444860413, "support": 18672}, "accuracy": 0.9943953894146883, "macro avg": {"precision": 0.9943810905871002, "recall": 0.9944119994713843, "f1-score": 0.9943946650493778, "support": 37826}, "weighted avg": {"precision": 0.9943993234836543, "recall": 0.9943953894146883, "f1-score": 0.9943954770123538, "support": 37826}}

config.json ADDED Viewed

	@@ -0,0 +1,28 @@

+{
+  "_name_or_path": "distilroberta-base",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 6,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.35.0",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

confusion_matrix.png ADDED Viewed

detailed_confusion_matrix.png ADDED Viewed

fold_results.json ADDED Viewed

	@@ -0,0 +1,67 @@

+{
+    "0": {
+        "eval_loss": 0.4894842505455017,
+        "eval_precision": 0.797077839433895,
+        "eval_recall": 0.8385282776349614,
+        "eval_acc": 0.8149205593887964,
+        "eval_mcc": 0.6308544272382445,
+        "eval_f1": 0.8172778285266865,
+        "eval_auc": 0.9029118022996898,
+        "eval_runtime": 140.306,
+        "eval_samples_per_second": 269.604,
+        "eval_steps_per_second": 4.219,
+        "epoch": 5.0
+    },
+    "1": {
+        "eval_loss": 0.30189815163612366,
+        "eval_precision": 0.8898150560041678,
+        "eval_recall": 0.914738646101114,
+        "eval_acc": 0.9020012160626008,
+        "eval_mcc": 0.8043471347208236,
+        "eval_f1": 0.90210473499353,
+        "eval_auc": 0.9664702229053249,
+        "eval_runtime": 145.1802,
+        "eval_samples_per_second": 260.552,
+        "eval_steps_per_second": 4.078,
+        "epoch": 5.0
+    },
+    "2": {
+        "eval_loss": 0.13572567701339722,
+        "eval_precision": 0.9530286256523802,
+        "eval_recall": 0.9682395158266831,
+        "eval_acc": 0.9607677259028181,
+        "eval_mcc": 0.9216528289238667,
+        "eval_f1": 0.9605738575982997,
+        "eval_auc": 0.9932413748732483,
+        "eval_runtime": 146.7514,
+        "eval_samples_per_second": 257.756,
+        "eval_steps_per_second": 4.034,
+        "epoch": 5.0
+    },
+    "3": {
+        "eval_loss": 0.03292611241340637,
+        "eval_precision": 0.9882822902796272,
+        "eval_recall": 0.9937339331619537,
+        "eval_acc": 0.9910907841167451,
+        "eval_mcc": 0.9821944795487312,
+        "eval_f1": 0.9910006142014046,
+        "eval_auc": 0.9993099888344676,
+        "eval_runtime": 149.3977,
+        "eval_samples_per_second": 253.19,
+        "eval_steps_per_second": 3.963,
+        "epoch": 5.0
+    },
+    "4": {
+        "eval_loss": 0.021255388855934143,
+        "eval_precision": 0.9929502243110446,
+        "eval_recall": 0.9957155098543273,
+        "eval_acc": 0.9943953894146883,
+        "eval_mcc": 0.9887930895753908,
+        "eval_f1": 0.9943309444860413,
+        "eval_auc": 0.9996470227915908,
+        "eval_runtime": 152.3623,
+        "eval_samples_per_second": 248.264,
+        "eval_steps_per_second": 3.885,
+        "epoch": 5.0
+    }
+}

metrics.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"precision": 0.9929502243110446, "recall": 0.9957155098543273, "acc": 0.9943953894146883, "mcc": 0.9887930895753908, "f1": 0.9943309444860413, "auc": 0.9996470227915908}

metrics_all_fold.json ADDED Viewed

	@@ -0,0 +1,44 @@

+{
+    "precision": [
+        0.797077839433895,
+        0.8898150560041678,
+        0.9530286256523802,
+        0.9882822902796272,
+        0.9929502243110446
+    ],
+    "recall": [
+        0.8385282776349614,
+        0.914738646101114,
+        0.9682395158266831,
+        0.9937339331619537,
+        0.9957155098543273
+    ],
+    "f1": [
+        0.8172778285266865,
+        0.90210473499353,
+        0.9605738575982997,
+        0.9910006142014046,
+        0.9943309444860413
+    ],
+    "auc": [
+        0.9029118022996898,
+        0.9664702229053249,
+        0.9932413748732483,
+        0.9993099888344676,
+        0.9996470227915908
+    ],
+    "acc": [
+        0.8149205593887964,
+        0.9020012160626008,
+        0.9607677259028181,
+        0.9910907841167451,
+        0.9943953894146883
+    ],
+    "mcc": [
+        0.6308544272382445,
+        0.8043471347208236,
+        0.9216528289238667,
+        0.9821944795487312,
+        0.9887930895753908
+    ]
+}

metrics_ci_bounds.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+    "precision": {
+        "ci_lower": 0.8222052584794745,
+        "ci_upper": 1.0262563557929716
+    },
+    "recall": {
+        "ci_lower": 0.8595956350124584,
+        "ci_upper": 1.0247867180191574
+    },
+    "f1": {
+        "ci_lower": 0.8404890769938336,
+        "ci_upper": 1.0256261149285513
+    },
+    "auc": {
+        "ci_lower": 0.9212542173438407,
+        "ci_upper": 1.0233779473378881
+    },
+    "acc": {
+        "ci_lower": 0.8388545766959804,
+        "ci_upper": 1.0264156932582789
+    },
+    "mcc": {
+        "ci_lower": 0.6785236289948702,
+        "ci_upper": 1.0526131550079523
+    }
+}

metrics_mean.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "precision": 0.924230807136223,
+    "recall": 0.9421911765158079,
+    "f1": 0.9330575959611924,
+    "auc": 0.9723160823408644,
+    "acc": 0.9326351349771297,
+    "mcc": 0.8655683920014112
+}

metrics_std.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "precision": 0.08216840369402846,
+    "recall": 0.06652004215539391,
+    "f1": 0.07455198757576255,
+    "auc": 0.041123738040960776,
+    "acc": 0.07552812871824857,
+    "mcc": 0.15064040133009118
+}

metrics_visualisation.png ADDED Viewed

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a95ee069d4168c7d3365ca440c2f16dfcdc7efb7878bce98630282f3270c1705
+size 328492280

precision_recall_curve.png ADDED Viewed

reduced_main_data.csv ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:974465e69f61aeeb0bd35a58984cda3aa19211c1d4048e18c400c381a4787843
+size 739635171

roc_curve.png ADDED Viewed

test_data_for_future_evaluation.csv ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4329d38bcb602d54b1a5649f5c20dd5ddd5db16790961c4d2f1a0f9a8e3595cc
+size 132511279

test_top_repo_data.csv ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:934908191818388b67cd9e863630ee44be092075423ce9047fb3b8f25395ccd4
+size 18864191

top_repo_data.csv ADDED Viewed

The diff for this file is too large to render. See raw diff

tracker_carbon_statistics.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+    "cloud_provider": "",
+    "cloud_region": "",
+    "codecarbon_version": "2.3.4",
+    "country_iso_code": "NOR",
+    "country_name": "Norway",
+    "cpu_count": 192,
+    "cpu_energy": 0.2805582379736331,
+    "cpu_model": "AMD EPYC 7642 48-Core Processor",
+    "cpu_power": 13.170642692663874,
+    "duration": 23640.817118406296,
+    "emissions": 0.13423884939187516,
+    "emissions_rate": 5.678266056521343e-06,
+    "energy_consumed": 4.872553516946467,
+    "gpu_count": 4,
+    "gpu_energy": 2.0628040124641123,
+    "gpu_model": "4 x NVIDIA GeForce RTX 3090",
+    "gpu_power": 311.66423576058344,
+    "latitude": 59.955,
+    "longitude": 10.859,
+    "on_cloud": "N",
+    "os": "Linux-4.18.0-513.11.1.el8_9.x86_64-x86_64-with-glibc2.28",
+    "project_name": "codecarbon",
+    "pue": 1.0,
+    "python_version": "3.10.8",
+    "ram_energy": 2.5291912665087213,
+    "ram_power": 377.6938133239746,
+    "ram_total_size": 1007.1835021972656,
+    "region": "oslo county",
+    "run_id": "296b5fc3-192f-42d9-81b1-6fca1ee69702",
+    "timestamp": "2024-03-01T19:13:31",
+    "tracking_mode": "machine"
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9b446cc14a4826cf3da183f238854503e14c55fce6c9fd91ae844a33bde459d0
+size 4664