Upload folder using huggingface_hub

Browse files

Files changed (11) hide show

config.json +35 -0
model.safetensors +3 -0
optimizer.pt +3 -0
rng_state.pth +3 -0
scheduler.pt +3 -0
special_tokens_map.json +7 -0
tokenizer.json +0 -0
tokenizer_config.json +58 -0
trainer_state.json +369 -0
training_args.bin +3 -0
vocab.txt +0 -0

config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.3,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.3,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "positive",
+    "1": "neutral",
+    "2": "negative"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "negative": 2,
+    "neutral": 1,
+    "positive": 0
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.51.3",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1deb9be85df5cf2caebaf89eb96edf2726065eaa82ed65a98977f951b9a359de
+size 437961724

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:39babeebdf045a0667104ca81277d52c20a3c02a286ae7cadc068f15e0b946a5
+size 876039307

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:44dcd01f34bcb1442f88d5e0041a9b57f83bc68bda81b16db67500d575523285
+size 14455

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:97c7b7b7b107f6d3c881356e647fadedace35248f4a6a75c5720b5b2fa06ee6e
+size 1465

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,58 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": true,
+  "extra_special_tokens": {},
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,369 @@

+{
+  "best_global_step": 872,
+  "best_metric": 0.8792872839502528,
+  "best_model_checkpoint": "finbert-news\\checkpoint-872",
+  "epoch": 8.0,
+  "eval_steps": 500,
+  "global_step": 872,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.22935779816513763,
+      "grad_norm": 14.148714065551758,
+      "learning_rate": 5.4545454545454545e-06,
+      "loss": 1.4992,
+      "step": 25
+    },
+    {
+      "epoch": 0.45871559633027525,
+      "grad_norm": 3.876201629638672,
+      "learning_rate": 1.1136363636363637e-05,
+      "loss": 1.1135,
+      "step": 50
+    },
+    {
+      "epoch": 0.6880733944954128,
+      "grad_norm": 5.878354072570801,
+      "learning_rate": 1.681818181818182e-05,
+      "loss": 1.0131,
+      "step": 75
+    },
+    {
+      "epoch": 0.9174311926605505,
+      "grad_norm": 8.439997673034668,
+      "learning_rate": 1.999028701591291e-05,
+      "loss": 0.9438,
+      "step": 100
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.6847545219638242,
+      "eval_best_tau": 0.3,
+      "eval_f1": 0.676566431827065,
+      "eval_loss": 0.7978772521018982,
+      "eval_runtime": 25.6096,
+      "eval_samples_per_second": 15.111,
+      "eval_steps_per_second": 0.508,
+      "step": 109
+    },
+    {
+      "epoch": 1.146788990825688,
+      "grad_norm": 11.146471977233887,
+      "learning_rate": 1.9896130185675263e-05,
+      "loss": 0.8281,
+      "step": 125
+    },
+    {
+      "epoch": 1.3761467889908257,
+      "grad_norm": 13.593254089355469,
+      "learning_rate": 1.9702741799106508e-05,
+      "loss": 0.7709,
+      "step": 150
+    },
+    {
+      "epoch": 1.6055045871559632,
+      "grad_norm": 18.543376922607422,
+      "learning_rate": 1.9412061021336404e-05,
+      "loss": 0.6926,
+      "step": 175
+    },
+    {
+      "epoch": 1.834862385321101,
+      "grad_norm": 8.12672233581543,
+      "learning_rate": 1.9027002598375012e-05,
+      "loss": 0.7276,
+      "step": 200
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.7829457364341085,
+      "eval_best_tau": 0.3,
+      "eval_f1": 0.7652186280745745,
+      "eval_loss": 0.5902541875839233,
+      "eval_runtime": 26.2346,
+      "eval_samples_per_second": 14.752,
+      "eval_steps_per_second": 0.496,
+      "step": 218
+    },
+    {
+      "epoch": 2.0642201834862384,
+      "grad_norm": 19.604272842407227,
+      "learning_rate": 1.8551427630053464e-05,
+      "loss": 0.6274,
+      "step": 225
+    },
+    {
+      "epoch": 2.293577981651376,
+      "grad_norm": 14.275187492370605,
+      "learning_rate": 1.7990104853582494e-05,
+      "loss": 0.5545,
+      "step": 250
+    },
+    {
+      "epoch": 2.522935779816514,
+      "grad_norm": 5.522476673126221,
+      "learning_rate": 1.7348662825950356e-05,
+      "loss": 0.6335,
+      "step": 275
+    },
+    {
+      "epoch": 2.7522935779816513,
+      "grad_norm": 13.290278434753418,
+      "learning_rate": 1.6633533484642104e-05,
+      "loss": 0.5528,
+      "step": 300
+    },
+    {
+      "epoch": 2.981651376146789,
+      "grad_norm": 11.074273109436035,
+      "learning_rate": 1.5851887652614238e-05,
+      "loss": 0.5402,
+      "step": 325
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.8268733850129198,
+      "eval_best_tau": 0.3,
+      "eval_f1": 0.815201593241898,
+      "eval_loss": 0.49993327260017395,
+      "eval_runtime": 26.1993,
+      "eval_samples_per_second": 14.771,
+      "eval_steps_per_second": 0.496,
+      "step": 327
+    },
+    {
+      "epoch": 3.2110091743119265,
+      "grad_norm": 11.70258617401123,
+      "learning_rate": 1.5011563134236408e-05,
+      "loss": 0.4388,
+      "step": 350
+    },
+    {
+      "epoch": 3.4403669724770642,
+      "grad_norm": 15.00348949432373,
+      "learning_rate": 1.4120986123204257e-05,
+      "loss": 0.3964,
+      "step": 375
+    },
+    {
+      "epoch": 3.669724770642202,
+      "grad_norm": 13.193717002868652,
+      "learning_rate": 1.3189086710490649e-05,
+      "loss": 0.424,
+      "step": 400
+    },
+    {
+      "epoch": 3.8990825688073394,
+      "grad_norm": 17.48609161376953,
+      "learning_rate": 1.2225209339563144e-05,
+      "loss": 0.4301,
+      "step": 425
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.8604651162790697,
+      "eval_best_tau": 0.3,
+      "eval_f1": 0.8555597375519169,
+      "eval_loss": 0.4141731262207031,
+      "eval_runtime": 25.6623,
+      "eval_samples_per_second": 15.08,
+      "eval_steps_per_second": 0.507,
+      "step": 436
+    },
+    {
+      "epoch": 4.128440366972477,
+      "grad_norm": 29.30590057373047,
+      "learning_rate": 1.1239019106760909e-05,
+      "loss": 0.3741,
+      "step": 450
+    },
+    {
+      "epoch": 4.3577981651376145,
+      "grad_norm": 12.956811904907227,
+      "learning_rate": 1.024040484638617e-05,
+      "loss": 0.3516,
+      "step": 475
+    },
+    {
+      "epoch": 4.587155963302752,
+      "grad_norm": 13.52210807800293,
+      "learning_rate": 9.239379972305992e-06,
+      "loss": 0.3391,
+      "step": 500
+    },
+    {
+      "epoch": 4.81651376146789,
+      "grad_norm": 15.72844123840332,
+      "learning_rate": 8.245982070356186e-06,
+      "loss": 0.312,
+      "step": 525
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.8811369509043928,
+      "eval_best_tau": 0.3,
+      "eval_f1": 0.8760670434788734,
+      "eval_loss": 0.3646778464317322,
+      "eval_runtime": 25.7825,
+      "eval_samples_per_second": 15.01,
+      "eval_steps_per_second": 0.504,
+      "step": 545
+    },
+    {
+      "epoch": 5.045871559633028,
+      "grad_norm": 13.13558578491211,
+      "learning_rate": 7.270172248365468e-06,
+      "loss": 0.3204,
+      "step": 550
+    },
+    {
+      "epoch": 5.275229357798165,
+      "grad_norm": 14.52351188659668,
+      "learning_rate": 6.321735253048214e-06,
+      "loss": 0.2749,
+      "step": 575
+    },
+    {
+      "epoch": 5.504587155963303,
+      "grad_norm": 11.246268272399902,
+      "learning_rate": 5.410181355324622e-06,
+      "loss": 0.2962,
+      "step": 600
+    },
+    {
+      "epoch": 5.73394495412844,
+      "grad_norm": 21.78761100769043,
+      "learning_rate": 4.544650987894515e-06,
+      "loss": 0.2512,
+      "step": 625
+    },
+    {
+      "epoch": 5.963302752293578,
+      "grad_norm": 14.13925552368164,
+      "learning_rate": 3.733823091293274e-06,
+      "loss": 0.2983,
+      "step": 650
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.8837209302325582,
+      "eval_best_tau": 0.3,
+      "eval_f1": 0.8773838929062463,
+      "eval_loss": 0.37674975395202637,
+      "eval_runtime": 26.3938,
+      "eval_samples_per_second": 14.663,
+      "eval_steps_per_second": 0.493,
+      "step": 654
+    },
+    {
+      "epoch": 6.192660550458716,
+      "grad_norm": 6.343225002288818,
+      "learning_rate": 2.9858280874723833e-06,
+      "loss": 0.266,
+      "step": 675
+    },
+    {
+      "epoch": 6.422018348623853,
+      "grad_norm": 16.15406036376953,
+      "learning_rate": 2.3081663535453736e-06,
+      "loss": 0.2446,
+      "step": 700
+    },
+    {
+      "epoch": 6.651376146788991,
+      "grad_norm": 12.924860000610352,
+      "learning_rate": 1.7076330131880525e-06,
+      "loss": 0.2401,
+      "step": 725
+    },
+    {
+      "epoch": 6.8807339449541285,
+      "grad_norm": 13.268035888671875,
+      "learning_rate": 1.1902497998330065e-06,
+      "loss": 0.2426,
+      "step": 750
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.8811369509043928,
+      "eval_best_tau": 0.3,
+      "eval_f1": 0.8763676520557254,
+      "eval_loss": 0.3656945824623108,
+      "eval_runtime": 25.7215,
+      "eval_samples_per_second": 15.046,
+      "eval_steps_per_second": 0.505,
+      "step": 763
+    },
+    {
+      "epoch": 7.110091743119266,
+      "grad_norm": 4.727287769317627,
+      "learning_rate": 7.612046748871327e-07,
+      "loss": 0.2214,
+      "step": 775
+    },
+    {
+      "epoch": 7.339449541284404,
+      "grad_norm": 10.04178524017334,
+      "learning_rate": 4.247998064389458e-07,
+      "loss": 0.1936,
+      "step": 800
+    },
+    {
+      "epoch": 7.568807339449541,
+      "grad_norm": 24.02179527282715,
+      "learning_rate": 1.844084300893456e-07,
+      "loss": 0.2567,
+      "step": 825
+    },
+    {
+      "epoch": 7.798165137614679,
+      "grad_norm": 7.141385555267334,
+      "learning_rate": 4.244102447555909e-08,
+      "loss": 0.1959,
+      "step": 850
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.8837209302325582,
+      "eval_best_tau": 0.3,
+      "eval_f1": 0.8792872839502528,
+      "eval_loss": 0.3580004572868347,
+      "eval_runtime": 26.2238,
+      "eval_samples_per_second": 14.758,
+      "eval_steps_per_second": 0.496,
+      "step": 872
+    }
+  ],
+  "logging_steps": 25,
+  "max_steps": 872,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 8,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 2,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 1832848067893248.0,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3d6ec71644c6b78e2400d55adb6f12088c3cc76e753a8f44c30ed0fe2d93fcdf
+size 5649

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff