new

Browse files

Files changed (16) hide show

bert_sentiment_model/checkpoint-10252/model.safetensors +1 -1
bert_sentiment_model/checkpoint-10252/optimizer.pt +1 -1
bert_sentiment_model/checkpoint-10252/trainer_state.json +49 -49
bert_sentiment_model/checkpoint-10252/training_args.bin +1 -1
bert_sentiment_model/checkpoint-15378/model.safetensors +1 -1
bert_sentiment_model/checkpoint-15378/optimizer.pt +1 -1
bert_sentiment_model/checkpoint-15378/trainer_state.json +73 -73
bert_sentiment_model/checkpoint-15378/training_args.bin +1 -1
bert_sentiment_model/checkpoint-5126/model.safetensors +1 -1
bert_sentiment_model/checkpoint-5126/optimizer.pt +1 -1
bert_sentiment_model/checkpoint-5126/trainer_state.json +26 -26
bert_sentiment_model/checkpoint-5126/training_args.bin +1 -1
bert_sentiment_model/runs/{Nov22_15-25-42_0db92e0bbeed/events.out.tfevents.1763825143.0db92e0bbeed.48.0 → Nov23_06-43-46_010a7f9e6512/events.out.tfevents.1763880227.010a7f9e6512.48.0} +1 -1
lstm_model.keras +1 -1
tokenizer.pickle → lstm_tokenizer.pickle +2 -2
tfidf_vectorizer.pkl +1 -1

bert_sentiment_model/checkpoint-10252/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:873e0bfc4370c12d3d114845be4849002d2871bc76ff75ef1a25526addb6008d
 size 267835644

 version https://git-lfs.github.com/spec/v1
+oid sha256:45f05fef0c477156a0ee0355c569be98ea80244f4e2c86194707b971086dbba6
 size 267835644

bert_sentiment_model/checkpoint-10252/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7ce435dc5353a073f95c1258305b3f4eaf966a71d457368b94b343212f087bc9
 size 535733434

 version https://git-lfs.github.com/spec/v1
+oid sha256:4e08d2d6e825e0432082a9a0f7f907decfe780f3cad7ed2d1fc00c0e2cfefff2
 size 535733434

bert_sentiment_model/checkpoint-10252/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "best_global_step": 5126,
-  "best_metric": 0.14533720910549164,
   "best_model_checkpoint": "bert_sentiment_model/checkpoint-5126",
   "epoch": 2.0,
   "eval_steps": 500,
@@ -11,160 +11,160 @@
   "log_history": [
     {
       "epoch": 0.09754194303550527,
-      "grad_norm": 1.0485230684280396,
       "learning_rate": 1.9351020939003774e-05,
-      "loss": 0.2321,
       "step": 500
     },
     {
       "epoch": 0.19508388607101054,
-      "grad_norm": 3.7028684616088867,
       "learning_rate": 1.870074131876707e-05,
-      "loss": 0.1714,
       "step": 1000
     },
     {
       "epoch": 0.2926258291065158,
-      "grad_norm": 0.6240711212158203,
       "learning_rate": 1.805046169853037e-05,
-      "loss": 0.1624,
       "step": 1500
     },
     {
       "epoch": 0.3901677721420211,
-      "grad_norm": 1.1150747537612915,
       "learning_rate": 1.7400182078293668e-05,
-      "loss": 0.1627,
       "step": 2000
     },
     {
       "epoch": 0.4877097151775263,
-      "grad_norm": 0.31245458126068115,
       "learning_rate": 1.6749902458056965e-05,
-      "loss": 0.1477,
       "step": 2500
     },
     {
       "epoch": 0.5852516582130316,
-      "grad_norm": 1.4625613689422607,
       "learning_rate": 1.6099622837820262e-05,
-      "loss": 0.1574,
       "step": 3000
     },
     {
       "epoch": 0.6827936012485368,
-      "grad_norm": 0.7397491931915283,
       "learning_rate": 1.5449343217583563e-05,
-      "loss": 0.146,
       "step": 3500
     },
     {
       "epoch": 0.7803355442840422,
-      "grad_norm": 3.28501033782959,
       "learning_rate": 1.4799063597346861e-05,
-      "loss": 0.1471,
       "step": 4000
     },
     {
       "epoch": 0.8778774873195474,
-      "grad_norm": 5.020526885986328,
       "learning_rate": 1.4148783977110158e-05,
-      "loss": 0.1509,
       "step": 4500
     },
     {
       "epoch": 0.9754194303550526,
-      "grad_norm": 3.897925615310669,
       "learning_rate": 1.3498504356873457e-05,
-      "loss": 0.1454,
       "step": 5000
     },
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.9512789875393206,
-      "eval_loss": 0.14533720910549164,
-      "eval_runtime": 74.7449,
-      "eval_samples_per_second": 548.653,
-      "eval_steps_per_second": 17.152,
       "step": 5126
     },
     {
       "epoch": 1.0729613733905579,
-      "grad_norm": 1.9805785417556763,
       "learning_rate": 1.2848224736636754e-05,
-      "loss": 0.13,
       "step": 5500
     },
     {
       "epoch": 1.1705033164260632,
-      "grad_norm": 1.3755881786346436,
       "learning_rate": 1.2197945116400054e-05,
-      "loss": 0.1276,
       "step": 6000
     },
     {
       "epoch": 1.2680452594615685,
-      "grad_norm": 3.5536131858825684,
       "learning_rate": 1.1547665496163351e-05,
       "loss": 0.1185,
       "step": 6500
     },
     {
       "epoch": 1.3655872024970737,
-      "grad_norm": 1.3367644548416138,
       "learning_rate": 1.089738587592665e-05,
-      "loss": 0.1262,
       "step": 7000
     },
     {
       "epoch": 1.463129145532579,
-      "grad_norm": 3.0645148754119873,
       "learning_rate": 1.0247106255689946e-05,
-      "loss": 0.1253,
       "step": 7500
     },
     {
       "epoch": 1.5606710885680841,
-      "grad_norm": 0.6243263483047485,
       "learning_rate": 9.596826635453245e-06,
-      "loss": 0.1209,
       "step": 8000
     },
     {
       "epoch": 1.6582130316035895,
-      "grad_norm": 4.116105556488037,
       "learning_rate": 8.946547015216544e-06,
       "loss": 0.1242,
       "step": 8500
     },
     {
       "epoch": 1.7557549746390948,
-      "grad_norm": 4.457709789276123,
       "learning_rate": 8.296267394979842e-06,
-      "loss": 0.1267,
       "step": 9000
     },
     {
       "epoch": 1.8532969176746001,
-      "grad_norm": 0.8020169734954834,
       "learning_rate": 7.64598777474314e-06,
-      "loss": 0.1289,
       "step": 9500
     },
     {
       "epoch": 1.9508388607101055,
-      "grad_norm": 3.107414722442627,
       "learning_rate": 6.995708154506439e-06,
-      "loss": 0.1166,
       "step": 10000
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.9529371601355799,
-      "eval_loss": 0.1457434594631195,
-      "eval_runtime": 74.98,
-      "eval_samples_per_second": 546.933,
-      "eval_steps_per_second": 17.098,
       "step": 10252
     }
   ],

 {
   "best_global_step": 5126,
+  "best_metric": 0.14522501826286316,
   "best_model_checkpoint": "bert_sentiment_model/checkpoint-5126",
   "epoch": 2.0,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.09754194303550527,
+      "grad_norm": 0.7001327872276306,
       "learning_rate": 1.9351020939003774e-05,
+      "loss": 0.2293,
       "step": 500
     },
     {
       "epoch": 0.19508388607101054,
+      "grad_norm": 4.297205924987793,
       "learning_rate": 1.870074131876707e-05,
+      "loss": 0.1698,
       "step": 1000
     },
     {
       "epoch": 0.2926258291065158,
+      "grad_norm": 1.2200896739959717,
       "learning_rate": 1.805046169853037e-05,
+      "loss": 0.1634,
       "step": 1500
     },
     {
       "epoch": 0.3901677721420211,
+      "grad_norm": 1.0850228071212769,
       "learning_rate": 1.7400182078293668e-05,
+      "loss": 0.1635,
       "step": 2000
     },
     {
       "epoch": 0.4877097151775263,
+      "grad_norm": 0.29681870341300964,
       "learning_rate": 1.6749902458056965e-05,
+      "loss": 0.1485,
       "step": 2500
     },
     {
       "epoch": 0.5852516582130316,
+      "grad_norm": 1.5155694484710693,
       "learning_rate": 1.6099622837820262e-05,
+      "loss": 0.1566,
       "step": 3000
     },
     {
       "epoch": 0.6827936012485368,
+      "grad_norm": 0.7628584504127502,
       "learning_rate": 1.5449343217583563e-05,
+      "loss": 0.1469,
       "step": 3500
     },
     {
       "epoch": 0.7803355442840422,
+      "grad_norm": 2.7121143341064453,
       "learning_rate": 1.4799063597346861e-05,
+      "loss": 0.1467,
       "step": 4000
     },
     {
       "epoch": 0.8778774873195474,
+      "grad_norm": 4.958296298980713,
       "learning_rate": 1.4148783977110158e-05,
+      "loss": 0.1512,
       "step": 4500
     },
     {
       "epoch": 0.9754194303550526,
+      "grad_norm": 3.2470967769622803,
       "learning_rate": 1.3498504356873457e-05,
+      "loss": 0.1445,
       "step": 5000
     },
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.9502548221122192,
+      "eval_loss": 0.14522501826286316,
+      "eval_runtime": 77.7071,
+      "eval_samples_per_second": 527.738,
+      "eval_steps_per_second": 16.498,
       "step": 5126
     },
     {
       "epoch": 1.0729613733905579,
+      "grad_norm": 1.8167076110839844,
       "learning_rate": 1.2848224736636754e-05,
+      "loss": 0.1307,
       "step": 5500
     },
     {
       "epoch": 1.1705033164260632,
+      "grad_norm": 1.4334732294082642,
       "learning_rate": 1.2197945116400054e-05,
+      "loss": 0.1273,
       "step": 6000
     },
     {
       "epoch": 1.2680452594615685,
+      "grad_norm": 3.130772590637207,
       "learning_rate": 1.1547665496163351e-05,
       "loss": 0.1185,
       "step": 6500
     },
     {
       "epoch": 1.3655872024970737,
+      "grad_norm": 1.2805956602096558,
       "learning_rate": 1.089738587592665e-05,
+      "loss": 0.1254,
       "step": 7000
     },
     {
       "epoch": 1.463129145532579,
+      "grad_norm": 6.393189907073975,
       "learning_rate": 1.0247106255689946e-05,
+      "loss": 0.1246,
       "step": 7500
     },
     {
       "epoch": 1.5606710885680841,
+      "grad_norm": 0.682952880859375,
       "learning_rate": 9.596826635453245e-06,
+      "loss": 0.1213,
       "step": 8000
     },
     {
       "epoch": 1.6582130316035895,
+      "grad_norm": 3.8420190811157227,
       "learning_rate": 8.946547015216544e-06,
       "loss": 0.1242,
       "step": 8500
     },
     {
       "epoch": 1.7557549746390948,
+      "grad_norm": 5.53094482421875,
       "learning_rate": 8.296267394979842e-06,
+      "loss": 0.1266,
       "step": 9000
     },
     {
       "epoch": 1.8532969176746001,
+      "grad_norm": 2.091581344604492,
       "learning_rate": 7.64598777474314e-06,
+      "loss": 0.1296,
       "step": 9500
     },
     {
       "epoch": 1.9508388607101055,
+      "grad_norm": 1.8294498920440674,
       "learning_rate": 6.995708154506439e-06,
+      "loss": 0.1175,
       "step": 10000
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.9524006925309079,
+      "eval_loss": 0.147334024310112,
+      "eval_runtime": 77.7359,
+      "eval_samples_per_second": 527.543,
+      "eval_steps_per_second": 16.492,
       "step": 10252
     }
   ],

bert_sentiment_model/checkpoint-10252/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:821493876e4c41dba842c49ce5fab3b065233a721a9d4cedcdac3b251c6aa960
 size 5368

 version https://git-lfs.github.com/spec/v1
+oid sha256:0bef23a9df09a87b02e3a926fa1cef1d6042ebe2dff78b46cbd238fd398f8e34
 size 5368

bert_sentiment_model/checkpoint-15378/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:68b0a910bf6f5c17ac24cb683004cc4075d767dc2160f7b643cacd7ac667869d
 size 267835644

 version https://git-lfs.github.com/spec/v1
+oid sha256:969b24c73843c7220531eedd087942b39833f2227968cc49ec78d6308e3699c9
 size 267835644

bert_sentiment_model/checkpoint-15378/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5a00717569fd9026ec62b066c6023adbd6790e5956d07de6ad2c7fb500848cb2
 size 535733434

 version https://git-lfs.github.com/spec/v1
+oid sha256:3be434bcf8328bcaf1237acdb938faaaa0f5498001aa4866aabb6186e812dd8a
 size 535733434

bert_sentiment_model/checkpoint-15378/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "best_global_step": 5126,
-  "best_metric": 0.14533720910549164,
   "best_model_checkpoint": "bert_sentiment_model/checkpoint-5126",
   "epoch": 3.0,
   "eval_steps": 500,
@@ -11,239 +11,239 @@
   "log_history": [
     {
       "epoch": 0.09754194303550527,
-      "grad_norm": 1.0485230684280396,
       "learning_rate": 1.9351020939003774e-05,
-      "loss": 0.2321,
       "step": 500
     },
     {
       "epoch": 0.19508388607101054,
-      "grad_norm": 3.7028684616088867,
       "learning_rate": 1.870074131876707e-05,
-      "loss": 0.1714,
       "step": 1000
     },
     {
       "epoch": 0.2926258291065158,
-      "grad_norm": 0.6240711212158203,
       "learning_rate": 1.805046169853037e-05,
-      "loss": 0.1624,
       "step": 1500
     },
     {
       "epoch": 0.3901677721420211,
-      "grad_norm": 1.1150747537612915,
       "learning_rate": 1.7400182078293668e-05,
-      "loss": 0.1627,
       "step": 2000
     },
     {
       "epoch": 0.4877097151775263,
-      "grad_norm": 0.31245458126068115,
       "learning_rate": 1.6749902458056965e-05,
-      "loss": 0.1477,
       "step": 2500
     },
     {
       "epoch": 0.5852516582130316,
-      "grad_norm": 1.4625613689422607,
       "learning_rate": 1.6099622837820262e-05,
-      "loss": 0.1574,
       "step": 3000
     },
     {
       "epoch": 0.6827936012485368,
-      "grad_norm": 0.7397491931915283,
       "learning_rate": 1.5449343217583563e-05,
-      "loss": 0.146,
       "step": 3500
     },
     {
       "epoch": 0.7803355442840422,
-      "grad_norm": 3.28501033782959,
       "learning_rate": 1.4799063597346861e-05,
-      "loss": 0.1471,
       "step": 4000
     },
     {
       "epoch": 0.8778774873195474,
-      "grad_norm": 5.020526885986328,
       "learning_rate": 1.4148783977110158e-05,
-      "loss": 0.1509,
       "step": 4500
     },
     {
       "epoch": 0.9754194303550526,
-      "grad_norm": 3.897925615310669,
       "learning_rate": 1.3498504356873457e-05,
-      "loss": 0.1454,
       "step": 5000
     },
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.9512789875393206,
-      "eval_loss": 0.14533720910549164,
-      "eval_runtime": 74.7449,
-      "eval_samples_per_second": 548.653,
-      "eval_steps_per_second": 17.152,
       "step": 5126
     },
     {
       "epoch": 1.0729613733905579,
-      "grad_norm": 1.9805785417556763,
       "learning_rate": 1.2848224736636754e-05,
-      "loss": 0.13,
       "step": 5500
     },
     {
       "epoch": 1.1705033164260632,
-      "grad_norm": 1.3755881786346436,
       "learning_rate": 1.2197945116400054e-05,
-      "loss": 0.1276,
       "step": 6000
     },
     {
       "epoch": 1.2680452594615685,
-      "grad_norm": 3.5536131858825684,
       "learning_rate": 1.1547665496163351e-05,
       "loss": 0.1185,
       "step": 6500
     },
     {
       "epoch": 1.3655872024970737,
-      "grad_norm": 1.3367644548416138,
       "learning_rate": 1.089738587592665e-05,
-      "loss": 0.1262,
       "step": 7000
     },
     {
       "epoch": 1.463129145532579,
-      "grad_norm": 3.0645148754119873,
       "learning_rate": 1.0247106255689946e-05,
-      "loss": 0.1253,
       "step": 7500
     },
     {
       "epoch": 1.5606710885680841,
-      "grad_norm": 0.6243263483047485,
       "learning_rate": 9.596826635453245e-06,
-      "loss": 0.1209,
       "step": 8000
     },
     {
       "epoch": 1.6582130316035895,
-      "grad_norm": 4.116105556488037,
       "learning_rate": 8.946547015216544e-06,
       "loss": 0.1242,
       "step": 8500
     },
     {
       "epoch": 1.7557549746390948,
-      "grad_norm": 4.457709789276123,
       "learning_rate": 8.296267394979842e-06,
-      "loss": 0.1267,
       "step": 9000
     },
     {
       "epoch": 1.8532969176746001,
-      "grad_norm": 0.8020169734954834,
       "learning_rate": 7.64598777474314e-06,
-      "loss": 0.1289,
       "step": 9500
     },
     {
       "epoch": 1.9508388607101055,
-      "grad_norm": 3.107414722442627,
       "learning_rate": 6.995708154506439e-06,
-      "loss": 0.1166,
       "step": 10000
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.9529371601355799,
-      "eval_loss": 0.1457434594631195,
-      "eval_runtime": 74.98,
-      "eval_samples_per_second": 546.933,
-      "eval_steps_per_second": 17.098,
       "step": 10252
     },
     {
       "epoch": 2.048380803745611,
-      "grad_norm": 1.5238676071166992,
       "learning_rate": 6.345428534269737e-06,
-      "loss": 0.1146,
       "step": 10500
     },
     {
       "epoch": 2.1459227467811157,
-      "grad_norm": 0.5615836977958679,
       "learning_rate": 5.695148914033035e-06,
-      "loss": 0.0978,
       "step": 11000
     },
     {
       "epoch": 2.243464689816621,
-      "grad_norm": 2.8565406799316406,
       "learning_rate": 5.044869293796333e-06,
-      "loss": 0.1008,
       "step": 11500
     },
     {
       "epoch": 2.3410066328521264,
-      "grad_norm": 0.9610119462013245,
       "learning_rate": 4.394589673559631e-06,
-      "loss": 0.1066,
       "step": 12000
     },
     {
       "epoch": 2.4385485758876317,
-      "grad_norm": 5.30699348449707,
       "learning_rate": 3.7443100533229294e-06,
       "loss": 0.1002,
       "step": 12500
     },
     {
       "epoch": 2.536090518923137,
-      "grad_norm": 3.4920408725738525,
       "learning_rate": 3.0940304330862276e-06,
-      "loss": 0.0966,
       "step": 13000
     },
     {
       "epoch": 2.6336324619586424,
-      "grad_norm": 1.7962068319320679,
       "learning_rate": 2.4437508128495254e-06,
-      "loss": 0.1044,
       "step": 13500
     },
     {
       "epoch": 2.7311744049941473,
-      "grad_norm": 1.224229097366333,
       "learning_rate": 1.7934711926128236e-06,
-      "loss": 0.0972,
       "step": 14000
     },
     {
       "epoch": 2.8287163480296527,
-      "grad_norm": 1.4311927556991577,
       "learning_rate": 1.1431915723761218e-06,
-      "loss": 0.1059,
       "step": 14500
     },
     {
       "epoch": 2.926258291065158,
-      "grad_norm": 0.935365617275238,
       "learning_rate": 4.9291195213942e-07,
-      "loss": 0.1074,
       "step": 15000
     },
     {
       "epoch": 3.0,
-      "eval_accuracy": 0.9533273183935234,
-      "eval_loss": 0.15521423518657684,
-      "eval_runtime": 74.605,
-      "eval_samples_per_second": 549.682,
-      "eval_steps_per_second": 17.184,
       "step": 15378
     }
   ],

 {
   "best_global_step": 5126,
+  "best_metric": 0.14522501826286316,
   "best_model_checkpoint": "bert_sentiment_model/checkpoint-5126",
   "epoch": 3.0,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.09754194303550527,
+      "grad_norm": 0.7001327872276306,
       "learning_rate": 1.9351020939003774e-05,
+      "loss": 0.2293,
       "step": 500
     },
     {
       "epoch": 0.19508388607101054,
+      "grad_norm": 4.297205924987793,
       "learning_rate": 1.870074131876707e-05,
+      "loss": 0.1698,
       "step": 1000
     },
     {
       "epoch": 0.2926258291065158,
+      "grad_norm": 1.2200896739959717,
       "learning_rate": 1.805046169853037e-05,
+      "loss": 0.1634,
       "step": 1500
     },
     {
       "epoch": 0.3901677721420211,
+      "grad_norm": 1.0850228071212769,
       "learning_rate": 1.7400182078293668e-05,
+      "loss": 0.1635,
       "step": 2000
     },
     {
       "epoch": 0.4877097151775263,
+      "grad_norm": 0.29681870341300964,
       "learning_rate": 1.6749902458056965e-05,
+      "loss": 0.1485,
       "step": 2500
     },
     {
       "epoch": 0.5852516582130316,
+      "grad_norm": 1.5155694484710693,
       "learning_rate": 1.6099622837820262e-05,
+      "loss": 0.1566,
       "step": 3000
     },
     {
       "epoch": 0.6827936012485368,
+      "grad_norm": 0.7628584504127502,
       "learning_rate": 1.5449343217583563e-05,
+      "loss": 0.1469,
       "step": 3500
     },
     {
       "epoch": 0.7803355442840422,
+      "grad_norm": 2.7121143341064453,
       "learning_rate": 1.4799063597346861e-05,
+      "loss": 0.1467,
       "step": 4000
     },
     {
       "epoch": 0.8778774873195474,
+      "grad_norm": 4.958296298980713,
       "learning_rate": 1.4148783977110158e-05,
+      "loss": 0.1512,
       "step": 4500
     },
     {
       "epoch": 0.9754194303550526,
+      "grad_norm": 3.2470967769622803,
       "learning_rate": 1.3498504356873457e-05,
+      "loss": 0.1445,
       "step": 5000
     },
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.9502548221122192,
+      "eval_loss": 0.14522501826286316,
+      "eval_runtime": 77.7071,
+      "eval_samples_per_second": 527.738,
+      "eval_steps_per_second": 16.498,
       "step": 5126
     },
     {
       "epoch": 1.0729613733905579,
+      "grad_norm": 1.8167076110839844,
       "learning_rate": 1.2848224736636754e-05,
+      "loss": 0.1307,
       "step": 5500
     },
     {
       "epoch": 1.1705033164260632,
+      "grad_norm": 1.4334732294082642,
       "learning_rate": 1.2197945116400054e-05,
+      "loss": 0.1273,
       "step": 6000
     },
     {
       "epoch": 1.2680452594615685,
+      "grad_norm": 3.130772590637207,
       "learning_rate": 1.1547665496163351e-05,
       "loss": 0.1185,
       "step": 6500
     },
     {
       "epoch": 1.3655872024970737,
+      "grad_norm": 1.2805956602096558,
       "learning_rate": 1.089738587592665e-05,
+      "loss": 0.1254,
       "step": 7000
     },
     {
       "epoch": 1.463129145532579,
+      "grad_norm": 6.393189907073975,
       "learning_rate": 1.0247106255689946e-05,
+      "loss": 0.1246,
       "step": 7500
     },
     {
       "epoch": 1.5606710885680841,
+      "grad_norm": 0.682952880859375,
       "learning_rate": 9.596826635453245e-06,
+      "loss": 0.1213,
       "step": 8000
     },
     {
       "epoch": 1.6582130316035895,
+      "grad_norm": 3.8420190811157227,
       "learning_rate": 8.946547015216544e-06,
       "loss": 0.1242,
       "step": 8500
     },
     {
       "epoch": 1.7557549746390948,
+      "grad_norm": 5.53094482421875,
       "learning_rate": 8.296267394979842e-06,
+      "loss": 0.1266,
       "step": 9000
     },
     {
       "epoch": 1.8532969176746001,
+      "grad_norm": 2.091581344604492,
       "learning_rate": 7.64598777474314e-06,
+      "loss": 0.1296,
       "step": 9500
     },
     {
       "epoch": 1.9508388607101055,
+      "grad_norm": 1.8294498920440674,
       "learning_rate": 6.995708154506439e-06,
+      "loss": 0.1175,
       "step": 10000
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.9524006925309079,
+      "eval_loss": 0.147334024310112,
+      "eval_runtime": 77.7359,
+      "eval_samples_per_second": 527.543,
+      "eval_steps_per_second": 16.492,
       "step": 10252
     },
     {
       "epoch": 2.048380803745611,
+      "grad_norm": 0.9975255727767944,
       "learning_rate": 6.345428534269737e-06,
+      "loss": 0.1142,
       "step": 10500
     },
     {
       "epoch": 2.1459227467811157,
+      "grad_norm": 0.9234778881072998,
       "learning_rate": 5.695148914033035e-06,
+      "loss": 0.0986,
       "step": 11000
     },
     {
       "epoch": 2.243464689816621,
+      "grad_norm": 2.015749216079712,
       "learning_rate": 5.044869293796333e-06,
+      "loss": 0.1014,
       "step": 11500
     },
     {
       "epoch": 2.3410066328521264,
+      "grad_norm": 1.0170682668685913,
       "learning_rate": 4.394589673559631e-06,
+      "loss": 0.1075,
       "step": 12000
     },
     {
       "epoch": 2.4385485758876317,
+      "grad_norm": 4.830516815185547,
       "learning_rate": 3.7443100533229294e-06,
       "loss": 0.1002,
       "step": 12500
     },
     {
       "epoch": 2.536090518923137,
+      "grad_norm": 4.4720377922058105,
       "learning_rate": 3.0940304330862276e-06,
+      "loss": 0.0968,
       "step": 13000
     },
     {
       "epoch": 2.6336324619586424,
+      "grad_norm": 1.8125988245010376,
       "learning_rate": 2.4437508128495254e-06,
+      "loss": 0.1053,
       "step": 13500
     },
     {
       "epoch": 2.7311744049941473,
+      "grad_norm": 2.168368101119995,
       "learning_rate": 1.7934711926128236e-06,
+      "loss": 0.0984,
       "step": 14000
     },
     {
       "epoch": 2.8287163480296527,
+      "grad_norm": 1.9152271747589111,
       "learning_rate": 1.1431915723761218e-06,
+      "loss": 0.1065,
       "step": 14500
     },
     {
       "epoch": 2.926258291065158,
+      "grad_norm": 1.1602133512496948,
       "learning_rate": 4.9291195213942e-07,
+      "loss": 0.1058,
       "step": 15000
     },
     {
       "epoch": 3.0,
+      "eval_accuracy": 0.9531322392645517,
+      "eval_loss": 0.1548861563205719,
+      "eval_runtime": 77.3477,
+      "eval_samples_per_second": 530.19,
+      "eval_steps_per_second": 16.575,
       "step": 15378
     }
   ],

bert_sentiment_model/checkpoint-15378/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:821493876e4c41dba842c49ce5fab3b065233a721a9d4cedcdac3b251c6aa960
 size 5368

 version https://git-lfs.github.com/spec/v1
+oid sha256:0bef23a9df09a87b02e3a926fa1cef1d6042ebe2dff78b46cbd238fd398f8e34
 size 5368

bert_sentiment_model/checkpoint-5126/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dec3328f2136cd119e3e22196d97cfabe5f711be78842ec0fe551baad38456b0
 size 267835644

 version https://git-lfs.github.com/spec/v1
+oid sha256:6bfabd5bd5d8b50816a72f021346d8f92e6559146162f66ea47e8af3d8239663
 size 267835644

bert_sentiment_model/checkpoint-5126/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e60f8ba4cc8d1bca385deeba83bf27f0b2d3b9c39e8de40068d97b0d194fc21b
 size 535733434

 version https://git-lfs.github.com/spec/v1
+oid sha256:7dc5d01664fff60d7e83241bc732fb15b5a9a0c1df8024101d648b6104539c65
 size 535733434

bert_sentiment_model/checkpoint-5126/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "best_global_step": 5126,
-  "best_metric": 0.14533720910549164,
   "best_model_checkpoint": "bert_sentiment_model/checkpoint-5126",
   "epoch": 1.0,
   "eval_steps": 500,
@@ -11,81 +11,81 @@
   "log_history": [
     {
       "epoch": 0.09754194303550527,
-      "grad_norm": 1.0485230684280396,
       "learning_rate": 1.9351020939003774e-05,
-      "loss": 0.2321,
       "step": 500
     },
     {
       "epoch": 0.19508388607101054,
-      "grad_norm": 3.7028684616088867,
       "learning_rate": 1.870074131876707e-05,
-      "loss": 0.1714,
       "step": 1000
     },
     {
       "epoch": 0.2926258291065158,
-      "grad_norm": 0.6240711212158203,
       "learning_rate": 1.805046169853037e-05,
-      "loss": 0.1624,
       "step": 1500
     },
     {
       "epoch": 0.3901677721420211,
-      "grad_norm": 1.1150747537612915,
       "learning_rate": 1.7400182078293668e-05,
-      "loss": 0.1627,
       "step": 2000
     },
     {
       "epoch": 0.4877097151775263,
-      "grad_norm": 0.31245458126068115,
       "learning_rate": 1.6749902458056965e-05,
-      "loss": 0.1477,
       "step": 2500
     },
     {
       "epoch": 0.5852516582130316,
-      "grad_norm": 1.4625613689422607,
       "learning_rate": 1.6099622837820262e-05,
-      "loss": 0.1574,
       "step": 3000
     },
     {
       "epoch": 0.6827936012485368,
-      "grad_norm": 0.7397491931915283,
       "learning_rate": 1.5449343217583563e-05,
-      "loss": 0.146,
       "step": 3500
     },
     {
       "epoch": 0.7803355442840422,
-      "grad_norm": 3.28501033782959,
       "learning_rate": 1.4799063597346861e-05,
-      "loss": 0.1471,
       "step": 4000
     },
     {
       "epoch": 0.8778774873195474,
-      "grad_norm": 5.020526885986328,
       "learning_rate": 1.4148783977110158e-05,
-      "loss": 0.1509,
       "step": 4500
     },
     {
       "epoch": 0.9754194303550526,
-      "grad_norm": 3.897925615310669,
       "learning_rate": 1.3498504356873457e-05,
-      "loss": 0.1454,
       "step": 5000
     },
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.9512789875393206,
-      "eval_loss": 0.14533720910549164,
-      "eval_runtime": 74.7449,
-      "eval_samples_per_second": 548.653,
-      "eval_steps_per_second": 17.152,
       "step": 5126
     }
   ],

 {
   "best_global_step": 5126,
+  "best_metric": 0.14522501826286316,
   "best_model_checkpoint": "bert_sentiment_model/checkpoint-5126",
   "epoch": 1.0,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.09754194303550527,
+      "grad_norm": 0.7001327872276306,
       "learning_rate": 1.9351020939003774e-05,
+      "loss": 0.2293,
       "step": 500
     },
     {
       "epoch": 0.19508388607101054,
+      "grad_norm": 4.297205924987793,
       "learning_rate": 1.870074131876707e-05,
+      "loss": 0.1698,
       "step": 1000
     },
     {
       "epoch": 0.2926258291065158,
+      "grad_norm": 1.2200896739959717,
       "learning_rate": 1.805046169853037e-05,
+      "loss": 0.1634,
       "step": 1500
     },
     {
       "epoch": 0.3901677721420211,
+      "grad_norm": 1.0850228071212769,
       "learning_rate": 1.7400182078293668e-05,
+      "loss": 0.1635,
       "step": 2000
     },
     {
       "epoch": 0.4877097151775263,
+      "grad_norm": 0.29681870341300964,
       "learning_rate": 1.6749902458056965e-05,
+      "loss": 0.1485,
       "step": 2500
     },
     {
       "epoch": 0.5852516582130316,
+      "grad_norm": 1.5155694484710693,
       "learning_rate": 1.6099622837820262e-05,
+      "loss": 0.1566,
       "step": 3000
     },
     {
       "epoch": 0.6827936012485368,
+      "grad_norm": 0.7628584504127502,
       "learning_rate": 1.5449343217583563e-05,
+      "loss": 0.1469,
       "step": 3500
     },
     {
       "epoch": 0.7803355442840422,
+      "grad_norm": 2.7121143341064453,
       "learning_rate": 1.4799063597346861e-05,
+      "loss": 0.1467,
       "step": 4000
     },
     {
       "epoch": 0.8778774873195474,
+      "grad_norm": 4.958296298980713,
       "learning_rate": 1.4148783977110158e-05,
+      "loss": 0.1512,
       "step": 4500
     },
     {
       "epoch": 0.9754194303550526,
+      "grad_norm": 3.2470967769622803,
       "learning_rate": 1.3498504356873457e-05,
+      "loss": 0.1445,
       "step": 5000
     },
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.9502548221122192,
+      "eval_loss": 0.14522501826286316,
+      "eval_runtime": 77.7071,
+      "eval_samples_per_second": 527.738,
+      "eval_steps_per_second": 16.498,
       "step": 5126
     }
   ],

bert_sentiment_model/checkpoint-5126/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:821493876e4c41dba842c49ce5fab3b065233a721a9d4cedcdac3b251c6aa960
 size 5368

 version https://git-lfs.github.com/spec/v1
+oid sha256:0bef23a9df09a87b02e3a926fa1cef1d6042ebe2dff78b46cbd238fd398f8e34
 size 5368

bert_sentiment_model/runs/{Nov22_15-25-42_0db92e0bbeed/events.out.tfevents.1763825143.0db92e0bbeed.48.0 → Nov23_06-43-46_010a7f9e6512/events.out.tfevents.1763880227.010a7f9e6512.48.0} RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:722143b2b87a2fa3bee692b56d80fb7ca82226bfd46543009ef47db25caece7c
 size 12660

 version https://git-lfs.github.com/spec/v1
+oid sha256:bc7b837e644ca3a40eb6a6c7628bfea2c578369bac6aa7808bcb675aea001d91
 size 12660

lstm_model.keras CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ae7cc154c422d9a844884d821176f4702f054bd25bc940a75d0ed8f5861d1f6e
 size 33928028

 version https://git-lfs.github.com/spec/v1
+oid sha256:7544f463eeaa33ae7572edb6328f22ab4305ffc3071761caddf5eea89d577b16
 size 33928028

tokenizer.pickle → lstm_tokenizer.pickle RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:21e4fd61bb2bccd17a7fa7cf3d3d4bfd11152717e35c7bc22be7d005183dbada
-size 467490

 version https://git-lfs.github.com/spec/v1
+oid sha256:f9424507a7b1583b0466691aa520b3d4977f77237c89c51cc9d18ee693b4110e
+size 1546136

tfidf_vectorizer.pkl CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:098fb11fbad95b6e55cfe4233c13eff78fc2ac3ade0c6ec86d2d849553adcdff
 size 1244923

 version https://git-lfs.github.com/spec/v1
+oid sha256:24915c16f607a8c931c095cda107118bb24c14b0bf539a7553eefae0842900af
 size 1244923