willherbert27/bert-combined-textbook

Browse files

Files changed (3) hide show

README.md +22 -22
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google-bert/bert-base-cased](https://huggingface.co/google-bert/bert-base-cased) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.5965
 ## Model description
@@ -35,7 +35,7 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 1e-05
-- train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
@@ -46,26 +46,26 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step  | Validation Loss |
 |:-------------:|:-----:|:-----:|:---------------:|
-| 2.2161        | 1.0   | 4936  | nan             |
-| 2.0531        | 2.0   | 9872  | 1.9590          |
-| 1.978         | 3.0   | 14808 | nan             |
-| 1.9616        | 4.0   | 19744 | nan             |
-| 1.8559        | 5.0   | 24680 | 1.8338          |
-| 1.7902        | 6.0   | 29616 | 1.7772          |
-| 1.7603        | 7.0   | 34552 | 1.7686          |
-| 1.769         | 8.0   | 39488 | 1.7368          |
-| 1.6527        | 9.0   | 44424 | nan             |
-| 1.65          | 10.0  | 49360 | 1.6888          |
-| 1.6281        | 11.0  | 54296 | nan             |
-| 1.591         | 12.0  | 59232 | 1.6576          |
-| 1.5508        | 13.0  | 64168 | nan             |
-| 1.5929        | 14.0  | 69104 | 1.6151          |
-| 1.5504        | 15.0  | 74040 | nan             |
-| 1.5492        | 16.0  | 78976 | 1.6250          |
-| 1.5488        | 17.0  | 83912 | 1.6311          |
-| 1.5152        | 18.0  | 88848 | nan             |
-| 1.5066        | 19.0  | 93784 | 1.5964          |
-| 1.4764        | 20.0  | 98720 | 1.5965          |
 ### Framework versions

 This model is a fine-tuned version of [google-bert/bert-base-cased](https://huggingface.co/google-bert/bert-base-cased) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.6464
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 1e-05
+- train_batch_size: 16
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 | Training Loss | Epoch | Step  | Validation Loss |
 |:-------------:|:-----:|:-----:|:---------------:|
+| 2.3141        | 1.0   | 2468  | 2.0738          |
+| 2.1063        | 2.0   | 4936  | 2.0016          |
+| 2.0241        | 3.0   | 7404  | 1.9165          |
+| 1.9769        | 4.0   | 9872  | nan             |
+| 1.897         | 5.0   | 12340 | 1.8370          |
+| 1.8501        | 6.0   | 14808 | 1.8046          |
+| 1.8182        | 7.0   | 17276 | 1.7854          |
+| 1.7648        | 8.0   | 19744 | 1.7328          |
+| 1.7409        | 9.0   | 22212 | 1.7238          |
+| 1.7486        | 10.0  | 24680 | 1.7043          |
+| 1.6753        | 11.0  | 27148 | 1.7076          |
+| 1.6833        | 12.0  | 29616 | 1.6704          |
+| 1.6684        | 13.0  | 32084 | 1.6873          |
+| 1.6092        | 14.0  | 34552 | 1.6702          |
+| 1.6077        | 15.0  | 37020 | 1.6972          |
+| 1.6271        | 16.0  | 39488 | 1.6379          |
+| 1.6159        | 17.0  | 41956 | 1.6624          |
+| 1.5678        | 18.0  | 44424 | 1.6646          |
+| 1.5857        | 19.0  | 46892 | 1.6290          |
+| 1.5741        | 20.0  | 49360 | 1.6464          |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6ea802980df924fe7ea3b4c5c293932c490f8d6edfe4235a9fa53f6ffdb32178
 size 433386912

 version https://git-lfs.github.com/spec/v1
+oid sha256:f9a09133de17c960c4b4becdc9437ccd0cb097cf25ef295baae1891d24e71a49
 size 433386912

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:97e91b3e0388343c1ca5d355d889e3d6c34031cdf90f9b95e8fbbd5cf04885f6
 size 4475

 version https://git-lfs.github.com/spec/v1
+oid sha256:03ce4d44123b36c72fefade7afea1a807d7db0f8476dd2f43f9d7ce6049eac09
 size 4475