End of training

Browse files

Files changed (4) hide show

README.md +103 -23
model.safetensors +1 -1
runs/Apr02_01-49-49_d536b201e3f7/events.out.tfevents.1712022590.d536b201e3f7.208.5 +3 -0
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -1,8 +1,8 @@
 ---
 license: apache-2.0
 tags:
 - generated_from_trainer
-base_model: distilbert/distilgpt2
 model-index:
 - name: MiniProject_Prescription_Chatbot
   results: []
@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [distilbert/distilgpt2](https://huggingface.co/distilbert/distilgpt2) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 3.4693
 ## Model description
@@ -40,32 +40,112 @@ The following hyperparameters were used during training:
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 20.0
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| No log        | 1.0   | 10   | 3.7086          |
-| No log        | 2.0   | 20   | 3.6408          |
-| No log        | 3.0   | 30   | 3.5992          |
-| No log        | 4.0   | 40   | 3.5599          |
-| No log        | 5.0   | 50   | 3.5313          |
-| No log        | 6.0   | 60   | 3.5170          |
-| No log        | 7.0   | 70   | 3.5049          |
-| No log        | 8.0   | 80   | 3.4880          |
-| No log        | 9.0   | 90   | 3.4896          |
-| No log        | 10.0  | 100  | 3.4722          |
-| No log        | 11.0  | 110  | 3.4717          |
-| No log        | 12.0  | 120  | 3.4714          |
-| No log        | 13.0  | 130  | 3.4662          |
-| No log        | 14.0  | 140  | 3.4620          |
-| No log        | 15.0  | 150  | 3.4627          |
-| No log        | 16.0  | 160  | 3.4661          |
-| No log        | 17.0  | 170  | 3.4693          |
-| No log        | 18.0  | 180  | 3.4697          |
-| No log        | 19.0  | 190  | 3.4684          |
-| No log        | 20.0  | 200  | 3.4693          |
 ### Framework versions

 ---
 license: apache-2.0
+base_model: distilbert/distilgpt2
 tags:
 - generated_from_trainer
 model-index:
 - name: MiniProject_Prescription_Chatbot
   results: []
 This model is a fine-tuned version of [distilbert/distilgpt2](https://huggingface.co/distilbert/distilgpt2) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 4.7032
 ## Model description
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 100
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| No log        | 1.0   | 10   | 3.4660          |
+| No log        | 2.0   | 20   | 3.4891          |
+| No log        | 3.0   | 30   | 3.4953          |
+| No log        | 4.0   | 40   | 3.5052          |
+| No log        | 5.0   | 50   | 3.5185          |
+| No log        | 6.0   | 60   | 3.5524          |
+| No log        | 7.0   | 70   | 3.5385          |
+| No log        | 8.0   | 80   | 3.5735          |
+| No log        | 9.0   | 90   | 3.5777          |
+| No log        | 10.0  | 100  | 3.5964          |
+| No log        | 11.0  | 110  | 3.6150          |
+| No log        | 12.0  | 120  | 3.6228          |
+| No log        | 13.0  | 130  | 3.6513          |
+| No log        | 14.0  | 140  | 3.6463          |
+| No log        | 15.0  | 150  | 3.7043          |
+| No log        | 16.0  | 160  | 3.6930          |
+| No log        | 17.0  | 170  | 3.7220          |
+| No log        | 18.0  | 180  | 3.7353          |
+| No log        | 19.0  | 190  | 3.7855          |
+| No log        | 20.0  | 200  | 3.7626          |
+| No log        | 21.0  | 210  | 3.8130          |
+| No log        | 22.0  | 220  | 3.8215          |
+| No log        | 23.0  | 230  | 3.8350          |
+| No log        | 24.0  | 240  | 3.8692          |
+| No log        | 25.0  | 250  | 3.8832          |
+| No log        | 26.0  | 260  | 3.9128          |
+| No log        | 27.0  | 270  | 3.9191          |
+| No log        | 28.0  | 280  | 3.9653          |
+| No log        | 29.0  | 290  | 3.9743          |
+| No log        | 30.0  | 300  | 4.0078          |
+| No log        | 31.0  | 310  | 3.9850          |
+| No log        | 32.0  | 320  | 4.0363          |
+| No log        | 33.0  | 330  | 4.0254          |
+| No log        | 34.0  | 340  | 4.0554          |
+| No log        | 35.0  | 350  | 4.0768          |
+| No log        | 36.0  | 360  | 4.0785          |
+| No log        | 37.0  | 370  | 4.1056          |
+| No log        | 38.0  | 380  | 4.1224          |
+| No log        | 39.0  | 390  | 4.1539          |
+| No log        | 40.0  | 400  | 4.1457          |
+| No log        | 41.0  | 410  | 4.1998          |
+| No log        | 42.0  | 420  | 4.2190          |
+| No log        | 43.0  | 430  | 4.2188          |
+| No log        | 44.0  | 440  | 4.2462          |
+| No log        | 45.0  | 450  | 4.2509          |
+| No log        | 46.0  | 460  | 4.2763          |
+| No log        | 47.0  | 470  | 4.3198          |
+| No log        | 48.0  | 480  | 4.3034          |
+| No log        | 49.0  | 490  | 4.3255          |
+| 1.8667        | 50.0  | 500  | 4.3399          |
+| 1.8667        | 51.0  | 510  | 4.3529          |
+| 1.8667        | 52.0  | 520  | 4.3660          |
+| 1.8667        | 53.0  | 530  | 4.3998          |
+| 1.8667        | 54.0  | 540  | 4.3952          |
+| 1.8667        | 55.0  | 550  | 4.4336          |
+| 1.8667        | 56.0  | 560  | 4.4153          |
+| 1.8667        | 57.0  | 570  | 4.4583          |
+| 1.8667        | 58.0  | 580  | 4.4434          |
+| 1.8667        | 59.0  | 590  | 4.4514          |
+| 1.8667        | 60.0  | 600  | 4.5067          |
+| 1.8667        | 61.0  | 610  | 4.5001          |
+| 1.8667        | 62.0  | 620  | 4.5002          |
+| 1.8667        | 63.0  | 630  | 4.5109          |
+| 1.8667        | 64.0  | 640  | 4.5240          |
+| 1.8667        | 65.0  | 650  | 4.5265          |
+| 1.8667        | 66.0  | 660  | 4.5662          |
+| 1.8667        | 67.0  | 670  | 4.5540          |
+| 1.8667        | 68.0  | 680  | 4.5560          |
+| 1.8667        | 69.0  | 690  | 4.5660          |
+| 1.8667        | 70.0  | 700  | 4.5804          |
+| 1.8667        | 71.0  | 710  | 4.5797          |
+| 1.8667        | 72.0  | 720  | 4.6063          |
+| 1.8667        | 73.0  | 730  | 4.6016          |
+| 1.8667        | 74.0  | 740  | 4.6091          |
+| 1.8667        | 75.0  | 750  | 4.6332          |
+| 1.8667        | 76.0  | 760  | 4.6250          |
+| 1.8667        | 77.0  | 770  | 4.6156          |
+| 1.8667        | 78.0  | 780  | 4.6387          |
+| 1.8667        | 79.0  | 790  | 4.6566          |
+| 1.8667        | 80.0  | 800  | 4.6411          |
+| 1.8667        | 81.0  | 810  | 4.6496          |
+| 1.8667        | 82.0  | 820  | 4.6546          |
+| 1.8667        | 83.0  | 830  | 4.6493          |
+| 1.8667        | 84.0  | 840  | 4.6483          |
+| 1.8667        | 85.0  | 850  | 4.6678          |
+| 1.8667        | 86.0  | 860  | 4.6828          |
+| 1.8667        | 87.0  | 870  | 4.6867          |
+| 1.8667        | 88.0  | 880  | 4.6817          |
+| 1.8667        | 89.0  | 890  | 4.6893          |
+| 1.8667        | 90.0  | 900  | 4.6989          |
+| 1.8667        | 91.0  | 910  | 4.6918          |
+| 1.8667        | 92.0  | 920  | 4.6895          |
+| 1.8667        | 93.0  | 930  | 4.6907          |
+| 1.8667        | 94.0  | 940  | 4.6905          |
+| 1.8667        | 95.0  | 950  | 4.6959          |
+| 1.8667        | 96.0  | 960  | 4.6987          |
+| 1.8667        | 97.0  | 970  | 4.7011          |
+| 1.8667        | 98.0  | 980  | 4.7027          |
+| 1.8667        | 99.0  | 990  | 4.7031          |
+| 0.9294        | 100.0 | 1000 | 4.7032          |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:62a7f75360582754ea26989555343baf0c530a04b98942f747c9013abec6cff3
 size 327657928

 version https://git-lfs.github.com/spec/v1
+oid sha256:8b98d4941f96ae619095a55cff215b1c3c86405c6482543c91ad68efe8b0c368
 size 327657928

runs/Apr02_01-49-49_d536b201e3f7/events.out.tfevents.1712022590.d536b201e3f7.208.5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e9f173013c6f4175a70d7fdd1ca4ba3b96eedcd3a0b69c23742ed943b115d62b
+size 32804

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:69e2a0a5a45021f2225544aaad9b1c55732be09ff7acc9878bb6b943be86c555
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:1b8d7566a399bd7f2b0264b124994d5f5da043ef12defe54d9d05a2885d33625
 size 4920