pradeep4321
/

model2

@@ -14,9 +14,9 @@ probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [gpt2](https://huggingface.co/gpt2) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Train Loss: 3.5158
-- Validation Loss: 6.4256
-- Epoch: 49
 ## Model description
@@ -42,56 +42,106 @@ The following hyperparameters were used during training:
 | Train Loss | Validation Loss | Epoch |
 |:----------:|:---------------:|:-----:|
-| 7.2465     | 7.5143          | 0     |
-| 7.1890     | 7.4800          | 1     |
-| 7.1104     | 7.4496          | 2     |
-| 7.0491     | 7.4218          | 3     |
-| 7.0064     | 7.3964          | 4     |
-| 6.9428     | 7.3732          | 5     |
-| 6.9061     | 7.3505          | 6     |
-| 6.8538     | 7.3301          | 7     |
-| 6.7857     | 7.3108          | 8     |
-| 6.7253     | 7.2893          | 9     |
-| 6.6743     | 7.2693          | 10    |
-| 6.5944     | 7.2491          | 11    |
-| 6.5499     | 7.2288          | 12    |
-| 6.4767     | 7.2084          | 13    |
-| 6.4145     | 7.1887          | 14    |
-| 6.3713     | 7.1664          | 15    |
-| 6.2863     | 7.1450          | 16    |
-| 6.2017     | 7.1229          | 17    |
-| 6.1524     | 7.1017          | 18    |
-| 6.0841     | 7.0788          | 19    |
-| 5.9643     | 7.0540          | 20    |
-| 5.9225     | 7.0365          | 21    |
-| 5.8569     | 7.0151          | 22    |
-| 5.7639     | 6.9941          | 23    |
-| 5.6801     | 6.9732          | 24    |
-| 5.5930     | 6.9537          | 25    |
-| 5.5279     | 6.9410          | 26    |
-| 5.4268     | 6.9139          | 27    |
-| 5.3621     | 6.8950          | 28    |
-| 5.2726     | 6.8795          | 29    |
-| 5.1767     | 6.8652          | 30    |
-| 5.0694     | 6.8448          | 31    |
-| 4.9900     | 6.8524          | 32    |
-| 4.8658     | 6.8038          | 33    |
-| 4.7845     | 6.8157          | 34    |
-| 4.7204     | 6.7753          | 35    |
-| 4.6609     | 6.7670          | 36    |
-| 4.5092     | 6.7305          | 37    |
-| 4.4266     | 6.7136          | 38    |
-| 4.3334     | 6.6761          | 39    |
-| 4.1928     | 6.6554          | 40    |
-| 4.1157     | 6.6311          | 41    |
-| 4.0755     | 6.6162          | 42    |
-| 4.0072     | 6.5830          | 43    |
-| 3.8881     | 6.5423          | 44    |
-| 3.7678     | 6.5271          | 45    |
-| 3.6915     | 6.4925          | 46    |
-| 3.6772     | 6.4618          | 47    |
-| 3.5962     | 6.4445          | 48    |
-| 3.5158     | 6.4256          | 49    |
 ### Framework versions

 This model is a fine-tuned version of [gpt2](https://huggingface.co/gpt2) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Train Loss: 0.7652
+- Validation Loss: 5.5941
+- Epoch: 99
 ## Model description
 | Train Loss | Validation Loss | Epoch |
 |:----------:|:---------------:|:-----:|
+| 3.4440     | 6.3917          | 0     |
+| 3.4011     | 6.3744          | 1     |
+| 3.3080     | 6.3398          | 2     |
+| 3.1988     | 6.3392          | 3     |
+| 3.1543     | 6.2950          | 4     |
+| 3.1246     | 6.2795          | 5     |
+| 3.0182     | 6.2569          | 6     |
+| 2.9706     | 6.2238          | 7     |
+| 2.9353     | 6.2055          | 8     |
+| 2.8828     | 6.1995          | 9     |
+| 2.8187     | 6.1703          | 10    |
+| 2.8116     | 6.1570          | 11    |
+| 2.7118     | 6.1329          | 12    |
+| 2.6847     | 6.1232          | 13    |
+| 2.5602     | 6.1206          | 14    |
+| 2.5477     | 6.0860          | 15    |
+| 2.5032     | 6.0694          | 16    |
+| 2.4366     | 6.0671          | 17    |
+| 2.4570     | 6.0441          | 18    |
+| 2.3515     | 6.0281          | 19    |
+| 2.3095     | 6.0236          | 20    |
+| 2.2707     | 6.0046          | 21    |
+| 2.2307     | 6.0047          | 22    |
+| 2.2420     | 5.9822          | 23    |
+| 2.1877     | 5.9821          | 24    |
+| 2.1529     | 5.9695          | 25    |
+| 2.1017     | 5.9491          | 26    |
+| 2.0531     | 5.9321          | 27    |
+| 2.0368     | 5.9264          | 28    |
+| 1.9904     | 5.8998          | 29    |
+| 1.9361     | 5.8969          | 30    |
+| 1.8996     | 5.8903          | 31    |
+| 1.8659     | 5.8584          | 32    |
+| 1.8632     | 5.8600          | 33    |
+| 1.8212     | 5.8541          | 34    |
+| 1.7985     | 5.8355          | 35    |
+| 1.7606     | 5.8375          | 36    |
+| 1.7477     | 5.8386          | 37    |
+| 1.7227     | 5.8048          | 38    |
+| 1.6932     | 5.7964          | 39    |
+| 1.6661     | 5.8007          | 40    |
+| 1.6619     | 5.7988          | 41    |
+| 1.5900     | 5.7883          | 42    |
+| 1.5415     | 5.7777          | 43    |
+| 1.5588     | 5.7713          | 44    |
+| 1.5399     | 5.7631          | 45    |
+| 1.5140     | 5.7631          | 46    |
+| 1.4937     | 5.7553          | 47    |
+| 1.5147     | 5.7406          | 48    |
+| 1.4266     | 5.7349          | 49    |
+| 1.4252     | 5.7405          | 50    |
+| 1.3933     | 5.7348          | 51    |
+| 1.4023     | 5.7215          | 52    |
+| 1.3401     | 5.7227          | 53    |
+| 1.3143     | 5.7167          | 54    |
+| 1.3144     | 5.7003          | 55    |
+| 1.2713     | 5.7020          | 56    |
+| 1.2799     | 5.7082          | 57    |
+| 1.2838     | 5.6978          | 58    |
+| 1.2470     | 5.6985          | 59    |
+| 1.2221     | 5.7085          | 60    |
+| 1.2011     | 5.6839          | 61    |
+| 1.1714     | 5.6601          | 62    |
+| 1.2091     | 5.6667          | 63    |
+| 1.1699     | 5.6733          | 64    |
+| 1.1445     | 5.6703          | 65    |
+| 1.1000     | 5.6558          | 66    |
+| 1.1695     | 5.6495          | 67    |
+| 1.0887     | 5.6600          | 68    |
+| 1.0687     | 5.6746          | 69    |
+| 1.0707     | 5.6642          | 70    |
+| 1.0540     | 5.6388          | 71    |
+| 1.0631     | 5.6357          | 72    |
+| 1.0715     | 5.6466          | 73    |
+| 1.0207     | 5.6451          | 74    |
+| 1.0022     | 5.6403          | 75    |
+| 1.0054     | 5.6351          | 76    |
+| 0.9940     | 5.6329          | 77    |
+| 0.9626     | 5.6395          | 78    |
+| 0.9546     | 5.6376          | 79    |
+| 0.9911     | 5.6295          | 80    |
+| 0.9299     | 5.6289          | 81    |
+| 0.9670     | 5.6176          | 82    |
+| 0.9488     | 5.6055          | 83    |
+| 0.9189     | 5.6171          | 84    |
+| 0.9037     | 5.6366          | 85    |
+| 0.8709     | 5.6191          | 86    |
+| 0.8831     | 5.6023          | 87    |
+| 0.8548     | 5.6089          | 88    |
+| 0.8604     | 5.6212          | 89    |
+| 0.8613     | 5.6210          | 90    |
+| 0.8719     | 5.6093          | 91    |
+| 0.8374     | 5.6026          | 92    |
+| 0.8557     | 5.5959          | 93    |
+| 0.8125     | 5.5987          | 94    |
+| 0.7930     | 5.6022          | 95    |
+| 0.7937     | 5.6002          | 96    |
+| 0.8035     | 5.5926          | 97    |
+| 0.7795     | 5.5938          | 98    |
+| 0.7652     | 5.5941          | 99    |
 ### Framework versions

tf_model.h5 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:97d8278d8ee76028d8f565047ab81a0118c7c37838be4fbf5f08c94d519b6276
 size 351244368

 version https://git-lfs.github.com/spec/v1
+oid sha256:972e095d63574cd92abe582465c0eb354bccce299f9c2c59813e838309f6bda9
 size 351244368