Upload TFBertForSequenceClassification

Files changed (3) hide show

README.md CHANGED Viewed

@@ -11,11 +11,9 @@ probably proofread and complete it, then remove this comment. -->
 # pretrained-m-bert
-This model is a fine-tuned version of [](https://huggingface.co/) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Train Loss: 10.1160
-- Validation Loss: 10.8236
-- Epoch: 0
 ## Model description
@@ -34,14 +32,11 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- optimizer: {'name': 'Adam', 'learning_rate': 1e-04, 'decay': 0.0, 'beta_1': 0.9, 'beta_2': 0.999, 'epsilon': 1e-07, 'amsgrad': False}
 - training_precision: float32
 ### Training results
-| Train Loss | Validation Loss | Epoch |
-|:----------:|:---------------:|:-----:|
-| 10.1160    | 10.8236         | 0     |
 ### Framework versions

 # pretrained-m-bert
+This model is a fine-tuned version of [amrisaurus/pretrained-bert](https://huggingface.co/amrisaurus/pretrained-bert) on an unknown dataset.
 It achieves the following results on the evaluation set:
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- optimizer: None
 - training_precision: float32
 ### Training results
 ### Framework versions

config.json CHANGED Viewed

@@ -1,10 +1,11 @@
 {
   "architectures": [
-    "BertForPreTraining"
   ],
   "attention_probs_dropout_prob": 0.1,
   "classifier_dropout": null,
-  "directionality": "bidi",
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
   "hidden_size": 768,
@@ -16,14 +17,9 @@
   "num_attention_heads": 12,
   "num_hidden_layers": 12,
   "pad_token_id": 0,
-  "pooler_fc_size": 768,
-  "pooler_num_attention_heads": 12,
-  "pooler_num_fc_layers": 3,
-  "pooler_size_per_head": 128,
-  "pooler_type": "first_token_transform",
   "position_embedding_type": "absolute",
   "transformers_version": "4.27.0.dev0",
   "type_vocab_size": 2,
   "use_cache": true,
-  "vocab_size": 119547
 }

 {
+  "_name_or_path": "amrisaurus/pretrained-bert",
   "architectures": [
+    "BertForSequenceClassification"
   ],
   "attention_probs_dropout_prob": 0.1,
   "classifier_dropout": null,
+  "gradient_checkpointing": false,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
   "hidden_size": 768,
   "num_attention_heads": 12,
   "num_hidden_layers": 12,
   "pad_token_id": 0,
   "position_embedding_type": "absolute",
   "transformers_version": "4.27.0.dev0",
   "type_vocab_size": 2,
   "use_cache": true,
+  "vocab_size": 28996
 }

tf_model.h5 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b573265165f9ebd90738aafd5c372b5135530ef6fdab1b028b02c31c04df0d08
-size 1083389236

 version https://git-lfs.github.com/spec/v1
+oid sha256:e90af7ce7c9c09806d77bfb6d0ce6f7d12b7f4993cb3e7f8f460d9b5b90e06af
+size 433535320