Waggerra
/

classifier

Text Generation

text-generation-inference

Model card Files Files and versions

Waggerra commited on Jan 17, 2025

Commit

1b7e469

·

verified ·

1 Parent(s): b445666

Update config.json

Files changed (1) hide show

config.json +13 -28

config.json CHANGED Viewed

@@ -1,29 +1,14 @@
 {
-    "model_config": {
-        "architectures": ["BloomForCausalLM"],
-        "model_type": "phi",
-        "name": "Waggerra/classifier",
-        "base_model": "microsoft/phi-3",
-        "fine_tuned": true
-    },
-    "inference_config": {
-        "temperature": 0.7,
-        "top_p": 0.9,
-        "max_length": 2048,
-        "do_sample": true
-    },
-    "training_config": {
-        "learning_rate": 2e-5,
-        "num_train_epochs": 3,
-        "per_device_train_batch_size": 4,
-        "gradient_accumulation_steps": 4
-    },
-    "metadata": {
-        "author": "Waggerra",
-        "model_name": "classifier",
-        "description": "Phi-3 3B model fine-tuned for classification tasks",
-        "tags": ["classification", "phi-3", "fine-tuned"],
-        "license": "mit",
-        "language": ["en"]
-    }
-}

 {
+    "architectures": [
+        "BloomForCausalLM"
+    ],
+    "vocab_size": 50257,
+    "hidden_size": 4096,
+    "tie_word_embeddings": true,
+    "n_layer": 30,
+    "hidden_dropout": 0.0,
+    "layer_norm_epsilon": 1e-05,
+    "n_head": 32,
+    "attention_dropout": 0.0,
+    "model_type": "bloom"
+}