Recag
/

Bharatai-v-2

Text Generation

BharataiForCausalLM

Model card Files Files and versions

Recag commited on Dec 4, 2023

Commit

053a765

·

1 Parent(s): 55d908a

Upload BharataiForCausalLM

Files changed (3) hide show

config.json +6 -1
model.py +1 -1
model.safetensors +1 -1

config.json CHANGED Viewed

@@ -1,8 +1,12 @@
 {
   "attention_bias": false,
   "attention_dropout": 0.0,
   "auto_map": {
-    "AutoConfig": "config.BharataiConfig"
   },
   "bos_token_id": 1,
   "eos_token_id": 2,
@@ -20,6 +24,7 @@
   "rope_scaling": null,
   "rope_theta": 10000.0,
   "tie_word_embeddings": false,
   "transformers_version": "4.36.0.dev0",
   "use_cache": true,
   "vocab_size": 5000

 {
+  "architectures": [
+    "BharataiForCausalLM"
+  ],
   "attention_bias": false,
   "attention_dropout": 0.0,
   "auto_map": {
+    "AutoConfig": "config.BharataiConfig",
+    "AutoModelForCausalLM": "model.BharataiForCausalLM"
   },
   "bos_token_id": 1,
   "eos_token_id": 2,
   "rope_scaling": null,
   "rope_theta": 10000.0,
   "tie_word_embeddings": false,
+  "torch_dtype": "float32",
   "transformers_version": "4.36.0.dev0",
   "use_cache": true,
   "vocab_size": 5000

model.py CHANGED Viewed

@@ -1218,4 +1218,4 @@ class BharataiForSequenceClassification(BharataiPreTrainedModel):
             past_key_values=transformer_outputs.past_key_values,
             hidden_states=transformer_outputs.hidden_states,
             attentions=transformer_outputs.attentions,
-        )

             past_key_values=transformer_outputs.past_key_values,
             hidden_states=transformer_outputs.hidden_states,
             attentions=transformer_outputs.attentions,
+        )

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7faefd0d75ecc53d6b11cd4afc72a43dc1d5465163bcdefbdd5ef9cbc29d8948
 size 595142768

 version https://git-lfs.github.com/spec/v1
+oid sha256:d979701fe48484e0a277a01296f98140cd6e786359d9b1d5273ba24a1377f8af
 size 595142768