optimum-intel-internal-testing
/

tiny-random-aya-base

Model card Files Files and versions

pnevskaiaan commited on Feb 26

Commit

c783b92

·

verified ·

1 Parent(s): 487ce37

Update README.md

Files changed (1) hide show

README.md +31 -3

README.md CHANGED Viewed

@@ -1,3 +1,31 @@
----
-license: apache-2.0
----

+---
+license: apache-2.0
+---
+# === Obtained with following code. ===
+import os
+import torch
+torch.set_default_dtype(torch.bfloat16)
+from transformers import AutoTokenizer, AutoConfig, Cohere2ForCausalLM, AutoModelForCausalLM
+model_id = "CohereLabs/tiny-aya-base"
+config = AutoConfig.from_pretrained(model_id)
+config.num_hidden_layers=2
+config.layer_types=[
+    "sliding_attention",
+    "full_attention",
+  ]
+config.num_attention_heads=4
+config.hidden_size=4
+config.intermediate_size=5
+model = Cohere2ForCausalLM(config)
+tokenizer = AutoTokenizer.from_pretrained(model_id)
+output_dir = "./tiny-random-aya-base/"
+os.makedirs(output_dir, exist_ok=True)
+model.save_pretrained(output_dir, safe_serialization=True)
+tokenizer.save_pretrained(output_dir)