optimum-intel-internal-testing
/

tiny-random-lfm2-moe

Model card Files Files and versions

pnevskaiaan commited on Mar 19

Commit

9dfce1f

·

verified ·

1 Parent(s): 23d280b

Update README.md

Files changed (1) hide show

README.md +4 -2

README.md CHANGED Viewed

@@ -18,14 +18,17 @@ from transformers import AutoTokenizer, AutoConfig, Lfm2MoeForCausalLM
 model_id = "LiquidAI/LFM2-24B-A2B"
 config = AutoConfig.from_pretrained(model_id)
-config.num_hidden_layers = 2
 config.layer_types = [
     "full_attention",
     "conv",
 ]
 config.num_attention_heads = 4
 config.num_key_value_heads = 4
 config.hidden_size = 16
 # === Step 2: Create model from config ===
 model = Lfm2MoeForCausalLM(config)
@@ -39,5 +42,4 @@ os.makedirs(output_dir, exist_ok=True)
 model.save_pretrained(output_dir, safe_serialization=False)
 tokenizer.save_pretrained(output_dir)
 ```

 model_id = "LiquidAI/LFM2-24B-A2B"
 config = AutoConfig.from_pretrained(model_id)
+config.num_hidden_layers = 3
 config.layer_types = [
+    "full_attention",
     "full_attention",
     "conv",
 ]
 config.num_attention_heads = 4
 config.num_key_value_heads = 4
 config.hidden_size = 16
+config.num_dense_layers = 1
+config.moe_intermediate_size = 16
 # === Step 2: Create model from config ===
 model = Lfm2MoeForCausalLM(config)
 model.save_pretrained(output_dir, safe_serialization=False)
 tokenizer.save_pretrained(output_dir)
 ```