MhaWay
/

Veronica

Text Generation

polymorphic-mlp

mixture-of-branches

entropy-regularized-routing

expandable-architecture

Model card Files Files and versions

MhaWay commited on Nov 18, 2025

Commit

adf74d4

·

verified ·

1 Parent(s): bff0ad9

Update README.md

Files changed (1) hide show

README.md +7 -7

README.md CHANGED Viewed

@@ -41,6 +41,13 @@ model-index:
 ## Installation
 | Source | Share | Link |
 |--------|-------|------|
 | FinePDFs‑1B | 50% | https://huggingface.co/datasets/codelion/finepdfs-1B |
@@ -53,13 +60,6 @@ Notes
 Total tokens target (example): ~60B. The composition balances semantic density (FinePDFs) and generality (DCLM) per codelion’s guidance.
-```bash
-pip install -e .
-from veronica import VeronicaConfig, VeronicaForCausalLM
-cfg = VeronicaConfig(n_layer=24, num_funcs=3)  # base polymorphic setup
-model = VeronicaForCausalLM(cfg)
-```
 Generation example:
 ```python
 from transformers import AutoTokenizer

 ## Installation
+```bash
+pip install -e .
+from veronica import VeronicaConfig, VeronicaForCausalLM
+cfg = VeronicaConfig(n_layer=24, num_funcs=3)  # base polymorphic setup
+model = VeronicaForCausalLM(cfg)
+```
 | Source | Share | Link |
 |--------|-------|------|
 | FinePDFs‑1B | 50% | https://huggingface.co/datasets/codelion/finepdfs-1B |
 Total tokens target (example): ~60B. The composition balances semantic density (FinePDFs) and generality (DCLM) per codelion’s guidance.
 Generation example:
 ```python
 from transformers import AutoTokenizer