codelion
/

SmolLM2-70M

Text Generation

Eval Results (legacy)

text-generation-inference

Model card Files Files and versions

codelion commited on 1 day ago

Commit

285b36e

·

verified ·

1 Parent(s): 4785466

Update README.md

Files changed (1) hide show

README.md +11 -0

README.md CHANGED Viewed

@@ -238,6 +238,17 @@ print(tokenizer.decode(outputs[0], skip_special_tokens=True))
 - **Dataset**: [codelion/sutra-10B](https://huggingface.co/datasets/codelion/sutra-10B) — 10B token pedagogical pretraining dataset
 - **Sutra Framework**: Generates structured educational content optimized for LLM pretraining
 ## License
 Apache 2.0

 - **Dataset**: [codelion/sutra-10B](https://huggingface.co/datasets/codelion/sutra-10B) — 10B token pedagogical pretraining dataset
 - **Sutra Framework**: Generates structured educational content optimized for LLM pretraining
+## Citation
+```bibtex
+@article{sharma2026sutra,
+  title={Scaling Pedagogical Pretraining: From Optimal Mixing to 10 Billion Tokens},
+  author={Sharma, Asankhaya},
+  year={2026},
+  url={https://huggingface.co/blog/codelion/scaling-pedagogical-pretraining-10-billion-tokens}
+}
+```
 ## License
 Apache 2.0