Updated • 3.09k
• 179
Updated • 2.57k
• 495
nampdn-ai/tiny-strange-textbooks
Viewer
• Updated • 1M • 55
• 92
Viewer
• Updated • 61.6M • 233k
• 1.21k
Viewer
• Updated • 2.94M • 52.7k
• 1.53k
Updated • 88.1k
• 615
Viewer
• Updated • 420k • 569
• 174
togethercomputer/RedPajama-Data-V2
Updated • 6.24k
• 401
nampdn-ai/tiny-math-textbooks
Viewer
• Updated • 635k • 45
• 29
Viewer
• Updated • 44.8k • 255
• 54
Viewer
• Updated • 10.4B • 796k
• 570
Updated • 15k
• 353
Updated • 6.17k
• 152
Viewer
• Updated • 720k • 7.68k
• 29
Viewer
• Updated • 7.18B • 36.2k
• 618
Viewer
• Updated • 1.01M • 3.69k
• 144
Viewer
• Updated • 20k • 13
• 24
nampdn-ai/tiny-bridgedict
Viewer
• Updated • 17.6k • 8
• 18
nampdn-ai/tiny-orca-textbooks
Viewer
• Updated • 147k • 44
• 43
Preview
• Updated • 397
• 194
Viewer
• Updated • 7.89M • 12.5k
• 185
Viewer
• Updated • 1.63M • 1.88k
• 288
Updated • 12.8k
• 196
Viewer
• Updated • 1.91M • 51
• 10
Viewer
• Updated • 31.1M • 20.4k
• 692
CausalLM/Refined-Anime-Text
Viewer
• Updated • 1.02M • 32
• 269
Updated • 64.9k
• 138
Viewer
• Updated • 8.01M • 68.1k
• 510
Locutusque/UltraTextbooks-2.0
Viewer
• Updated • 3.22M • 336
• 51
Viewer
• Updated • 654k • 1.03k
• 191
Updated • 4.43k
• 1.03k
Viewer
• Updated • 5.86M • 721
• 56
Viewer
• Updated • 221k • 19
• 7
Viewer
• Updated • 2.2M • 279
• 3
YeungNLP/firefly-pretrain-dataset
Viewer
• Updated • 2.46M • 512
• 42
Viewer
• Updated • 1.8k • 320
• 94
Viewer
• Updated • 933 • 26
• 3
Viewer
• Updated • 968M • 22.3k
• 911
Viewer
• Updated • 636M • 627
• 17
Viewer
• Updated • 1.77B • 4.41k
• 80
Updated • 16.9k
• 224
open-web-math/open-web-math
Viewer
• Updated • 6.32M • 40.3k
• 339
Viewer
• Updated • 291M • 87
• 25
Viewer
• Updated • 52.5B • 637k
• 2.79k
HuggingFaceTB/smollm-corpus
Viewer
• Updated • 237M • 57.4k
• 453
Viewer
• Updated • 1.06M • 285
• 38
Viewer
• Updated • 2.14M • 95.4k
• 977
Viewer
• Updated • 6.43B • 10.9k
• 174
Viewer
• Updated • 219k • 263
• 38
opencsg/chinese-cosmopedia
Preview
• Updated • 869
• 77
Updated • 381
• 38
Viewer
• Updated • 54.8M • 5.56k
• 59
Viewer
• Updated • 826M • 3.27k
• 68
Hieuman/wikitext-103-filtered
Viewer
• Updated • 717k • 6
• 2
Viewer
• Updated • 3.71M • 1.32M
• 683
iohadrubin/wikitext-103-raw-v1
Viewer
• Updated • 29.7k • 596
• 8
Viewer
• Updated • 100k • 889
• 8
ashaba1in/small_openwebtext
Viewer
• Updated • 1M • 81
• 1
Viewer
• Updated • 1.04M • 13
• 6
TigerResearch/pretrain_zh
Viewer
• Updated • 16.9M • 2.11k
• 122
erhwenkuo/pretrain-chinese-zhtw
Viewer
• Updated • 11.5M • 1.02k
• 3
karpathy/tiny_shakespeare
Updated • 4.66k
• 75
Viewer
• Updated • 69.9k • 65.8k
• 399
Viewer
• Updated • 621M • 29.3k
• 88
Viewer
• Updated • 170M • 20k
• 94
institutional/institutional-books-1.0
Viewer
• Updated • 983k • 2.92k
• 277
EssentialAI/essential-web-v1.0
Preview
• Updated • 35.6k
• 224
PrimeIntellect/SYNTHETIC-2-Base
Viewer
• Updated • 465k • 68
• 9
shajiu/TibetanGeneral_corpus
Viewer
• Updated • 259k • 44
• 5
Viewer
• Updated • 476M • 53.9k
• 858
xTimeCrystal/TinyCorpus-v2
Viewer
• Updated • 12.9M • 49
• 5
karpathy/fineweb-edu-100b-shuffle
Viewer
• Updated • 97.2M • 7.83k
• 166
Updated • 25.9k
• 317