Updated • 3.13k
• 179
Updated • 2.65k
• 495
nampdn-ai/tiny-strange-textbooks
Viewer
• Updated • 1M • 59
• 92
Viewer
• Updated • 61.6M • 252k
• 1.22k
Viewer
• Updated • 2.94M • 53k
• 1.53k
Updated • 83.3k
• 615
Viewer
• Updated • 420k • 597
• 175
togethercomputer/RedPajama-Data-V2
Updated • 7.01k
• 401
nampdn-ai/tiny-math-textbooks
Viewer
• Updated • 635k • 50
• 31
Viewer
• Updated • 44.8k • 285
• 54
Viewer
• Updated • 10.4B • 812k
• 570
Updated • 16.2k
• 353
Updated • 5.81k
• 152
Viewer
• Updated • 720k • 8.7k
• 29
Viewer
• Updated • 7.18B • 38.9k
• 618
Viewer
• Updated • 1.01M • 3.78k
• 144
Viewer
• Updated • 20k • 13
• 24
nampdn-ai/tiny-bridgedict
Viewer
• Updated • 17.6k • 8
• 18
nampdn-ai/tiny-orca-textbooks
Viewer
• Updated • 147k • 47
• 43
Preview
• Updated • 383
• 194
Viewer
• Updated • 7.89M • 12.4k
• 185
Viewer
• Updated • 1.63M • 1.89k
• 288
Updated • 12.6k
• 196
Viewer
• Updated • 1.91M • 51
• 10
Viewer
• Updated • 31.1M • 20.6k
• 692
CausalLM/Refined-Anime-Text
Viewer
• Updated • 1.02M • 32
• 269
Updated • 66.3k
• 138
Viewer
• Updated • 8.01M • 66.4k
• 510
Locutusque/UltraTextbooks-2.0
Viewer
• Updated • 3.22M • 335
• 51
Viewer
• Updated • 654k • 1.06k
• 191
Updated • 4.4k
• 1.03k
Viewer
• Updated • 5.86M • 715
• 56
Viewer
• Updated • 221k • 20
• 7
Viewer
• Updated • 2.2M • 356
• 3
YeungNLP/firefly-pretrain-dataset
Viewer
• Updated • 2.46M • 562
• 42
Viewer
• Updated • 1.8k • 323
• 94
Viewer
• Updated • 933 • 26
• 3
Viewer
• Updated • 968M • 23k
• 911
Viewer
• Updated • 636M • 632
• 17
Viewer
• Updated • 1.77B • 4.87k
• 80
Updated • 17k
• 224
open-web-math/open-web-math
Viewer
• Updated • 6.32M • 41.2k
• 339
Viewer
• Updated • 291M • 87
• 25
Viewer
• Updated • 52.5B • 909k
• 2.79k
HuggingFaceTB/smollm-corpus
Viewer
• Updated • 237M • 58.7k
• 453
Viewer
• Updated • 1.06M • 291
• 38
Viewer
• Updated • 2.14M • 93.6k
• 977
Viewer
• Updated • 6.43B • 11.9k
• 174
Viewer
• Updated • 219k • 256
• 38
opencsg/chinese-cosmopedia
Preview
• Updated • 884
• 77
Updated • 384
• 38
Viewer
• Updated • 54.8M • 5.55k
• 59
Viewer
• Updated • 826M • 2.97k
• 68
Hieuman/wikitext-103-filtered
Viewer
• Updated • 717k • 6
• 2
Viewer
• Updated • 3.71M • 1.33M
• 683
iohadrubin/wikitext-103-raw-v1
Viewer
• Updated • 29.7k • 551
• 8
Viewer
• Updated • 100k • 901
• 8
ashaba1in/small_openwebtext
Viewer
• Updated • 1M • 84
• 1
Viewer
• Updated • 1.04M • 14
• 6
TigerResearch/pretrain_zh
Viewer
• Updated • 16.9M • 2.79k
• 122
erhwenkuo/pretrain-chinese-zhtw
Viewer
• Updated • 11.5M • 1k
• 3
karpathy/tiny_shakespeare
Updated • 4.79k
• 75
Viewer
• Updated • 69.9k • 70.6k
• 399
Viewer
• Updated • 621M • 28.6k
• 88
Viewer
• Updated • 170M • 21.4k
• 94
institutional/institutional-books-1.0
Viewer
• Updated • 983k • 3.35k
• 277
EssentialAI/essential-web-v1.0
Preview
• Updated • 48.9k
• 224
PrimeIntellect/SYNTHETIC-2-Base
Viewer
• Updated • 465k • 68
• 9
shajiu/TibetanGeneral_corpus
Viewer
• Updated • 259k • 52
• 5
Viewer
• Updated • 476M • 61.8k
• 858
xTimeCrystal/TinyCorpus-v2
Viewer
• Updated • 12.9M • 54
• 5
karpathy/fineweb-edu-100b-shuffle
Viewer
• Updated • 97.2M • 7.62k
• 166
Updated • 29.2k
• 317