Updated • 1.78k
• 181
Updated • 6k
• 500
nampdn-ai/tiny-strange-textbooks
Viewer
• Updated • 1M • 108
• 92
Viewer
• Updated • 61.6M • 181k
• 1.26k
Viewer
• Updated • 2.94M • 16.9k
• 1.56k
Updated • 89.3k
• 635
Viewer
• Updated • 420k • 523
• 179
togethercomputer/RedPajama-Data-V2
Updated • 9.48k
• 404
nampdn-ai/tiny-math-textbooks
Viewer
• Updated • 635k • 103
• 33
Viewer
• Updated • 44.8k • 247
• 54
Viewer
• Updated • 10.4B • 1.25M
• 604
Updated • 10.2k
• 357
Updated • 19.6k
• 153
Viewer
• Updated • 720k • 1.95k
• 33
Viewer
• Updated • 7.18B • 18.4k
• 643
Viewer
• Updated • 1.01M • 3.95k
• 149
Viewer
• Updated • 20k • 228
• 24
nampdn-ai/tiny-bridgedict
Viewer
• Updated • 17.6k • 12
• 18
nampdn-ai/tiny-orca-textbooks
Viewer
• Updated • 147k • 48
• 43
Preview
• Updated • 245
• 195
Viewer
• Updated • 7.89M • 6.87k
• 185
Viewer
• Updated • 1.63M • 1.37k
• 294
Updated • 11.2k
• 197
Viewer
• Updated • 1.91M • 13
• 10
Viewer
• Updated • 31.1M • 17.1k
• 722
CausalLM/Refined-Anime-Text
Viewer
• Updated • 1.02M • 15
• 273
Updated • 126k
• 141
Viewer
• Updated • 8.01M • 69.7k
• 522
Locutusque/UltraTextbooks-2.0
Viewer
• Updated • 3.22M • 164
• 52
Viewer
• Updated • 654k • 1.06k
• 191
Updated • 4.19k
• 1.05k
Viewer
• Updated • 5.86M • 1.2k
• 56
Viewer
• Updated • 221k • 7
• 7
Viewer
• Updated • 2.2M • 153
• 3
YeungNLP/firefly-pretrain-dataset
Viewer
• Updated • 2.46M • 515
• 42
Viewer
• Updated • 1.8k • 420
• 95
Viewer
• Updated • 933 • 9
• 3
Viewer
• Updated • 968M • 12.7k
• 930
Viewer
• Updated • 636M • 168
• 18
Viewer
• Updated • 1.77B • 5.07k
• 81
Updated • 12k
• 228
open-web-math/open-web-math
Viewer
• Updated • 6.32M • 31.8k
• 352
Viewer
• Updated • 291M • 173
• 26
Viewer
• Updated • 52.5B • 317k
• 2.91k
HuggingFaceTB/smollm-corpus
Viewer
• Updated • 237M • 36k
• 469
Viewer
• Updated • 1.06M • 181
• 38
Viewer
• Updated • 2.14M • 81.5k
• 1.05k
Viewer
• Updated • 6.43B • 6.03k
• 175
Viewer
• Updated • 219k • 227
• 38
opencsg/chinese-cosmopedia
Preview
• Updated • 1.88k
• 81
Updated • 822
• 38
Viewer
• Updated • 54.8M • 5.54k
• 60
Viewer
• Updated • 826M • 7.8k
• 73
Hieuman/wikitext-103-filtered
Viewer
• Updated • 717k • 6
• 2
Viewer
• Updated • 3.71M • 1.33M
• 728
iohadrubin/wikitext-103-raw-v1
Viewer
• Updated • 29.7k • 1.6k
• 10
Viewer
• Updated • 100k • 464
• 8
ashaba1in/small_openwebtext
Viewer
• Updated • 1M • 34
• 1
Viewer
• Updated • 1.04M • 10
• 6
TigerResearch/pretrain_zh
Viewer
• Updated • 16.9M • 11.8k
• 122
erhwenkuo/pretrain-chinese-zhtw
Viewer
• Updated • 11.5M • 858
• 4
karpathy/tiny_shakespeare
Updated • 6.56k
• 85
Viewer
• Updated • 69.9k • 91.6k
• 405
Viewer
• Updated • 621M • 58.1k
• 88
Viewer
• Updated • 170M • 11.8k
• 97
institutional/institutional-books-1.0
Viewer
• Updated • 983k • 8.16k
• 281
EssentialAI/essential-web-v1.0
Preview
• Updated • 427k
• 230
PrimeIntellect/SYNTHETIC-2-Base
Viewer
• Updated • 465k • 132
• 9
shajiu/TibetanGeneral_corpus
Viewer
• Updated • 259k • 43
• 5
Viewer
• Updated • 476M • 74.4k
• 883
xTimeCrystal/TinyCorpus-v2
Viewer
• Updated • 12.9M • 372
• 5
karpathy/fineweb-edu-100b-shuffle
Viewer
• Updated • 97.2M • 6.01k
• 167
Updated • 22.4k
• 330