LM datas
updated
Updated
• 4.4k
• 176
Updated
• 1.87k
• 491
nampdn-ai/tiny-strange-textbooks
Viewer
• Updated
• 1M • 20
• 92
Viewer
• Updated
• 61.6M • 87.6k
• 1.16k
Viewer
• Updated
• 2.94M • 16.7k
• 1.51k
Updated
• 184k
• 591
Viewer
• Updated
• 420k • 1.17k
• 167
togethercomputer/RedPajama-Data-V2
Updated
• 6.12k
• 398
nampdn-ai/tiny-math-textbooks
Viewer
• Updated
• 635k • 43
• 25
Viewer
• Updated
• 44.8k • 121
• 53
Viewer
• Updated
• 10.4B • 589k
• 534
Updated
• 11.2k
• 351
Viewer
• Updated
• 1.35M • 15k
• 149
Viewer
• Updated
• 720k • 436
• 27
Viewer
• Updated
• 7.18B • 26.4k
• 597
Viewer
• Updated
• 1.01M • 4.13k
• 142
Viewer
• Updated
• 20k • 35
• 24
nampdn-ai/tiny-bridgedict
Viewer
• Updated
• 17.6k • 8
• 18
nampdn-ai/tiny-orca-textbooks
Viewer
• Updated
• 147k • 47
• 43
Preview
• Updated
• 365
• 193
Viewer
• Updated
• 7.89M • 17.1k
• 184
Viewer
• Updated
• 1.63M • 2k
• 285
Updated
• 5.4k
• 196
Viewer
• Updated
• 1.91M • 23
• 10
Viewer
• Updated
• 31.1M • 14.8k
• 676
CausalLM/Refined-Anime-Text
Viewer
• Updated
• 1.02M • 42
• 267
Updated
• 72.8k
• 136
Viewer
• Updated
• 8.01M • 78.8k
• 499
Locutusque/UltraTextbooks-2.0
Viewer
• Updated
• 3.22M • 203
• 51
Viewer
• Updated
• 654k • 276
• 186
Updated
• 7.5k
• 998
Viewer
• Updated
• 5.86M • 446
• 56
Viewer
• Updated
• 221k • 8
• 7
Viewer
• Updated
• 2.2M • 27
• 3
YeungNLP/firefly-pretrain-dataset
Viewer
• Updated
• 2.46M • 491
• 42
Viewer
• Updated
• 1.8k • 502
• 93
Viewer
• Updated
• 933 • 17
• 3
Viewer
• Updated
• 968M • 13.6k
• 896
Viewer
• Updated
• 636M • 374
• 17
Viewer
• Updated
• 1.77B • 8k
• 78
Updated
• 10.1k
• 218
open-web-math/open-web-math
Viewer
• Updated
• 6.32M • 12.4k
• 330
Viewer
• Updated
• 291M • 16
• 25
Viewer
• Updated
• 52.5B • 180k
• 2.7k
HuggingFaceTB/smollm-corpus
Viewer
• Updated
• 237M • 36.6k
• 444
Viewer
• Updated
• 1.06M • 103
• 38
Viewer
• Updated
• 2.14M • 86.4k
• 918
Viewer
• Updated
• 6.43B • 3.07k
• 174
Viewer
• Updated
• 219k • 190
• 37
opencsg/chinese-cosmopedia
Preview
• Updated
• 440
• 76
Updated
• 130
• 37
Viewer
• Updated
• 54.8M • 1.22k
• 56
Viewer
• Updated
• 826M • 1.04k
• 64
Hieuman/wikitext-103-filtered
Viewer
• Updated
• 717k • 39
• 2
Viewer
• Updated
• 3.71M • 968k
• 641
iohadrubin/wikitext-103-raw-v1
Viewer
• Updated
• 29.7k • 358
• 8
Viewer
• Updated
• 100k • 1.12k
• 8
ashaba1in/small_openwebtext
Viewer
• Updated
• 1M • 39
• 1
Viewer
• Updated
• 1.04M • 195
• 6
TigerResearch/pretrain_zh
Viewer
• Updated
• 16.9M • 1.07k
• 122
erhwenkuo/pretrain-chinese-zhtw
Viewer
• Updated
• 11.5M • 101
• 3
karpathy/tiny_shakespeare
Updated
• 5.47k
• 72
Viewer
• Updated
• 69.9k • 154k
• 386
Viewer
• Updated
• 621M • 11.9k
• 87
Viewer
• Updated
• 170M • 25.3k
• 90
institutional/institutional-books-1.0
Viewer
• Updated
• 983k • 5.07k
• 269
EssentialAI/essential-web-v1.0
Preview
• Updated
• 41.7k
• 218
PrimeIntellect/SYNTHETIC-2-Base
Viewer
• Updated
• 465k • 29
• 9
shajiu/TibetanGeneral_corpus
Viewer
• Updated
• 259k • 17
• 5
Viewer
• Updated
• 476M • 35.1k
• 826
xTimeCrystal/TinyCorpus-v2
Viewer
• Updated
• 12.9M • 51
• 5
karpathy/fineweb-edu-100b-shuffle
Viewer
• Updated
• 97.2M • 30.7k
• 160