LM datas
updated
Updated • 4.4k
• 176
Updated • 1.87k
• 491
nampdn-ai/tiny-strange-textbooks
Viewer
• Updated • 1M • 20
• 92
Viewer
• Updated • 61.6M • 87.6k
• 1.16k
Viewer
• Updated • 2.94M • 16.7k
• 1.51k
Updated • 184k
• 591
Viewer
• Updated • 420k • 1.17k
• 167
togethercomputer/RedPajama-Data-V2
Updated • 6.12k
• 398
nampdn-ai/tiny-math-textbooks
Viewer
• Updated • 635k • 43
• 25
Viewer
• Updated • 44.8k • 121
• 53
Viewer
• Updated • 10.4B • 589k
• 534
Updated • 11.2k
• 351
Viewer
• Updated • 1.35M • 15k
• 149
Viewer
• Updated • 720k • 436
• 27
Viewer
• Updated • 7.18B • 26.4k
• 597
Viewer
• Updated • 1.01M • 4.13k
• 142
Viewer
• Updated • 20k • 35
• 24
nampdn-ai/tiny-bridgedict
Viewer
• Updated • 17.6k • 8
• 18
nampdn-ai/tiny-orca-textbooks
Viewer
• Updated • 147k • 47
• 43
Preview
• Updated • 365
• 193
Viewer
• Updated • 7.89M • 17.1k
• 184
Viewer
• Updated • 1.63M • 2k
• 285
Updated • 5.4k
• 196
Viewer
• Updated • 1.91M • 23
• 10
Viewer
• Updated • 31.1M • 14.8k
• 676
CausalLM/Refined-Anime-Text
Viewer
• Updated • 1.02M • 42
• 267
Updated • 72.8k
• 136
Viewer
• Updated • 8.01M • 78.8k
• 499
Locutusque/UltraTextbooks-2.0
Viewer
• Updated • 3.22M • 203
• 51
Viewer
• Updated • 654k • 276
• 186
Updated • 7.5k
• 998
Viewer
• Updated • 5.86M • 446
• 56
Viewer
• Updated • 221k • 8
• 7
Viewer
• Updated • 2.2M • 27
• 3
YeungNLP/firefly-pretrain-dataset
Viewer
• Updated • 2.46M • 491
• 42
Viewer
• Updated • 1.8k • 502
• 93
Viewer
• Updated • 933 • 17
• 3
Viewer
• Updated • 968M • 13.6k
• 896
Viewer
• Updated • 636M • 374
• 17
Viewer
• Updated • 1.77B • 8k
• 78
Updated • 10.1k
• 218
open-web-math/open-web-math
Viewer
• Updated • 6.32M • 12.4k
• 330
Viewer
• Updated • 291M • 16
• 25
Viewer
• Updated • 52.5B • 180k
• 2.71k
HuggingFaceTB/smollm-corpus
Viewer
• Updated • 237M • 36.6k
• 444
Viewer
• Updated • 1.06M • 103
• 38
Viewer
• Updated • 2.14M • 86.4k
• 918
Viewer
• Updated • 6.43B • 3.07k
• 174
Viewer
• Updated • 219k • 190
• 37
opencsg/chinese-cosmopedia
Preview
• Updated • 440
• 76
Updated • 130
• 37
Viewer
• Updated • 54.8M • 1.22k
• 56
Viewer
• Updated • 826M • 1.04k
• 64
Hieuman/wikitext-103-filtered
Viewer
• Updated • 717k • 39
• 2
Viewer
• Updated • 3.71M • 968k
• 641
iohadrubin/wikitext-103-raw-v1
Viewer
• Updated • 29.7k • 358
• 8
Viewer
• Updated • 100k • 1.12k
• 8
ashaba1in/small_openwebtext
Viewer
• Updated • 1M • 39
• 1
Viewer
• Updated • 1.04M • 195
• 6
TigerResearch/pretrain_zh
Viewer
• Updated • 16.9M • 1.07k
• 122
erhwenkuo/pretrain-chinese-zhtw
Viewer
• Updated • 11.5M • 101
• 3
karpathy/tiny_shakespeare
Updated • 5.47k
• 72
Viewer
• Updated • 69.9k • 154k
• 386
Viewer
• Updated • 621M • 11.9k
• 87
Viewer
• Updated • 170M • 25.3k
• 90
institutional/institutional-books-1.0
Viewer
• Updated • 983k • 5.07k
• 269
EssentialAI/essential-web-v1.0
Preview
• Updated • 41.7k
• 218
PrimeIntellect/SYNTHETIC-2-Base
Viewer
• Updated • 465k • 29
• 9
shajiu/TibetanGeneral_corpus
Viewer
• Updated • 259k • 17
• 5
Viewer
• Updated • 476M • 35.1k
• 826
xTimeCrystal/TinyCorpus-v2
Viewer
• Updated • 12.9M • 51
• 5
karpathy/fineweb-edu-100b-shuffle
Viewer
• Updated • 97.2M • 30.7k
• 160