LM datas
updated
Updated
•
523
•
173
Preview
•
Updated
•
109k
•
514
Updated
•
2.04k
•
476
nampdn-ai/tiny-strange-textbooks
Viewer
•
Updated
•
1M
•
106
•
92
Viewer
•
Updated
•
61.6M
•
79.4k
•
1.13k
Viewer
•
Updated
•
2.94M
•
14k
•
1.49k
Updated
•
173k
•
587
Viewer
•
Updated
•
420k
•
525
•
163
togethercomputer/RedPajama-Data-V2
Updated
•
2.25k
•
391
nampdn-ai/tiny-math-textbooks
Viewer
•
Updated
•
635k
•
32
•
25
Viewer
•
Updated
•
44.8k
•
133
•
53
Viewer
•
Updated
•
10.4B
•
514k
•
510
Updated
•
5.84k
•
347
Viewer
•
Updated
•
1.35M
•
7.65k
•
147
Viewer
•
Updated
•
720k
•
506
•
25
Viewer
•
Updated
•
7.18B
•
41k
•
579
Viewer
•
Updated
•
1.01M
•
1.45k
•
136
Viewer
•
Updated
•
20k
•
34
•
24
nampdn-ai/tiny-bridgedict
Viewer
•
Updated
•
17.6k
•
6
•
18
nampdn-ai/tiny-orca-textbooks
Viewer
•
Updated
•
147k
•
67
•
43
Preview
•
Updated
•
509
•
193
Viewer
•
Updated
•
7.89M
•
10k
•
182
Viewer
•
Updated
•
1.63M
•
824
•
283
Updated
•
1.53k
•
187
Viewer
•
Updated
•
1.91M
•
4
•
10
Viewer
•
Updated
•
31.1M
•
34k
•
660
CausalLM/Refined-Anime-Text
Viewer
•
Updated
•
1.02M
•
46
•
266
Updated
•
96.8k
•
128
Viewer
•
Updated
•
8.01M
•
56.4k
•
486
Locutusque/UltraTextbooks-2.0
Viewer
•
Updated
•
3.22M
•
57
•
51
Viewer
•
Updated
•
654k
•
125
•
186
Updated
•
1.89k
•
983
Viewer
•
Updated
•
5.86M
•
338
•
55
Viewer
•
Updated
•
221k
•
2
•
7
Viewer
•
Updated
•
2.2M
•
17
•
3
YeungNLP/firefly-pretrain-dataset
Viewer
•
Updated
•
2.46M
•
459
•
42
Viewer
•
Updated
•
1.8k
•
291
•
93
Viewer
•
Updated
•
933
•
4
•
3
Viewer
•
Updated
•
968M
•
34.4k
•
891
Viewer
•
Updated
•
636M
•
216
•
17
Viewer
•
Updated
•
1.77B
•
3.88k
•
78
Updated
•
5.25k
•
210
open-web-math/open-web-math
Viewer
•
Updated
•
6.32M
•
8.04k
•
326
Viewer
•
Updated
•
291M
•
1.71k
•
25
Viewer
•
Updated
•
52.5B
•
205k
•
2.63k
HuggingFaceTB/smollm-corpus
Viewer
•
Updated
•
237M
•
22.5k
•
419
Viewer
•
Updated
•
1.06M
•
53
•
38
Viewer
•
Updated
•
2.14M
•
66.1k
•
894
Viewer
•
Updated
•
6.43B
•
2.75k
•
172
Viewer
•
Updated
•
219k
•
62
•
36
opencsg/chinese-cosmopedia
Preview
•
Updated
•
1.06k
•
76
Updated
•
61
•
37
Viewer
•
Updated
•
54.8M
•
4.05k
•
53
Viewer
•
Updated
•
826M
•
3.81k
•
63
Hieuman/wikitext-103-filtered
Viewer
•
Updated
•
717k
•
3
•
2
Viewer
•
Updated
•
3.71M
•
822k
•
628
iohadrubin/wikitext-103-raw-v1
Viewer
•
Updated
•
29.7k
•
434
•
8
Viewer
•
Updated
•
100k
•
1.77k
•
9
ashaba1in/small_openwebtext
Viewer
•
Updated
•
1M
•
4
•
1
Viewer
•
Updated
•
1.04M
•
42
•
6
TigerResearch/pretrain_zh
Viewer
•
Updated
•
16.9M
•
1.42k
•
119
erhwenkuo/pretrain-chinese-zhtw
Viewer
•
Updated
•
11.5M
•
141
•
3
karpathy/tiny_shakespeare
Updated
•
2.89k
•
69
Viewer
•
Updated
•
470M
•
35.5k
•
335
Viewer
•
Updated
•
621M
•
10.2k
•
86
Viewer
•
Updated
•
170M
•
57.9k
•
90
institutional/institutional-books-1.0
Viewer
•
Updated
•
983k
•
2.19k
•
264
EssentialAI/essential-web-v1.0
Preview
•
Updated
•
13.3k
•
214
PrimeIntellect/SYNTHETIC-2-Base
Viewer
•
Updated
•
465k
•
17
•
9
shajiu/TibetanGeneral_corpus
Viewer
•
Updated
•
259k
•
14
•
5
Viewer
•
Updated
•
476M
•
33.7k
•
810
xTimeCrystal/TinyCorpus-v2
Viewer
•
Updated
•
12.9M
•
127
•
4
karpathy/fineweb-edu-100b-shuffle
Viewer
•
Updated
•
97.2M
•
36.4k
•
151