Text Generation
Safetensors
English
Portuguese
gpt2
pedrodev2026 commited on
Commit
b0014ce
·
verified ·
1 Parent(s): 13552bb

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +16 -3
README.md CHANGED
@@ -1,3 +1,16 @@
1
- ---
2
- license: apache-2.0
3
- ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ license: apache-2.0
3
+ datasets:
4
+ - wikimedia/wikipedia
5
+ - HuggingFaceFW/fineweb-edu
6
+ language:
7
+ - en
8
+ - pt
9
+ pipeline_tag: text-generation
10
+ ---
11
+ # MicroLM-1M
12
+ O MicroLM-1M é um modelo de IA treinado do zero com 1 milhão de parâmetros e 500 milhões de tokens de dados de treinamento.
13
+ ## Créditos
14
+ Este modelo foi treinado com dados provenientes de dois conjuntos de dados públicos: Wikipedia e FineWeb-Edu.
15
+ A Wikipedia é licenciada sob CC BY-SA 3.0, e o FineWeb-Edu sob a licença ODC-BY 1.0.
16
+ Este modelo não armazena nem reproduz os dados de treinamento de forma literal. Em vez disso, ele aprende representações estatísticas a partir dos padrões presentes nos dados.