Victor Dieguez commited on
Commit ·
ba8fc6b
1
Parent(s): ce068d8
updating readme
Browse files
README.md
CHANGED
|
@@ -1,10 +1,24 @@
|
|
| 1 |
---
|
| 2 |
title: README
|
| 3 |
-
emoji:
|
| 4 |
-
colorFrom:
|
| 5 |
-
colorTo:
|
| 6 |
sdk: static
|
| 7 |
pinned: false
|
| 8 |
---
|
| 9 |
|
| 10 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
---
|
| 2 |
title: README
|
| 3 |
+
emoji: 📖
|
| 4 |
+
colorFrom: blue
|
| 5 |
+
colorTo: indigo
|
| 6 |
sdk: static
|
| 7 |
pinned: false
|
| 8 |
---
|
| 9 |
|
| 10 |
+
# Prosodia
|
| 11 |
+
|
| 12 |
+
**Prosodia** é uma iniciativa brasileira de pesquisa em inteligência artificial dedicada ao desenvolvimento de modelos de linguagem e datasets abertos para o português.
|
| 13 |
+
|
| 14 |
+
O português é uma das línguas mais faladas do mundo, porém permanece sub-representado nos sistemas modernos de IA. A Prosodia existe para reduzir essa lacuna, criando modelos fundacionais, datasets curados e benchmarks de avaliação que refletem a diversidade linguística e cultural das comunidades lusófonas.
|
| 15 |
+
|
| 16 |
+
Trabalhamos com pré-treinamento e fine-tuning de LLMs otimizados para português brasileiro e europeu, infraestrutura de tradução EN-PT de alta vazão para localização de datasets, suítes de avaliação de NLU/NLG em português (ASSIN, BLUEX, OAB, ENEM, HateBR, entre outros), e curadoria de corpora de larga escala para pré-treinamento e instruction tuning.
|
| 17 |
+
|
| 18 |
+
Nosso trabalho enfatiza métodos práticos e reproduzíveis, incluindo pruning e destilação de modelos para arquiteturas eficientes, inferência de alto desempenho, e pipelines robustos para tradução e filtragem de bilhões de tokens.
|
| 19 |
+
|
| 20 |
+
Acesse [prosodia.org](https://prosodia.org) para documentação técnica completa.
|
| 21 |
+
|
| 22 |
+
---
|
| 23 |
+
|
| 24 |
+
© 2025 Prosodia. Todos os direitos reservados.
|