| | --- |
| | title: README |
| | emoji: 📖 |
| | colorFrom: blue |
| | colorTo: indigo |
| | sdk: static |
| | pinned: false |
| | --- |
| | |
| | # Prosodia |
| |
|
| | **Prosodia** é uma iniciativa brasileira de pesquisa em inteligência artificial dedicada ao desenvolvimento de modelos de linguagem e datasets abertos para o português. |
| |
|
| | O português é uma das línguas mais faladas do mundo, porém permanece sub-representado nos sistemas modernos de IA. O Prosodia existe para reduzir essa lacuna, criando modelos fundacionais, datasets curados e benchmarks de avaliação que refletem a diversidade linguística e cultural das comunidades lusófonas. |
| |
|
| | Trabalhamos com pré-treinamento e fine-tuning de LLMs otimizados para português brasileiro e europeu, infraestrutura de tradução EN-PT de alta vazão para localização de datasets, suítes de avaliação de NLU/NLG em português (ASSIN, BLUEX, OAB, ENEM, HateBR, entre outros), e curadoria de corpora de larga escala para pré-treinamento e instruction tuning. |
| |
|
| | Nosso trabalho enfatiza métodos práticos e reproduzíveis, incluindo pruning e destilação de modelos para arquiteturas eficientes, inferência de alto desempenho, e pipelines robustos para tradução e filtragem de bilhões de tokens. |
| |
|
| | Acesse [prosodia.org](https://prosodia.org) para documentação técnica completa. |
| |
|
| | --- |
| |
|
| | © 2025 Prosodia. Todos os direitos reservados. |
| |
|