File size: 1,340 Bytes
ce068d8
 
ba8fc6b
 
 
ce068d8
 
 
 
ba8fc6b
 
 
 
f6b9b03
ba8fc6b
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
---
title: README
emoji: 📖
colorFrom: blue
colorTo: indigo
sdk: static
pinned: false
---

# Prosodia

**Prosodia** é uma iniciativa brasileira de pesquisa em inteligência artificial dedicada ao desenvolvimento de modelos de linguagem e datasets abertos para o português.

O português é uma das línguas mais faladas do mundo, porém permanece sub-representado nos sistemas modernos de IA. O Prosodia existe para reduzir essa lacuna, criando modelos fundacionais, datasets curados e benchmarks de avaliação que refletem a diversidade linguística e cultural das comunidades lusófonas.

Trabalhamos com pré-treinamento e fine-tuning de LLMs otimizados para português brasileiro e europeu, infraestrutura de tradução EN-PT de alta vazão para localização de datasets, suítes de avaliação de NLU/NLG em português (ASSIN, BLUEX, OAB, ENEM, HateBR, entre outros), e curadoria de corpora de larga escala para pré-treinamento e instruction tuning.

Nosso trabalho enfatiza métodos práticos e reproduzíveis, incluindo pruning e destilação de modelos para arquiteturas eficientes, inferência de alto desempenho, e pipelines robustos para tradução e filtragem de bilhões de tokens.

Acesse [prosodia.org](https://prosodia.org) para documentação técnica completa.

---

© 2025 Prosodia. Todos os direitos reservados.