File size: 1,365 Bytes
79c8978 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 | ---
license: mit
language:
- pt
tags:
- finance
- transaction-categorization
- embeddings
size_categories:
- 1K<n<10K
---
# Transaction Recategorization Dataset
Dataset de embeddings para recategorização de transações financeiras em português brasileiro.
## Descrição
Este dataset contém 1174 exemplos de transações financeiras com suas respectivas categorias e embeddings pré-calculados usando o modelo `text-embedding-3-small` da OpenAI (1536 dimensões).
## Uso
```typescript
import { HfInference } from '@huggingface/inference';
// Carregar dataset
const response = await fetch('https://huggingface.co/datasets/leticiamantovani/recategorization/resolve/main/embeddings.json');
const embeddings = await response.json();
```
## Estrutura
Cada exemplo contém:
- `description`: Descrição da transação
- `category`: Categoria correta
- `embedding`: Vetor de 1536 dimensões
## Categorias
O dataset inclui categorias do Pluggy:
- Streaming de vídeo/música
- Táxi e transporte privado urbano
- Delivery de alimentos
- Restaurantes, bares e lanchonetes
- Postos de gasolina
- Supermercado
- E muitas outras...
## Estatísticas
- Total de exemplos: 1174
- Dimensões do embedding: 1536
- Modelo: text-embedding-3-small (OpenAI)
- Idioma: Português (Brasil)
## Licença
MIT License
## Manutenção
Dataset mantido pela equipe Pierre.
|