File size: 1,365 Bytes
79c8978
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
---
license: mit
language:
- pt
tags:
- finance
- transaction-categorization
- embeddings
size_categories:
- 1K<n<10K
---

# Transaction Recategorization Dataset

Dataset de embeddings para recategorização de transações financeiras em português brasileiro.

## Descrição

Este dataset contém 1174 exemplos de transações financeiras com suas respectivas categorias e embeddings pré-calculados usando o modelo `text-embedding-3-small` da OpenAI (1536 dimensões).

## Uso

```typescript
import { HfInference } from '@huggingface/inference';

// Carregar dataset
const response = await fetch('https://huggingface.co/datasets/leticiamantovani/recategorization/resolve/main/embeddings.json');
const embeddings = await response.json();
```

## Estrutura

Cada exemplo contém:
- `description`: Descrição da transação
- `category`: Categoria correta
- `embedding`: Vetor de 1536 dimensões

## Categorias

O dataset inclui categorias do Pluggy:
- Streaming de vídeo/música
- Táxi e transporte privado urbano
- Delivery de alimentos
- Restaurantes, bares e lanchonetes
- Postos de gasolina
- Supermercado
- E muitas outras...

## Estatísticas

- Total de exemplos: 1174
- Dimensões do embedding: 1536
- Modelo: text-embedding-3-small (OpenAI)
- Idioma: Português (Brasil)

## Licença

MIT License

## Manutenção

Dataset mantido pela equipe Pierre.