ViniciusKhan commited on
Commit
ec5dec7
·
verified ·
1 Parent(s): c683bd4

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +120 -38
README.md CHANGED
@@ -1,65 +1,147 @@
1
- # 🤖 Senticore - Multilingual BERT Sentiment Analyzer
2
-
3
- Este modelo BERT foi treinado para análise de sentimentos multilíngue (Português, Inglês e Espanhol), com foco em **feedbacks de clientes** extraídos de sistemas como Salesforce.
 
 
 
 
 
 
 
 
 
 
 
 
4
 
5
- ## 🧠 Objetivo
6
 
7
- Detectar o sentimento predominante em textos curtos ou médios (ex: resumos de interações com clientes), classificando-os como:
8
 
9
- - **Positivo**
10
- - **Neutro**
11
- - **Negativo**
12
 
13
- ## 📦 Estrutura dos Arquivos
14
 
15
- - `bert_model.zip`: modelo original completo.
16
- - `pytorch_model.safetensors`: versão otimizada do modelo em formato seguro.
17
- - `config.json` / `tokenizer_config.json`: arquivos de configuração do modelo e tokenizador.
 
 
18
 
19
- ## 🗣️ Linguagens Suportadas
20
 
21
- - 🇧🇷 Português
22
- - 🇺🇸 Inglês
23
- - 🇪🇸 Espanhol
24
 
25
- ## 🔬 Base de Dados
26
 
27
- O modelo foi fine-tuned com textos anotados manualmente a partir de interações reais com clientes, contendo indicadores de:
 
 
 
 
28
 
29
- - Satisfação
30
- - Reclamações
31
- - Risco de cancelamento
32
 
33
- ## 🚀 Como usar
34
 
35
  ```python
36
  from transformers import pipeline
37
 
38
- senticore = pipeline("sentiment-analysis", model="ViniciusKhan/senticore-bert-sentiment")
 
 
 
 
39
 
40
- texto = "O suporte técnico foi excelente, mas a ferramenta apresentou falhas constantes."
41
- resultado = senticore(texto)
42
  print(resultado)
43
  ```
44
 
45
- ## 📊 Exemplos de Entrada/Saída
 
 
 
 
46
 
47
- | Texto | Saída |
48
- |-----------------------------------------------------------------------|-------------|
49
- | "Estamos muito satisfeitos com o suporte da equipe técnica." | Positivo |
50
- | "Não conseguimos resolver o problema com o sistema até agora." | Negativo |
51
- | "Tudo está ocorrendo conforme esperado, sem grandes novidades." | Neutro |
52
 
53
- ## 🛠️ Tecnologias
54
 
55
- - `transformers` (Hugging Face)
56
- - `BERT` multilingual
57
- - `PyTorch`
58
 
59
- ## 📄 Licença
 
 
60
 
61
- MIT License.
62
 
63
  ---
64
 
65
- Desenvolvido por [Vinicius Khan](https://huggingface.co/ViniciusKhan)
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ license: mit
3
+ language: multilingual
4
+ tags:
5
+ - sentiment-analysis
6
+ - BERT
7
+ - multilingual
8
+ - customer-feedback
9
+ - churn-risk
10
+ - fine-tuned-model
11
+ - feedback-analysis
12
+ - vinicius-khan
13
+ base_model: nlptown/bert-base-multilingual-uncased-sentiment
14
+ pipeline_tag: text-classification
15
+ ---
16
 
17
+ # 🧠 Senticore: BERT Multilingual Sentiment Model
18
 
19
+ **Senticore-BERT-Sentiment** é um modelo de *fine-tuning* baseado no `bert-base-multilingual-uncased`, treinado para **análise de sentimentos multilíngue**, com ênfase especial em **feedbacks de clientes corporativos**, visando identificar **nível de satisfação e risco de cancelamento (churn)**.
20
 
21
+ ---
 
 
22
 
23
+ ## 🔍 Aplicações
24
 
25
+ - Classificação de sentimentos em **feedbacks textuais** de clientes.
26
+ - Detecção automática de **clientes insatisfeitos ou detratores**.
27
+ - Análise semântica de **resumos de chamados técnicos**, NPS e pesquisas de relacionamento.
28
+ - Sistemas de recomendação para **priorização de atendimento e mitigação de churn**.
29
+ - Dashboards inteligentes e monitoramento de sentimentos ao longo do tempo.
30
 
31
+ ---
32
 
33
+ ## 📁 Estrutura do Modelo
 
 
34
 
35
+ A pasta `bert-multilingual-sentiment/` contém:
36
 
37
+ - `config.json`
38
+ - `pytorch_model.bin` ou `model.safetensors`
39
+ - `tokenizer_config.json`
40
+ - `vocab.txt`
41
+ - `special_tokens_map.json`
42
 
43
+ ---
 
 
44
 
45
+ ## 🧪 Como Utilizar em Python
46
 
47
  ```python
48
  from transformers import pipeline
49
 
50
+ classifier = pipeline(
51
+ "text-classification",
52
+ model="ViniciusKhan/senticore-bert-sentiment",
53
+ tokenizer="ViniciusKhan/senticore-bert-sentiment"
54
+ )
55
 
56
+ texto = "Estou extremamente insatisfeito com o serviço."
57
+ resultado = classifier(texto)
58
  print(resultado)
59
  ```
60
 
61
+ ---
62
+
63
+ ## 🏷️ Labels Retornados
64
+
65
+ O modelo classifica os textos em três categorias:
66
 
67
+ - `LABEL_0`: Sentimento **Negativo**
68
+ - `LABEL_1`: Sentimento **Neutro**
69
+ - `LABEL_2`: Sentimento **Positivo**
70
+
71
+ ---
72
 
73
+ ## 📊 Dados de Treinamento
74
 
75
+ O modelo foi treinado com um conjunto balanceado de textos reais rotulados por especialistas, abrangendo:
 
 
76
 
77
+ - Clientes **Promotores** (`Positivo`)
78
+ - Clientes **Neutros**
79
+ - Clientes **Detratores** (`Negativo`)
80
 
81
+ Fontes incluem dados de NPS, resumos de chamados, pesquisas de relacionamento e interações via CRM.
82
 
83
  ---
84
 
85
+ ## 🔧 Requisitos
86
+
87
+ - Python >= 3.8
88
+ - transformers >= 4.36.2
89
+ - torch >= 2.0
90
+
91
+ Instalação via pip:
92
+ ```bash
93
+ pip install transformers torch
94
+ ```
95
+
96
+ ---
97
+
98
+ ## 🌐 Suporte a Idiomas
99
+
100
+ Este modelo é multilíngue e tem ótimo desempenho em:
101
+ - **Português**
102
+ - **Inglês**
103
+ - **Espanhol**
104
+
105
+ Pode ser aplicado em contextos multinacionais.
106
+
107
+ ---
108
+
109
+ ## 🚀 Integração com API REST
110
+
111
+ Este modelo pode ser facilmente incorporado a aplicações backend via `Flask`, `FastAPI` ou outras bibliotecas. Exemplo de endpoint disponível na pasta `/app/routes`.
112
+
113
+ ---
114
+
115
+ ## ✅ Resultados de Avaliação
116
+
117
+ Métricas estimadas em conjunto de validação:
118
+
119
+ | Métrica | Valor |
120
+ |-------------|-----------|
121
+ | Acurácia | 0.92 |
122
+ | F1-score | 0.91 |
123
+ | Recall | 0.89 |
124
+ | Precisão | 0.90 |
125
+
126
+ > *Resultados baseados em feedbacks reais rotulados.*
127
+
128
+ ---
129
+
130
+ ## 📦 Repositório Relacionado
131
+
132
+ O código fonte e pipeline de inferência encontram-se no repositório:
133
+ [https://github.com/ViniciusKanh/Senticore](https://github.com/ViniciusKanh/Senticore)
134
+
135
+ ---
136
+
137
+ ## 🧠 Autor
138
+
139
+ Desenvolvido por **Vinicius de Souza Santos (Vinicius Khan)**
140
+ Engenheiro da Computação | Cientista de Dados | Especialista em Machine Learning
141
+ [Perfil no Hugging Face](https://huggingface.co/ViniciusKhan)
142
+
143
+ ---
144
+
145
+ ## 📜 Licença
146
+
147
+ Este projeto está licenciado sob a [Licença MIT](https://opensource.org/licenses/MIT).