ViniciusKhan
/

bert-nps-feedback-analyzer

Text Classification

sentiment-analysis

Model card Files Files and versions

bert-nps-feedback-analyzer / README.md

ViniciusKhan's picture

Update README.md

9499fda verified 7 months ago

|

history blame contribute delete

3.68 kB

	---
	language:
	- pt
	tags:
	- sentiment-analysis
	- nps
	- text-classification
	- portuguese
	license: mit
	pipeline_tag: text-classification
	datasets:
	- nps
	- customer-feedback
	---

	# 🤖 BERT NPS Feedback Analyzer (PT-BR)

	Este modelo é uma adaptação de `cardiffnlp/twitter-xlm-roberta-base-sentiment` voltada para a análise de sentimentos em textos longos de NPS (Net Promoter Score), com foco em avaliações técnicas, institucionais e operacionais típicas de ambientes corporativos.

	---

	## 🧠 Contexto do Problema

	Frases de NPS corporativas em português tendem a ser extensas e mistas, contendo tanto elogios quanto críticas em uma mesma resposta. A maioria dos modelos tradicionais apresenta falhas ao interpretar esse tipo de conteúdo, classificando erroneamente como negativo textos que relatam problemas já resolvidos ou experiências neutras.

	---

	## 🏗️ Arquitetura do Modelo

	- Base: [`cardiffnlp/twitter-xlm-roberta-base-sentiment`](https://huggingface.co/cardiffnlp/twitter-xlm-roberta-base-sentiment)
	- Arquitetura: XLM-RoBERTa base (multilíngue, robusto para entradas longas)
	- Tarefa: `text-classification` com 3 classes:
	- `Negative`
	- `Neutral`
	- `Positive`

	---

	## 📥 Uso do Modelo

	### 🔧 Requisitos

	```bash
	pip install transformers torch
	```

	### 📦 Código de uso

	```python
	from transformers import AutoTokenizer, AutoModelForSequenceClassification
	import torch.nn.functional as F
	import torch

	# Nome do modelo no Hugging Face Hub
	modelo = "ViniciusKhan/bert-nps-feedback-analyzer"

	# Carregar modelo e tokenizer
	tokenizer = AutoTokenizer.from_pretrained(modelo)
	model = AutoModelForSequenceClassification.from_pretrained(modelo)

	# Texto de NPS para avaliação
	texto = """
	Conversei com Alexandre em 20/06 e ele relatou insatisfação com os relatórios, pois vieram misturados.
	O chamado foi resolvido e desde então me procura sempre que precisa. Está satisfeito com os serviços atuais.
	"""

	# Tokenizar e inferir
	inputs = tokenizer(texto, return_tensors="pt", truncation=True)
	with torch.no_grad():
	outputs = model(**inputs)
	probs = F.softmax(outputs.logits, dim=1)

	# Rótulos
	classes = ['Negative', 'Neutral', 'Positive']
	classe_predita = classes[probs.argmax().item()]

	print("Sentimento:", classe_predita)
	```

	---

	## ✅ Aplicações práticas

	Este modelo é ideal para:

	- Classificação de feedback de clientes em SAC, helpdesk e pós-venda
	- Avaliação de sentimento em pesquisas de satisfação (NPS)
	- Processamento automatizado de tickets e reclamações
	- Sistemas de BI e dashboards com análise textual

	---

	## 🗂️ Estrutura do Repositório

	\| Arquivo \| Descrição \|
	\|----------------------\|-------------------------------------\|
	\| `pytorch_model.bin` \| Pesos do modelo \|
	\| `config.json` \| Configuração do modelo \|
	\| `tokenizer.json` \| Vocabulário do tokenizer \|
	\| `README.md` \| Descrição técnica do modelo \|

	---

	## 🧬 Dataset original do modelo base

	O modelo base foi treinado com dados multilingues do Twitter, incluindo português, e adaptado para generalização ampla de sentimentos. A robustez do XLM-RoBERTa permite interpretar frases com vocabulário técnico e institucional mesmo sem fine-tuning adicional.

	---

	## 👨‍💻 Autor

	Vinicius de Souza Santos
	Cientista de Dados • IFSP • Especialista em Machine Learning aplicado a serviços e experiência do cliente
	🔗 [GitHub](https://github.com/ViniciusKanh)

	---

	## 📄 Licença

	Este modelo é disponibilizado sob a licença MIT.