COPLIN-UFSM
/

student-sentiment-analysis-multilabel

Safetensors

Portuguese

bert

Model card Files Files and versions

xet

Community

henryzord commited on Jul 10, 2025

Commit

d112cc8

verified ·

1 Parent(s): 5178e4b

Update README.md

Browse files

Files changed (1) hide show

README.md +15 -51

README.md CHANGED Viewed

@@ -34,63 +34,27 @@ pelo modelo.
 ## Treinamento
-Para utilizar este script:
-1. A partir do diretório raiz do repositório, crie uma pasta `instance`. Dentro dela, crie uma pasta `models`.
-  Finalmente, dentro da pasta `models`, crie outra pasta, desta vez com o nome do modelo que será treinado. Neste
-  exemplo usaremos o nome `student-sentiment-analysis-multilabel`, mas você pode usar qualquer outro nome.
-   ```
-   nlp/
-     instance/
-       models/
-         student-sentiment-analysis-multilabel/
-   ```
-2. Copie-e-cole para dentro da pasta do modelo o arquivo [parameters.json](student_sentiment_analysis_multilabel.json):
-   ```
-   nlp/
-     instance/
-       models/
-         student-sentiment-analysis-multilabel/
-           parameters.json
-   ```
-3. Abra este arquivo em um editor de texto, e mude os parâmetros de acordo com sua preferência. Os principais parâmetros
-   a serem modificados são:
-   * use_cpu: use `true` caso você não tenha uma placa de vídeo NVIDIA compatível com CUDA. Para saber se sua placa é
-     compatível, execute o comando `python -c "import torch; print(torch.cuda.is_available())`; caso a saída deste
-     comando seja `True`, você tem uma placa de vídeo compatível e configurada.
-   * num_train_epochs: número de épocas para treinar o modelo. Para fazer um fine-tuning, não é necessário utilizar
-     muitas épocas. Modifique de acordo com sua preferência;
-   * train_path, val_path, test_path: caminhos para arquivos de treino, validação e teste, respectivamente. Os arquivos
-     devem estar no formato csv, possuírem delimitação por vírgula, texto entre aspas, e codificação UTF-8. Use caminho
-     absoluto.
-   * input_column: nome da coluna nos arquivos de treino, validação e teste que possuí o texto.
-   * class_name: nome das colunas que serão utilizadas como atributo-classe, uma coluna para cada rótulo. Estas colunas
-     devem ser binárias (i.e. valor 1 para um comentário que apresenta aquele sentimento, ou 0 em caso contrário).
-   * output_dir: caminho onde escrever o modelo treinado. Use um caminho absoluto para o diretório
-     `instance/models/<nome_do_modelo>`, e.g.
-     `C:\\Users\\henry\\Projects\\nlp\\instance\\models\\multilabel_two_classes`
-   * output_model_name: Nome do modelo. Neste tutorial, estamos usando `multilabel_two_classes`
-4. Após a configuração, e a partir da pasta raiz do diretório, execute o script [finetune.py](finetune.py),
-   passando como parâmetro o caminho do arquivo `parameters.json`:
-   ```bash
-   conda activate nlp
-   python learning/multilabel/finetune.py --parameters-path instance/models/<nome_do_modelo>/student_sentiment_analysis_multilabel.json
-   ```
-   Substitua `<nome_do_modelo>` pelo nome dado para o parâmetro `output_model_name`.
-## Predição
-Para predizer valores com o modelo treinado:
 ```bash
-conda activate nlp
-python --model-path "path_to_model" --mode annotate --dataset-path "path_to_csv"
 ```

 ## Treinamento
+Consulte o repositório do [GitHub](https://github.com/COPLIN-UFSM/nlp)
+## Predição
+Você precisará gerar um [token de acesso](https://huggingface.co/settings/tokens) para fazer inferências. Armazene este token na variável `token`:
+```python
+from transformers import pipeline, BertTokenizer, BertForSequenceClassification
+model = BertForSequenceClassification.from_pretrained('COPLIN-UFSM/student-sentiment-analysis-multilabel', token=token)
+tokenizer = BertTokenizer.from_pretrained(
+    'COPLIN-UFSM/student-sentiment-analysis-multilabel', model_max_length=model.config.max_position_embeddings, token=token
+)
+pipe = pipeline('sentiment-analysis', model=model, tokenizer=tokenizer, device='cpu')
+pipe('eu adoro o professor henry!', top_k=None)
+```
+A saída será:
 ```bash
+[{'label': 'positive', 'score': 0.9967827796936035},
+ {'label': 'negative', 'score': 0.001376272994093597}]
 ```