|
|
--- |
|
|
license: cc-by-nc-sa-4.0 |
|
|
language: |
|
|
- pt |
|
|
base_model: |
|
|
- google-bert/bert-base-multilingual-cased |
|
|
pipeline_tag: text-classification |
|
|
tags: |
|
|
- legal |
|
|
--- |
|
|
|
|
|
# Modelo BERT para Classificação de Sentenças Jurídicas: Fato, Tese e Ruído |
|
|
|
|
|
Este repositório disponibiliza um modelo BERT fine-tuned a partir do `google-bert/bert-base-multilingual-cased`, com o objetivo de classificar sentenças extraídas de processos judiciais em três categorias: |
|
|
|
|
|
- **FATO**: Sentenças que descrevem acontecimentos ou elementos objetivos do caso. |
|
|
- **TESE**: Sentenças que apresentam argumentos jurídicos ou fundamentos legais. |
|
|
- **RUÍDO**: Sentenças que não se enquadram como fato nem como tese (ex: trechos genéricos, introdutórios ou sem relevância jurídica direta). |
|
|
|
|
|
> Desenvolvido pela **Diretoria de Inteligência Artificial, Ciência de Dados e Estatística** do **Tribunal de Justiça do Estado de Goiás (TJGO)**. |
|
|
|
|
|
|
|
|
## 1. Instalação |
|
|
|
|
|
Para instalar as dependências necessárias, execute o comando abaixo: |
|
|
|
|
|
```bash |
|
|
pip install transformers |
|
|
``` |
|
|
|
|
|
## 2. Utilização do Modelo |
|
|
|
|
|
```Python |
|
|
from transformers import pipeline |
|
|
text = """a empresa requerente atua...""" |
|
|
|
|
|
classifier = pipeline("text-classification", model=r"DIACDE/BERT_FATO_TESE", return_all_scores=True, truncation=True) |
|
|
print(classifier(text)) |
|
|
|
|
|
#[ |
|
|
# {'label': 'FATO', 'score': 0.85}, |
|
|
# {'label': 'TESE', 'score': 0.10} |
|
|
# {'label': 'RUIDO', 'score': 0.5} |
|
|
#] |
|
|
``` |