DIACDE's picture
Update README.md
f741b3e verified
---
license: cc-by-nc-sa-4.0
language:
- pt
base_model:
- google-bert/bert-base-multilingual-cased
pipeline_tag: text-classification
tags:
- legal
---
# Modelo BERT para Classificação de Sentenças Jurídicas: Fato, Tese e Ruído
Este repositório disponibiliza um modelo BERT fine-tuned a partir do `google-bert/bert-base-multilingual-cased`, com o objetivo de classificar sentenças extraídas de processos judiciais em três categorias:
- **FATO**: Sentenças que descrevem acontecimentos ou elementos objetivos do caso.
- **TESE**: Sentenças que apresentam argumentos jurídicos ou fundamentos legais.
- **RUÍDO**: Sentenças que não se enquadram como fato nem como tese (ex: trechos genéricos, introdutórios ou sem relevância jurídica direta).
> Desenvolvido pela **Diretoria de Inteligência Artificial, Ciência de Dados e Estatística** do **Tribunal de Justiça do Estado de Goiás (TJGO)**.
## 1. Instalação
Para instalar as dependências necessárias, execute o comando abaixo:
```bash
pip install transformers
```
## 2. Utilização do Modelo
```Python
from transformers import pipeline
text = """a empresa requerente atua..."""
classifier = pipeline("text-classification", model=r"DIACDE/BERT_FATO_TESE", return_all_scores=True, truncation=True)
print(classifier(text))
#[
# {'label': 'FATO', 'score': 0.85},
# {'label': 'TESE', 'score': 0.10}
# {'label': 'RUIDO', 'score': 0.5}
#]
```