DIACDE's picture
Update README.md
f741b3e verified
metadata
license: cc-by-nc-sa-4.0
language:
  - pt
base_model:
  - google-bert/bert-base-multilingual-cased
pipeline_tag: text-classification
tags:
  - legal

Modelo BERT para Classificação de Sentenças Jurídicas: Fato, Tese e Ruído

Este repositório disponibiliza um modelo BERT fine-tuned a partir do google-bert/bert-base-multilingual-cased, com o objetivo de classificar sentenças extraídas de processos judiciais em três categorias:

  • FATO: Sentenças que descrevem acontecimentos ou elementos objetivos do caso.
  • TESE: Sentenças que apresentam argumentos jurídicos ou fundamentos legais.
  • RUÍDO: Sentenças que não se enquadram como fato nem como tese (ex: trechos genéricos, introdutórios ou sem relevância jurídica direta).

Desenvolvido pela Diretoria de Inteligência Artificial, Ciência de Dados e Estatística do Tribunal de Justiça do Estado de Goiás (TJGO).

1. Instalação

Para instalar as dependências necessárias, execute o comando abaixo:

pip install transformers

2. Utilização do Modelo

from transformers import pipeline
text = """a empresa requerente atua..."""

classifier = pipeline("text-classification", model=r"DIACDE/BERT_FATO_TESE", return_all_scores=True, truncation=True)
print(classifier(text))

#[
#    {'label': 'FATO', 'score': 0.85},
#    {'label': 'TESE', 'score': 0.10}
#    {'label': 'RUIDO', 'score': 0.5}
#]