Spaces:

rubendsm
/

rubendsm-inteligencia-ricardo-bart-large-2

Paused

App Files Files Community

rubendsm-inteligencia-ricardo-bart-large-2 / app.py

rubendsm's picture

Update app.py

8d48e06 verified over 1 year ago

history blame contribute delete

3.15 kB

	import gradio as gr
	import os
	import torch
	from transformers import BartTokenizer, BartForConditionalGeneration, AutoConfig

	# Definindo o dispositivo
	device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

	# Obtendo o token do ambiente
	HF_TOKEN = os.environ.get("HF_TOKEN")

	# Definindo o nome do modelo
	model_name = 'rubendsm/inteligencia-ricardo-bart-large-2'

	# Carregando o tokenizador e o modelo
	config = AutoConfig.from_pretrained(model_name, hf_token=HF_TOKEN)
	tokenizer = BartTokenizer.from_pretrained(model_name)
	model = BartForConditionalGeneration.from_pretrained(model_name, config=config)
	model.to(device) # Movendo o modelo para o dispositivo adequado

	# Função para sumarizar o texto de entrada
	def summarize_long_text(input_text, temperature=1.6, top_k=55, top_p=0.8, num_beams=8):
	# Divide o texto em partes menores
	max_input_length = 2048
	max_output_length = 2048
	parts = [input_text[i:i+max_input_length] for i in range(0, len(input_text), max_input_length)]

	part_summaries = []
	for part in parts:
	input_ids = tokenizer.encode(part, return_tensors="pt", max_length=max_input_length, truncation=True)
	# Movendo os dados de entrada para o dispositivo adequado
	input_ids = input_ids.to(device)
	output = model.generate(
	input_ids, # IDs de entrada codificados
	max_length=max_output_length, # Comprimento máximo do texto gerado
	num_return_sequences=1, # Número de sequências de retorno
	do_sample=True, # Habilita a amostragem aleatória
	temperature=temperature, # Controla a aleatoriedade da geração
	top_k=top_k, # Controla o número de tokens candidatos considerados
	top_p=top_p, # Controla a soma acumulada das probabilidades de tokens
	num_beams=num_beams # Número de feixes (sequências candidatas) durante a geração
	)
	summary = tokenizer.decode(output[0], skip_special_tokens=True)
	part_summaries.append(summary)

	# Concatena os resumos das partes em um único resumo
	full_summary = ' '.join(part_summaries)
	return full_summary


	# Interface do Gradio
	textbox_input = gr.Textbox(lines=7, label="Input Text")
	temperature_slider = gr.Slider(minimum=0.1, maximum=2.0, label="Temperature - Controla a aleatoriedade da geração", value=1.6)
	top_k_slider = gr.Slider(minimum=1, maximum=100, label="Top K - Controla o número de tokens candidatos considerados", value=55)
	top_p_slider = gr.Slider(minimum=0.1, maximum=1.0, label="Top P - Controla a soma acumulada das probabilidades de tokens", value=0.8)
	num_beams_slider = gr.Slider(minimum=1, maximum=10, label="Num Beams - Número de feixes (sequências candidatas) durante a geração", value=8)
	textbox_output = gr.Textbox(label="Summary")

	interface = gr.Interface(
	fn=summarize_long_text,
	inputs=[textbox_input, temperature_slider, top_k_slider, top_p_slider, num_beams_slider],
	outputs=textbox_output,
	title="Resumo de transcrição de reuniões",
	description="Assembleia Municipal de Paredes"
	)
	interface.launch(share=True)