Spaces:
Sleeping
Sleeping
Update app.py
Browse files
app.py
CHANGED
|
@@ -45,9 +45,21 @@ def answer_question(question, max_length=200, temperature=0.7, top_k=50, top_p=0
|
|
| 45 |
try:
|
| 46 |
if not pdf_content:
|
| 47 |
return "Por favor, carregue um PDF primeiro.", ""
|
| 48 |
-
|
| 49 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 50 |
inputs = tokenizer(prompt, return_tensors="pt")
|
|
|
|
|
|
|
|
|
|
| 51 |
outputs = model.generate(
|
| 52 |
inputs.input_ids,
|
| 53 |
max_length=max_length,
|
|
@@ -56,12 +68,13 @@ def answer_question(question, max_length=200, temperature=0.7, top_k=50, top_p=0
|
|
| 56 |
top_p=top_p,
|
| 57 |
num_return_sequences=1
|
| 58 |
)
|
|
|
|
| 59 |
response = tokenizer.decode(outputs[0], skip_special_tokens=True)
|
| 60 |
return response, prompt
|
| 61 |
except Exception as e:
|
| 62 |
print(f"Erro ao gerar resposta: {e}")
|
| 63 |
print(traceback.format_exc())
|
| 64 |
-
return "Erro ao gerar resposta.",
|
| 65 |
|
| 66 |
# Interface do Gradio para carregar PDF e fazer perguntas
|
| 67 |
pdf_loader = gr.Interface(
|
|
|
|
| 45 |
try:
|
| 46 |
if not pdf_content:
|
| 47 |
return "Por favor, carregue um PDF primeiro.", ""
|
| 48 |
+
|
| 49 |
+
# Limitar o tamanho do conteúdo do PDF para evitar exceder o número máximo de tokens
|
| 50 |
+
max_tokens = 1024 # O número máximo de tokens permitido para o GPT-2 é geralmente 1024
|
| 51 |
+
truncated_content = pdf_content[:max_tokens]
|
| 52 |
+
|
| 53 |
+
prompt = f"Conteúdo do PDF: {truncated_content}\nPergunta: {question}\nResposta em português:"
|
| 54 |
+
|
| 55 |
+
# Verificando o tamanho do prompt
|
| 56 |
+
print(f"Prompt gerado (tamanho {len(prompt)}):\n{prompt[:500]}...") # Imprime os primeiros 500 caracteres para depuração
|
| 57 |
+
|
| 58 |
+
# Tokenizando o prompt
|
| 59 |
inputs = tokenizer(prompt, return_tensors="pt")
|
| 60 |
+
print(f"Tokens de entrada: {inputs.input_ids.shape[1]} tokens") # Verifica o número de tokens
|
| 61 |
+
|
| 62 |
+
# Gerar a resposta
|
| 63 |
outputs = model.generate(
|
| 64 |
inputs.input_ids,
|
| 65 |
max_length=max_length,
|
|
|
|
| 68 |
top_p=top_p,
|
| 69 |
num_return_sequences=1
|
| 70 |
)
|
| 71 |
+
|
| 72 |
response = tokenizer.decode(outputs[0], skip_special_tokens=True)
|
| 73 |
return response, prompt
|
| 74 |
except Exception as e:
|
| 75 |
print(f"Erro ao gerar resposta: {e}")
|
| 76 |
print(traceback.format_exc())
|
| 77 |
+
return "Erro ao gerar resposta.", ""
|
| 78 |
|
| 79 |
# Interface do Gradio para carregar PDF e fazer perguntas
|
| 80 |
pdf_loader = gr.Interface(
|