Spaces:

fschwartzer
/

llm_test

Sleeping

App Files Files Community

fschwartzer commited on Jul 9, 2024

Commit

ece4f2b

verified ·

1 Parent(s): d016c3b

Update app.py

Browse files

Files changed (1) hide show

app.py +32 -6

app.py CHANGED Viewed

@@ -1,18 +1,44 @@
 import os
 import gradio as gr
 import pandas as pd
-from src.brain import generate_answers
 processing = False
 data = pd.read_csv('anomalies.csv')
-def response(query, history):
     global processing
     processing = True
-    context = f"Analyze the following data to answer the question: {data.head().to_string(index=False)}"
-    prompt = {query}
-    output = generate_answers(prompt)
-    history.append((query, output))
     processing = False
     return "", history

 import os
 import gradio as gr
 import pandas as pd
+from transformers import GPT2Tokenizer, GPT2LMHeadModel
+# Carregando o modelo e o tokenizador do GPT-2
+tokenizer = GPT2Tokenizer.from_pretrained('gpt2')
+model = GPT2LMHeadModel.from_pretrained('gpt2')
 processing = False
 data = pd.read_csv('anomalies.csv')
+def response(question, history):
     global processing
     processing = True
+    if tokenizer.pad_token is None:
+        tokenizer.pad_token = tokenizer.eos_token
+    prompt = f"Considerando os dados: {df.to_string(index=False)}. Pergunta: {question} Resposta:"
+    inputs = tokenizer(prompt, return_tensors='pt', padding='max_length', truncation=True, max_length=512)
+    attention_mask = inputs['attention_mask']
+    input_ids = inputs['input_ids']
+    generated_ids = model.generate(
+        input_ids,
+        attention_mask=attention_mask,
+        max_length=len(input_ids[0]) + 100,  # Aumentar o limite de geração
+        temperature=0.65,  # Ajustar a criatividade
+        top_p=0.9,  # Usar nucleus sampling
+        no_repeat_ngram_size=2  # Evitar repetições desnecessárias
+    )
+    generated_text = tokenizer.decode(generated_ids[0], skip_special_tokens=True)
+    # Processando para extrair apenas a resposta após "Resposta:"
+    response_part = generated_text.split("Resposta:")[1] if "Resposta:" in generated_text else "Resposta não encontrada."
+    # Limpeza adicional para remover qualquer texto indesejado após a resposta
+    final_response = response_part.split(".")[0] + "."  # Isso assume que a resposta termina na primeira sentença.
+    history.append((question, final_response))
     processing = False
     return "", history