chat_docker / corretor.py
profdanielvieira95's picture
aplicaçao chatbot
2b54ad5 verified
# corretor.py
import re
import unicodedata
# Dicionário com erros comuns
erros_comuns = {
"repexções": "repetições",
"repeções": "repetições",
"repitições": "repetições",
"repeçoes": "repetições",
"repiticões": "repetições",
"algorítmo": "algoritmo",
"algorimo": "algoritmo",
"negeção": "negação",
"conjunsão": "conjunção",
"disjunsão": "disjunção",
"logíca": "lógica",
"logica": "lógica",
"computácional": "computacional",
"computácionais": "computacionais",
"Repexções": "Repetições",
"algorítimo": "algoritmo",
"inteligëncia": "inteligência",
"inteligêcia": "inteligência",
"proçesso": "processo",
"conhecimento prévio": "conhecimento pré-existente",
"machine learn": "machine learning",
"aprendizagem de maquina": "aprendizado de máquina",
"treinamemto": "treinamento",
"resposta esperda": "resposta esperada",
"parâmetors": "parâmetros",
"varíavel": "variável",
"entrada e sáida": "entrada e saída",
"expecificação": "especificação",
"funcionalidae": "funcionalidade",
"platafoma": "plataforma",
"dadoos": "dados",
"códigoo": "código",
"apredizado": "aprendizado",
"funcinamento": "funcionamento",
"reconhencimento": "reconhecimento",
"desempenhho": "desempenho",
"classificaçao": "classificação",
"interpetar": "interpretar",
"devem ser treinados com base nos dados": "devem ser treinados com base em dados",
"idenxicar": "identificar",
"inicialixado": "inicializado",
"funxão": "função",
"operaçõx": "operações",
"bitdog lab": "BitDog Lab",
"Bitdog Lab": "BitDog Lab",
}
def corrigir_texto(texto: str) -> str:
for erro, correcao in erros_comuns.items():
texto = re.sub(rf"\b{erro}\b", correcao, texto, flags=re.IGNORECASE)
return texto