Commit Inicial para Reconocimiento Avanzado de Documentos
Browse files- __pycache__/app.cpython-311.pyc +0 -0
- __pycache__/funciones.cpython-311.pyc +0 -0
- documentos.py +1 -0
- funciones.py +2 -0
- herramientas.py +3 -2
- obtenCampo.py +2 -1
__pycache__/app.cpython-311.pyc
CHANGED
|
Binary files a/__pycache__/app.cpython-311.pyc and b/__pycache__/app.cpython-311.pyc differ
|
|
|
__pycache__/funciones.cpython-311.pyc
CHANGED
|
Binary files a/__pycache__/funciones.cpython-311.pyc and b/__pycache__/funciones.cpython-311.pyc differ
|
|
|
documentos.py
CHANGED
|
@@ -1,6 +1,7 @@
|
|
| 1 |
import obtenCampo
|
| 2 |
|
| 3 |
async def dni(textos_extraidos):
|
|
|
|
| 4 |
textos_extraidos_simplificados = [texto.lower().replace(" ", "") for texto in textos_extraidos]
|
| 5 |
print("Textos extraídos simplificados:")
|
| 6 |
print(textos_extraidos_simplificados)
|
|
|
|
| 1 |
import obtenCampo
|
| 2 |
|
| 3 |
async def dni(textos_extraidos):
|
| 4 |
+
print("Iniciando búsqueda de dni.")
|
| 5 |
textos_extraidos_simplificados = [texto.lower().replace(" ", "") for texto in textos_extraidos]
|
| 6 |
print("Textos extraídos simplificados:")
|
| 7 |
print(textos_extraidos_simplificados)
|
funciones.py
CHANGED
|
@@ -5,6 +5,8 @@ import time
|
|
| 5 |
async def procesa_documento(image):
|
| 6 |
|
| 7 |
textos_extraidos = await herramientas.procesaImagen(image)
|
|
|
|
|
|
|
| 8 |
print("Textos extraídos: ")
|
| 9 |
print(textos_extraidos)
|
| 10 |
|
|
|
|
| 5 |
async def procesa_documento(image):
|
| 6 |
|
| 7 |
textos_extraidos = await herramientas.procesaImagen(image)
|
| 8 |
+
print("El tipo regresado por procesa imagen es: ", type(textos_extraidos))
|
| 9 |
+
time.sleep(1)
|
| 10 |
print("Textos extraídos: ")
|
| 11 |
print(textos_extraidos)
|
| 12 |
|
herramientas.py
CHANGED
|
@@ -15,7 +15,7 @@ async def imageToTemp(image):
|
|
| 15 |
return temp_file_path
|
| 16 |
|
| 17 |
except Exception as e:
|
| 18 |
-
print(f"Error al procesar
|
| 19 |
return {"error": "Error al procesar la imagen"}
|
| 20 |
|
| 21 |
|
|
@@ -150,6 +150,7 @@ async def procesaImagen(image):
|
|
| 150 |
return textos_extraidos
|
| 151 |
except Exception as e:
|
| 152 |
print(f"Error al procesar el archivo: {e}")
|
|
|
|
| 153 |
|
| 154 |
|
| 155 |
def obtener_fecha(texto):
|
|
@@ -204,7 +205,7 @@ def define_documento(textos_extraidos):
|
|
| 204 |
|
| 205 |
#Busqueda de DNI
|
| 206 |
conceptos_busqueda_dni = [
|
| 207 |
-
{'preferida': 'nombre', 'alternativas': []},
|
| 208 |
{'preferida': 'usual', 'alternativas': []}
|
| 209 |
]
|
| 210 |
|
|
|
|
| 15 |
return temp_file_path
|
| 16 |
|
| 17 |
except Exception as e:
|
| 18 |
+
print(f"Error al procesar la imagen: {e}")
|
| 19 |
return {"error": "Error al procesar la imagen"}
|
| 20 |
|
| 21 |
|
|
|
|
| 150 |
return textos_extraidos
|
| 151 |
except Exception as e:
|
| 152 |
print(f"Error al procesar el archivo: {e}")
|
| 153 |
+
return 'Error'
|
| 154 |
|
| 155 |
|
| 156 |
def obtener_fecha(texto):
|
|
|
|
| 205 |
|
| 206 |
#Busqueda de DNI
|
| 207 |
conceptos_busqueda_dni = [
|
| 208 |
+
{'preferida': 'nombre', 'alternativas': ['noaigre']},
|
| 209 |
{'preferida': 'usual', 'alternativas': []}
|
| 210 |
]
|
| 211 |
|
obtenCampo.py
CHANGED
|
@@ -20,7 +20,8 @@ def Fecha_Nacimiento(textos_extraidos, textos_extraidos_limpios):
|
|
| 20 |
{'preferida': 'nacimiento', 'alternativas': ['nacimento']} ]
|
| 21 |
|
| 22 |
indice, textos_extraidos_corregidos = herramientas.buscaIndexMultiplesPalabras_Corregida(textos_extraidos_limpios, conceptos_busqueda)
|
| 23 |
-
|
|
|
|
| 24 |
textos_extraidos_limpios = textos_extraidos_corregidos
|
| 25 |
print("El índice de la fecha de nacimiento es: ", indice)
|
| 26 |
texto_fecha_nacimiento = textos_extraidos_limpios[indice] #En ésta ocasión estoy usando el texto limpio para que el patrón lo identifique más fácilmente.
|
|
|
|
| 20 |
{'preferida': 'nacimiento', 'alternativas': ['nacimento']} ]
|
| 21 |
|
| 22 |
indice, textos_extraidos_corregidos = herramientas.buscaIndexMultiplesPalabras_Corregida(textos_extraidos_limpios, conceptos_busqueda)
|
| 23 |
+
#Future: Agregar validación aquí, porque si regresa None es que no encontró nada.
|
| 24 |
+
print("Ésto es textos extraídos corregidos: ", textos_extraidos_corregidos)
|
| 25 |
textos_extraidos_limpios = textos_extraidos_corregidos
|
| 26 |
print("El índice de la fecha de nacimiento es: ", indice)
|
| 27 |
texto_fecha_nacimiento = textos_extraidos_limpios[indice] #En ésta ocasión estoy usando el texto limpio para que el patrón lo identifique más fácilmente.
|