eberhenriquez94 commited on
Commit
cd6f6b9
verified
1 Parent(s): e642214
Files changed (1) hide show
  1. app.py +12 -2
app.py CHANGED
@@ -28,18 +28,28 @@ def procesar_pdf_con_ocr(pdf_subido, idioma="spa"):
28
  input_pdf = pdf_subido.name
29
  output_pdf = tempfile.NamedTemporaryFile(delete=False, suffix=".pdf").name
30
 
 
 
 
 
 
 
 
31
  ejecutar_comando(
32
- f"ocrmypdf -l {idioma} --force-ocr --deskew --output-type pdf {input_pdf} {output_pdf}",
33
  mensaje_exito="OCR completado",
34
  mensaje_error="Error en OCR"
35
  )
36
 
 
 
 
 
37
  return output_pdf # Ruta del archivo procesado
38
  except Exception as e:
39
  logging.error(f"Error al procesar el PDF: {e}")
40
  raise gr.Error(f"Ocurri贸 un error al procesar el archivo: {e}")
41
 
42
- # Interfaz Gradio
43
  def interfaz_ocr():
44
  """Crea la interfaz Gradio para el flujo de OCR."""
45
  with gr.Blocks() as app:
 
28
  input_pdf = pdf_subido.name
29
  output_pdf = tempfile.NamedTemporaryFile(delete=False, suffix=".pdf").name
30
 
31
+ # Verificar que el archivo de entrada es un PDF
32
+ if not input_pdf.endswith(".pdf"):
33
+ raise gr.Error("El archivo subido no es un PDF v谩lido.")
34
+
35
+ # Ejecutar ocrmypdf
36
+ comando = f"ocrmypdf -l {idioma} --force-ocr --deskew --output-type pdf '{input_pdf}' '{output_pdf}'"
37
+ logging.info(f"Ejecutando comando: {comando}")
38
  ejecutar_comando(
39
+ comando,
40
  mensaje_exito="OCR completado",
41
  mensaje_error="Error en OCR"
42
  )
43
 
44
+ # Verificar que el archivo de salida se haya creado
45
+ if not os.path.exists(output_pdf):
46
+ raise gr.Error("El archivo procesado no se gener贸 correctamente.")
47
+
48
  return output_pdf # Ruta del archivo procesado
49
  except Exception as e:
50
  logging.error(f"Error al procesar el PDF: {e}")
51
  raise gr.Error(f"Ocurri贸 un error al procesar el archivo: {e}")
52
 
 
53
  def interfaz_ocr():
54
  """Crea la interfaz Gradio para el flujo de OCR."""
55
  with gr.Blocks() as app: