Spaces:

MelonnAI
/

AuxiliaryTools

Sleeping

App Files Files Community

Daniel Castrillon commited on Oct 26, 2023

Commit

66a2e50

1 Parent(s): 98d21f2

added tracking identification logic

Browse files

Files changed (1) hide show

app.py +49 -17

app.py CHANGED Viewed

@@ -20,15 +20,43 @@ def process_estafeta_pdf(file_name, page):
     # page.scale_to(100, 200)
     save_pdf_file(file_name, page)
 def process_dhl_pdf(file_name, page):
     page.cropbox.upper_left = (92,20)
     page.cropbox.lower_right = (360,560)
     save_pdf_file(file_name, page)
 def process_ups_pdf(file_name, page):
     # page.cropbox.upper_left = (0,0)
     # page.cropbox.lower_right = (500,400)
     page.rotate(90)
     save_pdf_file(file_name, page)
 def process_coppel_pdf(file_name, page):
@@ -36,6 +64,17 @@ def process_coppel_pdf(file_name, page):
     page.cropbox.lower_right = (400,520)
     save_pdf_file(file_name, page)
 def process_pdf_file(file):
     """
     This function processes the PDF file and returns the file name, file path and transport company
@@ -54,34 +93,27 @@ def process_pdf_file(file):
     page = pdf.pages[0]
     pdf_text = page.extract_text()
-    page.rotateClockwise = 90
     transport_company = None
     file_name = file.name
     file_path = f"files/{file_name}"
     if re.search("estafeta", pdf_text, re.IGNORECASE):
         transport_company = "estafeta"
         process_estafeta_pdf(file_name, page)
-    elif re.search("ups", pdf_text, re.IGNORECASE):
-        transport_company = "ups"
-        process_ups_pdf(file_name, page)
     elif re.search("dhl", pdf_text, re.IGNORECASE):
         transport_company = "dhl"
         process_dhl_pdf(file_name, page)
     elif re.search("coppel", pdf_text, re.IGNORECASE):
         transport_company = "coppel"
         process_coppel_pdf(file_name, page)
-    if transport_company is None:
         transport_company = "ups"
         process_ups_pdf(file_name, page)
-        # print(pdf_text)
-        # raise Exception("No se pudo identificar la compañia de transporte")
     pdf_stream.close()
     return file_name, file_path, transport_company
 async def process_chat():
@@ -99,17 +131,17 @@ async def process_chat():
         ).send()
     try:
-        elements = []
-        content = ""
         files_path = []
         for file in files:
             file_name, file_path, transport_company = process_pdf_file(file)
-            elements.append(cl.File(name=file_name, display="inline", path=file_path))
             files_path.append(file_path)
-            content += f"Guía de {transport_company.upper()}\n"
-        msg = cl.Message(content=content, elements=elements)
-        await msg.send()
         for file_path in files_path:
             os.remove(file_path)
     except Exception as e:

     # page.scale_to(100, 200)
     save_pdf_file(file_name, page)
+def process_estafeta_text(pdf_text):
+    extracted_text = ""
+    match = re.search(r'CONFIRMACION (\d+-\d+\w+)', pdf_text)
+    if match:
+        extracted_text = match.group(1)
+        index = -1
+        for i, char in enumerate(reversed(extracted_text)):
+            if char.isalpha():
+                index = len(extracted_text) - i
+                break
+    extracted_text = extracted_text[0:index].replace("-", "")
+    file_name = extracted_text + ".pdf"
+    file_path = f"files/{file_name}"
+    return file_name, file_path
 def process_dhl_pdf(file_name, page):
     page.cropbox.upper_left = (92,20)
     page.cropbox.lower_right = (360,560)
     save_pdf_file(file_name, page)
+def process_dhl_text(pdf_text):
+    matches = re.findall(r'WAYBILL (\d+(?: \d+)*)', pdf_text)
+    for match in matches:
+        extracted_text = match.replace(" ", "")
+    file_name = extracted_text + ".pdf"
+    file_path = f"files/{file_name}"
+    return file_name, file_path
 def process_ups_pdf(file_name, page):
     # page.cropbox.upper_left = (0,0)
     # page.cropbox.lower_right = (500,400)
     page.rotate(90)
+    pdf_text = page.extract_text()
+    print(pdf_text)
     save_pdf_file(file_name, page)
 def process_coppel_pdf(file_name, page):
     page.cropbox.lower_right = (400,520)
     save_pdf_file(file_name, page)
+def process_coppel_text(pdf_text):
+    match = re.search(r'TN: (\w+)', pdf_text)
+    if match:
+        extracted_text = match.group(1)
+    else:
+        print("Pattern not found in the text.")
+    file_name = extracted_text + ".pdf"
+    file_path = f"files/{file_name}"
+    return file_name, file_path
 def process_pdf_file(file):
     """
     This function processes the PDF file and returns the file name, file path and transport company
     page = pdf.pages[0]
     pdf_text = page.extract_text()
     transport_company = None
     file_name = file.name
     file_path = f"files/{file_name}"
     if re.search("estafeta", pdf_text, re.IGNORECASE):
         transport_company = "estafeta"
+        file_name, file_path = process_estafeta_text(pdf_text)
         process_estafeta_pdf(file_name, page)
     elif re.search("dhl", pdf_text, re.IGNORECASE):
         transport_company = "dhl"
+        file_name, file_path = process_dhl_text(pdf_text)
         process_dhl_pdf(file_name, page)
     elif re.search("coppel", pdf_text, re.IGNORECASE):
         transport_company = "coppel"
+        file_name, file_path = process_coppel_text(pdf_text)
         process_coppel_pdf(file_name, page)
+    else:
         transport_company = "ups"
         process_ups_pdf(file_name, page)
     pdf_stream.close()
     return file_name, file_path, transport_company
 async def process_chat():
         ).send()
     try:
         files_path = []
         for file in files:
             file_name, file_path, transport_company = process_pdf_file(file)
+            elements = [cl.File(name=file_name, display="inline", path=file_path)]
             files_path.append(file_path)
+            file_name = file_name.replace(".pdf", "")
+            content = f"Guía de {transport_company.upper()}: **{file_name}**"
+            msg = cl.Message(content=content, elements=elements)
+            await msg.send()
         for file_path in files_path:
             os.remove(file_path)
     except Exception as e: