Spaces:

Shami96
/

PPRA-Copilot

Sleeping

Shami96 commited on May 17, 2025

Commit

b1e29d6

verified ·

1 Parent(s): 9ae7124

Update utils.py

Files changed (1) hide show

utils.py CHANGED Viewed

@@ -1,10 +1,36 @@
 # utils.py
-import pdfplumber
-def extract_text_from_pdf(file):
-    text = ""
-    with pdfplumber.open(file) as pdf:
-        for page in pdf.pages:
-            text += page.extract_text() or ""
-    return text.strip()

 # utils.py
+import requests
+from bs4 import BeautifulSoup
+def fetch_active_tenders():
+    url = "https://www.ppra.org.pk/dad_tenders.asp"
+    response = requests.get(url)
+    soup = BeautifulSoup(response.content, "html.parser")
+    tenders = []
+    table = soup.find("table")  # Adjust selector based on actual HTML structure
+    if table:
+        rows = table.find_all("tr")[1:]  # Skip header row
+        for row in rows:
+            cols = row.find_all("td")
+            if len(cols) >= 5:
+                tender = {
+                    "tender_no": cols[0].get_text(strip=True),
+                    "organization": cols[1].get_text(strip=True),
+                    "title": cols[2].get_text(strip=True),
+                    "advertised_date": cols[3].get_text(strip=True),
+                    "closing_date": cols[4].get_text(strip=True),
+                }
+                tenders.append(tender)
+    return tenders
+def fetch_tender_details(tender_no):
+    # Construct the URL to the tender's detail page
+    detail_url = f"https://www.ppra.org.pk/tender/{tender_no}.asp"  # Placeholder URL
+    response = requests.get(detail_url)
+    soup = BeautifulSoup(response.content, "html.parser")
+    # Extract detailed information
+    details = soup.get_text(separator="\n", strip=True)
+    return details