Spaces:

MoslemBot
/

KajiWeb

Sleeping

Bofandra commited on Jul 16, 2025

Commit

2981248

verified ·

1 Parent(s): 882e86e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -39,7 +39,10 @@ def extract_links_and_text(base_url, max_depth=1, visited=None):
     visited.add(base_url)
     print(f"🔗 Crawling: {base_url}")
     try:
-        response = requests.get(base_url, timeout=10)
         response.raise_for_status()
         soup = BeautifulSoup(response.text, 'html.parser')
         page_text = ' '.join([p.get_text() for p in soup.find_all(['p', 'h1', 'h2', 'h3'])])

     visited.add(base_url)
     print(f"🔗 Crawling: {base_url}")
     try:
+        headers = {
+            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36"
+        }
+        response = requests.get(base_url, headers=headers, timeout=10)
         response.raise_for_status()
         soup = BeautifulSoup(response.text, 'html.parser')
         page_text = ' '.join([p.get_text() for p in soup.find_all(['p', 'h1', 'h2', 'h3'])])