Spaces:

dkescape
/

pxy

Sleeping

App Files Files Community

dkescape commited on Jun 6, 2025

Commit

7437948

verified ·

1 Parent(s): 9c4292d

Create app.py

Browse files

Files changed (1) hide show

app.py +71 -0

app.py ADDED Viewed

	@@ -0,0 +1,71 @@

+import gradio as gr
+import requests
+from bs4 import BeautifulSoup
+import urllib.parse
+def fetch_website(url):
+    try:
+        headers = {
+            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0 Safari/537.36"
+        }
+        response = requests.get(url, headers=headers, timeout=10)
+        response.raise_for_status()
+        soup = BeautifulSoup(response.text, 'html.parser')
+        title = soup.title.string if soup.title else "No Title"
+        # Extract links from page
+        base_url = urllib.parse.urljoin(url, '/')
+        links = [
+            urllib.parse.urljoin(base_url, a.get('href'))
+            for a in soup.find_all('a', href=True)
+        ]
+        return {
+            "title": title,
+            "url": url,
+            "status_code": response.status_code,
+            "content_preview": response.text[:1000],  # First 1000 chars
+            "links": "\n".join(links[:20])  # Show up to 20 links
+        }
+    except Exception as e:
+        return {
+            "title": "Error",
+            "url": "",
+            "status_code": 500,
+            "content_preview": str(e),
+            "links": ""
+        }
+# UI Definition
+with gr.Blocks(theme="default") as demo:
+    gr.Markdown("# 🌐 Proxy Website Surfer\nEnter a URL to fetch its contents through this HuggingFace-powered proxy.")
+    with gr.Row():
+        url_input = gr.Textbox(label="Enter URL", placeholder="https://example.com")
+    submit_btn = gr.Button("Fetch Site")
+    with gr.Row():
+        title_output = gr.Textbox(label="Page Title")
+        status_output = gr.Number(label="HTTP Status Code")
+    content_output = gr.Textbox(label="Content Preview (first 1000 characters)", lines=10)
+    link_output = gr.Textbox(label="Extracted Links", lines=15)
+    def wrapper(url):
+        result = fetch_website(url)
+        return (
+            result["title"],
+            result["status_code"],
+            result["content_preview"],
+            result["links"]
+        )
+    submit_btn.click(
+        fn=wrapper,
+        inputs=url_input,
+        outputs=[title_output, status_output, content_output, link_output]
+    )
+demo.launch()