Spaces:

QJMKWB
/

QJMKWB2

Sleeping

App Files Files Community

QJMKWB commited on Apr 12

Commit

0fa3414

verified ·

1 Parent(s): 02a3666

Update scraper5.py

Browse files

Files changed (1) hide show

scraper5.py +33 -3

scraper5.py CHANGED Viewed

@@ -25,15 +25,32 @@ class XrayBrowserManager:
         async with self._lock:
             if self._setup_done: return
             setup_and_start_xray()
             self.playwright = await async_playwright().start()
             self.context = await self.playwright.chromium.launch_persistent_context(
                 "/tmp/xray_profile",
                 headless=True,
                 proxy={"server": "socks5://127.0.0.1:10808"},
-                args=["--no-sandbox", "--disable-setuid-sandbox"]
             )
             self._setup_done = True
     async def get_page(self):
         if not self._setup_done: await self.start()
         return await self.context.new_page()
@@ -45,12 +62,25 @@ async def search_movies(query):
     try:
         url = f"{DOMENA}/se/j/json?q={urllib.parse.quote(query)}"
         print(f"[TUNNEL] Vyhľadávam: {query}")
-        await page.goto(url, timeout=30000)
         content = await page.evaluate("() => document.body.innerText")
         return json.loads(content)
-    except: return []
     finally: await page.close()
 async def get_details(slug, media_type):
     page = await manager.get_page()
     url = f"{DOMENA}/p/{slug}" if media_type in ["movie", "film"] else f"{DOMENA}/tv/{slug}/S01E01"

         async with self._lock:
             if self._setup_done: return
             setup_and_start_xray()
             self.playwright = await async_playwright().start()
             self.context = await self.playwright.chromium.launch_persistent_context(
                 "/tmp/xray_profile",
                 headless=True,
                 proxy={"server": "socks5://127.0.0.1:10808"},
+                user_agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36"
             )
+            # --- OVERENIE IP ADRESY ---
+            test_page = await self.context.new_page()
+            try:
+                print("[DEBUG] Overujem IP cez tunel...")
+                await test_page.goto("https://api.ipify.org", timeout=15000)
+                ip = await test_page.inner_text("body")
+                print(f"[DEBUG] Tvoja IP v tuneli je: {ip}")
+            except Exception as e:
+                print(f"[DEBUG ERROR] Tunel nefunguje: {e}")
+            finally:
+                await test_page.close()
+            # ---------------------------
             self._setup_done = True
     async def get_page(self):
         if not self._setup_done: await self.start()
         return await self.context.new_page()
     try:
         url = f"{DOMENA}/se/j/json?q={urllib.parse.quote(query)}"
         print(f"[TUNNEL] Vyhľadávam: {query}")
+        # Otestujeme aj klasickú HTML stránku, či nás pustí
+        await page.goto(url, wait_until="networkidle", timeout=30000)
+        # Získame surový obsah
+        raw_content = await page.content()
+        print(f"[DEBUG] Surová dĺžka obsahu: {len(raw_content)}")
+        if len(raw_content) < 200:
+            print(f"[DEBUG] POZOR! Web vrátil podozrivo málo dát: {raw_content}")
         content = await page.evaluate("() => document.body.innerText")
         return json.loads(content)
+    except Exception as e:
+        print(f"[SEARCH ERROR] {e}")
+        return []
     finally: await page.close()
 async def get_details(slug, media_type):
     page = await manager.get_page()
     url = f"{DOMENA}/p/{slug}" if media_type in ["movie", "film"] else f"{DOMENA}/tv/{slug}/S01E01"