Spaces:

QJMKWB
/

QJMKWB2

Sleeping

QJMKWB commited on Apr 12

Commit

c640e70

verified ·

1 Parent(s): 44917c6

Update scraper4.py

Files changed (1) hide show

scraper4.py CHANGED Viewed

@@ -67,8 +67,19 @@ async def search_movies(query):
     try:
         url = f"{DOMENA}/se/j/json?q={urllib.parse.quote(query)}"
         success = await manager.goto_with_fallback(page, url)
         if success:
             content = await page.inner_text("body")
             return json.loads(content)
     except Exception as e:
         print(f"[SEARCH ERROR] {e}")
@@ -76,6 +87,7 @@ async def search_movies(query):
         await page.close()
     return []
 async def get_details(slug, media_type):
     print(f"[DETAILS] Info cez Tor: {slug}")
     page = await manager.get_page()

     try:
         url = f"{DOMENA}/se/j/json?q={urllib.parse.quote(query)}"
         success = await manager.goto_with_fallback(page, url)
         if success:
+            # Získame surový text stránky
             content = await page.inner_text("body")
+            # DEBUG: Ak je obsah podozrivo krátky, vypíšeme ho
+            if len(content) < 100:
+                print(f"[DEBUG] Surový obsah z webu: '{content}'")
+            if not content.strip():
+                print("[TOR] Web vrátil prázdnu stránku. Tor uzol je pravdepodobne blokovaný.")
+                return []
             return json.loads(content)
     except Exception as e:
         print(f"[SEARCH ERROR] {e}")
         await page.close()
     return []
 async def get_details(slug, media_type):
     print(f"[DETAILS] Info cez Tor: {slug}")
     page = await manager.get_page()