Spaces:

MyanmarSwe
/

medium

Running

App Files Files Community

MyanmarSwe commited on 3 days ago

Commit

04fa3a5

verified ·

1 Parent(s): a5a0c5c

Update main.py

Browse files

Files changed (1) hide show

main.py +31 -15

main.py CHANGED Viewed

@@ -28,7 +28,6 @@ ua = UserAgent(fallback='Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/5
 MEDIAFIRE_CACHE = {}
 CACHE_TTL = 1800
-# Persistent Client for connection pooling
 client = httpx.AsyncClient(
     timeout=httpx.Timeout(60.0, read=None),
     follow_redirects=True,
@@ -85,29 +84,48 @@ async def download_proxy(request: Request, url: str, key: str = None):
         if not target_link:
             try:
-                # Browser အစစ်လိုမျိုး Header တွေထည့်ပြီး Scrape လုပ်ခြင်း
                 headers = {
                     'User-Agent': ua.random,
                     'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,*/*;q=0.8',
                     'Accept-Language': 'en-US,en;q=0.5',
-                    'Connection': 'keep-alive',
-                    'Upgrade-Insecure-Requests': '1'
                 }
-                async with httpx.AsyncClient(headers=headers, follow_redirects=True) as temp_client:
                     r = await temp_client.get(clean_url)
                     if r.status_code == 200:
-                        match = re.search(r"https?://download[0-9]+\.mediafire\.com/[a-zA-Z0-9_-]+/[a-zA-Z0-9_-]+/[^\s'\"]+", r.text)
                         if match:
-                            target_link = match.group(0).replace('"', '').replace("'", "")
                         if target_link:
                             MEDIAFIRE_CACHE[clean_url] = {'link': target_link, 'time': current_time}
-            except: pass
         if target_link:
             return await stream_file(target_link, range_header, filename, referer=clean_url)
         else:
-            raise HTTPException(status_code=404, detail="Could not find direct link")
     # --- Google Drive Section ---
     elif "drive.google.com" in clean_url:
@@ -140,20 +158,18 @@ async def download_proxy(request: Request, url: str, key: str = None):
 async def stream_file(target_url, range_header, filename, referer=None):
     headers = {'User-Agent': ua.random}
     if range_header: headers['Range'] = range_header
-    if referer: headers['Referer'] = referer # MediaFire အတွက် Referer ထည့်ပေးခြင်း
     try:
         req = client.build_request("GET", target_url, headers=headers)
         r = await client.send(req, stream=True)
-        # အကယ်၍ MediaFire က Block ပြီး HTML ပြန်ပို့ရင် Cache ကိုဖျက်ပြီး အသစ်ပြန်လုပ်ရန်
         if "text/html" in r.headers.get("Content-Type", "").lower() and r.status_code == 200:
             await r.aclose()
-            # Cache ရှင်းလင်းခြင်း
             for key, val in list(MEDIAFIRE_CACHE.items()):
-                if val['link'] == target_url:
-                    del MEDIAFIRE_CACHE[key]
-            raise HTTPException(status_code=415, detail="MediaFire detection triggered. Retrying...")
         return await process_response(r, filename)
     except HTTPException: raise

 MEDIAFIRE_CACHE = {}
 CACHE_TTL = 1800
 client = httpx.AsyncClient(
     timeout=httpx.Timeout(60.0, read=None),
     follow_redirects=True,
         if not target_link:
             try:
                 headers = {
                     'User-Agent': ua.random,
                     'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,*/*;q=0.8',
                     'Accept-Language': 'en-US,en;q=0.5',
+                    'Referer': 'https://www.mediafire.com/'
                 }
+                async with httpx.AsyncClient(headers=headers, follow_redirects=True, timeout=20.0) as temp_client:
                     r = await temp_client.get(clean_url)
                     if r.status_code == 200:
+                        # 1. Regex ရှာဖွေခြင်း (ပိုမိုကျယ်ပြန့်သော Pattern)
+                        match = re.search(r'https?://download[^\s"\']+mediafire\.com/[^\s"\']+', r.text)
                         if match:
+                            target_link = match.group(0).strip()
+                        # 2. BeautifulSoup နဲ့ ထပ်မံရှာဖွေခြင်း
+                        if not target_link:
+                            soup = BeautifulSoup(r.text, 'html.parser')
+                            # Download link ရှာရန် ဖြစ်နိုင်သမျှ နည်းလမ်းအားလုံးသုံးခြင်း
+                            link_tags = soup.find_all('a', href=True)
+                            for tag in link_tags:
+                                href = tag['href']
+                                if 'download' in href and 'mediafire.com' in href:
+                                    target_link = href
+                                    break
+                            # aria-label ထဲတွင် ဝှက်ထားသော link ကိုရှာခြင်း
+                            if not target_link:
+                                download_btn = soup.find('a', {'aria-label': re.compile(r'Download', re.I)})
+                                if download_btn: target_link = download_btn.get('href')
                         if target_link:
+                            # // နဲ့စရင် https: ထည့်ပေးခြင်း
+                            if target_link.startswith("//"): target_link = f"https:{target_link}"
                             MEDIAFIRE_CACHE[clean_url] = {'link': target_link, 'time': current_time}
+            except Exception as e:
+                print(f"Scraper Error: {e}")
         if target_link:
             return await stream_file(target_link, range_header, filename, referer=clean_url)
         else:
+            # 404 ပြန်ရခြင်းအကြောင်းရင်းမှာ Scraper က link ရှာမတွေ့လို့ပါ
+            raise HTTPException(status_code=404, detail="Direct link not found in MediaFire page.")
     # --- Google Drive Section ---
     elif "drive.google.com" in clean_url:
 async def stream_file(target_url, range_header, filename, referer=None):
     headers = {'User-Agent': ua.random}
     if range_header: headers['Range'] = range_header
+    if referer: headers['Referer'] = referer
     try:
         req = client.build_request("GET", target_url, headers=headers)
         r = await client.send(req, stream=True)
+        # HTML ပြန်ကျလာရင် (Block ခံရရင်) Cache ရှင်းပြီး Error ပြန်ပေးရန်
         if "text/html" in r.headers.get("Content-Type", "").lower() and r.status_code == 200:
             await r.aclose()
             for key, val in list(MEDIAFIRE_CACHE.items()):
+                if val['link'] == target_url: del MEDIAFIRE_CACHE[key]
+            raise HTTPException(status_code=415, detail="MediaFire detection triggered.")
         return await process_response(r, filename)
     except HTTPException: raise