Spaces:

iq7se2
/

4

Paused

App Files Files Community

iq7se2 commited on Apr 1

Commit

73e87db

verified ·

1 Parent(s): a5a71d2

Update app.py

Browse files

Files changed (1) hide show

app.py +68 -90

app.py CHANGED Viewed

@@ -1,5 +1,5 @@
 import gradio as gr
-import requests
 from bs4 import BeautifulSoup
 import img2pdf
 import io
@@ -12,111 +12,89 @@ def fetch_chapters_range(base_url, start_ch, end_ch):
     start = int(start_ch)
     end = int(end_ch)
     all_imgs = []
     log_messages = []
-    session = requests.Session()
-    # هيدرز قوية جداً لتقليد متصفح حقيقي
-    headers = {
-        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36',
-        'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8',
-        'Referer': base_url,
-        'Accept-Language': 'ar,en-US;q=0.7,en;q=0.3',
-    }
     base_url = base_url.strip().rstrip('/')
     for i in range(start, end + 1):
-        # تجربة نمط الرابط الخاص بأوليمبوس (غالباً يكون رقم فقط أو chapter-X)
-        ch_url = f"{base_url}/chapter-{i}/"
-        log_messages.append(f"⏳ جاري فحص: الفصل {i}")
-        try:
-            response = session.get(ch_url, headers=headers, timeout=20)
-            if response.status_code != 200:
-                # محاولة تجربة الرابط بدون كلمة chapter (بعض المواقع تضع الرقم فقط)
-                ch_url = f"{base_url}/{i}/"
-                response = session.get(ch_url, headers=headers, timeout=20)
-            soup = BeautifulSoup(response.text, 'html.parser')
-            # بحث مكثف عن الصور في كل الأماكن المحتملة
-            # أوليمبوس غالباً يضع الصور داخل div باسم 'rd-host' أو داخل برمجية JavaScript
-            images = soup.find_all('img')
-            chapter_count = 0
-            for img in images:
-                # فحص كل السمات الممكنة لرابط الصورة
-                img_url = (img.get('src') or
-                           img.get('data-src') or
-                           img.get('data-lazy-src') or
-                           img.get('data-full-url') or
-                           img.get('srcset')) # بعض المواقع تستخدم srcset
-                if img_url:
-                    # تنظيف الرابط من المسافات أو الرموز الزائدة
-                    img_url = img_url.split(' ')[0].strip()
-                    if not img_url.startswith('http'):
-                        img_url = "https:" + img_url if img_url.startswith('//') else img_url
-                    # تصفية الصور التي ليست مانهوا (أيقونات، لوجو، صور صغيرة)
-                    if any(x in img_url.lower() for x in ["logo", "icon", "avatar", "bg", "button", "loader"]):
-                        continue
-                    try:
-                        img_res = session.get(img_url, headers=headers, timeout=15)
-                        if img_res.status_code == 200 and len(img_res.content) > 10000: # التأكد أنها صورة حقيقية وليست بكسل صغير
-                            image = Image.open(io.BytesIO(img_res.content)).convert('RGB')
-                            all_imgs.append(image)
-                            chapter_count += 1
-                    except:
-                        continue
-            if chapter_count > 0:
-                log_messages.append(f"✅ تم سحب {chapter_count} صورة من الفصل {i}")
-            else:
-                log_messages.append(f"⚠️ لم نجد صوراً في الفصل {i}، قد يكون المحتوى مشفراً.")
-            time.sleep(2) # زيادة وقت الانتظار لتجنب حماية Cloudflare في أوليمبوس
-        except Exception as e:
-            log_messages.append(f"❌ خطأ في الفصل {i}: {str(e)}")
-# واجهة المستخدم (UI) بنظام Gradio
-with gr.Blocks(theme=gr.themes.Monochrome(), title="Manga Bulk Downloader") as demo:
-    gr.Markdown("# 📚 مجمع فصول المانهوا الذكي (Team X & Azora)")
-    gr.Markdown("أدخل الرابط الرئيسي للمانهوا وحدد مدى الفصول لتحميلها في ملف PDF واحد.")
     with gr.Row():
-        url_input = gr.Textbox(
-            label="رابط المانهوا الرئيسي",
-            placeholder="مثال: https://teamx.org/series/nano-machine",
-            scale=3
-        )
     with gr.Row():
-        start_ch = gr.Number(label="بداية من فصل", value=1, precision=0)
-        end_ch = gr.Number(label="إلى فصل", value=5, precision=0)
-    with gr.Column():
-        btn = gr.Button("🚀 ابدأ التجميع والتحويل الآن", variant="primary")
-        # قسم أرباح Adsterra
-        gr.HTML("""
-            <div style='background: #121212; padding: 20px; border: 2px solid #ff4500; border-radius: 12px; text-align: center;'>
-                <p style='color: #ff4500; font-size: 18px; font-weight: bold; margin-bottom: 10px;'>🚨 تنبيه السيرفر</p>
-                <p style='color: #ffffff; margin-bottom: 15px;'>لضمان عدم توقف التحميل التلقائي، يرجى تفعيل "رابط التحقق" من الراعي الرسمي:</p>
-                <a href='ضع_رابط_ADSTERRA_هنا' target='_blank'
-                   style='background: #ff4500; color: white; padding: 10px 25px; text-decoration: none; border-radius: 5px; font-weight: bold; display: inline-block;'>
-                   ✅ اضغط هنا لتفعيل التحميل السريع
-                </a>
-            </div>
-        """)
-        status_output = gr.Textbox(label="سجل العملية (Log)", interactive=False, lines=8)
-        file_output = gr.File(label="تحميل ملف الـ PDF المجمع")
     btn.click(fn=fetch_chapters_range, inputs=[url_input, start_ch, end_ch], outputs=[file_output, status_output])
-demo.launch()

 import gradio as gr
+import cloudscraper
 from bs4 import BeautifulSoup
 import img2pdf
 import io
     start = int(start_ch)
     end = int(end_ch)
+    if end < start:
+        return None, "❌ خطأ: رقم الفصل النهائي أصغر من البداية!"
     all_imgs = []
     log_messages = []
+    # استخدام cloudscraper بدلاً من requests العادي لتجاوز حماية أوليمبوس
+    scraper = cloudscraper.create_scraper()
     base_url = base_url.strip().rstrip('/')
     for i in range(start, end + 1):
+        # تجربة أنماط روابط مختلفة (أوليمبوس وتيم إكس)
+        ch_urls = [f"{base_url}/chapter-{i}/", f"{base_url}/{i}/", f"{base_url}/فصل-{i}/"]
+        success = False
+        for url in ch_urls:
+            try:
+                log_messages.append(f"⏳ فحص: {url}")
+                response = scraper.get(url, timeout=20)
+                if response.status_code == 200:
+                    soup = BeautifulSoup(response.text, 'html.parser')
+                    # البحث عن الصور في الأماكن المحتملة (أوليمبوس يستخدم كلاسات متغيرة)
+                    images = soup.find_all('img')
+                    chapter_count = 0
+                    for img in images:
+                        img_url = img.get('src') or img.get('data-src') or img.get('data-lazy-src')
+                        if img_url:
+                            img_url = img_url.strip()
+                            if not img_url.startswith('http'):
+                                img_url = "https:" + img_url if img_url.startswith('//') else img_url
+                            if any(x in img_url.lower() for x in ["logo", "icon", "avatar", "bg", "banner"]):
+                                continue
+                            try:
+                                img_res = scraper.get(img_url, timeout=15)
+                                if img_res.status_code == 200 and len(img_res.content) > 10000:
+                                    image = Image.open(io.BytesIO(img_res.content)).convert('RGB')
+                                    all_imgs.append(image)
+                                    chapter_count += 1
+                            except: continue
+                    if chapter_count > 0:
+                        log_messages.append(f"✅ تم سحب {chapter_count} صورة من الفصل {i}")
+                        success = True
+                        break # توقف عن تجربة الأنماط الأخرى لهذا الفصل
+            except: continue
+        if not success:
+            log_messages.append(f"⚠️ تعذر الوصول للفصل {i}")
+        time.sleep(2) # حماية من الحظر
+    if not all_imgs:
+        return None, "\n".join(log_messages) + "\n\n❌ لم يتم العثور على صور. تأكد من الرابط!"
+    output_filename = f"manga_collection_{int(time.time())}.pdf"
+    all_imgs[0].save(output_filename, save_all=True, append_images=all_imgs[1:], format='PDF')
+    return output_filename, "\n".join(log_messages) + "\n\n✨ تم التجميع بنجاح!"
+# تصميم الواجهة مع إصلاح خطأ Theme
+with gr.Blocks(title="Manga Downloader") as demo:
+    gr.Markdown("# 📚 محمل المانهوا الشامل")
     with gr.Row():
+        url_input = gr.Textbox(label="رابط المانهوا الرئيسي", placeholder="https://olympustaff.com/series/demonic-emperor/")
     with gr.Row():
+        start_ch = gr.Number(label="من فصل", value=1)
+        end_ch = gr.Number(label="إلى فصل", value=2)
+    btn = gr.Button("🚀 ابدأ التحميل", variant="primary")
+    gr.HTML("<div style='text-align:center'><a href='YOUR_ADSTERRA_LINK'>📥 اضغط هنا لتسريع التحميل (إعلان)</a></div>")
+    status_output = gr.Textbox(label="سجل العملية", lines=5)
+    file_output = gr.File(label="الملف الجاهز")
     btn.click(fn=fetch_chapters_range, inputs=[url_input, start_ch, end_ch], outputs=[file_output, status_output])
+# نقل الـ theme هنا كما يطلب Gradio 6
+demo.launch(ssr_mode=False)