Spaces:

iq7se2
/

4

Paused

App Files Files Community

iq7se2 commited on Apr 1

Commit

e76b526

verified ·

1 Parent(s): 086fd59

Update app.py

Browse files

Files changed (1) hide show

app.py +40 -18

app.py CHANGED Viewed

@@ -5,44 +5,59 @@ from bs4 import BeautifulSoup
 import threading
 from flask import Flask
-# --- الإعدادات الخاصة بك ---
 BOT_TOKEN = os.getenv("TELEGRAM_BOT_TOKEN")
 bot = telebot.TeleBot(BOT_TOKEN, threaded=False)
-# سيرفر وهمي لإبقاء Hugging Face يعمل دون واجهة رسومية
 app = Flask(__name__)
 @app.route('/')
-def home(): return "Engine is running..."
 def process_manga_logic(sample_url, start, end):
-    scraper = cloudscraper.create_scraper(browser={'browser': 'chrome', 'platform': 'windows', 'desktop': True})
     sample_url = sample_url.strip().rstrip('/')
     base_part = re.sub(r'/(?:chapter-)?\d+$', '', sample_url)
     is_azora = "azoramoon" in sample_url
     pdf_files = []
     for i in range(int(start), int(end) + 1):
         ch_url = f"{base_part}/chapter-{i}" if is_azora else f"{base_part}/{i}"
         try:
-            headers = {'Referer': sample_url, 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36'}
             response = scraper.get(ch_url, headers=headers, timeout=30)
             if response.status_code == 200:
                 soup = BeautifulSoup(response.text, 'html.parser')
                 chapter_imgs = []
-                # البحث عن الصور في كل مكان (img, source, regex)
-                html_text = response.text
-                found_urls = re.findall(r'(https?://[^\s"\']+?\.(?:jpg|jpeg|png|webp|avif))', html_text)
                 for img_url in list(dict.fromkeys(found_urls)):
                     img_url = urllib.parse.urljoin(ch_url, img_url.strip())
-                    if any(x in img_url.lower() for x in ['logo', 'banner', 'icon', 'staff', 'discord']): continue
                     try:
                         img_res = scraper.get(img_url, headers=headers, timeout=10)
                         if len(img_res.content) > 25000:
                             img_data = Image.open(io.BytesIO(img_res.content)).convert('RGB')
                             chapter_imgs.append(img_data)
@@ -52,41 +67,48 @@ def process_manga_logic(sample_url, start, end):
                     fname = f"Chapter_{i}.pdf"
                     chapter_imgs[0].save(fname, save_all=True, append_images=chapter_imgs[1:], format='PDF')
                     pdf_files.append(fname)
         except: continue
-        time.sleep(2)
     if not pdf_files: return None
     zip_name = f"Manga_{int(time.time())}.zip"
     with zipfile.ZipFile(zip_name, 'w') as zipf:
         for f in pdf_files:
-            zipf.write(f); os.remove(f)
     return zip_name
 @bot.message_handler(func=lambda m: True)
 def handle_msg(message):
     try:
-        url, r_part = message.text.strip().split(' ')
-        start, end = r_part.split('-')
-        status = bot.reply_to(message, "⏳ جاري السحب والإرسال المباشر...")
         zip_path = process_manga_logic(url, start, end)
         if zip_path:
             with open(zip_path, 'rb') as f:
-                bot.send_document(message.chat.id, f, caption=f"📦 تم تجهيز الفصول من {start} إلى {end}")
             bot.delete_message(message.chat.id, status.message_id)
             os.remove(zip_path)
         else:
-            bot.edit_message_text("❌ فشل السحب. تأكد من الرابط.", message.chat.id, status.message_id)
-    except: pass
-# --- تشغيل البوت والسيرفر الصامت ---
 def run_bot():
     bot.remove_webhook()
     bot.infinity_polling(timeout=20, long_polling_timeout=10)
 if __name__ == "__main__":
     threading.Thread(target=run_bot, daemon=True).start()
     app.run(host="0.0.0.0", port=7860)

 import threading
 from flask import Flask
+# --- الإعدادات ---
+# تأكد من وضع التوكن في Secrets باسم TELEGRAM_BOT_TOKEN [cite: 1]
 BOT_TOKEN = os.getenv("TELEGRAM_BOT_TOKEN")
 bot = telebot.TeleBot(BOT_TOKEN, threaded=False)
+# سيرفر صامت لإبقاء المنصة تعمل
 app = Flask(__name__)
 @app.route('/')
+def home(): return "System Status: Online"
 def process_manga_logic(sample_url, start, end):
+    # محاكاة متصفح حديث جداً لتجاوز الحظر [cite: 1]
+    scraper = cloudscraper.create_scraper(
+        browser={'browser': 'chrome', 'platform': 'windows', 'desktop': True}
+    )
     sample_url = sample_url.strip().rstrip('/')
+    # تنظيف الرابط لاستخراج الجزء الثابت [cite: 1]
     base_part = re.sub(r'/(?:chapter-)?\d+$', '', sample_url)
     is_azora = "azoramoon" in sample_url
     pdf_files = []
     for i in range(int(start), int(end) + 1):
+        # بناء الرابط حسب بنية الموقع
         ch_url = f"{base_part}/chapter-{i}" if is_azora else f"{base_part}/{i}"
         try:
+            headers = {
+                'Referer': 'https://google.com/', # تمويه المصدر
+                'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36'
+            }
             response = scraper.get(ch_url, headers=headers, timeout=30)
             if response.status_code == 200:
                 soup = BeautifulSoup(response.text, 'html.parser')
                 chapter_imgs = []
+                # استخراج الصور بالاعتماد على الروابط المباشرة داخل الـ HTML
+                html_content = response.text
+                found_urls = re.findall(r'(https?://[^\s"\']+?\.(?:jpg|jpeg|png|webp|avif))', html_content)
+                # تصفية الروابط المكررة
                 for img_url in list(dict.fromkeys(found_urls)):
                     img_url = urllib.parse.urljoin(ch_url, img_url.strip())
+                    # استبعاد الإعلانات والشعارات [cite: 1]
+                    if any(x in img_url.lower() for x in ['logo', 'banner', 'icon', 'staff', 'discord', 'fb-']):
+                        continue
                     try:
                         img_res = scraper.get(img_url, headers=headers, timeout=10)
+                        # التأكد أن الملف صورة حقيقية وليس أيقونة صغيرة
                         if len(img_res.content) > 25000:
                             img_data = Image.open(io.BytesIO(img_res.content)).convert('RGB')
                             chapter_imgs.append(img_data)
                     fname = f"Chapter_{i}.pdf"
                     chapter_imgs[0].save(fname, save_all=True, append_images=chapter_imgs[1:], format='PDF')
                     pdf_files.append(fname)
+            time.sleep(3) # تأخير لعدم كشف البوت [cite: 1]
         except: continue
     if not pdf_files: return None
     zip_name = f"Manga_{int(time.time())}.zip"
     with zipfile.ZipFile(zip_name, 'w') as zipf:
         for f in pdf_files:
+            zipf.write(f)
+            os.remove(f)
     return zip_name
 @bot.message_handler(func=lambda m: True)
 def handle_msg(message):
     try:
+        # التنسيق: الرابط مسافة المدى [cite: 1]
+        parts = message.text.strip().split(' ')
+        url = parts[0]
+        start, end = parts[1].split('-')
+        status = bot.reply_to(message, "⏳ جاري السحب والإرسال المباشر للملف... يرجى الانتظار.")
         zip_path = process_manga_logic(url, start, end)
         if zip_path:
             with open(zip_path, 'rb') as f:
+                bot.send_document(message.chat.id, f, caption=f"📦 تم التجميع من {start} إلى {end}")
             bot.delete_message(message.chat.id, status.message_id)
             os.remove(zip_path)
         else:
+            bot.edit_message_text("❌ فشل السحب. الموقع قد يكون حظر السيرفر حالياً.", message.chat.id, status.message_id)
+    except:
+        bot.reply_to(message, "⚠️ استخدم: الرابط مسافة 1-5")
+# --- التشغيل الصامت ---
 def run_bot():
     bot.remove_webhook()
     bot.infinity_polling(timeout=20, long_polling_timeout=10)
 if __name__ == "__main__":
+    # تشغيل البوت في خلفية السيرفر
     threading.Thread(target=run_bot, daemon=True).start()
+    # تشغيل Flask على المنفذ الافتراضي لـ Hugging Face
     app.run(host="0.0.0.0", port=7860)