Spaces:

aliSaac510
/

LightNovel

Sleeping

App Files Files Community

aliSaac510 commited on Jan 24

Commit

fda0afb

verified ·

1 Parent(s): 8746acb

Update scraper.py

Browse files

Files changed (1) hide show

scraper.py +25 -1

scraper.py CHANGED Viewed

@@ -23,10 +23,34 @@ def _scrape_novel_list_page(page_url):
                 author_element = row.find('span', class_='author')
                 author = author_element.text.strip() if author_element else 'N/A'
                 results.append({
                     'title': title,
                     'url': f"https://novelfull.net{url}",
-                    'author': author
                 })
     return results

                 author_element = row.find('span', class_='author')
                 author = author_element.text.strip() if author_element else 'N/A'
+                # --- بداية التعديل: استخراج الصورة ---
+                image_url = None
+                # عادة ما تكون الصورة في div بجانب العنوان (مثلاً col-xs-3)
+                # سنبحث عن أول صورة في السطر
+                img_tag = row.find('img')
+                if img_tag:
+                    # قد تكون الصورة في src أو data-cover/data-src
+                    if 'src' in img_tag.attrs:
+                         image_url = img_tag['src']
+                    elif 'data-src' in img_tag.attrs:
+                         image_url = img_tag['data-src']
+                    elif 'data-cover' in img_tag.attrs:
+                         image_url = img_tag['data-cover']
+                    # إصلاح الروابط النسبية
+                    if image_url and image_url.startswith('/'):
+                        image_url = f"https://novelfull.net{image_url}"
+                # تعيين صورة افتراضية إذا لم توجد
+                if not image_url:
+                     image_url = "https://placehold.co/200x300?text=No+Image"
+                # --- نهاية التعديل ---
                 results.append({
                     'title': title,
                     'url': f"https://novelfull.net{url}",
+                    'author': author,
+                    'image_url': image_url  # <-- إضافة هذا الحقل ضروري
                 })
     return results