Spaces:

mohammed777
/

youtube-analyzer-api

Sleeping

App Files Files Community

mohammed777 commited on Jun 22, 2025

Commit

5f26048

verified ·

1 Parent(s): 1f3cda2

Update main.py

Browse files

Files changed (1) hide show

main.py +21 -18

main.py CHANGED Viewed

@@ -18,7 +18,6 @@ from fake_useragent import UserAgent # جديد
 import random # جديد
 import io
 import base64
-from tqdm.notebook import tqdm # تم إضافة tqdm هنا لتكون متاحة بشكل عام
 import random # لاستخدام أخذ العينات العشوائية للتعليقات
 from urllib.parse import urlparse, parse_qs
 import math
@@ -49,7 +48,7 @@ loaded_quality_model = None
 loaded_sentiment_pipeline = None
 try:
-    with open('models/final_youtube_quality_model.pkl', 'rb') as f:
         loaded_quality_model = pickle.load(f)
     logging.info("تم تحميل نموذج جودة الفيديو بنجاح.")
 except FileNotFoundError:
@@ -58,7 +57,7 @@ except Exception as e:
     logging.error(f"خطأ غير متوقع أثناء تحميل نموذج جودة الفيديو: {e}")
 try:
-    with open('models/best_sentiment_pipeline.pkl', 'rb') as f:
         loaded_sentiment_pipeline = pickle.load(f)
     logging.info("تم تحميل نموذج تصنيف المشاعر بنجاح.")
 except FileNotFoundError:
@@ -148,7 +147,7 @@ def process_single_video2(video_url, loaded_quality_model, loaded_sentiment_pipe
             logging.info(f"[فيديو: {video_url}] المشاهدات: {views}, الإعجابات: {likes}")
             upload_date = info_dict.get('upload_date', 'Unknown')
-            publish_year = int(upload_date[:4]) if upload_date != 'Unknown' else datetime.datetime.now().year
         # --- جلب التعليقات ---
         sampled_comments = []
@@ -186,14 +185,14 @@ def process_single_video2(video_url, loaded_quality_model, loaded_sentiment_pipe
         input_df = pd.DataFrame([[views, likes, len(sampled_comments), 0, publish_year,
                                   like_view_ratio, comment_view_ratio, engagement_score]],
-                                columns=['views_count', 'likes_count', 'comments_count',
-                                         'video_duration_seconds', 'publish_year',
-                                         'like_view_ratio', 'comment_view_ratio', 'engagement_score'])
         playlist_quality = "لم يتم التقييم"
         try:
             prediction_numeric = loaded_quality_model.predict(input_df)[0]
-            logging.info(f"[فيديو: {video_url}] نتيجة التنبؤ: {prediction_numeric}")  # تسجيل النتيجة
             playlist_quality = "جيد" if prediction_numeric == 1 else "سيء"
         except Exception as e:
             playlist_quality = f"خطأ في التقييم: {e}"
@@ -217,18 +216,21 @@ def process_single_video2(video_url, loaded_quality_model, loaded_sentiment_pipe
         logging.error(f"حدث خطأ في الفيديو {video_url}: {e}")
         return None
-# --- نفس الدالة ولكن صحيحة مع Pydantic (بعد التعديلات) ---
-@app.post("/evaluate_youtube_playlist_individually_same_method2/")
-async def evaluate_youtube_playlist_individually_same_method2(youtube_url, max_comments_per_video=50, max_workers=3):
     """
     تقييم قائمة تشغيل يوتيوب باستخدام نظام مركب (نسخة 2)
     """
     if loaded_quality_model is None or loaded_sentiment_pipeline is None:
         logging.error("لم يتم تحميل النماذج المطلوبة.")
         return {"error": "لم يتم تحميل النماذج المطلوبة."}
     video_links = []
@@ -250,6 +252,7 @@ async def evaluate_youtube_playlist_individually_same_method2(youtube_url, max_c
     # --- معالجة الفيديوهات بالتوازي ---
     with ThreadPoolExecutor(max_workers=max_workers) as executor:
         futures = [
             executor.submit(
                 process_single_video2,
@@ -260,15 +263,15 @@ async def evaluate_youtube_playlist_individually_same_method2(youtube_url, max_c
             ) for video_url in video_links
         ]
-        for future in tqdm(futures, total=len(video_links), desc="معالجة الفيديوهات"):
             result = future.result()
             if result:
                 individual_results.append(result)
     # --- الإحصاء النهائي ---
-    num_good_videos = sum(1 for r in individual_results if r['quality'] == 'جيد')
-    total_positive_comments = sum(r['positive_comments'] for r in individual_results)
-    total_negative_comments = sum(r['negative_comments'] for r in individual_results)
     total_classified_comments = total_positive_comments + total_negative_comments
     total_videos = len(individual_results)

 import random # جديد
 import io
 import base64
 import random # لاستخدام أخذ العينات العشوائية للتعليقات
 from urllib.parse import urlparse, parse_qs
 import math
 loaded_sentiment_pipeline = None
 try:
+    with open('final_youtube_quality_model.pkl', 'rb') as f:
         loaded_quality_model = pickle.load(f)
     logging.info("تم تحميل نموذج جودة الفيديو بنجاح.")
 except FileNotFoundError:
     logging.error(f"خطأ غير متوقع أثناء تحميل نموذج جودة الفيديو: {e}")
 try:
+    with open('best_sentiment_pipeline.pkl', 'rb') as f:
         loaded_sentiment_pipeline = pickle.load(f)
     logging.info("تم تحميل نموذج تصنيف المشاعر بنجاح.")
 except FileNotFoundError:
             logging.info(f"[فيديو: {video_url}] المشاهدات: {views}, الإعجابات: {likes}")
             upload_date = info_dict.get('upload_date', 'Unknown')
+            publish_year = int(upload_date[:4]) if upload_date != 'Unknown' else datetime.now().year
         # --- جلب التعليقات ---
         sampled_comments = []
         input_df = pd.DataFrame([[views, likes, len(sampled_comments), 0, publish_year,
                                   like_view_ratio, comment_view_ratio, engagement_score]],
+                                 columns=['views_count', 'likes_count', 'comments_count',
+                                          'video_duration_seconds', 'publish_year',
+                                          'like_view_ratio', 'comment_view_ratio', 'engagement_score'])
         playlist_quality = "لم يتم التقييم"
         try:
             prediction_numeric = loaded_quality_model.predict(input_df)[0]
+            logging.info(f"[فيديو: {video_url}] نتيجة التنبؤ: {prediction_numeric}")
             playlist_quality = "جيد" if prediction_numeric == 1 else "سيء"
         except Exception as e:
             playlist_quality = f"خطأ في التقييم: {e}"
         logging.error(f"حدث خطأ في الفيديو {video_url}: {e}")
         return None
+# دالة FastAPI الأصلية التي ستستدعيها Gradio
+# قم بإزالة @app.post إذا لم تعد هذه نقطة نهاية API
+# ولكن بما أنك تستخدم هذا الملف كجزء من تطبيق FastAPI، فلا تزل @app.post.
+# بدلاً من ذلك، سنعدل كيفية استدعاء tqdm في هذه الدالة.
+# async def evaluate_youtube_playlist_individually_same_method2(youtube_url, max_comments_per_video=50, max_workers=3):
+# بما أننا نستدعيها من Gradio، يمكننا تمرير المعلمات مباشرة دون الحاجة لـ Pydantic BaseModel
+@app.post("/evaluate_youtube_playlist_individually_same_method2/") # أبقِ على هذا إذا كان لا يزال FastAPI API
+async def evaluate_youtube_playlist_individually_same_method2(youtube_url: str, max_comments_per_video: int = 50, max_workers: int = 3):
     """
     تقييم قائمة تشغيل يوتيوب باستخدام نظام مركب (نسخة 2)
     """
     if loaded_quality_model is None or loaded_sentiment_pipeline is None:
         logging.error("لم يتم تحميل النماذج المطلوبة.")
+        # تغيير الاستجابة لتكون متناسقة مع Gradio
         return {"error": "لم يتم تحميل النماذج المطلوبة."}
     video_links = []
     # --- معالجة الفيديوهات بالتوازي ---
     with ThreadPoolExecutor(max_workers=max_workers) as executor:
+        # تمت إزالة tqdm هنا لتجنب المشاكل في بيئات غير تفاعلية
         futures = [
             executor.submit(
                 process_single_video2,
             ) for video_url in video_links
         ]
+        for future in futures: # استخدام futures مباشرة بدون tqdm
             result = future.result()
             if result:
                 individual_results.append(result)
     # --- الإحصاء النهائي ---
+    num_good_videos = sum(1 for r in individual_results if r and r.get('quality') == 'جيد') # إضافة r and r.get('quality') للتحقق من عدم وجود None
+    total_positive_comments = sum(r.get('positive_comments', 0) for r in individual_results if r)
+    total_negative_comments = sum(r.get('negative_comments', 0) for r in individual_results if r)
     total_classified_comments = total_positive_comments + total_negative_comments
     total_videos = len(individual_results)