Spaces:

KIMOSSINO
/

hashtags

Sleeping

App Files Files Community

KIMOSSINO commited on Dec 8, 2024

Commit

a9f1b96

verified ·

1 Parent(s): ab3acff

Update app.py

Browse files

Files changed (1) hide show

app.py +12 -6

app.py CHANGED Viewed

@@ -1,7 +1,6 @@
 import gradio as gr
 from collections import Counter
 from bs4 import BeautifulSoup
-import pandas as pd
 # دالة استخراج العناوين والهاشتاغات
@@ -10,7 +9,7 @@ def extract_titles_and_hashtags(file):
         # قراءة محتوى الملف
         content = file.read() if hasattr(file, 'read') else open(file.name, 'r', encoding='utf-8').read()
     except Exception as e:
-        return f"خطأ أثناء قراءة الملف: {str(e)}", ""
     # تحليل HTML باستخدام BeautifulSoup
     soup = BeautifulSoup(content, 'html.parser')
@@ -21,7 +20,7 @@ def extract_titles_and_hashtags(file):
     desc_containers = soup.find_all('div', class_="css-vi46v1-DivDesContainer")
     if not desc_containers:
-        return "لم يتم العثور على أي بيانات مطابقة.", ""
     for container in desc_containers:
         title = container.get('aria-label', 'بدون عنوان')
@@ -36,8 +35,9 @@ def extract_titles_and_hashtags(file):
     # تحويل النتائج إلى نصوص
     titles_text = "\n".join([f"{i+1}. {row['Title']}" for i, row in enumerate(data)])
     hashtags_text = "\n".join([f"{hashtag}: {count}" for hashtag, count in hashtags_counter.items()])
-    return titles_text or "لا توجد عناوين مستخرجة.", hashtags_text or "لا توجد هاشتاغات مستخرجة."
 # إنشاء واجهة Gradio
@@ -59,16 +59,22 @@ def gradio_interface():
                 placeholder="ستظهر العناوين هنا"
             )
             hashtags_output = gr.Textbox(
-                label="🏷️ الهاشتاغات المستخرجة",
                 lines=10,
                 interactive=False,
                 placeholder="ستظهر الهاشتاغات هنا"
             )
         analyze_btn.click(
             fn=extract_titles_and_hashtags,
             inputs=[file_input],
-            outputs=[titles_output, hashtags_output],
         )
     return demo

 import gradio as gr
 from collections import Counter
 from bs4 import BeautifulSoup
 # دالة استخراج العناوين والهاشتاغات
         # قراءة محتوى الملف
         content = file.read() if hasattr(file, 'read') else open(file.name, 'r', encoding='utf-8').read()
     except Exception as e:
+        return f"خطأ أثناء قراءة الملف: {str(e)}", "", ""
     # تحليل HTML باستخدام BeautifulSoup
     soup = BeautifulSoup(content, 'html.parser')
     desc_containers = soup.find_all('div', class_="css-vi46v1-DivDesContainer")
     if not desc_containers:
+        return "لم يتم العثور على أي بيانات مطابقة.", "", ""
     for container in desc_containers:
         title = container.get('aria-label', 'بدون عنوان')
     # تحويل النتائج إلى نصوص
     titles_text = "\n".join([f"{i+1}. {row['Title']}" for i, row in enumerate(data)])
     hashtags_text = "\n".join([f"{hashtag}: {count}" for hashtag, count in hashtags_counter.items()])
+    unique_hashtags_text = "\n".join(hashtags_counter.keys())  # هاشتاغات غير مكررة
+    return titles_text or "لا توجد عناوين مستخرجة.", hashtags_text or "لا توجد هاشتاغات مستخرجة.", unique_hashtags_text or "لا توجد هاشتاغات فريدة."
 # إنشاء واجهة Gradio
                 placeholder="ستظهر العناوين هنا"
             )
             hashtags_output = gr.Textbox(
+                label="🏷️ الهاشتاغات المستخرجة (مع التكرار)",
                 lines=10,
                 interactive=False,
                 placeholder="ستظهر الهاشتاغات هنا"
             )
+            unique_hashtags_output = gr.Textbox(
+                label="🏷️ الهاشتاغات الفريدة (غير المكررة)",
+                lines=10,
+                interactive=False,
+                placeholder="ستظهر الهاشتاغات الفريدة هنا"
+            )
         analyze_btn.click(
             fn=extract_titles_and_hashtags,
             inputs=[file_input],
+            outputs=[titles_output, hashtags_output, unique_hashtags_output],
         )
     return demo