Spaces:

joermd
/

fpurl

Sleeping

App Files Files Community

joermd commited on Nov 19, 2024

Commit

e15250c

verified ·

1 Parent(s): 1d91c50

Update app.py

Browse files

Files changed (1) hide show

app.py +11 -24

app.py CHANGED Viewed

@@ -7,25 +7,7 @@ from bs4 import BeautifulSoup
 from datetime import datetime
 import matplotlib.pyplot as plt
 from wordcloud import WordCloud
-from langdetect import detect
-from textblob import TextBlob
-import nltk
-# تنزيل البيانات المطلوبة لـ NLTK و TextBlob إذا لم تكن موجودة
-def download_nltk_data():
-  import os
-  nltk_data_path = os.path.join(os.getcwd(), 'nltk_data')
-  if not os.path.exists(nltk_data_path):
-      os.makedirs(nltk_data_path)
-  nltk.data.path.append(nltk_data_path)
-  required_packages = ['wordnet', 'punkt', 'averaged_perceptron_tagger', 'brown']
-  for package in required_packages:
-      try:
-          nltk.data.find(f'corpora/{package}')
-      except LookupError:
-          nltk.download(package, download_dir=nltk_data_path)
-download_nltk_data()
 # إعداد العربية في Streamlit
 st.set_page_config(page_title="أداة تحليل المواقع", layout="wide")
@@ -65,14 +47,19 @@ def main():
           meta_desc = soup.find('meta', attrs={'name': 'description'})
           meta_desc_content = meta_desc['content'].strip() if meta_desc else "لم يتم العثور على ميتا الوصف"
-          # تحليل الكلمات المفتاحية
           texts = soup.get_text()
-          blob = TextBlob(texts)
-          keywords = blob.word_counts.items()
-          sorted_keywords = sorted(keywords, key=lambda x: x[1], reverse=True)[:10]
           # رسم سحابة الكلمات
-          wordcloud = WordCloud(width=800, height=400, background_color='white').generate(texts)
           fig_wc, ax_wc = plt.subplots(figsize=(12, 6))
           ax_wc.imshow(wordcloud, interpolation='bilinear')
           ax_wc.axis('off')

 from datetime import datetime
 import matplotlib.pyplot as plt
 from wordcloud import WordCloud
+# تم إزالة TextBlob و NLTK
 # إعداد العربية في Streamlit
 st.set_page_config(page_title="أداة تحليل المواقع", layout="wide")
           meta_desc = soup.find('meta', attrs={'name': 'description'})
           meta_desc_content = meta_desc['content'].strip() if meta_desc else "لم يتم العثور على ميتا الوصف"
+          # تحليل الكلمات المفتاحية (بدون TextBlob و NLTK)
           texts = soup.get_text()
+          # تقسيم النص إلى كلمات واستبعاد الكلمات الشائعة
+          words = texts.lower().split()
+          common_words = set(['و', 'في', 'من', 'على', 'أن', 'إلى', 'عن', 'هو', 'مع', 'هذا', 'ما', 'لم', 'كما', 'كل'])
+          filtered_words = [word for word in words if word.isalpha() and word not in common_words]
+          word_counts = {}
+          for word in filtered_words:
+              word_counts[word] = word_counts.get(word, 0) + 1
+          sorted_keywords = sorted(word_counts.items(), key=lambda x: x[1], reverse=True)[:10]
           # رسم سحابة الكلمات
+          wordcloud = WordCloud(width=800, height=400, background_color='white', font_path='arial').generate(' '.join(filtered_words))
           fig_wc, ax_wc = plt.subplots(figsize=(12, 6))
           ax_wc.imshow(wordcloud, interpolation='bilinear')
           ax_wc.axis('off')