Spaces:

Batnini
/

radius

Paused

App Files Files Community

Batnini commited on Aug 11, 2025

Commit

07a1614

verified ·

1 Parent(s): 48effdd

Update tools/quran_search.py

Browse files

Files changed (1) hide show

tools/quran_search.py +13 -18

tools/quran_search.py CHANGED Viewed

@@ -3,7 +3,6 @@ from sentence_transformers import SentenceTransformer
 from sklearn.metrics.pairwise import cosine_similarity
 import numpy as np
 import requests
-from io import StringIO
 import logging
 class QuranSearchEngine:
@@ -13,26 +12,19 @@ class QuranSearchEngine:
         self.verse_embeddings = None
         self.quran_df = None
         self.surah_names = {
-            1: "الفاتحة", 2: "البقرة", 3: "آل عمران",
-            # Add all 114 surah names here
             114: "الناس"
         }
     def load_data(self):
         if not self.data_loaded:
             try:
-                # Dynamic data loading
-                url = "https://api.quran.com/api/v4/chapters"
-                response = requests.get(url)
-                chapters = response.json()['chapters']
-                self.surah_names = {c['id']: c['name_arabic'] for c in chapters}
-                # Load verses
                 verses_url = "https://api.quran.com/api/v4/verses/by_chapter/2?language=ar&words=true"
-                verses_response = requests.get(verses_url)
-                verses = verses_response.json()['verses']
-                # Process verses into DataFrame
                 verses_data = []
                 for verse in verses:
                     verses_data.append({
@@ -45,19 +37,21 @@ class QuranSearchEngine:
                 self.model = SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2')
                 self.verse_embeddings = self.model.encode(self.quran_df['text'].tolist())
                 self.data_loaded = True
             except Exception as e:
-                logging.error(f"Error loading data: {str(e)}")
                 self.load_backup_data()
     def load_backup_data(self):
-        """Fallback to static data if API fails"""
         backup = [
             {"surah": 2, "ayah": 163, "text": "وإلهكم إله واحد لا إله إلا هو الرحمن الرحيم"},
             {"surah": 3, "ayah": 134, "text": "الذين ينفقون في السراء والضراء والكاظمين الغيظ والعافين عن الناس والله يحب المحسنين"},
             {"surah": 4, "ayah": 135, "text": "يا أيها الذين آمنوا كونوا قوامين بالقسط شهداء لله ولو على أنفسكم أو الوالدين والأقربين"}
         ]
         self.quran_df = pd.DataFrame(backup)
         self.verse_embeddings = self.model.encode(self.quran_df['text'].tolist())
         self.data_loaded = True
@@ -72,7 +66,7 @@ class QuranSearchEngine:
             for idx in top_indices:
                 verse = self.quran_df.iloc[idx]
                 results.append({
-                    "surah": self.surah_names.get(verse['surah'],
                     "ayah": verse['ayah'],
                     "text": verse['text'],
                     "similarity": f"{similarities[idx]:.2f}",
@@ -80,6 +74,7 @@ class QuranSearchEngine:
                     "ayah_num": verse['ayah']
                 })
             return results
         except Exception as e:
-            logging.error(f"Search error: {str(e)}")
             return []

 from sklearn.metrics.pairwise import cosine_similarity
 import numpy as np
 import requests
 import logging
 class QuranSearchEngine:
         self.verse_embeddings = None
         self.quran_df = None
         self.surah_names = {
+            1: "الفاتحة", 2: "البقرة", 3: "آل عمران",
+            4: "النساء", 5: "المائدة", 6: "الأنعام",
             114: "الناس"
         }
     def load_data(self):
         if not self.data_loaded:
             try:
+                # Try to load from API
                 verses_url = "https://api.quran.com/api/v4/verses/by_chapter/2?language=ar&words=true"
+                response = requests.get(verses_url, timeout=10)
+                verses = response.json().get('verses', [])
                 verses_data = []
                 for verse in verses:
                     verses_data.append({
                 self.model = SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2')
                 self.verse_embeddings = self.model.encode(self.quran_df['text'].tolist())
                 self.data_loaded = True
             except Exception as e:
+                logging.error(f"API Error: {str(e)}")
                 self.load_backup_data()
     def load_backup_data(self):
+        """Load backup data if API fails"""
         backup = [
             {"surah": 2, "ayah": 163, "text": "وإلهكم إله واحد لا إله إلا هو الرحمن الرحيم"},
             {"surah": 3, "ayah": 134, "text": "الذين ينفقون في السراء والضراء والكاظمين الغيظ والعافين عن الناس والله يحب المحسنين"},
             {"surah": 4, "ayah": 135, "text": "يا أيها الذين آمنوا كونوا قوامين بالقسط شهداء لله ولو على أنفسكم أو الوالدين والأقربين"}
         ]
         self.quran_df = pd.DataFrame(backup)
+        if not hasattr(self, 'model'):
+            self.model = SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2')
         self.verse_embeddings = self.model.encode(self.quran_df['text'].tolist())
         self.data_loaded = True
             for idx in top_indices:
                 verse = self.quran_df.iloc[idx]
                 results.append({
+                    "surah": self.surah_names.get(verse['surah'], "سورة غير معروفة"),
                     "ayah": verse['ayah'],
                     "text": verse['text'],
                     "similarity": f"{similarities[idx]:.2f}",
                     "ayah_num": verse['ayah']
                 })
             return results
         except Exception as e:
+            logging.error(f"Search Error: {str(e)}")
             return []