Spaces:

Batnini
/

radius

Paused

App Files Files Community

Batnini commited on Aug 12, 2025

Commit

c36492f

verified ·

1 Parent(s): 79c1095

Update tools/quran_search.py

Browse files

Files changed (1) hide show

tools/quran_search.py +15 -132

tools/quran_search.py CHANGED Viewed

@@ -1,3 +1,17 @@
 import requests
 import logging
 import numpy as np
@@ -26,135 +40,4 @@ class QuranSearchEngine:
             print(f"Initialization error: {e}", file=sys.stderr)
             self._load_fallback_data()  # Ensure minimal startup
-    def _load_full_quran(self):
-        max_retries = 5  # Increased retries
-        for attempt in range(max_retries):
-            try:
-                response = requests.get(f"{self.api_url}surah.json", timeout=15)  # Increased timeout
-                response.raise_for_status()
-                self.surahs = response.json()
-                for i, s in enumerate(self.surahs):
-                    s['id'] = i + 1
-                break
-            except Exception as e:
-                self.logger.error(f"Attempt {attempt + 1}/{max_retries} failed to fetch surahs: {e}")
-                if attempt == max_retries - 1:
-                    self._load_fallback_data()
-                time.sleep(2 ** attempt)
-        if self.surahs:
-            for surah in self.surahs:
-                surah_id = surah['id']
-                try:
-                    response = requests.get(f"{self.api_url}{surah_id}.json", timeout=15)
-                    response.raise_for_status()
-                    data = response.json()
-                    verses = data['arabic1']
-                    for verse_num, text in enumerate(verses, start=1):
-                        self.all_verses.append({
-                            'surah_id': surah_id,
-                            'verse_num': verse_num,
-                            'text': text
-                        })
-                except Exception as e:
-                    self.logger.error(f"Failed to fetch verses for surah {surah_id}: {e}")
-    def _load_fallback_data(self):
-        self.logger.warning("Falling back to minimal data due to API failure")
-        self.surahs = self._load_fallback_surahs()
-        self.all_verses = [
-            {'surah_id': 1, 'verse_num': 1, 'text': "بِسْمِ ٱللَّهِ ٱلرَّحْمَـٰنِ ٱلرَّحِيمِ"},
-            {'surah_id': 1, 'verse_num': 2, 'text': "ٱلْحَمْدُ لِلَّهِ رَبِّ ٱلْعَٰلَمِينَ"}
-        ]
-    def _load_all_verses_and_embeddings(self):
-        if not self.all_verses:
-            return
-        try:
-            print("Attempting to load model...", file=sys.stderr)  # Debug
-            self.model = SentenceTransformer(MODEL_NAME)
-            print("Model loaded successfully", file=sys.stderr)  # Debug
-            verse_texts = [v['text'] for v in self.all_verses]
-            self.verse_embeddings = []
-            for i in range(0, len(verse_texts), CHUNK_SIZE):
-                chunk = verse_texts[i:i + CHUNK_SIZE]
-                embeddings = self.model.encode(chunk, convert_to_tensor=False)
-                self.verse_embeddings.append(embeddings)
-            self.verse_embeddings = np.vstack(self.verse_embeddings)
-            print("Embeddings computed successfully", file=sys.stderr)  # Debug
-        except Exception as e:
-            self.logger.error(f"Failed to compute embeddings: {e}", exc_info=True)
-            self.verse_embeddings = None
-            self.logger.warning("Falling back to keyword-based search due to embedding failure")
-    def get_surahs(self):
-        if self.surahs:
-            return [(s['surahNameArabicLong'], s['id']) for s in self.surahs]
-        return self._load_fallback_surahs()
-    def get_surah_text(self, surah_id):
-        max_retries = 3
-        for attempt in range(max_retries):
-            try:
-                response = requests.get(f"{self.api_url}{surah_id}.json", timeout=15)
-                response.raise_for_status()
-                data = response.json()
-                verses = data['arabic1']
-                return "\n\n".join(f"آية {i + 1}: {v}" for i, v in enumerate(verses))
-            except Exception as e:
-                self.logger.error(f"Attempt {attempt + 1}/{max_retries} failed to fetch surah {surah_id}: {e}")
-                if attempt == max_retries - 1:
-                    return self._load_fallback_verse()
-                time.sleep(2 ** attempt)
-    def search_verses(self, query, top_k=5):
-        if self.model is None:
-            try:
-                print("Loading model on demand...", file=sys.stderr)
-                self.model = SentenceTransformer(MODEL_NAME)
-                print("Model loaded successfully", file=sys.stderr)
-                verse_texts = [v['text'] for v in self.all_verses]
-                self.verse_embeddings = []
-                for i in range(0, len(verse_texts), CHUNK_SIZE):
-                    chunk = verse_texts[i:i + CHUNK_SIZE]
-                    embeddings = self.model.encode(chunk, convert_to_tensor=False)
-                    self.verse_embeddings.append(embeddings)
-                self.verse_embeddings = np.vstack(self.verse_embeddings)
-            except Exception as e:
-                self.logger.error(f"Failed to load model on demand: {e}", exc_info=True)
-                self.verse_embeddings = None
-        if self.verse_embeddings is None or not self.all_verses:
-            return self._keyword_fallback_search(query, top_k)
-        try:
-            print(f"Encoding query: {query}", file=sys.stderr)  # Debug
-            query_embedding = self.model.encode([query], convert_to_tensor=False)
-            similarities = cosine_similarity(query_embedding, self.verse_embeddings)[0]
-            top_indices = np.argsort(similarities)[-top_k:][::-1]
-            results = []
-            for idx in top_indices:
-                verse = self.all_verses[idx]
-                surah_name = self.surahs[verse['surah_id'] - 1]['surahNameArabicLong']
-                results.append(f"سورة {surah_name} - آية {verse['verse_num']}:\n{verse['text']}")
-            return "\n\n".join(results)
-        except Exception as e:
-            self.logger.error(f"Search failed: {e}", exc_info=True)
-            return "حدث خطأ أثناء البحث. جرب مرة أخرى."
-    def _keyword_fallback_search(self, query, top_k=5):
-        query_lower = query.lower()
-        matches = []
-        for verse in self.all_verses:
-            if query_lower in verse['text'].lower():
-                surah_name = self.surahs[verse['surah_id'] - 1]['surahNameArabicLong'] if self.surahs else f"سورة {verse['surah_id']}"
-                matches.append(f"سورة {surah_name} - آية {verse['verse_num']}:\n{verse['text']}")
-        return "\n\n".join(matches[:top_k]) or "لا توجد نتائج مطابقة."
-    def _load_fallback_surahs(self):
-        return [("الفاتحة", 1), ("البقرة", 2), ("آل عمران", 3)]
-    def _load_fallback_verse(self):
-        return "بسم الله الرحمن الرحيم\nالله لا إله إلا هو الحي القيوم"

+# tools/quran_search.py
+# --- Patch for huggingface_hub cached_download removal ---
+import huggingface_hub
+if not hasattr(huggingface_hub, "cached_download"):
+    try:
+        from huggingface_hub import hf_hub_download
+        huggingface_hub.cached_download = hf_hub_download
+    except ImportError:
+        raise ImportError(
+            "huggingface_hub version is incompatible and cannot be patched automatically."
+        )
+# ---------------------------------------------------------
 import requests
 import logging
 import numpy as np
             print(f"Initialization error: {e}", file=sys.stderr)
             self._load_fallback_data()  # Ensure minimal startup
+    # ... rest of your class code unchanged ...