Spaces:

vikramvasudevan
/

sanatan_ai

Running

App Files Files Community

vikramvasudevan commited on Aug 7

Commit

5c1cea6

verified ·

1 Parent(s): 8d1a737

Upload folder using huggingface_hub

Browse files

Files changed (1) hide show

db.py +16 -10

db.py CHANGED Viewed

@@ -69,31 +69,38 @@ class SanatanDatabase:
         all_docs = collection.get()
         matched_docs = []
-        for doc, metadata, ids in zip(
             all_docs["documents"], all_docs["metadatas"], all_docs["ids"]
         ):
-            for i, d in enumerate(doc):
                 doc_match = regex.search(normalize(d))
                 metadata_match = False
-                current_metadata = metadata[i] if isinstance(metadata, list) else metadata
                 for key, value in current_metadata.items():
                     if isinstance(value, str) and regex.search(normalize(value)):
                         metadata_match = True
                         break
                     elif isinstance(value, list):
-                        # Check within list of strings (e.g., divya_desams)
-                        if any(
-                            isinstance(v, str) and regex.search(normalize(v))
-                            for v in value
-                        ):
                             metadata_match = True
                             break
                 if doc_match or metadata_match:
                     matched_docs.append(
                         {
-                            "id": ids[i],
                             "document": d,
                             "metadata": current_metadata,
                         }
@@ -103,7 +110,6 @@ class SanatanDatabase:
             if len(matched_docs) >= n_results:
                 break
         return {
             "documents": [[d["document"] for d in matched_docs]],
             "ids": [[d["id"] for d in matched_docs]],

         all_docs = collection.get()
         matched_docs = []
+        for doc_list, metadata_list, doc_id_list in zip(
             all_docs["documents"], all_docs["metadatas"], all_docs["ids"]
         ):
+            # Ensure all are lists
+            if isinstance(doc_list, str):
+                doc_list = [doc_list]
+            if isinstance(metadata_list, dict):
+                metadata_list = [metadata_list]
+            if isinstance(doc_id_list, str):
+                doc_id_list = [doc_id_list]
+            for i in range(len(doc_list)):
+                d = doc_list[i]
+                current_metadata = metadata_list[i]
+                current_id = doc_id_list[i]
                 doc_match = regex.search(normalize(d))
                 metadata_match = False
                 for key, value in current_metadata.items():
                     if isinstance(value, str) and regex.search(normalize(value)):
                         metadata_match = True
                         break
                     elif isinstance(value, list):
+                        if any(isinstance(v, str) and regex.search(normalize(v)) for v in value):
                             metadata_match = True
                             break
                 if doc_match or metadata_match:
                     matched_docs.append(
                         {
+                            "id": current_id,
                             "document": d,
                             "metadata": current_metadata,
                         }
             if len(matched_docs) >= n_results:
                 break
         return {
             "documents": [[d["document"] for d in matched_docs]],
             "ids": [[d["id"] for d in matched_docs]],