Spaces:

SondosM
/

avatarAPI

Running

SondosM commited on 3 days ago

Commit

ea1a0a7

verified ·

1 Parent(s): 25fff2a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -236,22 +236,29 @@ class SemanticSignMatcher:
             return self._normalizer.normalize_label(label)
         return label
-    def _load_database(self, csv_path: str, label_column: str):
         if not os.path.exists(csv_path):
-            logger.warning(f"CSV not found at {csv_path}. No word signs loaded.")
             return
-        df = pd.read_csv(csv_path, low_memory=False)
-        if label_column not in df.columns:
-            raise ValueError(f"Column '{label_column}' not found. Available: {list(df.columns)}")
-        all_labels = df[label_column].dropna().unique().tolist()
-        arabic_labels = [
-            str(l) for l in all_labels
-            if isinstance(l, str) and any("\u0600" <= c <= "\u06ff" for c in str(l))
-        ]
-        self._raw_labels = arabic_labels
-        self._word_signs = arabic_labels.copy()
-        logger.info(f"Database: {len(arabic_labels)} Arabic word labels loaded.")
     def _finalize_labels(self):
         if self._normalizer and self._raw_labels:
             self._word_signs = [self._normalize_label(l) for l in self._raw_labels]

             return self._normalizer.normalize_label(label)
         return label
+     def _load_database(self, csv_path: str, label_column: str):
         if not os.path.exists(csv_path):
+            logger.info("CSV not found locally. Downloading from Hugging Face...")
+            import urllib.request
+            url = "https://huggingface.co/spaces/SondosM/avatarAPI/resolve/main/arabic_sign_lang_features.csv"
+            try:
+                urllib.request.urlretrieve(url, csv_path)
+                logger.info("CSV downloaded successfully.")
+            except Exception as e:
+                logger.warning(f"Failed to download CSV: {e}. No word signs loaded.")
             return
+    df = pd.read_csv(csv_path, low_memory=False)
+    if label_column not in df.columns:
+        raise ValueError(f"Column '{label_column}' not found. Available: {list(df.columns)}")
+    all_labels = df[label_column].dropna().unique().tolist()
+    arabic_labels = [
+        str(l) for l in all_labels
+        if isinstance(l, str) and any("\u0600" <= c <= "\u06ff" for c in str(l))
+    ]
+    self._raw_labels = arabic_labels
+    self._word_signs = arabic_labels.copy()
+    logger.info(f"Database: {len(arabic_labels)} Arabic word labels loaded.")
     def _finalize_labels(self):
         if self._normalizer and self._raw_labels:
             self._word_signs = [self._normalize_label(l) for l in self._raw_labels]