Spaces:

Ya-Alex
/

anki-addons

Sleeping

Ya-Alex commited on Feb 1

Commit

5e67170

1 Parent(s): cdcdabb

Switch to "main" branch

Files changed (1) hide show

src/dataset_data.py CHANGED Viewed

@@ -8,6 +8,7 @@ from pandas import DataFrame
 class DatasetData:
     __repo_id: str = "Ya-Alex/anki-addons"
     def __init__(self):
         self.parquet_files: Optional[dict[date, DataFrame]] = None
@@ -19,7 +20,7 @@ class DatasetData:
         return self.parquet_files
     def __list_history_parquet_files(self) -> dict[date, str]:
-        all_files: list[str] = list_repo_files(self.__repo_id, repo_type="dataset", revision="parquet-versions")
         history_files: list[str] = [file for file in all_files if file.startswith("history")]
         parquet_files: list[str] = [file for file in history_files if file.endswith("data.parquet")]
         parquet_file_dict: dict[date, str] = {date.fromisoformat(file.split("/")[1]): file for file in parquet_files}
@@ -28,4 +29,4 @@ class DatasetData:
     def __read_parquet(self, parquet_file: str) -> DataFrame:
         return pd.read_parquet(
             hf_hub_download(repo_id=self.__repo_id, filename=parquet_file, repo_type="dataset",
-                            revision="parquet-versions"))

 class DatasetData:
     __repo_id: str = "Ya-Alex/anki-addons"
+    __revision: str = "main"
     def __init__(self):
         self.parquet_files: Optional[dict[date, DataFrame]] = None
         return self.parquet_files
     def __list_history_parquet_files(self) -> dict[date, str]:
+        all_files: list[str] = list_repo_files(self.__repo_id, repo_type="dataset", revision=self.__revision)
         history_files: list[str] = [file for file in all_files if file.startswith("history")]
         parquet_files: list[str] = [file for file in history_files if file.endswith("data.parquet")]
         parquet_file_dict: dict[date, str] = {date.fromisoformat(file.split("/")[1]): file for file in parquet_files}
     def __read_parquet(self, parquet_file: str) -> DataFrame:
         return pd.read_parquet(
             hf_hub_download(repo_id=self.__repo_id, filename=parquet_file, repo_type="dataset",
+                            revision=self.__revision))