AI-Streaming-Pro

Running

rahul7star commited on Jan 20

Commit

33779ec

verified ·

1 Parent(s): 56ede89

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,45 +1,28 @@
 import math
 import gradio as gr
 import pandas as pd
-from huggingface_hub import HfApi, hf_hub_download
 # ======================================================
 # CONFIG
 # ======================================================
-DATASET_REPO = "rahul7star/Wan-video"
-CSV_FILE = "train.csv"
 VIDEO_COL = "video"
 TEXT_COL = "text"
 DATE_COL = "date"
 # ======================================================
-# AUTH + DATA LOAD (LEARNED FROM YOUR SAMPLE)
 # ======================================================
-api = HfApi()  # auto-reads HUGGINGFACE_HUB_TOKEN
-def load_dataset_csv():
-    """
-    Validate repo access and load CSV from private dataset.
-    """
-    # 1️⃣ Permission + existence check
-    api.repo_info(repo_id=DATASET_REPO, repo_type="dataset")
-    # 2️⃣ Download CSV (auth handled implicitly)
-    csv_path = hf_hub_download(
-        repo_id=DATASET_REPO,
-        filename=CSV_FILE,
-        repo_type="dataset"
-    )
-    # 3️⃣ Load dataframe
-    df = pd.read_csv(csv_path)
-    df = df[[VIDEO_COL, TEXT_COL, DATE_COL]].dropna().reset_index(drop=True)
-    return df
-df = load_dataset_csv()
 # ======================================================
 # PAGINATION LOGIC
@@ -149,7 +132,7 @@ with gr.Blocks(theme=gr.themes.Soft(), css=css) as demo:
     gr.Markdown(
         """
         # 🎬 Wan Video Dataset Showcase
-        Securely browsing a **private Hugging Face dataset**.
         """
     )

 import math
 import gradio as gr
 import pandas as pd
+from datasets import load_dataset
 # ======================================================
 # CONFIG
 # ======================================================
+DATASET_NAME = "rahul7star/Wan-video"
 VIDEO_COL = "video"
 TEXT_COL = "text"
 DATE_COL = "date"
 # ======================================================
+# LOAD DATASET (PRIVATE-SAFE)
 # ======================================================
+# Auth is handled automatically via:
+# - `huggingface-cli login`
+# - or HUGGINGFACE_HUB_TOKEN env var
+dataset = load_dataset(DATASET_NAME, split="train")
+# Convert to pandas for easy slicing
+df = dataset.to_pandas()
+df = df[[VIDEO_COL, TEXT_COL, DATE_COL]].dropna().reset_index(drop=True)
 # ======================================================
 # PAGINATION LOGIC
     gr.Markdown(
         """
         # 🎬 Wan Video Dataset Showcase
+        Powered by **Hugging Face Datasets** (private-safe).
         """
     )