Spaces:

GenAIDevTOProd
/

Reddit-SemanticSearch-Prototype

Sleeping

GenAIDevTOProd commited on Aug 6

Commit

7afaf6d

verified ·

1 Parent(s): b661309

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -15,15 +15,15 @@ from huggingface_hub import HfApi
 # Load token from Hugging Face Secrets
 HF_TOKEN = os.environ.get("RedditSemanticSearch")
-# Define target subreddits
-target_subreddits = ["askscience", "gaming", "technology", "todayilearned", "programming"]
 # Function to stream JSONL Reddit files from HF Hub
 from datasets import load_dataset
 # Load full Reddit dataset (assumes it's pre-split by subreddit or has a field)
 dataset = load_dataset("HuggingFaceGECLM/REDDIT_comments", split="train")
 # Filter only relevant subreddits
 dataset = dataset.filter(lambda x: x["subreddit"] in target_subreddits)

 # Load token from Hugging Face Secrets
 HF_TOKEN = os.environ.get("RedditSemanticSearch")
 # Function to stream JSONL Reddit files from HF Hub
 from datasets import load_dataset
 # Load full Reddit dataset (assumes it's pre-split by subreddit or has a field)
 dataset = load_dataset("HuggingFaceGECLM/REDDIT_comments", split="train")
+# Define target subreddits
+target_subreddits = ["askscience", "gaming", "technology", "todayilearned", "programming"]
 # Filter only relevant subreddits
 dataset = dataset.filter(lambda x: x["subreddit"] in target_subreddits)