Papers-Leaderboard

Paused

hysts HF Staff commited on Sep 12, 2024

Commit

db967a1

1 Parent(s): 7a1f8d0

Update

Files changed (1) hide show

papers.py CHANGED Viewed

@@ -1,4 +1,3 @@
-import dataclasses
 import datetime
 import operator
@@ -21,17 +20,6 @@ ABSTRACT_RETRIEVER = RAGPretrainedModel.from_index(INDEX_DIR_PATH)
 ABSTRACT_RETRIEVER.search("LLM")
-@dataclasses.dataclass(frozen=True)
-class PaperInfo:
-    date: str
-    arxiv_id: str
-    github: str
-    title: str
-    paper_page: str
-    upvotes: int
-    num_comments: int
 def get_df() -> pd.DataFrame:
     df = pd.merge(
         left=datasets.load_dataset("hysts-bot-data/daily-papers", split="train").to_pandas(),
@@ -43,12 +31,11 @@ def get_df() -> pd.DataFrame:
     paper_info = []
     for _, row in tqdm.auto.tqdm(df.iterrows(), total=len(df)):
-        info = PaperInfo(
-            **row,
-            paper_page=f"https://huggingface.co/papers/{row.arxiv_id}",
-        )
         paper_info.append(info)
-    return pd.DataFrame([dataclasses.asdict(info) for info in paper_info])
 class Prettifier:

 import datetime
 import operator
 ABSTRACT_RETRIEVER.search("LLM")
 def get_df() -> pd.DataFrame:
     df = pd.merge(
         left=datasets.load_dataset("hysts-bot-data/daily-papers", split="train").to_pandas(),
     paper_info = []
     for _, row in tqdm.auto.tqdm(df.iterrows(), total=len(df)):
+        info = row.copy()
+        del info["abstract"]
+        info["paper_page"] = f"https://huggingface.co/papers/{row.arxiv_id}"
         paper_info.append(info)
+    return pd.DataFrame(paper_info)
 class Prettifier: