Ishan Mukherjee

ishanjmukherjee

6 5

·

https://ishanjmukherjee.github.io

ishanjmukherjee

AI & ML interests

Language models, mechanistic interpretability

Recent Activity

liked a Space 2 months ago

nanotron/ultrascale-playbook

View all activity

Organizations

upvoted 3 papers about 1 year ago

ReasonMed: A 370K Multi-Agent Generated Dataset for Advancing Medical Reasoning

Paper • 2506.09513 • Published Jun 11, 2025 • 103

Does Math Reasoning Improve General LLM Capabilities? Understanding Transferability of LLM Reasoning

Paper • 2507.00432 • Published Jul 1, 2025 • 79

ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models

Paper • 2505.24864 • Published May 30, 2025 • 146

upvoted an article about 1 year ago

Article

DeepSeek-R1 Dissection: Understanding PPO & GRPO Without Any Prior Reinforcement Learning Knowledge

NormalUhr

•

Feb 7, 2025

• 295

upvoted an article over 1 year ago

Article

Putting RL back in RLHF

vwxyzjn, ArashAhmadian

•

Jun 12, 2024

• 112

upvoted a paper over 1 year ago

HyenaDNA: Long-Range Genomic Sequence Modeling at Single Nucleotide Resolution

Paper • 2306.15794 • Published Jun 27, 2023 • 18