2 12 11

SII-Yakun Zhu

shzyk

shzyk

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

The Past Is Not Past: Memory-Enhanced Dynamic Reward Shaping

upvoted a paper about 2 months ago

Speed by Simplicity: A Single-Stream Architecture for Fast Audio-Video Generative Foundation Model

liked a dataset about 2 months ago

SWE-bench/SWE-bench

View all activity

Organizations

None yet

upvoted a paper about 1 month ago

The Past Is Not Past: Memory-Enhanced Dynamic Reward Shaping

Paper • 2604.11297 • Published Apr 13 • 143

upvoted a paper about 2 months ago

Speed by Simplicity: A Single-Stream Architecture for Fast Audio-Video Generative Foundation Model

Paper • 2603.21986 • Published Mar 23 • 125

liked a dataset about 2 months ago

SWE-bench/SWE-bench

Viewer • Updated Apr 29, 2025 • 21.5k • 4.05k • 29

upvoted a paper about 2 months ago

Rethinking UMM Visual Generation: Masked Modeling for Efficient Image-Only Pre-training

Paper • 2603.16139 • Published Mar 17 • 33

New activity in SII-SPIRAL-MED/DiagnosisArena 2 months ago

Update README.md

#2 opened 2 months ago by

shzyk

updated a dataset 2 months ago

shzyk/DiagnosisArena

Viewer • Updated Mar 13 • 915 • 318 • 9

upvoted an article 3 months ago

Article

Forge: Scalable Agent RL Framework and Algorithm

MiniMax-AI

•

Feb 13

• 153

upvoted a paper 3 months ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

Paper • 2602.08354 • Published Feb 9 • 265

authored a paper 3 months ago

MedMCP-Calc: Benchmarking LLMs for Realistic Medical Calculator Scenarios via MCP Integration

Paper • 2601.23049 • Published Jan 30 • 1

upvoted 6 papers 3 months ago

DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models

Paper • 2505.14107 • Published May 20, 2025 • 1

MeNTi: Bridging Medical Calculator and LLM Agent with Nested Tool Calling

Paper • 2410.13610 • Published Oct 17, 2024 • 1

CP-Env: Evaluating Large Language Models on Clinical Pathways in a Controllable Hospital Environment

Paper • 2512.10206 • Published Dec 11, 2025 • 1

MOVA: Towards Scalable and Synchronized Video-Audio Generation

Paper • 2602.08794 • Published Feb 9 • 159

MedMCP-Calc: Benchmarking LLMs for Realistic Medical Calculator Scenarios via MCP Integration

Paper • 2601.23049 • Published Jan 30 • 1

daVinci-Agency: Unlocking Long-Horizon Agency Data-Efficiently

Paper • 2602.02619 • Published Feb 2 • 53

liked a dataset 4 months ago

ncbi/MedCalc-Bench-v1.2

Viewer • Updated Dec 20, 2025 • 11.6k • 1.2k • 3

liked a dataset 5 months ago

ncbi/MedCalc-Bench

Viewer • Updated Dec 18, 2025 • 11.6k • 1.58k • 2

authored 3 papers 5 months ago

CP-Env: Evaluating Large Language Models on Clinical Pathways in a Controllable Hospital Environment

Paper • 2512.10206 • Published Dec 11, 2025 • 1

MeNTi: Bridging Medical Calculator and LLM Agent with Nested Tool Calling

Paper • 2410.13610 • Published Oct 17, 2024 • 1

DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models

Paper • 2505.14107 • Published May 20, 2025 • 1

SII-Yakun Zhu

AI & ML interests

Recent Activity

Organizations

shzyk's activity

Update README.md

Forge: Scalable Agent RL Framework and Algorithm