Xinzhe's picture

7

Xinzhe

Thmars

AI & ML interests

None yet

Recent Activity

upvoted a paper 7 days ago

DAComp: Benchmarking Data Agents across the Full Data Intelligence Lifecycle

upvoted a paper 3 months ago

A.S.E: A Repository-Level Benchmark for Evaluating Security in AI-Generated Code

upvoted a paper 7 months ago

Flow-GRPO: Training Flow Matching Models via Online RL

View all activity

Organizations

None yet

upvoted a paper 7 days ago

DAComp: Benchmarking Data Agents across the Full Data Intelligence Lifecycle

Paper • 2512.04324 • Published 8 days ago • 147

upvoted a paper 3 months ago

A.S.E: A Repository-Level Benchmark for Evaluating Security in AI-Generated Code

Paper • 2508.18106 • Published Aug 25 • 346

upvoted a paper 7 months ago

Flow-GRPO: Training Flow Matching Models via Online RL

Paper • 2505.05470 • Published May 8 • 86

upvoted a paper 11 months ago

URSA: Understanding and Verifying Chain-of-thought Reasoning in Multimodal Mathematics

Paper • 2501.04686 • Published Jan 8 • 53

upvoted 2 papers about 1 year ago

Critical Tokens Matter: Token-Level Contrastive Estimation Enhence LLM's Reasoning Capability

Paper • 2411.19943 • Published Nov 29, 2024 • 63

Large Language Models Can Self-Improve in Long-context Reasoning

Paper • 2411.08147 • Published Nov 12, 2024 • 66

upvoted a paper over 1 year ago

ChartMimic: Evaluating LMM's Cross-Modal Reasoning Capability via Chart-to-Code Generation

Paper • 2406.09961 • Published Jun 14, 2024 • 55