ZhangXiaoyun's picture

ZhangXiaoyun

DadaCloud01

·

AI & ML interests

None yet

Organizations

upvoted a paper 2 months ago

SCOPE: Signal-Calibrated On-Policy Distillation Enhancement with Dual-Path Adaptive Weighting

Paper • 2604.10688 • Published Apr 12 • 26

upvoted 3 papers 3 months ago

Rediscovering Entropy Regularization: Adaptive Coefficient Unlocks Its Potential for LLM Reinforcement Learning

Paper • 2510.10959 • Published Oct 13, 2025 • 2

Reasoner for Real-World Event Detection: Scaling Reinforcement Learning via Adaptive Perplexity-Aware Sampling Strategy

Paper • 2507.01327 • Published Jul 2, 2025 • 1

TRUST-SQL: Tool-Integrated Multi-Turn Reinforcement Learning for Text-to-SQL over Unknown Schemas

Paper • 2603.16448 • Published Mar 17 • 58

upvoted a paper 4 months ago

Lost in Stories: Consistency Bugs in Long Story Generation by LLMs

Paper • 2603.05890 • Published Mar 6 • 93

upvoted a paper 6 months ago

Step-DeepResearch Technical Report

Paper • 2512.20491 • Published Dec 23, 2025 • 89

upvoted 2 papers about 1 year ago

Adversarial Contrastive Decoding: Boosting Safety Alignment of Large Language Models via Opposite Prompt Optimization

Paper • 2406.16743 • Published Jun 24, 2024 • 1

When to Continue Thinking: Adaptive Thinking Mode Switching for Efficient Reasoning

Paper • 2505.15400 • Published May 21, 2025 • 23