Minrui Xu

RolandXMR

https://rolandminrui.github.io/rolandminrui-homepage/

RolandXMR

AI & ML interests

None yet

Recent Activity

updated a dataset 13 days ago

LARK-Lab/EnvFactory-SFT-DeepSeekV4Flash-OpenAI

published a dataset 17 days ago

LARK-Lab/EnvFactory-SFT-DeepSeekV4Flash-OpenAI

updated a dataset 18 days ago

LARK-Lab/EnvFactory-SFT-DeepSeekV4Flash

View all activity

Organizations

updated a dataset 13 days ago

LARK-Lab/EnvFactory-SFT-DeepSeekV4Flash-OpenAI

Viewer • Updated 13 days ago • 3.27k • 58

published a dataset 17 days ago

LARK-Lab/EnvFactory-SFT-DeepSeekV4Flash-OpenAI

Viewer • Updated 13 days ago • 3.27k • 58

updated a dataset 18 days ago

LARK-Lab/EnvFactory-SFT-DeepSeekV4Flash

Updated 18 days ago • 41

published a dataset 18 days ago

LARK-Lab/EnvFactory-SFT-DeepSeekV4Flash

Updated 18 days ago • 41

upvoted a paper 18 days ago

Demystifying Hidden-State Recurrence: Switchable Latent Reasoning with On-Policy Reinforcement Learning

Paper • 2606.13106 • Published 19 days ago • 21

upvoted a paper 20 days ago

Attention Amnesia in Hybrid LLMs: When CoT Fine-Tuning Breaks Long-Range Recall, and How to Fix It

Paper • 2606.11052 • Published 21 days ago • 16

upvoted 2 papers about 1 month ago

OScaR: The Occam's Razor for Extreme KV Cache Quantization in LLMs and Beyond

Paper • 2605.19660 • Published May 19 • 40

ThoughtTrace: Understanding User Thoughts in Real-World LLM Interactions

Paper • 2605.20087 • Published May 19 • 18

authored 5 papers about 1 month ago

FIRST: Teach A Reliable Large Language Model Through Efficient Trustworthy Distillation

Paper • 2408.12168 • Published Aug 22, 2024

ScaleBiO: Scalable Bilevel Optimization for LLM Data Reweighting

Paper • 2406.19976 • Published Jun 28, 2024

R&D-Agent-Quant: A Multi-Agent Framework for Data-Centric Factors and Model Joint Optimization

Paper • 2505.15155 • Published May 21, 2025 • 1

R&D-Agent: An LLM-Agent Framework Towards Autonomous Data Science

Paper • 2505.14738 • Published May 20, 2025 • 1

EnvFactory: Scaling Tool-Use Agents via Executable Environments Synthesis and Robust RL

Paper • 2605.18703 • Published May 18 • 50

updated a model about 1 month ago

LARK-Lab/EnvFactory-8B

Text Generation • 8B • Updated May 20 • 6 • 1

updated 3 datasets about 1 month ago

upvoted a paper about 1 month ago

EnvFactory: Scaling Tool-Use Agents via Executable Environments Synthesis and Robust RL

Paper • 2605.18703 • Published May 18 • 50

updated a collection about 1 month ago

EnvFactory

Collection

This is the checkpoints and dataset for: EnvFactory: Scaling Tool-Use Agents via Executable Environments Synthesis and Robust RL. • 7 items • Updated May 20 • 1

Minrui Xu

AI & ML interests

Recent Activity

Organizations

RolandXMR's activity