zhaoxu's picture

7

zhaoxu

zhang1129

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 20 hours ago

NGM: A Plug-and-Play Training-Free Memory Module for LLMs

upvoted a paper about 20 hours ago

TOBench: A Task-Oriented Omni-Modal Benchmark for Real-World Tool-Using Agents

upvoted a paper about 1 month ago

DR^{3}-Eval: Towards Realistic and Reproducible Deep Research Evaluation

View all activity

Organizations

None yet

upvoted 2 papers about 20 hours ago

NGM: A Plug-and-Play Training-Free Memory Module for LLMs

Paper • 2605.16893 • Published 4 days ago • 8

TOBench: A Task-Oriented Omni-Modal Benchmark for Real-World Tool-Using Agents

Paper • 2605.16909 • Published 4 days ago • 6

upvoted 2 papers about 1 month ago

DR^{3}-Eval: Towards Realistic and Reproducible Deep Research Evaluation

Paper • 2604.14683 • Published Apr 16 • 36

Rethinking Generalization in Reasoning SFT: A Conditional Analysis on Optimization, Data, and Model Capability

Paper • 2604.06628 • Published Apr 8 • 324

upvoted a paper about 2 months ago

AgentHallu: Benchmarking Automated Hallucination Attribution of LLM-based Agents

Paper • 2601.06818 • Published Jan 11 • 1

upvoted 2 papers 4 months ago

AgentDoG: A Diagnostic Guardrail Framework for AI Agent Safety and Security

Paper • 2601.18491 • Published Jan 26 • 125

Controlled Self-Evolution for Algorithmic Code Optimization

Paper • 2601.07348 • Published Jan 12 • 115