YUANZHE HU

ai-hyz

·

AI & ML interests

None yet

Recent Activity

liked a dataset 2 days ago

ai-hyz/MemoryArena-product-db

new activity 15 days ago

ai-hyz/MemoryAgentBench:Update README.md

upvoted a paper about 1 month ago

Masking Stale Observations Helps Search Agents -- Until It Doesn't: A Regime Map and Its Mechanism

View all activity

Organizations

None yet

upvoted a paper about 1 month ago

Masking Stale Observations Helps Search Agents -- Until It Doesn't: A Regime Map and Its Mechanism

Paper • 2606.00408 • Published May 29 • 65

upvoted a paper about 2 months ago

Code as Agent Harness

Paper • 2605.18747 • Published May 18 • 223

upvoted a paper 7 months ago

When Reasoning Meets Its Laws

Paper • 2512.17901 • Published Dec 19, 2025 • 62

upvoted 2 papers 9 months ago

When Benchmarks Age: Temporal Misalignment through Large Language Model Factuality Evaluation

Paper • 2510.07238 • Published Oct 8, 2025 • 15

BiasFreeBench: a Benchmark for Mitigating Bias in Large Language Model Responses

Paper • 2510.00232 • Published Sep 30, 2025 • 16

upvoted a collection 9 months ago

Representation & Optimization

Understanding about representation sheds light on optimization • 133 items • Updated 3 days ago • 7

upvoted 3 papers 9 months ago

Who's Your Judge? On the Detectability of LLM-Generated Judgments

Paper • 2509.25154 • Published Sep 29, 2025 • 30

Mem-α: Learning Memory Construction via Reinforcement Learning

Paper • 2509.25911 • Published Sep 30, 2025 • 15

EPO: Entropy-regularized Policy Optimization for LLM Agents Reinforcement Learning

Paper • 2509.22576 • Published Sep 26, 2025 • 137

upvoted a paper 10 months ago

WildScore: Benchmarking MLLMs in-the-Wild Symbolic Music Reasoning

Paper • 2509.04744 • Published Sep 5, 2025 • 12

upvoted 3 papers 12 months ago

Gemini 2.5: Pushing the Frontier with Advanced Reasoning, Multimodality, Long Context, and Next Generation Agentic Capabilities

Paper • 2507.06261 • Published Jul 7, 2025 • 68

MIRIX: Multi-Agent Memory System for LLM-Based Agents

Paper • 2507.07957 • Published Jul 10, 2025 • 80

Evaluating Memory in LLM Agents via Incremental Multi-Turn Interactions

Paper • 2507.05257 • Published Jul 7, 2025 • 15