Yantao Liu

RicardoL1u

·

https://scholar.google.com/citations?user=CKieAy4AAAAJ&hl=en

RicardoL1u

AI & ML interests

NLP

Recent Activity

upvoted a paper 10 days ago

Qwen-AgentWorld: Language World Models for General Agents

upvoted a paper 3 months ago

OccuBench: Evaluating AI Agents on Real-World Professional Tasks via Language World Models

liked a model 5 months ago

Qwen/Qwen3.5-397B-A17B

View all activity

Organizations

upvoted a paper 10 days ago

Qwen-AgentWorld: Language World Models for General Agents

Paper • 2606.24597 • Published 11 days ago • 144

upvoted a paper 3 months ago

OccuBench: Evaluating AI Agents on Real-World Professional Tasks via Language World Models

Paper • 2604.10866 • Published Apr 13 • 69

upvoted a paper 9 months ago

StockBench: Can LLM Agents Trade Stocks Profitably In Real-world Markets?

Paper • 2510.02209 • Published Oct 2, 2025 • 57

upvoted a paper about 1 year ago

AdaptThink: Reasoning Models Can Learn When to Think

Paper • 2505.13417 • Published May 19, 2025 • 83

upvoted 2 papers over 1 year ago

Agentic Reward Modeling: Integrating Human Preferences with Verifiable Correctness Signals for Reliable Reward Systems

Paper • 2502.19328 • Published Feb 26, 2025 • 23

ADELIE: Aligning Large Language Models on Information Extraction

Paper • 2405.05008 • Published May 8, 2024 • 2

upvoted a collection over 1 year ago

OpenSAE-LLaMA-3.1-8B

OpenSAE checkpoints for LLaMA 3.1 8B base model • 38 items • Updated Jan 29, 2025 • 5

upvoted 3 papers over 1 year ago

Pairwise RM: Perform Best-of-N Sampling with Knockout Tournament

Paper • 2501.13007 • Published Jan 22, 2025 • 19

Pre-training Distillation for Large Language Models: A Design Space Exploration

Paper • 2410.16215 • Published Oct 21, 2024 • 18

RM-Bench: Benchmarking Reward Models of Language Models with Subtlety and Style

Paper • 2410.16184 • Published Oct 21, 2024 • 26

upvoted 3 papers about 2 years ago

Simulating Classroom Education with LLM-Empowered Agents

Paper • 2406.19226 • Published Jun 27, 2024 • 32

SeaKR: Self-aware Knowledge Retrieval for Adaptive Retrieval Augmented Generation

Paper • 2406.19215 • Published Jun 27, 2024 • 32

Aligning Teacher with Student Preferences for Tailored Training Data Generation

Paper • 2406.19227 • Published Jun 27, 2024 • 25

upvoted a paper about 3 years ago

KoLA: Carefully Benchmarking World Knowledge of Large Language Models

Paper • 2306.09296 • Published Jun 15, 2023 • 20