17 18

Павлов Роман

tangqianyi

AI & ML interests

Agent systems for real-world tasks.

Recent Activity

liked a dataset about 9 hours ago

puruchinera/anime-faces-256px-v2

upvoted a paper 1 day ago

Masking Stale Observations Helps Search Agents -- Until It Doesn't: A Regime Map and Its Mechanism

liked a dataset 2 days ago

mlfoundations/dclm-baseline-1.0

View all activity

Organizations

None yet

liked a dataset about 9 hours ago

puruchinera/anime-faces-256px-v2

Updated about 9 hours ago • 1

upvoted a paper 1 day ago

Masking Stale Observations Helps Search Agents -- Until It Doesn't: A Regime Map and Its Mechanism

Paper • 2606.00408 • Published 6 days ago • 53

liked a dataset 2 days ago

mlfoundations/dclm-baseline-1.0

Preview • Updated Jul 22, 2024 • 620k • 282

upvoted a paper 4 days ago

CollectionLoRA: Collecting 50 Effects in 1 LoRA via Multi-Teacher On-Policy Distillation

Paper • 2605.25378 • Published 10 days ago • 58

upvoted 2 papers 7 days ago

Gated DeltaNet-2: Decoupling Erase and Write in Linear Attention

Paper • 2605.22791 • Published 14 days ago • 30

NSF-SciFy: Mining the NSF Awards Database for Scientific Claims

Paper • 2503.08600 • Published 10 days ago • 4

liked a model 9 days ago

tencent/Hy-MT2-1.8B

Translation • 2B • Updated 9 days ago • 20.4k • • 1.1k

liked a dataset 12 days ago

AI-MO/NuminaMath-CoT

Viewer • Updated Nov 25, 2024 • 860k • 58.8k • 585

liked a dataset 13 days ago

Gingiris/gingiris-growth-finder

Updated 1 day ago • 89 • 1

liked a dataset 14 days ago

Angelou0516/Colorectal-Liver_Metastases

Viewer • Updated 14 days ago • 1 • 1.44k • 1

upvoted a paper 16 days ago

CiteVQA: Benchmarking Evidence Attribution for Trustworthy Document Intelligence

Paper • 2605.12882 • Published 22 days ago • 270

liked a model 17 days ago

Tongyi-MAI/Z-Image-Turbo

Text-to-Image • Updated Jan 30 • 1.01M • • 4.74k

liked a model 21 days ago

openai/gpt-oss-120b

Text Generation • 120B • Updated Aug 26, 2025 • 4.61M • • 4.84k

liked a model 24 days ago

flipped121364/supply-chain-bert

Updated 24 days ago • 1

liked a model 28 days ago

shoxa-mir/SOLAR-10.7B-Instruct-v1.0-AWQ

11B • Updated 28 days ago • 18 • 1

liked a dataset about 1 month ago

wegrthj/a2uvjn-fdo6-raw

Preview • Updated May 2 • 4.01k • 1

upvoted 2 papers about 1 month ago

DiPO: Disentangled Perplexity Policy Optimization for Fine-grained Exploration-Exploitation Trade-Off

Paper • 2604.13902 • Published Apr 15 • 62

LLaDA2.0-Uni: Unifying Multimodal Understanding and Generation with Diffusion Large Language Model

Paper • 2604.20796 • Published Apr 22 • 243

liked a model about 2 months ago

tencent/HY-World-2.0

Image-to-3D • Updated 14 days ago • 3.42k • 664

upvoted a paper about 2 months ago

RationalRewards: Reasoning Rewards Scale Visual Generation Both Training and Test Time

Paper • 2604.11626 • Published Apr 13 • 102

Павлов Роман

AI & ML interests

Recent Activity

Organizations

tangqianyi's activity