miaow-lab-temp

community

AI & ML interests

None defined yet.

jzfeng

authored a paper 4 months ago

Game-TARS: Pretrained Foundation Models for Scalable Generalist Multimodal Game Agents

Paper • 2510.23691 • Published Oct 27, 2025 • 54

jzfeng

authored a paper 6 months ago

UI-TARS-2 Technical Report: Advancing GUI Agent with Multi-Turn Reinforcement Learning

Paper • 2509.02544 • Published Sep 2, 2025 • 125

jzfeng

authored 2 papers 9 months ago

Seed1.5-Thinking: Advancing Superb Reasoning Models with Reinforcement Learning

Paper • 2504.13914 • Published Apr 10, 2025 • 4

AdaCtrl: Towards Adaptive and Controllable Reasoning via Difficulty-Aware Budgeting

Paper • 2505.18822 • Published May 24, 2025 • 15

jzfeng

authored a paper 10 months ago

ReTool: Reinforcement Learning for Strategic Tool Use in LLMs

Paper • 2504.11536 • Published Apr 15, 2025 • 63

halfrot

authored a paper over 1 year ago

HAF-RM: A Hybrid Alignment Framework for Reward Model Training

Paper • 2407.04185 • Published Jul 4, 2024

jzfeng

authored 2 papers over 1 year ago

WizardLM: Empowering Large Language Models to Follow Complex Instructions

Paper • 2304.12244 • Published Apr 24, 2023 • 13

MMDialog: A Large-scale Multi-turn Dialogue Dataset Towards Multi-modal Open-domain Conversation

Paper • 2211.05719 • Published Nov 10, 2022

halfrot

authored 2 papers almost 2 years ago

ARKS: Active Retrieval in Knowledge Soup for Code Generation

Paper • 2402.12317 • Published Feb 19, 2024

ALaRM: Align Language Models via Hierarchical Rewards Modeling

Paper • 2403.06754 • Published Mar 11, 2024

jzfeng

authored a paper over 2 years ago

Language Models can be Logical Solvers

Paper • 2311.06158 • Published Nov 10, 2023 • 20

halfrot

authored a paper over 2 years ago

DS-1000: A Natural and Reliable Benchmark for Data Science Code Generation

Paper • 2211.11501 • Published Nov 18, 2022