1 11 2

Ming Zhang

konglongge

konglonggeFDU

AI & ML interests

LLMs

Recent Activity

updated a dataset about 20 hours ago

konglongge/TaxoBench

published a dataset about 20 hours ago

konglongge/TaxoBench

updated a dataset about 20 hours ago

konglongge/TransferTOD

View all activity

Organizations

authored 3 papers about 2 months ago

DFPO: Scaling Value Modeling via Distributional Flow towards Robust and Generalizable LLM Post-Training

Paper • 2602.05890 • Published Feb 5 • 1

SciAgentGym: Benchmarking Multi-Step Scientific Tool-use in LLM Agents

Paper • 2602.12984 • Published Feb 13 • 7

AI Can Learn Scientific Taste

Paper • 2603.14473 • Published Mar 15 • 426

authored a paper 3 months ago

CL-bench: A Benchmark for Context Learning

Paper • 2602.03587 • Published Feb 3 • 23

authored 16 papers 4 months ago

Can Deep Research Agents Find and Organize? Evaluating the Synthesis Gap with Expert Taxonomies

Paper • 2601.12369 • Published Jan 18 • 4

Muse: Towards Reproducible Long-Form Song Generation with Fine-Grained Style Control

Paper • 2601.03973 • Published Jan 7 • 2

LLMEval-Med: A Real-world Clinical Benchmark for Medical LLMs with Physician Validation

Paper • 2506.04078 • Published Jun 4, 2025 • 1

MouSi: Poly-Visual-Expert Vision-Language Models

Paper • 2401.17221 • Published Jan 30, 2024 • 9

The Rise and Potential of Large Language Model Based Agents: A Survey

Paper • 2309.07864 • Published Sep 14, 2023 • 8

What's Wrong with Your Code Generated by Large Language Models? An Extensive Study

Paper • 2407.06153 • Published Jul 8, 2024

Code2Logic: Game-Code-Driven Data Synthesis for Enhancing VLMs General Reasoning

Paper • 2505.13886 • Published May 20, 2025 • 9

PFDial: A Structured Dialogue Instruction Fine-tuning Method Based on UML Flowcharts

Paper • 2503.06706 • Published Mar 9, 2025

MDAR: A Multi-scene Dynamic Audio Reasoning Benchmark

Paper • 2509.22461 • Published Sep 26, 2025 • 1

What Makes a Good Speech Tokenizer for LLM-Centric Speech Generation? A Systematic Study

Paper • 2506.12537 • Published Jun 14, 2025 • 1

Thinking with Video: Video Generation as a Promising Multimodal Reasoning Paradigm

Paper • 2511.04570 • Published Nov 6, 2025 • 242

WisPaper: Your AI Scholar Search Engine

Paper • 2512.06879 • Published Dec 7, 2025 • 1

OpenNovelty: An LLM-powered Agentic System for Verifiable Scholarly Novelty Assessment

Paper • 2601.01576 • Published Jan 4 • 19

Beyond Scaling: Measuring and Predicting the Upper Bound of Knowledge Retention in Language Model Pre-Training

Paper • 2502.04066 • Published Feb 6, 2025

LLMEval-Fair: A Large-Scale Longitudinal Study on Robust and Fair Evaluation of Large Language Models

Paper • 2508.05452 • Published Aug 7, 2025

TransferTOD: A Generalizable Chinese Multi-Domain Task-Oriented Dialogue System with Transfer Capabilities

Paper • 2407.21693 • Published Jul 31, 2024

Ming Zhang

AI & ML interests

Recent Activity

Organizations

konglongge's activity