ReasonMind

https://utmathhomepage.github.io/

AI & ML interests

None defined yet.

authored 4 papers 4 months ago

AlignGuard: Scalable Safety Alignment for Text-to-Image Generation

Paper • 2412.10493 • Published Dec 13, 2024

LongVideoAgent: Multi-Agent Reasoning with Long Videos

Paper • 2512.20618 • Published Dec 23, 2025 • 56

Latent Guard: a Safety Framework for Text-to-image Generation

Paper • 2404.08031 • Published Apr 11, 2024

Fake it till You Make it: Reward Modeling as Discriminative Prediction

Paper • 2506.13846 • Published Jun 16, 2025

authored a paper 12 months ago

AdaCoT: Pareto-Optimal Adaptive Chain-of-Thought Triggering via Reinforcement Learning

Paper • 2505.11896 • Published May 17, 2025 • 58

authored a paper about 1 year ago

Exploring Data Scaling Trends and Effects in Reinforcement Learning from Human Feedback

Paper • 2503.22230 • Published Mar 28, 2025 • 45

updated a dataset over 1 year ago

ReasonMind/UTMath

Viewer • Updated Jan 14, 2025 • 1.05k • 346 • 7

updated a dataset over 1 year ago

ReasonMind/UTMath

Viewer • Updated Jan 14, 2025 • 1.05k • 346 • 7