Kieran Garvey's picture

14

Kieran Garvey

Atenai

https://atenai.ai/

AI & ML interests

None yet

Recent Activity

upvoted a paper 3 days ago

Atlas: Orchestrating Heterogeneous Models and Tools for Multi-Domain Complex Reasoning

upvoted a paper 4 days ago

OpenNovelty: An LLM-powered Agentic System for Verifiable Scholarly Novelty Assessment

upvoted a paper 4 days ago

COMPASS: A Framework for Evaluating Organization-Specific Policy Alignment in LLMs

View all activity

Organizations

None yet

upvoted a paper 3 days ago

Atlas: Orchestrating Heterogeneous Models and Tools for Multi-Domain Complex Reasoning

Paper • 2601.03872 • Published 4 days ago • 36

upvoted 13 papers 4 days ago

OpenNovelty: An LLM-powered Agentic System for Verifiable Scholarly Novelty Assessment

Paper • 2601.01576 • Published 7 days ago • 9

COMPASS: A Framework for Evaluating Organization-Specific Policy Alignment in LLMs

Paper • 2601.01836 • Published 7 days ago • 6

OpenRT: An Open-Source Red Teaming Framework for Multimodal LLMs

Paper • 2601.01592 • Published 7 days ago • 11

Digital Twin AI: Opportunities and Challenges from Large Language Models to World Models

Paper • 2601.01321 • Published 8 days ago • 16

Confidence Estimation for LLMs in Multi-turn Interactions

Paper • 2601.02179 • Published 6 days ago • 14

SimpleMem: Efficient Lifelong Memory for LLM Agents

Paper • 2601.02553 • Published 6 days ago • 21

The Reasoning-Creativity Trade-off: Toward Creativity-Driven Problem Solving

Paper • 2601.00747 • Published 9 days ago • 18

SWE-Lego: Pushing the Limits of Supervised Fine-tuning for Software Issue Resolving

Paper • 2601.01426 • Published 8 days ago • 20

MindWatcher: Toward Smarter Multimodal Tool-Integrated Reasoning

Paper • 2512.23412 • Published 13 days ago • 36

SenseNova-MARS: Empowering Multimodal Agentic Reasoning and Search via Reinforcement Learning

Paper • 2512.24330 • Published 12 days ago • 33

MOSS Transcribe Diarize: Accurate Transcription with Speaker Diarization

Paper • 2601.01554 • Published 7 days ago • 50

Youtu-Agent: Scaling Agent Productivity with Automated Generation and Hybrid Policy Optimization

Paper • 2512.24615 • Published 12 days ago • 108

Benchmark^2: Systematic Evaluation of LLM Benchmarks

Paper • 2601.03986 • Published 4 days ago • 30