13 5

Fanny Riols

FannyRiols

AI & ML interests

None yet

Recent Activity

liked a dataset 3 days ago

ServiceNow-AI/eva-bench

upvoted an article 3 days ago

EVA-Bench Data 2.0: 3 Domains, 121 Tools, 213 Scenarios

published an article 3 days ago

EVA-Bench Data 2.0: 3 Domains, 121 Tools, 213 Scenarios

View all activity

Organizations

liked a dataset 3 days ago

ServiceNow-AI/eva-bench

Viewer • Updated 24 days ago • 213 • 47 • 17

upvoted an article 3 days ago

Article

EVA-Bench Data 2.0: 3 Domains, 121 Tools, 213 Scenarios

ServiceNow-AI

•

3 days ago

• 34

published an article 3 days ago

Article

EVA-Bench Data 2.0: 3 Domains, 121 Tools, 213 Scenarios

ServiceNow-AI

•

3 days ago

• 34

upvoted a paper 17 days ago

EVA-Bench: A New End-to-end Framework for Evaluating Voice Agents

Paper • 2605.13841 • Published 25 days ago • 72

authored a paper 20 days ago

EVA-Bench: A New End-to-end Framework for Evaluating Voice Agents

Paper • 2605.13841 • Published 25 days ago • 72

upvoted a paper 25 days ago

Do Enterprise Systems Need Learned World Models? The Importance of Context to Infer Dynamics

Paper • 2605.12178 • Published 26 days ago • 61

upvoted 3 papers 2 months ago

liked a dataset 2 months ago

ServiceNow-AI/eva

Viewer • Updated Mar 24 • 50 • 243 • 71

upvoted an article 2 months ago

Article

A New Framework for Evaluating Voice Agents (EVA)

ServiceNow-AI

•

Mar 24

• 95

liked a dataset 3 months ago

ServiceNow-AI/EnterpriseOps-Gym

Viewer • Updated Apr 30 • 2.56k • 6.73k • 89

upvoted a paper 3 months ago

EnterpriseOps-Gym: Environments and Evaluations for Stateful Agentic Planning and Tool Use in Enterprise Settings

Paper • 2603.13594 • Published Mar 13 • 149

upvoted an article 6 months ago

Article

Apriel-1.6-15b-Thinker: Cost-efficient Frontier Multimodal Performance

ServiceNow-AI

•

Dec 9, 2025

• 84

liked a model 6 months ago

ServiceNow-AI/Apriel-1.6-15b-Thinker

Image-Text-to-Text • 15B • Updated Dec 22, 2025 • 540 • 300

upvoted a collection 8 months ago

Apriel-1.5-15B-Thinker

Collection

3 items • Updated Oct 2, 2025 • 76

upvoted a paper 8 months ago

Apriel-1.5-15b-Thinker

Paper • 2510.01141 • Published Oct 1, 2025 • 125

upvoted a paper 9 months ago

AU-Harness: An Open-Source Toolkit for Holistic Evaluation of Audio LLMs

Paper • 2509.08031 • Published Sep 9, 2025 • 21

liked a model about 1 year ago

ServiceNow-AI/Apriel-Nemotron-15b-Thinker

Text Generation • 15B • Updated Nov 10, 2025 • 1.03k • 126

upvoted a collection about 1 year ago

LMMs-Eval

Collection

Dataset Collection of LMMs-Eval • 35 items • Updated Mar 2 • 33

Fanny Riols

AI & ML interests

Recent Activity

Organizations

FannyRiols's activity

EVA-Bench Data 2.0: 3 Domains, 121 Tools, 213 Scenarios

EVA-Bench Data 2.0: 3 Domains, 121 Tools, 213 Scenarios

A New Framework for Evaluating Voice Agents (EVA)

Apriel-1.6-15b-Thinker: Cost-efficient Frontier Multimodal Performance