Salesforce AI Research

company

Verified

https://www.salesforceairesearch.com/

AI & ML interests

None defined yet.

Recent Activity

Taksu updated a Space 4 days ago

Salesforce/GIFT-Eval

ZixuanKe updated a dataset 28 days ago

Salesforce/MASBench

hongluzhou-sf updated a dataset about 1 month ago

Salesforce/ST-Evidence-Bench

View all activity

Papers

Learning from Language Feedback via Variational Policy Distillation

The Illusion of Certainty: Decoupling Capability and Calibration in On-Policy Distillation

View all Papers

Salesforce 's papers 20

Submitted by

Yang Li

Learning from Language Feedback via Variational Policy Distillation

Salesforce

Salesforce AI Research

Submitted by

Jiaxin Zhang

The Illusion of Certainty: Decoupling Capability and Calibration in On-Policy Distillation

Salesforce

Salesforce AI Research

Submitted by

Sarath Shekkizhar

Beyond the Assistant Turn: User Turn Generation as a Probe of Interaction Awareness in Language Models

Salesforce

Salesforce AI Research

2

Submitted by

Jun Hao Liew

GPA: Learning GUI Process Automation from Demonstrations

Salesforce

Salesforce AI Research

2

Submitted by

Shrey Pandit

Least-Loaded Expert Parallelism: Load Balancing An Imbalanced Mixture-of-Experts

Salesforce

Salesforce AI Research

Submitted by

Jiaxin Zhang

Agentic Confidence Calibration

Salesforce

Salesforce AI Research

2

Submitted by

Jiaxin Zhang

Agentic Uncertainty Quantification

Salesforce

Salesforce AI Research

2

Submitted by

Kanchana Ranasinghe

Future Optical Flow Prediction Improves Robot Control & Video Generation

Salesforce

Salesforce AI Research

Submitted by

Jielin Qiu

LoCoBench-Agent: An Interactive Benchmark for LLM Agents in Long-Context Software Engineering

Salesforce

Salesforce AI Research

Submitted by

Haoyi Qiu

MMPersuade: A Dataset and Evaluation Framework for Multimodal Persuasion

Salesforce

Salesforce AI Research

1

Submitted by

taesiri

Enterprise Deep Research: Steerable Multi-Agent Deep Research for Enterprise Analytics

Salesforce

Salesforce AI Research

Submitted by

Austin Xu

Foundational Automatic Evaluators: Scaling Multi-Task Generative Evaluator Training for Reasoning-Centric Domains

Salesforce

Salesforce AI Research

Submitted by

Jiayu (Mila) Wang

LiveResearchBench: A Live Benchmark for User-Centric Deep Research in the Wild

Salesforce

Salesforce AI Research

Submitted by

taesiri

Hard2Verify: A Step-Level Verification Benchmark for Open-Ended Frontier Math

Salesforce

Salesforce AI Research

Submitted by

Weiran Yao

Webscale-RL: Automated Data Pipeline for Scaling RL Data to Pretraining Levels

Salesforce

Salesforce AI Research

Submitted by

Can Qin

UNIDOC-BENCH: A Unified Benchmark for Document-Centric Multimodal RAG

Salesforce

Salesforce AI Research

Submitted by

Weiran Yao

CoDA: Coding LM via Diffusion Adaptation

Salesforce

Salesforce AI Research

Submitted by

Ziyang Luo

MCP-Universe: Benchmarking Large Language Models with Real-World Model Context Protocol Servers

Salesforce

Salesforce AI Research

Submitted by

Yan Yang

GTA1: GUI Test-time Scaling Agent

Salesforce

Salesforce AI Research

Submitted by

Zixuan Ke

Demystifying Domain-adaptive Post-training for Financial LLMs

Salesforce

Salesforce AI Research