Enyi (Olivia) Jiang PRO

EnyiJiang

·

https://enyijiang.github.io/

AI & ML interests

AI Safety & Alignment

Recent Activity

authored a paper 23 days ago

When Behavioral Safety Evaluation Fails: A Representation-Level Perspective

upvoted a paper 24 days ago

When Behavioral Safety Evaluation Fails: A Representation-Level Perspective

submitted a paper 24 days ago

When Behavioral Safety Evaluation Fails: A Representation-Level Perspective

View all activity

Organizations

upvoted a paper 24 days ago

When Behavioral Safety Evaluation Fails: A Representation-Level Perspective

Paper • 2606.08044 • Published 29 days ago • 1

upvoted a paper 5 months ago

Latent Adversarial Regularization for Offline Preference Optimization

Paper • 2601.22083 • Published Jan 29 • 14