Or Shafran's picture

Or Shafran

ordavids1

AI & ML interests

None yet

Recent Activity

upvoted a paper about 15 hours ago

Faithfulness Metrics Don't Measure Faithfulness: A Meta-Evaluation with Ground Truth

updated a model 24 days ago

ordavids1/decomposing-local-geometry-MFAs

published a model 25 days ago

ordavids1/decomposing-local-geometry-MFAs

View all activity

Organizations

None yet

upvoted a paper about 15 hours ago

Faithfulness Metrics Don't Measure Faithfulness: A Meta-Evaluation with Ground Truth

Paper • 2605.25052 • Published 3 days ago • 7

upvoted a paper 3 months ago

From Directions to Regions: Decomposing Activations in Language Models via Local Geometry

Paper • 2602.02464 • Published Feb 2 • 3

upvoted a paper 8 months ago

Mixing Mechanisms: How Language Models Retrieve Bound Entities In-Context

Paper • 2510.06182 • Published Oct 7, 2025 • 9

upvoted a paper 9 months ago

LMEnt: A Suite for Analyzing Knowledge in Language Models from Pretraining Data to Representations

Paper • 2509.03405 • Published Sep 3, 2025 • 24

upvoted a collection 10 months ago

🔍 Interpretability & Analysis of LMs

Outstanding research in LM interpretability and evaluation, summarized • 136 items • Updated about 14 hours ago • 119