Green skin's picture

Green skin

Green-skin

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 20 hours ago

Towards Evaluation Engineering: An Empirical Study of ML Evaluation Harnesses in the Wild

liked a dataset about 20 hours ago

zhiminy/EvalEng

liked a dataset 4 months ago

SWE-Arena/vote_data

View all activity

Organizations

None yet

upvoted a paper about 20 hours ago

Towards Evaluation Engineering: An Empirical Study of ML Evaluation Harnesses in the Wild

Paper • 2605.24213 • Published 6 days ago • 6