ActiveUltraFeedback: Sample-Efficient RLHF Preference data generation using Active Learning

university

AI & ML interests

NLP, LLM Alignment, Preference Data generation, Active Learning

Recent Activity

jessicalamjh published a dataset 8 days ago

ActiveUltraFeedback/combined

jessicalamjh updated a dataset 27 days ago

ActiveUltraFeedback/combined

jessicalamjh updated a dataset 27 days ago

ActiveUltraFeedback/skywork

View all activity

published a dataset 8 days ago

ActiveUltraFeedback/combined

Updated 27 days ago • 49

updated 4 datasets 27 days ago

ActiveUltraFeedback/combined

Updated 27 days ago • 49

ActiveUltraFeedback/skywork

Viewer • Updated 27 days ago • 847k • 68

ActiveUltraFeedback/tulu3

Viewer • Updated 27 days ago • 3M • 174

ActiveUltraFeedback/ultrafeedback

Viewer • Updated 27 days ago • 669k • 135

published 3 datasets 29 days ago

ActiveUltraFeedback/skywork

Viewer • Updated 27 days ago • 847k • 68

ActiveUltraFeedback/tulu3

Viewer • Updated 27 days ago • 3M • 174

ActiveUltraFeedback/ultrafeedback

Viewer • Updated 27 days ago • 669k • 135

authored a paper 4 months ago

ActiveUltraFeedback: Efficient Preference Data Generation using Active Learning

Paper • 2603.09692 • Published Mar 10 • 2

authored a paper 4 months ago

ActiveUltraFeedback: Efficient Preference Data Generation using Active Learning

Paper • 2603.09692 • Published Mar 10 • 2

updated a Space 4 months ago

ActiveUltraFeedback

Sample-Efficient RLHF Preference data generation

authored a paper 4 months ago

ActiveUltraFeedback: Efficient Preference Data Generation using Active Learning

Paper • 2603.09692 • Published Mar 10 • 2

published a Space 6 months ago

ActiveUltraFeedback

Sample-Efficient RLHF Preference data generation

updated a collection 6 months ago

Preference Datasets

40 items • Updated Jan 9