Raghav Kumar

kumarrg03

1

·

AI & ML interests

None yet

Organizations

None yet

upvoted an article 10 months ago

Article

Illustrating Reinforcement Learning from Human Feedback (RLHF)

+2

natolambert, LouisCastricato, lvwerra, Dahoas

•

Dec 9, 2022

• 418