Luckeciano Carvalho Melo

luckeciano

·

https://luckeciano.github.io

AI & ML interests

Reinforcement Learning

Organizations

luckeciano 's datasets 19

luckeciano/pku-llama3.1-8b-dataset-test-generations

Viewer • Updated Jan 31, 2025 • 4.7M • 9

luckeciano/pku-llama3.1-8b-dataset-train-generations

Viewer • Updated Jan 31, 2025 • 1.36M • 9

luckeciano/pku-alpaca3.1-8b-eval-gt-rewards

Viewer • Updated Sep 20, 2024 • 4.7k • 6

luckeciano/pku-alpaca3.1-8b-gt-rewards

Viewer • Updated Sep 10, 2024 • 6.05M • 9

luckeciano/pku-llama3.1-8b-answers-features-test

Viewer • Updated Sep 8, 2024 • 4.42M • 22

luckeciano/pku-llama3.1-8b-answers-features-train

Viewer • Updated Sep 6, 2024 • 1.28M • 7

luckeciano/pku-llama3.1-8b-dataset-features-gt-reward-modeling

Updated Sep 4, 2024 • 26

luckeciano/pku-llama3.1-8b-dataset-features

Viewer • Updated Sep 3, 2024 • 18.3k • 10

luckeciano/PKU-SafeRLHF-Shifts

Viewer • Updated Aug 26, 2024 • 18.3k • 52

luckeciano/mistral8x22b-reddit-post-features

Viewer • Updated May 10, 2024 • 92.9k • 15

luckeciano/llama370b-reddit-post-features

Viewer • Updated May 10, 2024 • 82.5k • 5

luckeciano/llama370b-features-reddit

Viewer • Updated May 7, 2024 • 150k • 10

luckeciano/mistral8x22b-features-reddit

Viewer • Updated Apr 22, 2024 • 166k • 8

luckeciano/hermes-reddit-post-features

Viewer • Updated Apr 18, 2024 • 92.7k • 9

luckeciano/llama27b-features-reddit

Viewer • Updated Apr 13, 2024 • 189k • 9

luckeciano/falcon7b-features-reddit

Viewer • Updated Apr 13, 2024 • 159k • 19

luckeciano/hermes-features-ultrafeedback

Viewer • Updated Mar 7, 2024 • 63.8k • 7

luckeciano/reddit-features-hermes

Viewer • Updated Feb 13, 2024 • 169k • 143

luckeciano/learning-to-summarize

Viewer • Updated Jan 17, 2024 • 426k • 7 • 1