Nicholas Stranges

nstranges

strangeman99

AI & ML interests

Reinforcement learning, robotics, LLM agents.

Recent Activity

liked a model 19 days ago

nvidia/personaplex-7b-v1

liked a dataset about 1 month ago

osunlp/Mind2Web-2

liked a dataset about 1 month ago

openai/gdpval

View all activity

Organizations

None yet

liked a model 19 days ago

nvidia/personaplex-7b-v1

Audio-to-Audio • Updated 3 days ago • 228k • 1.74k

liked 2 datasets about 1 month ago

osunlp/Mind2Web-2

Viewer • Updated Dec 14, 2025 • 130 • 145 • 16

openai/gdpval

Viewer • Updated 1 day ago • 220 • 28.4k • 460

liked a dataset 2 months ago

open-r1/DAPO-Math-17k-Processed

Viewer • Updated Nov 10, 2025 • 34.8k • 6.97k • 56

updated a model 3 months ago

nstranges/smollm2-finetuned-chat-instruct-lora-adapters

Updated Nov 22, 2025

published a model 3 months ago

nstranges/smollm2-finetuned-chat-instruct-lora-adapters

Updated Nov 22, 2025

updated a model 3 months ago

nstranges/CSC2516-HW10-Original-Model

0.1B • Updated Nov 21, 2025

published a model 3 months ago

nstranges/CSC2516-HW10-Original-Model

0.1B • Updated Nov 21, 2025

liked a dataset 3 months ago

trl-lib/tldr

Viewer • Updated Jan 8, 2025 • 130k • 3.41k • 30

liked a model 3 months ago

meta-llama/Llama-3.2-1B

Text Generation • 1B • Updated Oct 24, 2024 • 2.42M • 2.29k

liked a dataset 3 months ago

HuggingFaceH4/aime_2024

Viewer • Updated Jan 26, 2025 • 30 • 38.7k • 59

liked a model 4 months ago

Qwen/Qwen3-4B-Thinking-2507

Text Generation • 4B • Updated Aug 6, 2025 • 531k • • 544

liked 2 datasets 4 months ago

allenai/RLVR-MATH

Viewer • Updated Nov 20, 2024 • 7.5k • 44 • 18

osunlp/Mind2Web

Viewer • Updated Oct 19, 2025 • 253 • 2.48k • 122

updated a model 5 months ago

nstranges/Meta-Llama-3-8B-Instruct-OnlineDPO-Random-V2

8B • Updated Sep 21, 2025

published a model 5 months ago

nstranges/Meta-Llama-3-8B-Instruct-OnlineDPO-Random-V2

8B • Updated Sep 21, 2025

updated a model 5 months ago

nstranges/Meta-Llama-3-8B-Instruct-OnlineDPO-WIM-Zeta1.0-RefModel-V2

8B • Updated Sep 12, 2025

published a model 5 months ago

nstranges/Meta-Llama-3-8B-Instruct-OnlineDPO-WIM-Zeta1.0-RefModel-V2

8B • Updated Sep 12, 2025

updated a model 6 months ago

nstranges/Meta-Llama-3-8B-Instruct-OnlineDPO-WIM-Zeta1.0-RefModel

8B • Updated Aug 26, 2025

published a model 6 months ago