Benjamin Feuer PRO

penfever

·

AI & ML interests

Deep learning, computer vision, large language models, large vision language models

Recent Activity

updated a dataset 23 minutes ago

penfever/nemotron-gym-competitive-coding-qwen3.5-122b-32k-traces

published a dataset 23 minutes ago

penfever/nemotron-gym-competitive-coding-qwen3.5-122b-32k-traces

updated a dataset 24 minutes ago

DCAgent2/swebench_verified_random_100_folders_ablation_pymethods2test_seqmean_arm0_30_8B58465301

View all activity

Organizations

penfever 's datasets 376

penfever/Nexusflow_Athene-70B-jdgfct-Factuality

Viewer • Updated Apr 15 • 984k • 491

penfever/Nexusflow_Athene-70B-jdgfct-Completeness

Viewer • Updated Apr 15 • 984k • 6

penfever/nvidia_NVLM-D-72B-jdgfct-Completeness

Viewer • Updated Apr 15 • 987k • 5

penfever/meta-llama_Llama-3.1-70B-Instruct-jdgfct-Factuality

Viewer • Updated Apr 15 • 1M • 210

penfever/nvidia_NVLM-D-72B-jdgfct-Readability

Viewer • Updated Apr 14 • 987k • 6

penfever/meta-llama_Llama-3.1-70B-Instruct-jdgfct-Completeness

Viewer • Updated Apr 14 • 985k • 11

penfever/nvidia_NVLM-D-72B-jdgfct-Conciseness

Viewer • Updated Apr 14 • 987k • 213

penfever/Qwen_Qwen2-7B-Instruct-jdgfct-Completeness

Viewer • Updated Apr 14 • 990k • 559

penfever/Qwen_Qwen2-7B-Instruct-jdgfct-Readability

Viewer • Updated Apr 14 • 990k • 951

penfever/Qwen_Qwen2-7B-Instruct-jdgfct-Factuality

Viewer • Updated Apr 13 • 990k • 135

penfever/Qwen_Qwen2-7B-Instruct-jdgfct-Harmlessness

Viewer • Updated Apr 13 • 990k • 6

penfever/Qwen_Qwen2-7B-Instruct-jdgfct-Conciseness

Viewer • Updated Apr 13 • 990k • 6

penfever/meta-llama_Llama-3.1-8B-Instruct-jdgfct-Harmlessness

Viewer • Updated Apr 13 • 984k • 5

penfever/meta-llama_Llama-3.1-8B-Instruct-jdgfct-Completeness

Viewer • Updated Apr 13 • 984k • 6

penfever/meta-llama_Llama-3.1-8B-Instruct-jdgfct-Conciseness

Viewer • Updated Apr 13 • 984k • 219

penfever/meta-llama_Llama-3.1-8B-Instruct-jdgfct-Readability

Viewer • Updated Apr 13 • 984k • 5

penfever/rl__64GPU_base_32bnl2bash-tasks-cleaned-oraclesyh-r2eg-askl-glm_4__40-0

Updated Apr 4 • 3

penfever/rl__24GPU_shapedstackexchange-overflow-sandboxes-skywork-responseexp_tas_optimal_comb__40-0

Viewer • Updated Apr 1 • 41.8k • 5

penfever/rl__24GPU_shapedinferredbugs-sandboxes-verifierexp_tas_optimal_comb__40-0

Viewer • Updated Mar 26 • 30.8k • 5

penfever/rl__64GPU_shaped_32b_entropy__swe_rebench_patched_oracle__syh-r2eg-askl-glm_4__40-0

Viewer • Updated Mar 26 • 8.51k • 57

penfever/rl__24GPU_shapednemotron-math-oracle-filteredexp_tas_optimal_comb__40-0

Viewer • Updated Mar 26 • 22.4k • 5

penfever/Kimi-2.5-r2egym_sandboxes-maxeps-32k-reward1

Viewer • Updated Mar 26 • 2.82k • 9

penfever/Kimi-2.5-swesmith-sandboxes-with_tests-oracle_verified_120s-maxeps-32k-reward1

Viewer • Updated Mar 26 • 5.24k • 12

penfever/Kimi-2.5-swesmith-sandboxes-with_tests-oracle_verified_120s-maxeps-32k

Viewer • Updated Mar 26 • 9.36k • 35

penfever/rl__24GPU_shaped_entropy__swe_rebench_patched_oracle__100k_wd0Qwen3-8B20-0

Viewer • Updated Mar 26 • 9.97k • 80

penfever/rl__24GPU_shapedselfinstruct-naive-sandboxes-2-verifiedexp_tas_optimal_comb__40-0

Viewer • Updated Mar 26 • 30.2k • 5

penfever/rl__24GPU_shaped_entropynemotron-math-oracle-filtered100k_wd0

Viewer • Updated Mar 25 • 6.16k • 3

penfever/Kimi-2.5-inferredbugs-sandboxes-maxeps-32k

Viewer • Updated Mar 23 • 9.79k • 14

penfever/stackexchange-tezos-sandboxes__Kimi-2.5-smaxeps-32k

Viewer • Updated Mar 23 • 8.62k • 26

penfever/rl__24GPU_shaped__exp_rpt_pymethods2test-large__GLM-4_7-swesmith-san

Viewer • Updated Mar 23 • 21.8k • 6