nm

nmcco

2

AI & ML interests

None yet

Organizations

None yet

nmcco 's models 126

nmcco/23-truly-classic-2e4-just5epochs

Updated Mar 29, 2025

nmcco/32-gemma3-packing-2e5-15epochs

Updated Mar 28, 2025

nmcco/31-gemma3-packing-2e4-10epochs

Updated Mar 27, 2025

nmcco/30-gemma3-packing-3e4-3epochs

Updated Mar 27, 2025

nmcco/31-classic-just-3-epochs-3e5

Updated Mar 27, 2025

nmcco/31-classic-idgi-why-doesnt-it-work-at-fewer-epochs-1e4

Updated Mar 27, 2025

nmcco/30-gemma3-packing-3e4-10epochs

Updated Mar 27, 2025

nmcco/29-classic-again-save-this-1e4

Updated Mar 26, 2025

nmcco/28-gemma3-packing-1e4-20epochs

Updated Mar 26, 2025

nmcco/28-classic-just-lowerLR

Updated Mar 26, 2025

nmcco/27-gemma3-packing-1e4-15epochs

Updated Mar 26, 2025

nmcco/26-classic

Updated Mar 26, 2025

nmcco/24-gemma3-PADRIGHT-alsonoquant-alsonopacking-1e-4-bf16

Updated Mar 25, 2025

nmcco/25-classic-2e-5-lr-but50epochslol

Updated Mar 25, 2025

nmcco/24-gemma3-PADRIGHT-alsonoquant-alsonopacking-1e-4-flash-bf16

Updated Mar 25, 2025

nmcco/24-gemma3-alsonoquant-alsonopacking-1e-4-flash-bf16

Updated Mar 25, 2025

nmcco/23-classic-2e-5-lr

Updated Mar 24, 2025

nmcco/gemma-3-4b-with-speaker-tokens

Image-Text-to-Text • 4B • Updated Mar 24, 2025 • 3

nmcco/classic-verify-things-work

Updated Mar 24, 2025

nmcco/output

Updated Mar 23, 2025

nmcco/22-classic-but-lower-lr-and-40-length

Updated Mar 20, 2025

nmcco/21-classic-but-much-lower-lr

Updated Mar 20, 2025

nmcco/19-3books-classic-halfLR

Updated Mar 19, 2025

nmcco/20-qwen-1gpu-tenepochs

Updated Mar 19, 2025

nmcco/gemma-2-27b-speakertokens

Text Generation • 27B • Updated Mar 19, 2025 • 8

nmcco/17-gemma3-1b

Updated Mar 18, 2025

nmcco/18-qwen-1gpu

Updated Mar 18, 2025

nmcco/16-llama3.2-3b-flashattn2-batch8-balanced_vs_hp

Updated Mar 18, 2025

nmcco/14-llama3.2-3b-balanced_vs_hp

Updated Mar 18, 2025

nmcco/15-qwen2.5-3b-balanced_vs_hp

Updated Mar 17, 2025