JT

jtvino

·

AI & ML interests

None yet

Recent Activity

new activity 5 days ago

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4:Tool Calling Catastrophic Forgetfulness

new activity 7 days ago

google/diffusiongemma-26B-A4B-it:VLLM setup? Getting malformed responses. What is correct configuration

liked a model 8 days ago

LiquidAI/LFM2.5-350M

View all activity

Organizations

New activity in nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4 5 days ago

Tool Calling Catastrophic Forgetfulness

#11 opened 5 days ago by

New activity in google/diffusiongemma-26B-A4B-it 7 days ago

VLLM setup? Getting malformed responses. What is correct configuration

#11 opened 14 days ago by

liked a model 8 days ago

LiquidAI/LFM2.5-350M

Text Generation • 0.4B • Updated 26 days ago • 71.6k • 354

New activity in nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4 20 days ago

Tool Calling Failure because of missing '}'

#8 opened 20 days ago by

liked 2 models 29 days ago

nvidia/Cosmos3-Nano

16B • Updated 7 days ago • 153k • 269

nvidia/Cosmos3-Super

65B • Updated 7 days ago • 83.8k • 188

liked a model about 1 month ago

prism-ml/bonsai-image-binary-4B-unpacked

Text-to-Image • Updated 28 days ago • 155 • 25

New activity in google/gemma-4-31B-it about 1 month ago

Thinking erratic at 30000+ context

#76 opened 2 months ago by

liked a model about 1 month ago

CohereLabs/command-a-plus-05-2026-bf16

Image-Text-to-Text • 219B • Updated 15 days ago • 9.99k • • 139

New activity in nvidia/Nemotron-Labs-Diffusion-14B about 1 month ago

VLLM?

#2 opened about 1 month ago by

New activity in google/gemma-4-31B-it about 2 months ago

Drops in performance randomly VLLM on H200 and B200 with 2 GPUs

#104 opened about 2 months ago by

liked 3 models about 2 months ago

ibm-granite/granite-speech-4.1-2b-nar

Image Feature Extraction • 2B • Updated 11 days ago • 154k • 56

Zyphra/ZAYA1-74B-preview

75B • Updated 4 days ago • 262 • 46

RedHatAI/gemma-4-31B-it-FP8-block

Image-Text-to-Text • 31B • Updated 11 days ago • 2.2M • 36

New activity in SWE-bench/SWE-bench_Verified about 2 months ago

No Gemma4

#5 opened about 2 months ago by

New activity in nvidia/Efficient-DLM-8B about 2 months ago

Scaling to bigger models and MOE?

#1 opened about 2 months ago by

liked a model about 2 months ago

nvidia/Efficient-DLM-8B

Text Generation • 8B • Updated May 3 • 506 • 12

liked 2 models 2 months ago

ibm-granite/granite-embedding-311m-multilingual-r2

Feature Extraction • 0.3B • Updated May 18 • 336k • • 107

nvidia/nemotron-ocr-v2

Image-to-Text • Updated May 22 • 14k • 213

New activity in RedHatAI/gemma-4-31B-it-speculator.dflash 2 months ago

No thinking in training datset?

#6 opened 2 months ago by