nvidia
/

DeepSeek-V4-Pro-NVFP4

Text Generation

Model Optimizer

8-bit precision

Model card Files Files and versions

DeepSeek-V4-Pro-NVFP4

Commit History

Add vllm docker info

1449d1e
verified

zhiyucheng commited on Jun 14

Update config.json and hf_quant_config.json

d6acf0c
verified

jingyux-nv commited on Jun 5

Un-quantize MTP block (revert to native precision)

9e7e88e
verified

jingyux-nv commited on May 29

Drop FlashInfer MoE env vars from vLLM deploy command

b9e53ec
verified

jingyux-nv commited on May 27

Rename TensorRT Model Optimizer link to Model Optimizer (NVIDIA/Model-Optimizer)

994894a
verified

jingyux-nv commited on May 27

Update nvidia-modelopt version to v0.44

3f53361
verified

jingyux-nv commited on May 27

Fix malformed Release Date to 05/27/2026

d7d01c5
verified

jingyux-nv commited on May 27

Remove stale Max OSL note from Evaluation section

ce43847
verified

jingyux-nv commited on May 27

Update README: replace eval table (GPQA/AA-LCR/τ²-Bench/SciCode/IFBench); switch runtime to SGLang and vLLM

2e68f25
verified

jingyux-nv commited on May 27

Add files using upload-large-folder tool

cac567f
verified

jingyux-nv commited on May 14

Add files using upload-large-folder tool

bc21101
verified

jingyux-nv commited on May 14

initial commit

cb75a81
verified

jingyux-nv commited on May 14