amd
/

DeepSeek-R1-MXFP4

8-bit precision

Model card Files Files and versions

bowenbaoamd commited on Aug 4, 2025

Commit

a41f78a

·

verified ·

1 Parent(s): f595047

Update README.md

Files changed (1) hide show

README.md +17 -5

README.md CHANGED Viewed

@@ -124,15 +124,27 @@ lm_eval --model local-completions \
     --output_path output_data/DeepSeek-R1-MXFP4
 ```
 #### GSM8K
 ```
-lm_eval \
-    --model vllm \
-    --model_args pretrained=amd/DeepSeek-R1-MXFP4,dtype=auto,add_bos_token=True,tensor_parallel_size=8,gpu_memory_utilization=0.8,max_model_len=38768, \
     --tasks gsm8k \
-    --num_fewshot 8 \
     --batch_size auto \
-    --device cuda
 ```

     --output_path output_data/DeepSeek-R1-MXFP4
 ```
+#### GPQA Diamond
+```
+lm_eval --model local-completions \
+    --model_args model=amd/DeepSeek-R1-MXFP4,base_url=http://localhost:30000/v1/completions,num_concurrent=999999,timeout=999999,tokenized_requests=False,max_length=32000,temperature=0.6,top_p=0.95 \
+    --tasks gpqa_diamond_cot_zeroshot \
+    --num_fewshot 0 \
+    --gen_kwargs "do_sample=True,temperature=0.6,top_p=0.95,max_tokens=32000,max_gen_toks=32000" \
+    --batch_size auto \
+    --log_samples \
+    --output_path output_data/DeepSeek-R1-MXFP4
+```
 #### GSM8K
 ```
+lm_eval --model local-completions \
+    --model_args model=amd/DeepSeek-R1-MXFP4,base_url=http://localhost:30000/v1/completions,num_concurrent=999999,timeout=999999,tokenized_requests=False,max_length=8096 \
     --tasks gsm8k \
+    --num_fewshot 5 \
     --batch_size auto \
+    --log_samples \
+    --output_path output_data/DeepSeek-R1-MXFP4
 ```