Instructions to use MartinKu/DeepSeek-R1-Distill-Qwen-1.5B-GRPO with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

Libraries

How to use MartinKu/DeepSeek-R1-Distill-Qwen-1.5B-GRPO with Transformers:

# Use a pipeline as a high-level helper
from transformers import pipeline

pipe = pipeline("text-generation", model="MartinKu/DeepSeek-R1-Distill-Qwen-1.5B-GRPO")
messages = [
    {"role": "user", "content": "Who are you?"},
]
pipe(messages)

# Load model directly
from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("MartinKu/DeepSeek-R1-Distill-Qwen-1.5B-GRPO")
model = AutoModelForCausalLM.from_pretrained("MartinKu/DeepSeek-R1-Distill-Qwen-1.5B-GRPO", device_map="auto")
messages = [
    {"role": "user", "content": "Who are you?"},
]
inputs = tokenizer.apply_chat_template(
	messages,
	add_generation_prompt=True,
	tokenize=True,
	return_dict=True,
	return_tensors="pt",
).to(model.device)

outputs = model.generate(**inputs, max_new_tokens=40)
print(tokenizer.decode(outputs[0][inputs["input_ids"].shape[-1]:]))

Notebooks
Google Colab
Kaggle
Local Apps Settings

vLLM

How to use MartinKu/DeepSeek-R1-Distill-Qwen-1.5B-GRPO with vLLM:

Install from pip and serve model

# Install vLLM from pip:
pip install vllm
# Start the vLLM server:
vllm serve "MartinKu/DeepSeek-R1-Distill-Qwen-1.5B-GRPO"
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:8000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "MartinKu/DeepSeek-R1-Distill-Qwen-1.5B-GRPO",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Use Docker

docker model run hf.co/MartinKu/DeepSeek-R1-Distill-Qwen-1.5B-GRPO

SGLang

How to use MartinKu/DeepSeek-R1-Distill-Qwen-1.5B-GRPO with SGLang:

Install from pip and serve model

# Install SGLang from pip:
pip install sglang
# Start the SGLang server:
python3 -m sglang.launch_server \
    --model-path "MartinKu/DeepSeek-R1-Distill-Qwen-1.5B-GRPO" \
    --host 0.0.0.0 \
    --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "MartinKu/DeepSeek-R1-Distill-Qwen-1.5B-GRPO",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Use Docker images

docker run --gpus all \
    --shm-size 32g \
    -p 30000:30000 \
    -v ~/.cache/huggingface:/root/.cache/huggingface \
    --env "HF_TOKEN=<secret>" \
    --ipc=host \
    lmsysorg/sglang:latest \
    python3 -m sglang.launch_server \
        --model-path "MartinKu/DeepSeek-R1-Distill-Qwen-1.5B-GRPO" \
        --host 0.0.0.0 \
        --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "MartinKu/DeepSeek-R1-Distill-Qwen-1.5B-GRPO",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Docker Model Runner
How to use MartinKu/DeepSeek-R1-Distill-Qwen-1.5B-GRPO with Docker Model Runner:
```
docker model run hf.co/MartinKu/DeepSeek-R1-Distill-Qwen-1.5B-GRPO
```

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Commit History

Model save

95be682
verified

MartinKu commited on Apr 25, 2025

Training in progress, epoch 1

3869255
verified

MartinKu commited on Apr 25, 2025

Model save

cb0421c
verified

MartinKu commited on Apr 25, 2025

Training in progress, epoch 1

beaf509
verified

MartinKu commited on Apr 25, 2025

Model save

9aa1d35
verified

MartinKu commited on Apr 18, 2025

Training in progress, epoch 1

694e7e8
verified

MartinKu commited on Apr 18, 2025

Model save

ab09f25
verified

MartinKu commited on Apr 17, 2025

Model save

d44f78d
verified

MartinKu commited on Apr 17, 2025

Training in progress, epoch 1

de9a16c
verified

MartinKu commited on Apr 17, 2025

Model save

a38e93a
verified

MartinKu commited on Apr 16, 2025

Model save

ea53064
verified

MartinKu commited on Apr 16, 2025

Training in progress, epoch 1

e188fb0
verified

MartinKu commited on Apr 16, 2025

Model save

6205a7f
verified

MartinKu commited on Apr 14, 2025

Model save

570acf0
verified

MartinKu commited on Apr 13, 2025

Training in progress, epoch 0

096fd67
verified

MartinKu commited on Apr 13, 2025

Training in progress, step 150

1227e7a
verified

MartinKu commited on Apr 5, 2025

Training in progress, step 100

56c15c6
verified

MartinKu commited on Apr 5, 2025

Training in progress, step 50

3789542
verified

MartinKu commited on Apr 5, 2025

Training in progress, step 50

d610e1a
verified

MartinKu commited on Apr 5, 2025

Training in progress, step 1

776f4d1
verified

MartinKu commited on Apr 4, 2025

initial commit

b3ce63a
verified

MartinKu commited on Apr 3, 2025

Commit History

Model save 95be682 verified

Training in progress, epoch 1 3869255 verified

Model save cb0421c verified

Training in progress, epoch 1 beaf509 verified

Model save 9aa1d35 verified

Training in progress, epoch 1 694e7e8 verified

Model save ab09f25 verified

Model save d44f78d verified

Training in progress, epoch 1 de9a16c verified

Model save a38e93a verified

Model save ea53064 verified

Training in progress, epoch 1 e188fb0 verified

Model save 6205a7f verified

Model save 570acf0 verified

Training in progress, epoch 0 096fd67 verified

Training in progress, step 150 1227e7a verified

Training in progress, step 100 56c15c6 verified

Training in progress, step 50 3789542 verified

Training in progress, step 50 d610e1a verified

Training in progress, step 1 776f4d1 verified

initial commit b3ce63a verified

Model save

95be682
verified

Training in progress, epoch 1

3869255
verified

Model save

cb0421c
verified

Training in progress, epoch 1

beaf509
verified

Model save

9aa1d35
verified

Training in progress, epoch 1

694e7e8
verified

Model save

ab09f25
verified

Model save

d44f78d
verified

Training in progress, epoch 1

de9a16c
verified

Model save

a38e93a
verified

Model save

ea53064
verified

Training in progress, epoch 1

e188fb0
verified

Model save

6205a7f
verified

Model save

570acf0
verified

Training in progress, epoch 0

096fd67
verified

Training in progress, step 150

1227e7a
verified

Training in progress, step 100

56c15c6
verified

Training in progress, step 50

3789542
verified

Training in progress, step 50

d610e1a
verified

Training in progress, step 1

776f4d1
verified

initial commit

b3ce63a
verified