Instructions to use AiAF/rp-2b with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

Libraries

How to use AiAF/rp-2b with PEFT:

from peft import PeftModel
from transformers import AutoModelForCausalLM

base_model = AutoModelForCausalLM.from_pretrained("google/gemma-2-2b-it")
model = PeftModel.from_pretrained(base_model, "AiAF/rp-2b")

Transformers

How to use AiAF/rp-2b with Transformers:

# Use a pipeline as a high-level helper
from transformers import pipeline

pipe = pipeline("text-generation", model="AiAF/rp-2b")
messages = [
    {"role": "user", "content": "Who are you?"},
]
pipe(messages)

# Load model directly
from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("AiAF/rp-2b")
model = AutoModelForCausalLM.from_pretrained("AiAF/rp-2b")
messages = [
    {"role": "user", "content": "Who are you?"},
]
inputs = tokenizer.apply_chat_template(
	messages,
	add_generation_prompt=True,
	tokenize=True,
	return_dict=True,
	return_tensors="pt",
).to(model.device)

outputs = model.generate(**inputs, max_new_tokens=40)
print(tokenizer.decode(outputs[0][inputs["input_ids"].shape[-1]:]))

Notebooks
Google Colab
Kaggle
Local Apps

vLLM

How to use AiAF/rp-2b with vLLM:

Install from pip and serve model

# Install vLLM from pip:
pip install vllm
# Start the vLLM server:
vllm serve "AiAF/rp-2b"
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:8000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "AiAF/rp-2b",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Use Docker

docker model run hf.co/AiAF/rp-2b

SGLang

How to use AiAF/rp-2b with SGLang:

Install from pip and serve model

# Install SGLang from pip:
pip install sglang
# Start the SGLang server:
python3 -m sglang.launch_server \
    --model-path "AiAF/rp-2b" \
    --host 0.0.0.0 \
    --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "AiAF/rp-2b",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Use Docker images

docker run --gpus all \
    --shm-size 32g \
    -p 30000:30000 \
    -v ~/.cache/huggingface:/root/.cache/huggingface \
    --env "HF_TOKEN=<secret>" \
    --ipc=host \
    lmsysorg/sglang:latest \
    python3 -m sglang.launch_server \
        --model-path "AiAF/rp-2b" \
        --host 0.0.0.0 \
        --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "AiAF/rp-2b",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Docker Model Runner
How to use AiAF/rp-2b with Docker Model Runner:
```
docker model run hf.co/AiAF/rp-2b
```

AiAF commited on Oct 19, 2025

Commit

283c16a

verified ·

1 Parent(s): 75de095

Training in progress, step 1000, checkpoint

Browse files

Files changed (5) hide show

last-checkpoint/adapter_model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +565 -4

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a7ce7d64d20fdf389d531e9adbdd3b5ff3d852fea5307986d9255b260474f590
 size 332316480

 version https://git-lfs.github.com/spec/v1
+oid sha256:60f39bf0e2d04be586e3cdf61f38e4002d8f4ccf2b3e7506a28c3eebf56ae883
 size 332316480

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:725564e9f8183d7e28b741e7e93b7d22f858ed11067577a8e0e1c8143b298950
 size 169158677

 version https://git-lfs.github.com/spec/v1
+oid sha256:d52cab9303197d3ac09cad8604a16b3cd57e8bcfc3339e579cfd996a7044c903
 size 169158677

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:901a91e07bc4351a859fdeb9218e622accee766b4b0a88f88399d63dfa225750
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:391d73924ccf821cbbf0fdb4254c0376997b82cf4a16ef088c45a6a109b91100
 size 14645

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c08494ee770db422d5f2ff781935e817305fb84dab453dfcf5a5df2443b7693d
 size 1465

 version https://git-lfs.github.com/spec/v1
+oid sha256:1f94ebdc28f5491fc51fc2ecbab5d9e2e3ba6be348d92d880d778a28fcd2cbce
 size 1465

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -2,9 +2,9 @@
   "best_global_step": null,
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.95,
   "eval_steps": 50,
-  "global_step": 950,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -10678,6 +10678,567 @@
       "memory/max_active (GiB)": 7.78,
       "memory/max_allocated (GiB)": 7.78,
       "step": 950
     }
   ],
   "logging_steps": 1,
@@ -10692,12 +11253,12 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": false
       },
       "attributes": {}
     }
   },
-  "total_flos": 1.9677301637854003e+17,
   "train_batch_size": 1,
   "trial_name": null,
   "trial_params": null

   "best_global_step": null,
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.0,
   "eval_steps": 50,
+  "global_step": 1000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "memory/max_active (GiB)": 7.78,
       "memory/max_allocated (GiB)": 7.78,
       "step": 950
+    },
+    {
+      "epoch": 0.951,
+      "grad_norm": 0.8099629878997803,
+      "learning_rate": 1.30832912661093e-06,
+      "loss": 2.287,
+      "memory/device_reserved (GiB)": 17.74,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 951,
+      "tokens_per_second_per_gpu": 997.07
+    },
+    {
+      "epoch": 0.952,
+      "grad_norm": 0.910591185092926,
+      "learning_rate": 1.2566280820298426e-06,
+      "loss": 2.2643,
+      "memory/device_reserved (GiB)": 17.78,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 952,
+      "tokens_per_second_per_gpu": 821.07
+    },
+    {
+      "epoch": 0.953,
+      "grad_norm": 0.8110288381576538,
+      "learning_rate": 1.2059628086956044e-06,
+      "loss": 2.3573,
+      "memory/device_reserved (GiB)": 17.78,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 953,
+      "tokens_per_second_per_gpu": 1025.55
+    },
+    {
+      "epoch": 0.954,
+      "grad_norm": 0.8043859004974365,
+      "learning_rate": 1.1563338380629618e-06,
+      "loss": 2.5223,
+      "memory/device_reserved (GiB)": 17.78,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 954,
+      "tokens_per_second_per_gpu": 1124.93
+    },
+    {
+      "epoch": 0.955,
+      "grad_norm": 0.7169449329376221,
+      "learning_rate": 1.1077416907163574e-06,
+      "loss": 2.1511,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 955,
+      "tokens_per_second_per_gpu": 1207.88
+    },
+    {
+      "epoch": 0.956,
+      "grad_norm": 0.9546728730201721,
+      "learning_rate": 1.0601868763643996e-06,
+      "loss": 2.3221,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 956,
+      "tokens_per_second_per_gpu": 715.9
+    },
+    {
+      "epoch": 0.957,
+      "grad_norm": 0.9332824945449829,
+      "learning_rate": 1.0136698938346011e-06,
+      "loss": 2.4007,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 957,
+      "tokens_per_second_per_gpu": 909.16
+    },
+    {
+      "epoch": 0.958,
+      "grad_norm": 0.948166012763977,
+      "learning_rate": 9.68191231068083e-07,
+      "loss": 2.2667,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 958,
+      "tokens_per_second_per_gpu": 739.18
+    },
+    {
+      "epoch": 0.959,
+      "grad_norm": 0.7676699161529541,
+      "learning_rate": 9.237513651145225e-07,
+      "loss": 2.1496,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 959,
+      "tokens_per_second_per_gpu": 1144.45
+    },
+    {
+      "epoch": 0.96,
+      "grad_norm": 0.7553421854972839,
+      "learning_rate": 8.803507621270579e-07,
+      "loss": 2.4495,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 960,
+      "tokens_per_second_per_gpu": 1184.03
+    },
+    {
+      "epoch": 0.961,
+      "grad_norm": 0.8734245896339417,
+      "learning_rate": 8.379898773574924e-07,
+      "loss": 2.4696,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 961,
+      "tokens_per_second_per_gpu": 985.05
+    },
+    {
+      "epoch": 0.962,
+      "grad_norm": 0.9553205370903015,
+      "learning_rate": 7.966691551514527e-07,
+      "loss": 2.5366,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 962,
+      "tokens_per_second_per_gpu": 789.81
+    },
+    {
+      "epoch": 0.963,
+      "grad_norm": 1.0424203872680664,
+      "learning_rate": 7.563890289437825e-07,
+      "loss": 2.3128,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 963,
+      "tokens_per_second_per_gpu": 642.35
+    },
+    {
+      "epoch": 0.964,
+      "grad_norm": 0.9237273931503296,
+      "learning_rate": 7.171499212539123e-07,
+      "loss": 2.3017,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 964,
+      "tokens_per_second_per_gpu": 771.48
+    },
+    {
+      "epoch": 0.965,
+      "grad_norm": 0.821221649646759,
+      "learning_rate": 6.78952243681541e-07,
+      "loss": 2.3436,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 965,
+      "tokens_per_second_per_gpu": 1111.51
+    },
+    {
+      "epoch": 0.966,
+      "grad_norm": 0.8634496331214905,
+      "learning_rate": 6.41796396902239e-07,
+      "loss": 2.0172,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 966,
+      "tokens_per_second_per_gpu": 789.7
+    },
+    {
+      "epoch": 0.967,
+      "grad_norm": 0.8414502143859863,
+      "learning_rate": 6.056827706632185e-07,
+      "loss": 2.282,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 967,
+      "tokens_per_second_per_gpu": 1027.47
+    },
+    {
+      "epoch": 0.968,
+      "grad_norm": 1.1495898962020874,
+      "learning_rate": 5.706117437793701e-07,
+      "loss": 2.3397,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 968,
+      "tokens_per_second_per_gpu": 534.09
+    },
+    {
+      "epoch": 0.969,
+      "grad_norm": 0.8324930667877197,
+      "learning_rate": 5.365836841291438e-07,
+      "loss": 2.4827,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 969,
+      "tokens_per_second_per_gpu": 1116.92
+    },
+    {
+      "epoch": 0.97,
+      "grad_norm": 1.0874335765838623,
+      "learning_rate": 5.035989486508075e-07,
+      "loss": 2.3351,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 970,
+      "tokens_per_second_per_gpu": 579.44
+    },
+    {
+      "epoch": 0.971,
+      "grad_norm": 0.791401743888855,
+      "learning_rate": 4.7165788333860536e-07,
+      "loss": 2.2922,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 971,
+      "tokens_per_second_per_gpu": 1109.94
+    },
+    {
+      "epoch": 0.972,
+      "grad_norm": 0.8731902241706848,
+      "learning_rate": 4.4076082323920576e-07,
+      "loss": 2.4829,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 972,
+      "tokens_per_second_per_gpu": 877.97
+    },
+    {
+      "epoch": 0.973,
+      "grad_norm": 0.8560281991958618,
+      "learning_rate": 4.1090809244814785e-07,
+      "loss": 2.2317,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 973,
+      "tokens_per_second_per_gpu": 932.27
+    },
+    {
+      "epoch": 0.974,
+      "grad_norm": 0.9274902939796448,
+      "learning_rate": 3.82100004106456e-07,
+      "loss": 2.5177,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 974,
+      "tokens_per_second_per_gpu": 967.07
+    },
+    {
+      "epoch": 0.975,
+      "grad_norm": 0.9513389468193054,
+      "learning_rate": 3.543368603973529e-07,
+      "loss": 2.3584,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 975,
+      "tokens_per_second_per_gpu": 776.96
+    },
+    {
+      "epoch": 0.976,
+      "grad_norm": 0.8030345439910889,
+      "learning_rate": 3.2761895254306287e-07,
+      "loss": 2.1989,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 976,
+      "tokens_per_second_per_gpu": 1064.08
+    },
+    {
+      "epoch": 0.977,
+      "grad_norm": 0.8223397135734558,
+      "learning_rate": 3.019465608018024e-07,
+      "loss": 2.3525,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 977,
+      "tokens_per_second_per_gpu": 1110.89
+    },
+    {
+      "epoch": 0.978,
+      "grad_norm": 1.0492770671844482,
+      "learning_rate": 2.773199544648164e-07,
+      "loss": 2.336,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 978,
+      "tokens_per_second_per_gpu": 779.71
+    },
+    {
+      "epoch": 0.979,
+      "grad_norm": 0.897686779499054,
+      "learning_rate": 2.537393918535358e-07,
+      "loss": 2.357,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 979,
+      "tokens_per_second_per_gpu": 980.21
+    },
+    {
+      "epoch": 0.98,
+      "grad_norm": 0.8448941707611084,
+      "learning_rate": 2.312051203169352e-07,
+      "loss": 2.176,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 980,
+      "tokens_per_second_per_gpu": 1001.24
+    },
+    {
+      "epoch": 0.981,
+      "grad_norm": 0.9005848169326782,
+      "learning_rate": 2.0971737622883515e-07,
+      "loss": 2.2181,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 981,
+      "tokens_per_second_per_gpu": 900.62
+    },
+    {
+      "epoch": 0.982,
+      "grad_norm": 0.8972439169883728,
+      "learning_rate": 1.8927638498551502e-07,
+      "loss": 2.2886,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 982,
+      "tokens_per_second_per_gpu": 875.01
+    },
+    {
+      "epoch": 0.983,
+      "grad_norm": 0.8892665505409241,
+      "learning_rate": 1.6988236100329292e-07,
+      "loss": 2.2567,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 983,
+      "tokens_per_second_per_gpu": 844.42
+    },
+    {
+      "epoch": 0.984,
+      "grad_norm": 0.915696918964386,
+      "learning_rate": 1.5153550771630498e-07,
+      "loss": 2.3351,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 984,
+      "tokens_per_second_per_gpu": 815.64
+    },
+    {
+      "epoch": 0.985,
+      "grad_norm": 0.9981441497802734,
+      "learning_rate": 1.3423601757436287e-07,
+      "loss": 2.2343,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 985,
+      "tokens_per_second_per_gpu": 702.43
+    },
+    {
+      "epoch": 0.986,
+      "grad_norm": 0.8215169906616211,
+      "learning_rate": 1.179840720409331e-07,
+      "loss": 2.192,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 986,
+      "tokens_per_second_per_gpu": 1012.4
+    },
+    {
+      "epoch": 0.987,
+      "grad_norm": 1.0433471202850342,
+      "learning_rate": 1.0277984159122733e-07,
+      "loss": 2.3544,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 987,
+      "tokens_per_second_per_gpu": 829.67
+    },
+    {
+      "epoch": 0.988,
+      "grad_norm": 0.8312088847160339,
+      "learning_rate": 8.862348571043733e-08,
+      "loss": 2.3737,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 988,
+      "tokens_per_second_per_gpu": 1123.09
+    },
+    {
+      "epoch": 0.989,
+      "grad_norm": 1.0085126161575317,
+      "learning_rate": 7.551515289203615e-08,
+      "loss": 2.0985,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 989,
+      "tokens_per_second_per_gpu": 642.57
+    },
+    {
+      "epoch": 0.99,
+      "grad_norm": 0.9324679970741272,
+      "learning_rate": 6.34549806362239e-08,
+      "loss": 2.5521,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 990,
+      "tokens_per_second_per_gpu": 979.2
+    },
+    {
+      "epoch": 0.991,
+      "grad_norm": 0.8679972290992737,
+      "learning_rate": 5.2443095448506674e-08,
+      "loss": 2.2688,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 991,
+      "tokens_per_second_per_gpu": 857.33
+    },
+    {
+      "epoch": 0.992,
+      "grad_norm": 0.8510658740997314,
+      "learning_rate": 4.247961283835311e-08,
+      "loss": 2.2254,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 992,
+      "tokens_per_second_per_gpu": 952.28
+    },
+    {
+      "epoch": 0.993,
+      "grad_norm": 0.8851034641265869,
+      "learning_rate": 3.356463731798432e-08,
+      "loss": 2.3777,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 993,
+      "tokens_per_second_per_gpu": 930.35
+    },
+    {
+      "epoch": 0.994,
+      "grad_norm": 0.847767174243927,
+      "learning_rate": 2.5698262401263605e-08,
+      "loss": 2.501,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 994,
+      "tokens_per_second_per_gpu": 1058.39
+    },
+    {
+      "epoch": 0.995,
+      "grad_norm": 0.8249082565307617,
+      "learning_rate": 1.888057060274173e-08,
+      "loss": 2.0256,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 995,
+      "tokens_per_second_per_gpu": 914.1
+    },
+    {
+      "epoch": 0.996,
+      "grad_norm": 1.0485869646072388,
+      "learning_rate": 1.3111633436779791e-08,
+      "loss": 2.3413,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 996,
+      "tokens_per_second_per_gpu": 546.19
+    },
+    {
+      "epoch": 0.997,
+      "grad_norm": 0.923591136932373,
+      "learning_rate": 8.391511416816489e-09,
+      "loss": 2.4325,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 997,
+      "tokens_per_second_per_gpu": 844.28
+    },
+    {
+      "epoch": 0.998,
+      "grad_norm": 1.0989410877227783,
+      "learning_rate": 4.720254054679796e-09,
+      "loss": 2.2315,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 998,
+      "tokens_per_second_per_gpu": 518.76
+    },
+    {
+      "epoch": 0.999,
+      "grad_norm": 1.190458059310913,
+      "learning_rate": 2.0978998601206556e-09,
+      "loss": 2.5925,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 999,
+      "tokens_per_second_per_gpu": 618.02
+    },
+    {
+      "epoch": 1.0,
+      "grad_norm": 0.9831822514533997,
+      "learning_rate": 5.244763404133046e-10,
+      "loss": 2.2586,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 17.43,
+      "memory/max_allocated (GiB)": 17.43,
+      "step": 1000,
+      "tokens_per_second_per_gpu": 740.06
+    },
+    {
+      "epoch": 1.0,
+      "eval_loss": 2.245497226715088,
+      "eval_runtime": 67.8857,
+      "eval_samples_per_second": 2.887,
+      "eval_steps_per_second": 1.444,
+      "memory/device_reserved (GiB)": 17.79,
+      "memory/max_active (GiB)": 7.78,
+      "memory/max_allocated (GiB)": 7.78,
+      "step": 1000
     }
   ],
   "logging_steps": 1,
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": true
       },
       "attributes": {}
     }
   },
+  "total_flos": 2.0713221703021363e+17,
   "train_batch_size": 1,
   "trial_name": null,
   "trial_params": null