Instructions to use adpretko/ML815_Baseline with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

Libraries

How to use adpretko/ML815_Baseline with Transformers:

# Use a pipeline as a high-level helper
from transformers import pipeline

pipe = pipeline("text-generation", model="adpretko/ML815_Baseline")
messages = [
    {"role": "user", "content": "Who are you?"},
]
pipe(messages)

# Load model directly
from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("adpretko/ML815_Baseline")
model = AutoModelForCausalLM.from_pretrained("adpretko/ML815_Baseline")
messages = [
    {"role": "user", "content": "Who are you?"},
]
inputs = tokenizer.apply_chat_template(
	messages,
	add_generation_prompt=True,
	tokenize=True,
	return_dict=True,
	return_tensors="pt",
).to(model.device)

outputs = model.generate(**inputs, max_new_tokens=40)
print(tokenizer.decode(outputs[0][inputs["input_ids"].shape[-1]:]))

Notebooks
Google Colab
Kaggle
Local Apps Settings

vLLM

How to use adpretko/ML815_Baseline with vLLM:

Install from pip and serve model

# Install vLLM from pip:
pip install vllm
# Start the vLLM server:
vllm serve "adpretko/ML815_Baseline"
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:8000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "adpretko/ML815_Baseline",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Use Docker

docker model run hf.co/adpretko/ML815_Baseline

SGLang

How to use adpretko/ML815_Baseline with SGLang:

Install from pip and serve model

# Install SGLang from pip:
pip install sglang
# Start the SGLang server:
python3 -m sglang.launch_server \
    --model-path "adpretko/ML815_Baseline" \
    --host 0.0.0.0 \
    --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "adpretko/ML815_Baseline",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Use Docker images

docker run --gpus all \
    --shm-size 32g \
    -p 30000:30000 \
    -v ~/.cache/huggingface:/root/.cache/huggingface \
    --env "HF_TOKEN=<secret>" \
    --ipc=host \
    lmsysorg/sglang:latest \
    python3 -m sglang.launch_server \
        --model-path "adpretko/ML815_Baseline" \
        --host 0.0.0.0 \
        --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "adpretko/ML815_Baseline",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Docker Model Runner
How to use adpretko/ML815_Baseline with Docker Model Runner:
```
docker model run hf.co/adpretko/ML815_Baseline
```

ML815_Baseline / trainer_log.jsonl

adpretko

Model save

3c3fb93 verified 7 months ago

raw

history blame contribute delete

12 kB

	{"current_steps": 10, "total_steps": 618, "loss": 0.7994, "lr": 3.225806451612903e-06, "epoch": 0.016174686615446826, "percentage": 1.62, "elapsed_time": "0:02:10", "remaining_time": "2:12:38"}
	{"current_steps": 20, "total_steps": 618, "loss": 0.339, "lr": 6.451612903225806e-06, "epoch": 0.03234937323089365, "percentage": 3.24, "elapsed_time": "0:04:23", "remaining_time": "2:11:23"}
	{"current_steps": 30, "total_steps": 618, "loss": 0.1355, "lr": 9.67741935483871e-06, "epoch": 0.04852405984634048, "percentage": 4.85, "elapsed_time": "0:06:32", "remaining_time": "2:08:18"}
	{"current_steps": 40, "total_steps": 618, "loss": 0.0864, "lr": 1.2903225806451613e-05, "epoch": 0.0646987464617873, "percentage": 6.47, "elapsed_time": "0:08:43", "remaining_time": "2:06:08"}
	{"current_steps": 50, "total_steps": 618, "loss": 0.0771, "lr": 1.6129032258064517e-05, "epoch": 0.08087343307723413, "percentage": 8.09, "elapsed_time": "0:10:54", "remaining_time": "2:03:52"}
	{"current_steps": 60, "total_steps": 618, "loss": 0.0616, "lr": 1.935483870967742e-05, "epoch": 0.09704811969268096, "percentage": 9.71, "elapsed_time": "0:13:03", "remaining_time": "2:01:22"}
	{"current_steps": 70, "total_steps": 618, "loss": 0.068, "lr": 1.9989785286500294e-05, "epoch": 0.11322280630812778, "percentage": 11.33, "elapsed_time": "0:15:13", "remaining_time": "1:59:13"}
	{"current_steps": 80, "total_steps": 618, "loss": 0.0532, "lr": 1.994832377542755e-05, "epoch": 0.1293974929235746, "percentage": 12.94, "elapsed_time": "0:17:21", "remaining_time": "1:56:43"}
	{"current_steps": 90, "total_steps": 618, "loss": 0.0531, "lr": 1.9875109281794828e-05, "epoch": 0.14557217953902143, "percentage": 14.56, "elapsed_time": "0:19:30", "remaining_time": "1:54:29"}
	{"current_steps": 100, "total_steps": 618, "loss": 0.0543, "lr": 1.9770375491054264e-05, "epoch": 0.16174686615446826, "percentage": 16.18, "elapsed_time": "0:21:35", "remaining_time": "1:51:50"}
	{"current_steps": 110, "total_steps": 618, "loss": 0.0506, "lr": 1.9634456691705705e-05, "epoch": 0.1779215527699151, "percentage": 17.8, "elapsed_time": "0:23:59", "remaining_time": "1:50:46"}
	{"current_steps": 120, "total_steps": 618, "loss": 0.0436, "lr": 1.9467786708317257e-05, "epoch": 0.1940962393853619, "percentage": 19.42, "elapsed_time": "0:26:13", "remaining_time": "1:48:50"}
	{"current_steps": 130, "total_steps": 618, "loss": 0.0421, "lr": 1.9270897516847406e-05, "epoch": 0.21027092600080874, "percentage": 21.04, "elapsed_time": "0:28:20", "remaining_time": "1:46:21"}
	{"current_steps": 140, "total_steps": 618, "loss": 0.047, "lr": 1.9044417546688295e-05, "epoch": 0.22644561261625556, "percentage": 22.65, "elapsed_time": "0:30:32", "remaining_time": "1:44:16"}
	{"current_steps": 150, "total_steps": 618, "loss": 0.0421, "lr": 1.878906967484966e-05, "epoch": 0.2426202992317024, "percentage": 24.27, "elapsed_time": "0:32:39", "remaining_time": "1:41:52"}
	{"current_steps": 160, "total_steps": 618, "loss": 0.0433, "lr": 1.8505668918685603e-05, "epoch": 0.2587949858471492, "percentage": 25.89, "elapsed_time": "0:34:48", "remaining_time": "1:39:37"}
	{"current_steps": 170, "total_steps": 618, "loss": 0.0426, "lr": 1.8195119834528535e-05, "epoch": 0.274969672462596, "percentage": 27.51, "elapsed_time": "0:37:01", "remaining_time": "1:37:35"}
	{"current_steps": 180, "total_steps": 618, "loss": 0.0397, "lr": 1.7858413630533305e-05, "epoch": 0.29114435907804287, "percentage": 29.13, "elapsed_time": "0:39:11", "remaining_time": "1:35:23"}
	{"current_steps": 190, "total_steps": 618, "loss": 0.0418, "lr": 1.7496625002946702e-05, "epoch": 0.30731904569348967, "percentage": 30.74, "elapsed_time": "0:41:18", "remaining_time": "1:33:03"}
	{"current_steps": 200, "total_steps": 618, "loss": 0.0322, "lr": 1.7110908705900322e-05, "epoch": 0.3234937323089365, "percentage": 32.36, "elapsed_time": "0:43:30", "remaining_time": "1:30:56"}
	{"current_steps": 210, "total_steps": 618, "loss": 0.0344, "lr": 1.670249586567531e-05, "epoch": 0.3396684189243833, "percentage": 33.98, "elapsed_time": "0:45:53", "remaining_time": "1:29:08"}
	{"current_steps": 220, "total_steps": 618, "loss": 0.0329, "lr": 1.627269005120304e-05, "epoch": 0.3558431055398302, "percentage": 35.6, "elapsed_time": "0:48:02", "remaining_time": "1:26:54"}
	{"current_steps": 230, "total_steps": 618, "loss": 0.034, "lr": 1.5822863113343934e-05, "epoch": 0.37201779215527697, "percentage": 37.22, "elapsed_time": "0:50:12", "remaining_time": "1:24:41"}
	{"current_steps": 240, "total_steps": 618, "loss": 0.04, "lr": 1.5354450806224553e-05, "epoch": 0.3881924787707238, "percentage": 38.83, "elapsed_time": "0:52:19", "remaining_time": "1:22:24"}
	{"current_steps": 250, "total_steps": 618, "loss": 0.0335, "lr": 1.48689482046087e-05, "epoch": 0.4043671653861706, "percentage": 40.45, "elapsed_time": "0:54:23", "remaining_time": "1:20:04"}
	{"current_steps": 260, "total_steps": 618, "loss": 0.0316, "lr": 1.4367904931929422e-05, "epoch": 0.4205418520016175, "percentage": 42.07, "elapsed_time": "0:56:32", "remaining_time": "1:17:51"}
	{"current_steps": 270, "total_steps": 618, "loss": 0.0329, "lr": 1.3852920214212966e-05, "epoch": 0.4367165386170643, "percentage": 43.69, "elapsed_time": "0:58:42", "remaining_time": "1:15:40"}
	{"current_steps": 280, "total_steps": 618, "loss": 0.0337, "lr": 1.3325637775681561e-05, "epoch": 0.45289122523251113, "percentage": 45.31, "elapsed_time": "1:00:48", "remaining_time": "1:13:24"}
	{"current_steps": 290, "total_steps": 618, "loss": 0.0342, "lr": 1.2787740592327232e-05, "epoch": 0.46906591184795793, "percentage": 46.93, "elapsed_time": "1:03:00", "remaining_time": "1:11:15"}
	{"current_steps": 300, "total_steps": 618, "loss": 0.0309, "lr": 1.2240945520202079e-05, "epoch": 0.4852405984634048, "percentage": 48.54, "elapsed_time": "1:05:12", "remaining_time": "1:09:07"}
	{"current_steps": 310, "total_steps": 618, "loss": 0.0273, "lr": 1.1686997815570473e-05, "epoch": 0.5014152850788516, "percentage": 50.16, "elapsed_time": "1:07:35", "remaining_time": "1:07:09"}
	{"current_steps": 320, "total_steps": 618, "loss": 0.0342, "lr": 1.112766556441367e-05, "epoch": 0.5175899716942984, "percentage": 51.78, "elapsed_time": "1:09:46", "remaining_time": "1:04:58"}
	{"current_steps": 330, "total_steps": 618, "loss": 0.0307, "lr": 1.05647340390667e-05, "epoch": 0.5337646583097453, "percentage": 53.4, "elapsed_time": "1:11:56", "remaining_time": "1:02:47"}
	{"current_steps": 340, "total_steps": 618, "loss": 0.0283, "lr": 1e-05, "epoch": 0.549939344925192, "percentage": 55.02, "elapsed_time": "1:14:02", "remaining_time": "1:00:32"}
	{"current_steps": 350, "total_steps": 618, "loss": 0.0327, "lr": 9.435265960933304e-06, "epoch": 0.5661140315406389, "percentage": 56.63, "elapsed_time": "1:16:10", "remaining_time": "0:58:19"}
	{"current_steps": 360, "total_steps": 618, "loss": 0.024, "lr": 8.872334435586333e-06, "epoch": 0.5822887181560857, "percentage": 58.25, "elapsed_time": "1:18:19", "remaining_time": "0:56:08"}
	{"current_steps": 370, "total_steps": 618, "loss": 0.027, "lr": 8.313002184429529e-06, "epoch": 0.5984634047715326, "percentage": 59.87, "elapsed_time": "1:20:29", "remaining_time": "0:53:57"}
	{"current_steps": 380, "total_steps": 618, "loss": 0.0286, "lr": 7.759054479797924e-06, "epoch": 0.6146380913869793, "percentage": 61.49, "elapsed_time": "1:22:40", "remaining_time": "0:51:46"}
	{"current_steps": 390, "total_steps": 618, "loss": 0.0251, "lr": 7.2122594076727705e-06, "epoch": 0.6308127780024262, "percentage": 63.11, "elapsed_time": "1:24:48", "remaining_time": "0:49:34"}
	{"current_steps": 400, "total_steps": 618, "loss": 0.0237, "lr": 6.6743622243184405e-06, "epoch": 0.646987464617873, "percentage": 64.72, "elapsed_time": "1:26:56", "remaining_time": "0:47:22"}
	{"current_steps": 410, "total_steps": 618, "loss": 0.0277, "lr": 6.147079785787038e-06, "epoch": 0.6631621512333199, "percentage": 66.34, "elapsed_time": "1:29:21", "remaining_time": "0:45:20"}
	{"current_steps": 420, "total_steps": 618, "loss": 0.0295, "lr": 5.6320950680705826e-06, "epoch": 0.6793368378487666, "percentage": 67.96, "elapsed_time": "1:31:33", "remaining_time": "0:43:09"}
	{"current_steps": 430, "total_steps": 618, "loss": 0.0264, "lr": 5.131051795391302e-06, "epoch": 0.6955115244642135, "percentage": 69.58, "elapsed_time": "1:33:51", "remaining_time": "0:41:02"}
	{"current_steps": 440, "total_steps": 618, "loss": 0.0271, "lr": 4.645549193775452e-06, "epoch": 0.7116862110796603, "percentage": 71.2, "elapsed_time": "1:36:02", "remaining_time": "0:38:51"}
	{"current_steps": 450, "total_steps": 618, "loss": 0.0222, "lr": 4.177136886656067e-06, "epoch": 0.7278608976951072, "percentage": 72.82, "elapsed_time": "1:38:08", "remaining_time": "0:36:38"}
	{"current_steps": 460, "total_steps": 618, "loss": 0.0255, "lr": 3.727309948796963e-06, "epoch": 0.7440355843105539, "percentage": 74.43, "elapsed_time": "1:40:18", "remaining_time": "0:34:27"}
	{"current_steps": 470, "total_steps": 618, "loss": 0.0273, "lr": 3.2975041343246937e-06, "epoch": 0.7602102709260008, "percentage": 76.05, "elapsed_time": "1:42:32", "remaining_time": "0:32:17"}
	{"current_steps": 480, "total_steps": 618, "loss": 0.0258, "lr": 2.8890912940996784e-06, "epoch": 0.7763849575414477, "percentage": 77.67, "elapsed_time": "1:44:43", "remaining_time": "0:30:06"}
	{"current_steps": 490, "total_steps": 618, "loss": 0.0287, "lr": 2.5033749970533015e-06, "epoch": 0.7925596441568945, "percentage": 79.29, "elapsed_time": "1:46:50", "remaining_time": "0:27:54"}
	{"current_steps": 500, "total_steps": 618, "loss": 0.0255, "lr": 2.1415863694666973e-06, "epoch": 0.8087343307723412, "percentage": 80.91, "elapsed_time": "1:48:58", "remaining_time": "0:25:43"}
	{"current_steps": 510, "total_steps": 618, "loss": 0.0259, "lr": 1.8048801654714687e-06, "epoch": 0.8249090173877881, "percentage": 82.52, "elapsed_time": "1:51:20", "remaining_time": "0:23:34"}
	{"current_steps": 520, "total_steps": 618, "loss": 0.0228, "lr": 1.4943310813144006e-06, "epoch": 0.841083704003235, "percentage": 84.14, "elapsed_time": "1:53:25", "remaining_time": "0:21:22"}
	{"current_steps": 530, "total_steps": 618, "loss": 0.0272, "lr": 1.2109303251503434e-06, "epoch": 0.8572583906186818, "percentage": 85.76, "elapsed_time": "1:55:32", "remaining_time": "0:19:11"}
	{"current_steps": 540, "total_steps": 618, "loss": 0.0227, "lr": 9.555824533117064e-07, "epoch": 0.8734330772341286, "percentage": 87.38, "elapsed_time": "1:57:41", "remaining_time": "0:16:59"}
	{"current_steps": 550, "total_steps": 618, "loss": 0.022, "lr": 7.291024831525961e-07, "epoch": 0.8896077638495754, "percentage": 89.0, "elapsed_time": "1:59:49", "remaining_time": "0:14:48"}
	{"current_steps": 560, "total_steps": 618, "loss": 0.0252, "lr": 5.322132916827483e-07, "epoch": 0.9057824504650223, "percentage": 90.61, "elapsed_time": "2:01:57", "remaining_time": "0:12:37"}
	{"current_steps": 570, "total_steps": 618, "loss": 0.0223, "lr": 3.6554330829429716e-07, "epoch": 0.9219571370804691, "percentage": 92.23, "elapsed_time": "2:04:06", "remaining_time": "0:10:27"}
	{"current_steps": 580, "total_steps": 618, "loss": 0.0219, "lr": 2.2962450894573606e-07, "epoch": 0.9381318236959159, "percentage": 93.85, "elapsed_time": "2:06:14", "remaining_time": "0:08:16"}
	{"current_steps": 590, "total_steps": 618, "loss": 0.0264, "lr": 1.2489071820517394e-07, "epoch": 0.9543065103113627, "percentage": 95.47, "elapsed_time": "2:08:20", "remaining_time": "0:06:05"}
	{"current_steps": 600, "total_steps": 618, "loss": 0.0262, "lr": 5.1676224572452246e-08, "epoch": 0.9704811969268096, "percentage": 97.09, "elapsed_time": "2:10:21", "remaining_time": "0:03:54"}
	{"current_steps": 610, "total_steps": 618, "loss": 0.0224, "lr": 1.0214713499706596e-08, "epoch": 0.9866558835422564, "percentage": 98.71, "elapsed_time": "2:12:45", "remaining_time": "0:01:44"}
	{"current_steps": 618, "total_steps": 618, "epoch": 0.9995956328346138, "percentage": 100.0, "elapsed_time": "2:14:40", "remaining_time": "0:00:00"}