SkillFactory
/

cd3arg-Qwen2.5-7B-Instruct-R1-SFT

Safetensors

qwen2

Model card Files Files and versions

xet

Community

Zaynes commited on Dec 4, 2025

Commit

4661ff8

verified ·

1 Parent(s): 47bc52a

Upload README.md with huggingface_hub

Browse files

Files changed (1) hide show

README.md +26 -0

README.md ADDED Viewed

	@@ -0,0 +1,26 @@

+# M-sft_Qwen2.5-7B_R1Distill-sft-sft
+This model was created as part of the **sft_Qwen2.5-7B_R1Distill-sft** experiment using the SkillFactory experiment management system.
+## Model Details
+- **Training Method**: LLaMAFactory SFT (Supervised Fine-Tuning)
+- **Stage Name**: sft
+- **Experiment**: sft_Qwen2.5-7B_R1Distill-sft
+## Training Configuration
+{"model_name_or_path": "Qwen/Qwen2.5-7B-Instruct", "trust_remote_code": true, "stage": "sft", "do_train": true, "finetuning_type": "full", "deepspeed": "/scratch/10416/zaynesprague/skill_factory_dir/skill-factory/thirdparty/LLaMA-Factory/examples/deepspeed/ds_z2_config.json", "dataset": "TAUR_dev__D_SFT_C_sft_Qwen2_5_7B_R1Distill_sft_sft_data__sft_train", "template": "qwen", "cutoff_len": 16384, "max_samples": 1000000, "overwrite_cache": true, "preprocessing_num_workers": 1, "dataloader_num_workers": 0, "disable_tqdm": false, "output_dir": "/scratch/10416/zaynesprague/skill_inject_outputs/sf_experiments/sft_qwen7b_r1distill_sft/llamafactory/checkpoints", "logging_steps": 10, "save_steps": 100000, "plot_loss": true, "overwrite_output_dir": true, "per_device_train_batch_size": 1, "gradient_accumulation_steps": 1, "learning_rate": 1e-06, "num_train_epochs": 2, "lr_scheduler_type": "cosine", "warmup_ratio": 0.05, "weight_decay": 0.0001, "adam_beta1": 0.9, "adam_beta2": 0.95, "bf16": true, "ddp_timeout": 180000000, "gradient_checkpointing": true, "save_only_model": true, "enable_masked_ranges": false, "save_strategy": "steps", "save_total_limit": 5, "sf_tracker_dataset_id": "TAUR-dev/D-ExpTracker__sft_Qwen2.5-7B_R1Distill-sft__v1", "sf_eval_before_training": false, "sf_wandb_project": "sft_Qwen2.5-7B_R1Distill-sft_sft", "sf_eval_steps": null, "run_name": "sft_Qwen2.5-7B_R1Distill-sft_sft"}
+## Experiment Tracking
+🔗 **View complete experiment details**: [Experiment Tracker Dataset](https://huggingface.co/datasets/TAUR-dev/D-ExpTracker__sft_Qwen2.5-7B_R1Distill-sft__v1)
+## Usage
+```python
+from transformers import AutoTokenizer, AutoModelForCausalLM
+tokenizer = AutoTokenizer.from_pretrained("TAUR-dev/M-sft_Qwen2.5-7B_R1Distill-sft-sft")
+model = AutoModelForCausalLM.from_pretrained("TAUR-dev/M-sft_Qwen2.5-7B_R1Distill-sft-sft")
+```