RISys-Lab
/

RedSage-Qwen3-8B-Base

Text Generation

Generated from Trainer

continual-pretraining

targeted-pretraining

text-generation-inference

Model card Files Files and versions

naufalso commited on Jan 30

Commit

a0858db

·

verified ·

1 Parent(s): dc4b429

Update README.md

Files changed (1) hide show

README.md +4 -3

README.md CHANGED Viewed

@@ -49,10 +49,11 @@ This model is a **base model** intended for:
 RedSage employs a multi-stage training pipeline. This model represents the output of **Stage 2**.
-1.  Stage 1: Continual Pre-Training (CPT) -> `RedSage-Qwen3-8B-CFW` (CyberFineWeb data)
 2.  **Stage 2: Targeted Pre-Training** -> **`RedSage-Qwen3-8B-Base`** (Current Model)
-3.  Stage 3: Supervised Fine-Tuning (SFT) -> `RedSage-Qwen3-8B-Ins`
-4.  Stage 4: Direct Preference Optimization (DPO) -> `RedSage-Qwen3-8B-DPO`
 ## Training Data: RedSage-Seed & Dump

 RedSage employs a multi-stage training pipeline. This model represents the output of **Stage 2**.
+1.  Stage 1: Continual Pre-Training (CPT) -> [RedSage-Qwen3-8B-CFW](https://huggingface.co/RISys-Lab/RedSage-Qwen3-8B-CFW) (CyberFineWeb data)
 2.  **Stage 2: Targeted Pre-Training** -> **`RedSage-Qwen3-8B-Base`** (Current Model)
+    * *Data:* RedSage-Seed (\~150M Tokens) + RedSage-Dump (\~700M Tokens)
+4.  Stage 3: Supervised Fine-Tuning (SFT) -> [RedSage-Qwen3-8B-Ins](https://huggingface.co/RISys-Lab/RedSage-Qwen3-8B-Ins)
+5.  Stage 4: Direct Preference Optimization (DPO) -> [RedSage-Qwen3-8B-DPO](https://huggingface.co/RISys-Lab/RedSage-Qwen3-8B-DPO)
 ## Training Data: RedSage-Seed & Dump