NoesisLab
/

Arcade-3B

Text Generation

instruction-tuned

Model card Files Files and versions

OzTianlu commited on Mar 15

Commit

6449679

·

verified ·

1 Parent(s): 17e6d5c

Upload README.md

Files changed (1) hide show

README.md +2 -0

README.md CHANGED Viewed

@@ -41,6 +41,8 @@ $$\mathcal{L}_{\text{total}} = \mathcal{L}_{\text{CE}} + \frac{\lambda}{B \cdot
 with **λ = 0.1**. This soft regularization reduces divergence errors at inference time at zero architectural cost.
 ---
 ## Training Details

 with **λ = 0.1**. This soft regularization reduces divergence errors at inference time at zero architectural cost.
+![SC-Orthogonal Optimization Loop](DIAGRAM.png)
 ---
 ## Training Details