agentlans
/

Phi-3.5-mini-instruct-o1

Model card Files Files and versions

agentlans commited on Jan 6, 2025

Commit

455ca37

·

verified ·

1 Parent(s): 52a0e8b

Update README.md

Files changed (1) hide show

README.md +0 -1

README.md CHANGED Viewed

@@ -42,7 +42,6 @@ The fine-tuning process for Phi-3.5-mini-instruct-o1 employed the following tech
 - **Compute Type:** BF16
 - **Context Length:** 2048 tokens
 - **Optimizer:** AdamW with cosine learning rate scheduling
-- **Model Freezing:** Two trainable layers frozen
 - **Additional Enhancement:** NEFTune with alpha 5
 This fine-tuning approach was designed to efficiently adapt the model while maintaining its generalization capabilities and computational efficiency.

 - **Compute Type:** BF16
 - **Context Length:** 2048 tokens
 - **Optimizer:** AdamW with cosine learning rate scheduling
 - **Additional Enhancement:** NEFTune with alpha 5
 This fine-tuning approach was designed to efficiently adapt the model while maintaining its generalization capabilities and computational efficiency.