heegyu
/

kogpt-neox-tiny

Text Generation

text-generation-inference

Model card Files Files and versions

heegyu commited on Nov 24, 2022

Commit

72287da

·

1 Parent(s): b311c5d

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -22,7 +22,7 @@ PoC를 위해 학습한 작은 GPT 모델
 ## 학습 환경 및 하이퍼파라미터
 - NVIDIA Tesla T4(16GB VRAM)
 - fp 16, deepspeed stage2
-- 350000 steps
 - batch size 32
 - learning rate 5e-5, linear scheduler
 - 최종 train loss: 3.684

 ## 학습 환경 및 하이퍼파라미터
 - NVIDIA Tesla T4(16GB VRAM)
 - fp 16, deepspeed stage2
+- 350000 steps, 2일 17시간 소요
 - batch size 32
 - learning rate 5e-5, linear scheduler
 - 최종 train loss: 3.684