dahara1 commited on
Commit
931d015
·
verified ·
1 Parent(s): 6233e47

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +4 -4
README.md CHANGED
@@ -11,11 +11,11 @@ karpathyさん(元スタンフォード、元テスラ、元OpenAI)の教育目
11
  事前学習のみのため、補完しかできませんが、日本語が問題なく補完できることは確認済です。
12
 
13
  このリポジトリに格納されているモデルをホームディレクトリ(~/.cache/nanochat/)に
14
- - base_checkpoints_jp
15
- - tokenizer
16
- として配置する事で、続きとして中間学習, SFT(教師あり微調整), RLを実行する事ができると思います。
17
 
18
- 中間学習、SFTは比較的軽い処理なのでノード数とバッチサイズを減らせばH100 x 8台をレンタルせずともローカルPCなどで実行可能です。
19
 
20
 
21
  ### 事前学習実行時ログ
 
11
  事前学習のみのため、補完しかできませんが、日本語が問題なく補完できることは確認済です。
12
 
13
  このリポジトリに格納されているモデルをホームディレクトリ(~/.cache/nanochat/)に
14
+ - base_checkpoints_jp
15
+ - tokenizer
16
+ として配置する事で、続きとして中間学習, SFT(教師あり微調整), RL(強化学習)を実行する事ができると思います。
17
 
18
+ 中間学習、SFT、RL(強化学習)は比較的軽い処理なのでノード数とバッチサイズを減らせばH100 x 8台をレンタルせずともローカルPCなどで試行錯誤が実行可能です。
19
 
20
 
21
  ### 事前学習実行時ログ