webbigdata
/

nanochat-jp_base

Model card Files Files and versions

dahara1 commited on Oct 17, 2025

Commit

931d015

·

verified ·

1 Parent(s): 6233e47

Update README.md

Files changed (1) hide show

README.md +4 -4

README.md CHANGED Viewed

@@ -11,11 +11,11 @@ karpathyさん(元スタンフォード、元テスラ、元OpenAI)の教育目
 事前学習のみのため、補完しかできませんが、日本語が問題なく補完できることは確認済です。
 このリポジトリに格納されているモデルをホームディレクトリ(~/.cache/nanochat/)に
-- base_checkpoints_jp
-- tokenizer
-として配置する事で、続きとして中間学習, SFT(教師あり微調整), RLを実行する事ができると思います。
-中間学習、SFTは比較的軽い処理なのでノード数とバッチサイズを減らせばH100 x 8台をレンタルせずともローカルPCなどで実行可能です。
 ### 事前学習実行時ログ

 事前学習のみのため、補完しかできませんが、日本語が問題なく補完できることは確認済です。
 このリポジトリに格納されているモデルをホームディレクトリ(~/.cache/nanochat/)に
+- base_checkpoints_jp
+- tokenizer
+として配置する事で、続きとして中間学習, SFT(教師あり微調整), RL(強化学習)を実行する事ができると思います。
+中間学習、SFT、RL(強化学習)は比較的軽い処理なのでノード数とバッチサイズを減らせばH100 x 8台をレンタルせずともローカルPCなどで試行錯誤が実行可能です。
 ### 事前学習実行時ログ