webbigdata
/

nanochat-jp_base

Japanese

nanochat

Model card Files Files and versions

xet

Community

dahara1 commited on Oct 17, 2025

Commit

6233e47

verified ·

1 Parent(s): 1dc8a0c

Update README.md

Browse files

Files changed (1) hide show

README.md +8 -14

README.md CHANGED Viewed

@@ -6,26 +6,26 @@ language:
 ## nanochat-jp_base
-karpathyさん(元スタンドード 元テスラ 元OpenAIの)教育目的PJである[nanochat](https://github.com/karpathy/nanochat) のd20版を日本語データ(kajuma/ABEJA-CC-JA-edu 10%](https://huggingface.co/datasets/kajuma/ABEJA-CC-JA-edu ) を使って事前学習させたモデルです。
-事前学習のみのため、補完しかできませんが、補完できることは確認済です。
-このモデルをホームディレクトリ(~/.cache/nanochat/)に
 - base_checkpoints_jp
 - tokenizer
-として配置する事で中間学習、SFTを実行する事ができると思います。
-中間学習、SFTは比較的軽い処理なのでバッチサイズを減らせばH100 x 8台をレンタルせずともローカルPCなどで実行可能です。
-### トレーニング実行時ログ
 [wandb](https://wandb.ai/dahara1/nanochat-jp/runs/6wobnudj?nw=nwuserdahara1)
 ## 単体動作確認スクリプト
 Linux 前提です。文章の続きの補完のみです。
-1. [nanochat](https://github.com/karpathy/nanochat)をclone
 2. speedrun.shを動かす（失敗するが仮想環境.venvは作ってくれる）
 3. source .venv/bin/activate
 4. ~/.cache/nanochat/に本リポジトリのbase_checkpoints_jpとtokenizerを配置
@@ -107,12 +107,7 @@ if __name__ == "__main__":
             break
 ```
-## Environment
-### Git Information
-- Branch: master
-- Commit: d4a77fb (dirty)
-- Message: fix token eval2
 ### Hardware
 - Platform: Linux
@@ -127,7 +122,6 @@ if __name__ == "__main__":
 - Python: 3.11.9
 - PyTorch: 2.9.0+cu128
 ### Bloat
 - Characters: 382,832
 - Lines: 9,485

 ## nanochat-jp_base
+karpathyさん(元スタンフォード、元テスラ、元OpenAI)の教育目的PJである[nanochat](https://github.com/karpathy/nanochat) のd20版を日本語データ(kajuma/ABEJA-CC-JA-edu 10%](https://huggingface.co/datasets/kajuma/ABEJA-CC-JA-edu)を使って事前学習させたモデルです。
+事前学習のみのため、補完しかできませんが、日本語が問題なく補完できることは確認済です。
+このリポジトリに格納されているモデルをホームディレクトリ(~/.cache/nanochat/)に
 - base_checkpoints_jp
 - tokenizer
+として配置する事で、続きとして中間学習, SFT(教師あり微調整), RLを実行する事ができると思います。
+中間学習、SFTは比較的軽い処理なのでノード数とバッチサイズを減らせばH100 x 8台をレンタルせずともローカルPCなどで実行可能です。
+### 事前学習実行時ログ
 [wandb](https://wandb.ai/dahara1/nanochat-jp/runs/6wobnudj?nw=nwuserdahara1)
 ## 単体動作確認スクリプト
 Linux 前提です。文章の続きの補完のみです。
+1. [nanochat](https://github.com/karpathy/nanochat)をgit clone
 2. speedrun.shを動かす（失敗するが仮想環境.venvは作ってくれる）
 3. source .venv/bin/activate
 4. ~/.cache/nanochat/に本リポジトリのbase_checkpoints_jpとtokenizerを配置
             break
 ```
+## 学習環境情報
 ### Hardware
 - Platform: Linux
 - Python: 3.11.9
 - PyTorch: 2.9.0+cu128
 ### Bloat
 - Characters: 382,832
 - Lines: 9,485