webbigdata
/

nanochat-jp_base

Model card Files Files and versions

dahara1 commited on Oct 17, 2025

Commit

1dc8a0c

·

verified ·

1 Parent(s): 1a95ee1

Update README.md

Files changed (1) hide show

README.md +7 -9

README.md CHANGED Viewed

@@ -6,29 +6,27 @@ language:
 ## nanochat-jp_base
-karpathyさん(元スタンドード 元テスラ 元OpenAIの)教育目的PJである[nanochat](https://github.com/karpathy/nanochat)
-のd20版を日本語データ([kajuma/ABEJA-CC-JA-edu 10%](https://huggingface.co/datasets/kajuma/ABEJA-CC-JA-edu)を使って事前学習させたモデルです。
 事前学習のみのため、補完しかできませんが、補完できることは確認済です。
-ホームディレクトリ(~/.cache/nanochat/)に
 - base_checkpoints_jp
 - tokenizer
-を配置する事で中間学習、SFTを実行する事ができると思います。
-中間学習、SFTは比較的軽い処理なのでバッチサイズを減らせばローカルPCなどで実行可能です。
 ### トレーニング実行時ログ
 [wandb](https://wandb.ai/dahara1/nanochat-jp/runs/6wobnudj?nw=nwuserdahara1)
 ## 単体動作確認スクリプト
-Linux 前提です。文章の続きの補完のみです。
-1. [nanochat](https://github.com/karpathy/nanochat)をクローン
-2. speedrun.shを動かす（失敗するが.venvは作ってくれる）
 3. source .venv/bin/activate
 4. ~/.cache/nanochat/に本リポジトリのbase_checkpoints_jpとtokenizerを配置
 5. 以下のスクリプトをnanochatディレクトリ配下で動かす

 ## nanochat-jp_base
+karpathyさん(元スタンドード 元テスラ 元OpenAIの)教育目的PJである[nanochat](https://github.com/karpathy/nanochat) のd20版を日本語データ(kajuma/ABEJA-CC-JA-edu 10%](https://huggingface.co/datasets/kajuma/ABEJA-CC-JA-edu ) を使って事前学習させたモデルです。
 事前学習のみのため、補完しかできませんが、補完できることは確認済です。
+このモデルをホームディレクトリ(~/.cache/nanochat/)に
 - base_checkpoints_jp
 - tokenizer
+として配置する事で中間学習、SFTを実行する事ができると思います。
+中間学習、SFTは比較的軽い処理なのでバッチサイズを減らせばH100 x 8台をレンタルせずともローカルPCなどで実行可能です。
 ### トレーニング実行時ログ
 [wandb](https://wandb.ai/dahara1/nanochat-jp/runs/6wobnudj?nw=nwuserdahara1)
 ## 単体動作確認スクリプト
+Linux 前提です。文章の続きの補完のみです。
+1. [nanochat](https://github.com/karpathy/nanochat)をclone
+2. speedrun.shを動かす（失敗するが仮想環境.venvは作ってくれる）
 3. source .venv/bin/activate
 4. ~/.cache/nanochat/に本リポジトリのbase_checkpoints_jpとtokenizerを配置
 5. 以下のスクリプトをnanochatディレクトリ配下で動かす