webbigdata
/

nanochat-jp_base

Model card Files Files and versions

dahara1 commited on Oct 17, 2025

Commit

1a95ee1

·

verified ·

1 Parent(s): a6dc6de

Update README.md

Files changed (1) hide show

README.md +12 -7

README.md CHANGED Viewed

@@ -16,14 +16,12 @@ karpathyさん(元スタンドード 元テスラ 元OpenAIの)教育目的PJで
 - tokenizer
 を配置する事で中間学習、SFTを実行する事ができると思います。
-中間学習、SFTは比較的軽い処理なのでバッチサイズを減らせばローカルPCで実行可能です。
-## 謝辞
-以下の方たちのお力添えがなければこのモデルは完成しませんでした。ありがとうございます！
-- karpathyさん
-- kajumaさん
-- ABEJA社
-- 日本語でブログやWebサイトを執筆してくださった皆様
 ## 単体動作確認スクリプト
@@ -192,3 +190,10 @@ timestamp: 2025-10-16 16:17:09
 - Number of training tokens: 11,219,763,200
 - Minimum validation bpb: 0.6473
 - Final validation bpb: 0.6682

 - tokenizer
 を配置する事で中間学習、SFTを実行する事ができると思います。
+中間学習、SFTは比較的軽い処理なのでバッチサイズを減らせばローカルPCなどで実行可能です。
+### トレーニング実行時ログ
+[wandb](https://wandb.ai/dahara1/nanochat-jp/runs/6wobnudj?nw=nwuserdahara1)
 ## 単体動作確認スクリプト
 - Number of training tokens: 11,219,763,200
 - Minimum validation bpb: 0.6473
 - Final validation bpb: 0.6682
+## 謝辞
+以下の方たちのお力添えがなければこのモデルは完成しませんでした。ありがとうございます！
+- karpathyさん
+- kajumaさん
+- ABEJA社
+- 日本語でブログやWebサイトを執筆してくださった皆様