dahara1 commited on
Commit
1a95ee1
·
verified ·
1 Parent(s): a6dc6de

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +12 -7
README.md CHANGED
@@ -16,14 +16,12 @@ karpathyさん(元スタンドード 元テスラ 元OpenAIの)教育目的PJで
16
  - tokenizer
17
  を配置する事で中間学習、SFTを実行する事ができると思います。
18
 
19
- 中間学習、SFTは比較的軽い処理なのでバッチサイズを減らせばローカルPCで実行可能です。
 
 
 
 
20
 
21
- ## 謝辞
22
- 以下の方たちのお力添えがなければこのモデルは完成しませんでした。ありがとうございます!
23
- - karpathyさん
24
- - kajumaさん
25
- - ABEJA社
26
- - 日本語でブログやWebサイトを執筆してくださった皆様
27
 
28
  ## 単体動作確認スクリプト
29
 
@@ -192,3 +190,10 @@ timestamp: 2025-10-16 16:17:09
192
  - Number of training tokens: 11,219,763,200
193
  - Minimum validation bpb: 0.6473
194
  - Final validation bpb: 0.6682
 
 
 
 
 
 
 
 
16
  - tokenizer
17
  を配置する事で中間学習、SFTを実行する事ができると思います。
18
 
19
+ 中間学習、SFTは比較的軽い処理なのでバッチサイズを減らせばローカルPCなどで実行可能です。
20
+
21
+
22
+ ### トレーニング実行時ログ
23
+ [wandb](https://wandb.ai/dahara1/nanochat-jp/runs/6wobnudj?nw=nwuserdahara1)
24
 
 
 
 
 
 
 
25
 
26
  ## 単体動作確認スクリプト
27
 
 
190
  - Number of training tokens: 11,219,763,200
191
  - Minimum validation bpb: 0.6473
192
  - Final validation bpb: 0.6682
193
+
194
+ ## 謝辞
195
+ 以下の方たちのお力添えがなければこのモデルは完成しませんでした。ありがとうございます!
196
+ - karpathyさん
197
+ - kajumaさん
198
+ - ABEJA社
199
+ - 日本語でブログやWebサイトを執筆してくださった皆様