deepspeed / transformers /docs /source /ja /perf_train_tpu.md
xingzhikb's picture
init
002bd9b

Training on TPUs

注意: シングルGPUセクションで紹介されているほとんどの戦略(混合精度トレーニングや勾配蓄積など)およびマルチGPUセクションは一般的なモデルのトレーニングに適用できますので、このセクションに入る前にそれを確認してください。

このドキュメントは、TPUでのトレーニング方法に関する情報をまもなく追加いたします。