SSMモデルにより、LLMの厳しいハードウェア要求を引き下げることを目的にトレーニングしたモデル。 特に日本語への応答を滑らかにすることが主眼。
モデルサイズのためか、学習ステップ数のためかあまりよい応答を返すようにならなかった。
Files info
Base model