tr8b-104B-debug / emb-norm /000-module.4.self_attention.scale_mask_softmax
41.5 MB
bigscience-bot's picture
5h
29eff39