Anyone else having trouble loading the model?

by darknoon - opened Oct 18, 2023

Oct 18, 2023

•

edited Oct 18, 2023

Using more or less this code (transformers@caa0ff0bf104ee68ea46432b298a534e9a4a02a4):

from transformers import FuyuForCausalLM, AutoTokenizer
…
FuyuForCausalLM.from_pretrained("adept/fuyu-8b")

The checkpoint seems to download ok, but doesn't load:

Some weights of FuyuForCausalLM were not initialized from the model checkpoint at adept/fuyu-8b and are newly initialized: ['language_model.model.layers.27.self_attn.query_key_value.bias', 'language_model.model.layers.20.input_layernorm.weight', 'language_model.model.layers.10.self_attn.k_layernorm.weight', 'language_model.model.layers.21.mlp.dense_h_to_4h.weight', 'language_model.model.layers.3.input_layernorm.weight', 'language_model.model.layers.6.self_attn.dense.bias', 'language_model.model.layers.2.self_attn.query_key_value.weight', 'language_model.model.layers.11.self_attn.query_key_value.weight', 'language_model.model.layers.30.input_layernorm.weight', 'language_model.model.layers.22.mlp.dense_4h_to_h.bias', 'language_model.model.layers.16.post_attention_layernorm.bias'…

darknoon

Oct 18, 2023

Any chance this config change is needed?

darknoon

Oct 18, 2023

Relevant comment on the pr

pcuenq

Oct 19, 2023

The PR has been merged and the weights updated in the repo, so you should be able to load the model using transformers @ main.

darknoon changed discussion status to closed Oct 19, 2023

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment