Ошибка "NameError: name 'init_empty_weights' is not defined"
При попытке запустить скрипт (как Transformers так и Sentence Transformers) выводится ошибка
Traceback (most recent call last):
File "/home/username/giga_emb/main.py", line 7, in
model = SentenceTransformer(
File "/home/username/giga_emb/.venv/lib/python3.10/site-packages/sentence_transformers/SentenceTransformer.py", line 327, in init
modules, self.module_kwargs = self._load_sbert_model(
File "/home/username/giga_emb/.venv/lib/python3.10/site-packages/sentence_transformers/SentenceTransformer.py", line 2305, in _load_sbert_model
module = module_class.load(
File "/home/username/giga_emb/.venv/lib/python3.10/site-packages/sentence_transformers/models/Transformer.py", line 365, in load
return cls(model_name_or_path=model_name_or_path, **init_kwargs)
File "/home/username/giga_emb/.venv/lib/python3.10/site-packages/sentence_transformers/models/Transformer.py", line 88, in init
self._load_model(model_name_or_path, config, cache_dir, backend, is_peft_model, **model_args)
File "/home/username/giga_emb/.venv/lib/python3.10/site-packages/sentence_transformers/models/Transformer.py", line 196, in _load_model
self.auto_model = AutoModel.from_pretrained(
File "/home/username/giga_emb/.venv/lib/python3.10/site-packages/transformers/models/auto/auto_factory.py", line 564, in from_pretrained
return model_class.from_pretrained(
File "/home/username/giga_emb/.venv/lib/python3.10/site-packages/transformers/modeling_utils.py", line 279, in _wrapper
return func(*args, **kwargs)
File "/home/username/giga_emb/.venv/lib/python3.10/site-packages/transformers/modeling_utils.py", line 4333, in from_pretrained
model_init_context = cls.get_init_context(is_quantized, _is_ds_init_called)
File "/home/username/giga_emb/.venv/lib/python3.10/site-packages/transformers/modeling_utils.py", line 3736, in get_init_context
init_contexts = [no_init_weights(), init_empty_weights()]
NameError: name 'init_empty_weights' is not defined
Решил проблему даунгрейдом трансформера до transformers-4.50.3
Но теперь другая проблема - установка flash-attn через wheel занимает слишком много времени. Прошло уже более часа, установка до сих пор не завершена. Отпишусь по результату установится ли до конца дня вообще.
по поводу установки flash-attn советуют устанавливать с флагом pip install flash-attn --no-build-isolation.
Если не поможет, поделитесь пожалуйста окружением, в котором пробуете запускать (pip freeze будет достаточно), а так же кодом запуска, который приводит к данной ошибке.
Окружение:
certifi==2025.10.5
charset-normalizer==3.4.4
einops==0.8.1
filelock==3.20.0
fsspec==2025.10.0
hf-xet==1.2.0
huggingface-hub==0.36.0
idna==3.11
Jinja2==3.1.6
joblib==1.5.2
MarkupSafe==3.0.3
mpmath==1.3.0
networkx==3.4.2
numpy==2.2.6
nvidia-cublas-cu12==12.8.4.1
nvidia-cuda-cupti-cu12==12.8.90
nvidia-cuda-nvrtc-cu12==12.8.93
nvidia-cuda-runtime-cu12==12.8.90
nvidia-cudnn-cu12==9.10.2.21
nvidia-cufft-cu12==11.3.3.83
nvidia-cufile-cu12==1.13.1.3
nvidia-curand-cu12==10.3.9.90
nvidia-cusolver-cu12==11.7.3.90
nvidia-cusparse-cu12==12.5.8.93
nvidia-cusparselt-cu12==0.7.1
nvidia-nccl-cu12==2.27.5
nvidia-nvjitlink-cu12==12.8.93
nvidia-nvshmem-cu12==3.3.20
nvidia-nvtx-cu12==12.8.90
packaging==25.0
pillow==12.0.0
PyYAML==6.0.3
regex==2025.10.23
requests==2.32.5
safetensors==0.6.2
scikit-learn==1.7.2
scipy==1.15.3
sentence-transformers==5.1.1
sympy==1.14.0
threadpoolctl==3.6.0
tokenizers==0.21.4
torch==2.9.0
tqdm==4.67.1
transformers==4.50.3
triton==3.5.0
typing_extensions==4.15.0
urllib3==2.5.0
Устанавливаю как раз с флагом
pip install flash-attn --no-build-isolation
Но прошло уже более 2 часов и до сих пор происходит установка:
Requirement already satisfied: nvidia-nvshmem-cu12==3.3.20 in ./.venv/lib/python3.10/site-packages (from torch->flash-attn) (3.3.20)
Requirement already satisfied: mpmath<1.4,>=1.1.0 in ./.venv/lib/python3.10/site-packages (from sympy>=1.13.3->torch->flash-attn) (1.3.0)
Requirement already satisfied: MarkupSafe>=2.0 in ./.venv/lib/python3.10/site-packages (from jinja2->torch->flash-attn) (3.0.3)
Building wheels for collected packages: flash-attn
Building wheel for flash-attn (setup.py) ... \
Не получилось воспроизвести проблему. Подскажите, работают ли у вас другие модели на этом окружении? Пробовали ли проверить работоспособность кода например в google colab?
Спустя больше, чем 4 часа библиотека всё таки установилась и скрипт отрабатывает нормально.