youzexue
/

QQMM-embed-v2

Model card Files Files and versions

QQMM-embed-v2 / configuration_qqmm.py

youzexue's picture

Upload folder using huggingface_hub

44deaf3 verified 8 months ago

history blame contribute delete

2.8 kB

	from transformers import PretrainedConfig, AutoConfig, CONFIG_MAPPING
	from transformers.dynamic_module_utils import get_class_from_dynamic_module


	class QQMMConfig(PretrainedConfig):
	model_type = "qqmm"
	is_composition = True

	def __init__(self,
	language_model_config=None,
	vision_model_config=None,
	vision_abstractor_config=None,
	vision_output_key='last_hidden_state',
	image_token_id=None,
	**kwargs):
	super().__init__(**kwargs)

	if isinstance(language_model_config, dict):
	if '_name_or_path' not in language_model_config:
	language_model_config['_name_or_path'] = self._name_or_path
	language_model_type = language_model_config.get('model_type', '')
	is_remote_code = '.' in language_model_config.get('auto_map', {}).get('AutoConfig', '')
	if language_model_type in CONFIG_MAPPING and not is_remote_code:
	language_model_config = AutoConfig.for_model(**language_model_config)
	elif language_model_type:
	Config = get_class_from_dynamic_module(language_model_config["auto_map"]["AutoConfig"],
	language_model_config['_name_or_path'])
	language_model_config = Config(**language_model_config)
	self.language_model_config = language_model_config

	if isinstance(vision_model_config, dict):
	if '_name_or_path' not in vision_model_config:
	vision_model_config['_name_or_path'] = self._name_or_path
	vision_model_type = vision_model_config.get('model_type', '')
	is_remote_code = '.' in vision_model_config.get('auto_map', {}).get('AutoConfig', '')
	if vision_model_type in CONFIG_MAPPING and not is_remote_code:
	vision_model_config = AutoConfig.for_model(**vision_model_config)
	elif vision_model_type:
	Config = get_class_from_dynamic_module(vision_model_config["auto_map"]["AutoConfig"],
	vision_model_config['_name_or_path'])
	vision_model_config = Config(**vision_model_config)
	self.vision_model_config = vision_model_config

	self.vision_abstractor_config = vision_abstractor_config

	self.vision_output_key = vision_output_key
	self.image_token_id = image_token_id

	@property
	def hidden_size(self):
	return self.language_model_config.hidden_size

	@classmethod
	def from_dict(cls, config_dict, **kwargs):
	if 'name_or_path' in kwargs:
	config_dict['_name_or_path'] = kwargs.pop('name_or_path')
	return super().from_dict(config_dict, **kwargs)