SafaaAI
/

final_llm_darija_fr_tech

4-bit precision

Model card Files Files and versions

SafaaAI commited on Aug 30, 2025

Commit

d6ebd84

·

verified ·

1 Parent(s): dda7c7d

Update configuration.py

Files changed (1) hide show

configuration.py +4 -5

configuration.py CHANGED Viewed

@@ -1,6 +1,7 @@
 from transformers import PretrainedConfig
 from transformers import CONFIG_MAPPING
 from transformers import AutoConfig
 IGNORE_INDEX = -100
 IMAGE_TOKEN_INDEX = -200
@@ -79,9 +80,9 @@ class TinyLlavaConfig(PretrainedConfig):
     def _load_text_config(self, text_config=None):
         if self.llm_model_name_or_path is None or self.llm_model_name_or_path == '':
             self.text_config = CONFIG_MAPPING['llama']()
         else:
-            self.text_config = AutoConfig.from_pretrained(self.llm_model_name_or_path, trust_remote_code=True)
             if text_config is not None:
                 self.text_config = self.text_config.from_dict(text_config)
@@ -111,6 +112,4 @@ class TinyLlavaConfig(PretrainedConfig):
         self.vision_config.model_name_or_path = self.vision_model_name_or_path.split(':')[-1]
         self.vision_config.model_name_or_path2 = self.vision_model_name_or_path2.split(':')[-1]
-        self.vision_hidden_size = getattr(self.vision_config, 'hidden_size',  None)

 from transformers import PretrainedConfig
 from transformers import CONFIG_MAPPING
 from transformers import AutoConfig
+from transformers.models.phi.configuration_phi import PhiConfig # Ligne ajoutée
 IGNORE_INDEX = -100
 IMAGE_TOKEN_INDEX = -200
     def _load_text_config(self, text_config=None):
         if self.llm_model_name_or_path is None or self.llm_model_name_or_path == '':
             self.text_config = CONFIG_MAPPING['llama']()
         else:
+            self.text_config = PhiConfig.from_pretrained(self.llm_model_name_or_path, trust_remote_code=True) # Ligne modifiée
             if text_config is not None:
                 self.text_config = self.text_config.from_dict(text_config)
         self.vision_config.model_name_or_path = self.vision_model_name_or_path.split(':')[-1]
         self.vision_config.model_name_or_path2 = self.vision_model_name_or_path2.split(':')[-1]
+        self.vision_hidden_size = getattr(self.vision_config, 'hidden_size',  None)