Imagroune
/

feynmodel

Model card Files Files and versions

Imagroune commited on Sep 17, 2024

Commit

c20defd

·

verified ·

1 Parent(s): 13ca255

Update modeling_feynmodel.py

Files changed (1) hide show

modeling_feynmodel.py +15 -1

modeling_feynmodel.py CHANGED Viewed

@@ -1469,7 +1469,21 @@ class FeynModelForCausalLM(Gemma2ForCausalLM):
             else:
                 raise TypeError(f"Type inattendu pour self.lm_head.weight : {type(self.lm_head.weight)}")
-            min_dtype = torch.finfo(dtype).min
             attention_mask = _prepare_4d_causal_attention_mask_with_cache_position(
                 attention_mask,

             else:
                 raise TypeError(f"Type inattendu pour self.lm_head.weight : {type(self.lm_head.weight)}")
+            # min_dtype = torch.finfo(dtype).min
+            # Obtenir le dtype des poids de lm_head
+            if isinstance(self.lm_head, torch.ao.nn.quantized.dynamic.Linear):
+            # Pour les modules quantifiés dynamiquement, utiliser _weight_bias()
+                weight, bias = self.lm_head._weight_bias()
+                dtype = weight.dtype
+            else:
+                dtype = self.lm_head.weight.dtype
+            # Vérifier si dtype est un type de données en virgule flottante
+            if torch.is_floating_point(torch.empty(0, dtype=dtype)):
+                min_dtype = torch.finfo(dtype).min
+            else:
+                min_dtype = torch.iinfo(dtype).min
             attention_mask = _prepare_4d_causal_attention_mask_with_cache_position(
                 attention_mask,