katuni4ka
/

tiny-random-glm4

Feature Extraction

Model card Files Files and versions

katuni4ka commited on Mar 5, 2025

Commit

2ed169c

·

verified ·

1 Parent(s): b60128f

Update modeling_chatglm.py

Files changed (1) hide show

modeling_chatglm.py +12 -3

modeling_chatglm.py CHANGED Viewed

@@ -422,7 +422,7 @@ class SelfAttention(torch.nn.Module):
 def _config_to_kwargs(args):
     common_kwargs = {
-        "dtype": args.torch_dtype,
     }
     return common_kwargs
@@ -720,7 +720,7 @@ class ChatGLMModel(ChatGLMPreTrainedModel):
             init_method = default_init
         init_kwargs = {}
         if device is not None:
-            init_kwargs["device"] = device
         self.embedding = init_method(Embedding, config, **init_kwargs)
         self.num_layers = config.num_layers
         self.multi_query_group_num = config.multi_query_group_num
@@ -954,6 +954,15 @@ class ChatGLMForConditionalGeneration(ChatGLMPreTrainedModel):
             for layer_past in past
         )
     def process_response(self, output, history):
         content = ""
         history = deepcopy(history)
@@ -1231,4 +1240,4 @@ class ChatGLMForSequenceClassification(ChatGLMPreTrainedModel):
             past_key_values=transformer_outputs.past_key_values,
             hidden_states=transformer_outputs.hidden_states,
             attentions=transformer_outputs.attentions,
-        )

 def _config_to_kwargs(args):
     common_kwargs = {
+        "dtype": args.torch_dtype if not isinstance(args.torch_dtype, str) else getattr(torch, args.torch_dtype)
     }
     return common_kwargs
             init_method = default_init
         init_kwargs = {}
         if device is not None:
+            init_kwargs["device"] = device if not isinstance(device, str) else torch.device(device)
         self.embedding = init_method(Embedding, config, **init_kwargs)
         self.num_layers = config.num_layers
         self.multi_query_group_num = config.multi_query_group_num
             for layer_past in past
         )
+    @staticmethod
+    def _extract_past_from_model_output(outputs: ModelOutput, *args, **kwargs):
+        past_key_values = None
+        if "past_key_values" in outputs:
+            past_key_values = outputs.past_key_values
+        if is_transformers_4_42_or_higher:
+            return None, past_key_values
+        return past_key_values
     def process_response(self, output, history):
         content = ""
         history = deepcopy(history)
             past_key_values=transformer_outputs.past_key_values,
             hidden_states=transformer_outputs.hidden_states,
             attentions=transformer_outputs.attentions,
+        )