kaitchup
/

GLM-4.7-Flash-FP8-Dynamic

compressed-tensors

Model card Files Files and versions

GLM-4.7-Flash-FP8-Dynamic

File size: 235 Bytes

231c5f2

default_stage:
  default_modifiers:
    QuantizationModifier:
      targets: [Linear]
      ignore: [lm_head, model.embed_tokens, 're:.*input_layernorm$', 're:.*post_attention_layernorm$',
        model.norm]
      scheme: FP8_DYNAMIC