moonshotai
/

Kimi-Audio-7B-Instruct

audio-language-model

speech-recognition

audio-understanding

audio-generation

Model card Files Files and versions

Refactor Logits Naming

#15

by codecho - opened May 19, 2025

base: refs/heads/main

←

from: refs/pr/15

Discussion Files changed

Files changed (1) hide show

modeling_moonshot_kimia.py +4 -4

modeling_moonshot_kimia.py CHANGED Viewed

@@ -902,15 +902,15 @@ class MoonshotKimiaForCausalLM(Qwen2PreTrainedModel):
         else:
             hidden_states, mimo_hidden_states = outputs[0], outputs[1]
-        audio_logits = self.lm_head(hidden_states)
-        text_logits = self.mimo_output(mimo_hidden_states)
         if not return_dict:
-            output = (text_logits, audio_logits) + outputs[2:]
             return output
         return CausalLMOutputWithPast(
             loss=None,
-            logits=(text_logits, audio_logits),
             past_key_values=outputs.past_key_values,
             hidden_states=outputs.hidden_states,
             attentions=outputs.attentions,

         else:
             hidden_states, mimo_hidden_states = outputs[0], outputs[1]
+        text_logits = self.lm_head(hidden_states)
+        audio_logits = self.mimo_output(mimo_hidden_states)
         if not return_dict:
+            output = (audio_logits, text_logits) + outputs[2:]
             return output
         return CausalLMOutputWithPast(
             loss=None,
+            logits=(audio_logits, text_logits),
             past_key_values=outputs.past_key_values,
             hidden_states=outputs.hidden_states,
             attentions=outputs.attentions,