Maple728
/

TimeMoE-50M

Time Series Forecasting

Model card Files Files and versions

Maple728 commited on Oct 10, 2024

Commit

b4a2d57

·

verified ·

1 Parent(s): 4f6d0e5

Update ts_generation_mixin.py

Files changed (1) hide show

ts_generation_mixin.py +3 -3

ts_generation_mixin.py CHANGED Viewed

@@ -226,12 +226,12 @@ class TSGenerationMixin(GenerationMixin):
             if "decoder_attention_mask" in model_kwargs:
                 decoder_attention_mask = model_kwargs["decoder_attention_mask"]
                 model_kwargs["decoder_attention_mask"] = torch.cat(
-                    [decoder_attention_mask, decoder_attention_mask.new_ones((decoder_attention_mask.shape[0], 1))],
                     dim=-1,
                 )
         if "cache_position" in model_kwargs and model_kwargs["cache_position"] is not None:
-            # model_kwargs["cache_position"] = model_kwargs["cache_position"][-1:] + horizon_length
-            model_kwargs["cache_position"] = model_kwargs["cache_position"][-1:] + 1
         return model_kwargs

             if "decoder_attention_mask" in model_kwargs:
                 decoder_attention_mask = model_kwargs["decoder_attention_mask"]
                 model_kwargs["decoder_attention_mask"] = torch.cat(
+                    [decoder_attention_mask, decoder_attention_mask.new_ones((decoder_attention_mask.shape[0], horizon_length))],
                     dim=-1,
                 )
         if "cache_position" in model_kwargs and model_kwargs["cache_position"] is not None:
+            model_kwargs["cache_position"] = model_kwargs["cache_position"][-1:] + horizon_length
+            # model_kwargs["cache_position"] = model_kwargs["cache_position"][-1:] + 1
         return model_kwargs