File size: 2,348 Bytes

c882c3e


from typing import Any, Dict, List, Optional, Union, Callable
import torch
from transformers import GenerationMixin, LogitsProcessorList, StoppingCriteriaList
from transformers.generation.utils import GenerationConfig, GenerateOutput
from transformers.utils import ModelOutput


class TSGenerationMixin(GenerationMixin):
    @torch.no_grad()
    def generate(self,
        inputs: Optional[torch.Tensor] = None,
        generation_config: Optional[GenerationConfig] = None,
        logits_processor: Optional[LogitsProcessorList] = None,
        stopping_criteria: Optional[StoppingCriteriaList] = None,
        prefix_allowed_tokens_fn: Optional[Callable[[int, torch.Tensor], List[int]]] = None,
        synced_gpus: Optional[bool] = None,
        assistant_model: Optional["PreTrainedModel"] = None,
        streamer: Optional["BaseStreamer"] = None,
        negative_prompt_ids: Optional[torch.Tensor] = None,
        negative_prompt_attention_mask: Optional[torch.Tensor] = None,
        revin: Optional[bool] = True,
        patch_len:Optional[int] = None,
        stride_len:Optional[int]= None,
        max_output_length:Optional[int] = None,
        inference_patch_len: Optional[int] = None,

        **kwargs,
    ) -> Union[GenerateOutput, torch.Tensor]:
        

        if len(inputs.shape) != 3:
            raise ValueError('Input shape must be: [batch_size, seq_len, n_vars]')
        
        if revin:
            means = inputs.mean(dim=1, keepdim=True)
            stdev = inputs.std(dim=1, keepdim=True, unbiased=False) + 1e-5
            inputs = (inputs - means) / stdev

        

        model_inputs = {
            "input" : inputs,
            "patch_len" : patch_len,
            "stride" : stride_len,
            "target_dim" : max_output_length
        }


        outputs = self(**model_inputs) #[batch_size,target_dim,n_vars]

        outputs = outputs["prediction"]


        if revin:

            outputs = (outputs * stdev) + means

        return outputs
    
    
    def _update_model_kwargs_for_generation(
            self,
            outputs: ModelOutput,
            model_kwargs: Dict[str, Any],
            horizon_length: int = 1,
            is_encoder_decoder: bool = False,
            standardize_cache_format: bool = False,
    ) -> Dict[str, Any]:
        
        return model_kwargs