Upload 10 files

Browse files

Files changed (10) hide show

added_tokens.json +127 -0
config.json +96 -0
modeling_caputemendatoris.py +117 -0
pytorch_model-00001-of-00004.bin +3 -0
pytorch_model-00002-of-00004.bin +3 -0
pytorch_model-00003-of-00004.bin +3 -0
pytorch_model-00004-of-00004.bin +3 -0
pytorch_model.bin.index.json +841 -0
special_tokens_map.json +150 -0
tokenizer_config.json +1163 -0

added_tokens.json ADDED Viewed

	@@ -0,0 +1,127 @@

+{
+  "<extra_id_0>": 259,
+  "<extra_id_100>": 359,
+  "<extra_id_101>": 360,
+  "<extra_id_102>": 361,
+  "<extra_id_103>": 362,
+  "<extra_id_104>": 363,
+  "<extra_id_105>": 364,
+  "<extra_id_106>": 365,
+  "<extra_id_107>": 366,
+  "<extra_id_108>": 367,
+  "<extra_id_109>": 368,
+  "<extra_id_10>": 269,
+  "<extra_id_110>": 369,
+  "<extra_id_111>": 370,
+  "<extra_id_112>": 371,
+  "<extra_id_113>": 372,
+  "<extra_id_114>": 373,
+  "<extra_id_115>": 374,
+  "<extra_id_116>": 375,
+  "<extra_id_117>": 376,
+  "<extra_id_118>": 377,
+  "<extra_id_119>": 378,
+  "<extra_id_11>": 270,
+  "<extra_id_120>": 379,
+  "<extra_id_121>": 380,
+  "<extra_id_122>": 381,
+  "<extra_id_123>": 382,
+  "<extra_id_124>": 383,
+  "<extra_id_12>": 271,
+  "<extra_id_13>": 272,
+  "<extra_id_14>": 273,
+  "<extra_id_15>": 274,
+  "<extra_id_16>": 275,
+  "<extra_id_17>": 276,
+  "<extra_id_18>": 277,
+  "<extra_id_19>": 278,
+  "<extra_id_1>": 260,
+  "<extra_id_20>": 279,
+  "<extra_id_21>": 280,
+  "<extra_id_22>": 281,
+  "<extra_id_23>": 282,
+  "<extra_id_24>": 283,
+  "<extra_id_25>": 284,
+  "<extra_id_26>": 285,
+  "<extra_id_27>": 286,
+  "<extra_id_28>": 287,
+  "<extra_id_29>": 288,
+  "<extra_id_2>": 261,
+  "<extra_id_30>": 289,
+  "<extra_id_31>": 290,
+  "<extra_id_32>": 291,
+  "<extra_id_33>": 292,
+  "<extra_id_34>": 293,
+  "<extra_id_35>": 294,
+  "<extra_id_36>": 295,
+  "<extra_id_37>": 296,
+  "<extra_id_38>": 297,
+  "<extra_id_39>": 298,
+  "<extra_id_3>": 262,
+  "<extra_id_40>": 299,
+  "<extra_id_41>": 300,
+  "<extra_id_42>": 301,
+  "<extra_id_43>": 302,
+  "<extra_id_44>": 303,
+  "<extra_id_45>": 304,
+  "<extra_id_46>": 305,
+  "<extra_id_47>": 306,
+  "<extra_id_48>": 307,
+  "<extra_id_49>": 308,
+  "<extra_id_4>": 263,
+  "<extra_id_50>": 309,
+  "<extra_id_51>": 310,
+  "<extra_id_52>": 311,
+  "<extra_id_53>": 312,
+  "<extra_id_54>": 313,
+  "<extra_id_55>": 314,
+  "<extra_id_56>": 315,
+  "<extra_id_57>": 316,
+  "<extra_id_58>": 317,
+  "<extra_id_59>": 318,
+  "<extra_id_5>": 264,
+  "<extra_id_60>": 319,
+  "<extra_id_61>": 320,
+  "<extra_id_62>": 321,
+  "<extra_id_63>": 322,
+  "<extra_id_64>": 323,
+  "<extra_id_65>": 324,
+  "<extra_id_66>": 325,
+  "<extra_id_67>": 326,
+  "<extra_id_68>": 327,
+  "<extra_id_69>": 328,
+  "<extra_id_6>": 265,
+  "<extra_id_70>": 329,
+  "<extra_id_71>": 330,
+  "<extra_id_72>": 331,
+  "<extra_id_73>": 332,
+  "<extra_id_74>": 333,
+  "<extra_id_75>": 334,
+  "<extra_id_76>": 335,
+  "<extra_id_77>": 336,
+  "<extra_id_78>": 337,
+  "<extra_id_79>": 338,
+  "<extra_id_7>": 266,
+  "<extra_id_80>": 339,
+  "<extra_id_81>": 340,
+  "<extra_id_82>": 341,
+  "<extra_id_83>": 342,
+  "<extra_id_84>": 343,
+  "<extra_id_85>": 344,
+  "<extra_id_86>": 345,
+  "<extra_id_87>": 346,
+  "<extra_id_88>": 347,
+  "<extra_id_89>": 348,
+  "<extra_id_8>": 267,
+  "<extra_id_90>": 349,
+  "<extra_id_91>": 350,
+  "<extra_id_92>": 351,
+  "<extra_id_93>": 352,
+  "<extra_id_94>": 353,
+  "<extra_id_95>": 354,
+  "<extra_id_96>": 355,
+  "<extra_id_97>": 356,
+  "<extra_id_98>": 357,
+  "<extra_id_99>": 358,
+  "<extra_id_9>": 268
+}

config.json ADDED Viewed

	@@ -0,0 +1,96 @@

+{
+  "architectures": [
+    "Caputemendatoris"
+  ],
+  "byt5_config": {
+    "_attn_implementation_autoset": true,
+    "_name_or_path": "/lambda/nfs/pubcanontexas/LROCR/byt5-xl-ocr-finetuned",
+    "add_cross_attention": false,
+    "architectures": [
+      "T5ForConditionalGeneration"
+    ],
+    "bad_words_ids": null,
+    "begin_suppress_tokens": null,
+    "bos_token_id": null,
+    "chunk_size_feed_forward": 0,
+    "classifier_dropout": 0.0,
+    "cross_attention_hidden_size": null,
+    "d_ff": 6720,
+    "d_kv": 64,
+    "d_model": 2560,
+    "decoder_start_token_id": 0,
+    "dense_act_fn": "gelu_new",
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "dropout_rate": 0.1,
+    "early_stopping": false,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 1,
+    "exponential_decay_length_penalty": null,
+    "feed_forward_proj": "gated-gelu",
+    "finetuning_task": null,
+    "forced_bos_token_id": null,
+    "forced_eos_token_id": null,
+    "gradient_checkpointing": false,
+    "id2label": {
+      "0": "LABEL_0",
+      "1": "LABEL_1"
+    },
+    "initializer_factor": 1.0,
+    "is_decoder": false,
+    "is_encoder_decoder": true,
+    "is_gated_act": true,
+    "label2id": {
+      "LABEL_0": 0,
+      "LABEL_1": 1
+    },
+    "layer_norm_epsilon": 1e-06,
+    "length_penalty": 1.0,
+    "max_length": 20,
+    "min_length": 0,
+    "model_type": "t5",
+    "no_repeat_ngram_size": 0,
+    "num_beam_groups": 1,
+    "num_beams": 1,
+    "num_decoder_layers": 12,
+    "num_heads": 32,
+    "num_layers": 36,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_past": true,
+    "output_scores": false,
+    "pad_token_id": 0,
+    "prefix": null,
+    "problem_type": null,
+    "pruned_heads": {},
+    "relative_attention_max_distance": 128,
+    "relative_attention_num_buckets": 32,
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "sep_token_id": null,
+    "suppress_tokens": null,
+    "task_specific_params": null,
+    "temperature": 1.0,
+    "tf_legacy_loss": false,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": false,
+    "tokenizer_class": "ByT5Tokenizer",
+    "top_k": 50,
+    "top_p": 1.0,
+    "torch_dtype": "float32",
+    "torchscript": false,
+    "transformers_version": "4.51.0",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "use_cache": false,
+    "vocab_size": 384
+  },
+  "detector_hidden_dim": 512,
+  "max_position_embeddings": 256,
+  "model_type": "caputemendatoris",
+  "torch_dtype": "float32",
+  "transformers_version": "4.51.0"
+}

modeling_caputemendatoris.py ADDED Viewed

	@@ -0,0 +1,117 @@

+import torch
+import torch.nn as nn
+from transformers import (
+    PreTrainedModel,
+    T5ForConditionalGeneration,
+    T5Config,
+    AutoConfig,
+    AutoModel,
+)
+from transformers.configuration_utils import PretrainedConfig
+# ============================================================
+# Configuration
+# ============================================================
+class CaputemendatorisConfig(PretrainedConfig):
+    model_type = "caputemendatoris"
+    def __init__(
+        self,
+        byt5_config=None,
+        max_position_embeddings=256,
+        detector_hidden_dim=512,
+        **kwargs,
+    ):
+        super().__init__(**kwargs)
+        # Must allow None during save_pretrained() diff construction
+        self.byt5_config = byt5_config
+        self.max_position_embeddings = max_position_embeddings
+        self.detector_hidden_dim = detector_hidden_dim
+    def validate(self):
+        if self.byt5_config is None:
+            raise ValueError(
+                "Invalid Caputemendatoris config: byt5_config missing."
+            )
+# ============================================================
+# Model
+# ============================================================
+class Caputemendatoris(PreTrainedModel):
+    config_class = CaputemendatorisConfig
+    base_model_prefix = "caputemendatoris"
+    def __init__(self, config: CaputemendatorisConfig):
+        super().__init__(config)
+        # enforce real configuration during actual loading
+        if config.byt5_config is None:
+            raise ValueError(
+                "Caputemendatoris loaded without embedded ByT5 configuration."
+            )
+        # reconstruct finetuned ByT5
+        t5_config = T5Config(**config.byt5_config)
+        self.t5 = T5ForConditionalGeneration(t5_config)
+        self.encoder = self.t5.encoder
+        d_model = self.t5.config.d_model
+        # positional embedding (matches your training)
+        self.pos_emb = nn.Embedding(
+            config.max_position_embeddings,
+            d_model,
+        )
+        # detection head (identical to training architecture)
+        self.head = nn.Sequential(
+            nn.Linear(2 * d_model, config.detector_hidden_dim),
+            nn.LayerNorm(config.detector_hidden_dim),
+            nn.GELU(),
+            nn.Linear(config.detector_hidden_dim, 1),
+        )
+        self.post_init()
+    # ---------------- detection ----------------
+    def detect(self, input_ids, attention_mask=None):
+        enc = self.encoder(
+            input_ids=input_ids,
+            attention_mask=attention_mask,
+        )
+        hidden = enc.last_hidden_state
+        B, T, _ = hidden.shape
+        pos_ids = torch.arange(
+            T, device=input_ids.device
+        ).unsqueeze(0).expand(B, T)
+        pos = self.pos_emb(pos_ids)
+        h = torch.cat([hidden, pos], dim=-1)
+        return torch.sigmoid(self.head(h).squeeze(-1))
+    # forward = detector
+    def forward(self, input_ids=None, attention_mask=None, **kwargs):
+        return self.detect(input_ids, attention_mask)
+    # correction
+    def generate(self, **kwargs):
+        return self.t5.generate(**kwargs)
+# ============================================================
+# Registration (required for AutoModel)
+# ============================================================
+AutoConfig.register("caputemendatoris", CaputemendatorisConfig)
+AutoModel.register(CaputemendatorisConfig, Caputemendatoris)

pytorch_model-00001-of-00004.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2765e81a5d7c3767410fc072799fbf942cbc804006d4b27fce3e4dc23eaa5862
+size 4981819377

pytorch_model-00002-of-00004.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:94af50d39eaadeab2de11b38f4c14d438ebcb6cb993ef7c381554f6fdb41ba93
+size 4977892866

pytorch_model-00003-of-00004.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7743ca70f3ef1a2d658668fbe667500100aea51a2e536964e715561d49a7f88a
+size 4994334472

pytorch_model-00004-of-00004.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:918f4d8536cbad32679ec4e091540ebc9411456307c3be7e2fee321db197f5b1
+size 10496730

pytorch_model.bin.index.json ADDED Viewed

	@@ -0,0 +1,841 @@

+{
+  "metadata": {
+    "total_size": 14964322308
+  },
+  "weight_map": {
+    "encoder.block.0.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.0.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.0.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.0.layer.0.SelfAttention.relative_attention_bias.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.0.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.0.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.0.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.0.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.0.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.0.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.1.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.1.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.1.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.1.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.1.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.1.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.1.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.1.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.1.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.10.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.10.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.10.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.10.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.10.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.10.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.10.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.10.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.10.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.11.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.11.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.11.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.11.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.11.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.11.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.11.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.11.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.11.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.12.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.12.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.12.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.12.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.12.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.12.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.12.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.12.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.12.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.13.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.13.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.13.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.13.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.13.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.13.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.13.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.13.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.13.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.14.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.14.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.14.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.14.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.14.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.14.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.14.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.14.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.14.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.15.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.15.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.15.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.15.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.15.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.15.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.15.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.15.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.15.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.16.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.16.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.16.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.16.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.16.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.16.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.16.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.16.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.16.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.17.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.17.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.17.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.17.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.17.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.17.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.17.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.17.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.17.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.18.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.18.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.18.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.18.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.18.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.18.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.18.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.18.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.18.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.19.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.19.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.19.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.19.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.19.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.19.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.19.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.19.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.19.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.2.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.2.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.2.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.2.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.2.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.2.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.2.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.2.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.2.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.20.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.20.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.20.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.20.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.20.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.20.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.20.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.20.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.20.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.21.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.21.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.21.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.21.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.21.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.21.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.21.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.21.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.21.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.22.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.22.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.22.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.22.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.22.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.22.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.22.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.22.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.22.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.23.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.23.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.23.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.23.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.23.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.23.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.23.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.23.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.23.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.24.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.24.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.24.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.24.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.24.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.24.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.24.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.24.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.24.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.25.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.25.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.25.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.25.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.25.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.25.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.25.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.25.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.25.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.26.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.26.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.26.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.26.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.26.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.26.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.26.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.26.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.26.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.27.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.27.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.27.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.27.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.27.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.27.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.27.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.27.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.27.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.28.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.28.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.28.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.28.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.28.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.28.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.28.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.28.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.28.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.29.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.29.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.29.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.29.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.29.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.29.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.29.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.29.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.29.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.3.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.3.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.3.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.3.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.3.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.3.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.3.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.3.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.3.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.30.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.30.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.30.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.30.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.30.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.30.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.30.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.30.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.30.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.31.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.31.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.31.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.31.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.31.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.31.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.31.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.31.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.31.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.32.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.32.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.32.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.32.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.32.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.32.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.32.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.32.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.32.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.33.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.33.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.33.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.33.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.33.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.33.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.33.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.33.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.33.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.34.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.34.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.34.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.34.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.34.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "encoder.block.34.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00003-of-00004.bin",
+    "encoder.block.34.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00003-of-00004.bin",
+    "encoder.block.34.layer.1.DenseReluDense.wo.weight": "pytorch_model-00003-of-00004.bin",
+    "encoder.block.34.layer.1.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "encoder.block.35.layer.0.SelfAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "encoder.block.35.layer.0.SelfAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "encoder.block.35.layer.0.SelfAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "encoder.block.35.layer.0.SelfAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "encoder.block.35.layer.0.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "encoder.block.35.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00003-of-00004.bin",
+    "encoder.block.35.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00003-of-00004.bin",
+    "encoder.block.35.layer.1.DenseReluDense.wo.weight": "pytorch_model-00003-of-00004.bin",
+    "encoder.block.35.layer.1.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "encoder.block.4.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.4.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.4.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.4.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.4.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.4.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.4.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.4.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.4.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.5.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.5.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.5.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.5.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.5.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.5.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.5.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.5.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.5.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.6.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.6.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.6.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.6.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.6.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.6.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.6.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.6.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.6.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.7.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.7.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.7.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.7.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.7.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.7.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.7.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.7.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.7.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.8.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.8.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.8.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.8.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.8.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.8.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.8.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.8.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.8.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.9.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.9.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.9.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.9.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.9.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.9.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.9.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.9.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.block.9.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.embed_tokens.weight": "pytorch_model-00001-of-00004.bin",
+    "encoder.final_layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "head.0.bias": "pytorch_model-00004-of-00004.bin",
+    "head.0.weight": "pytorch_model-00004-of-00004.bin",
+    "head.1.bias": "pytorch_model-00004-of-00004.bin",
+    "head.1.weight": "pytorch_model-00004-of-00004.bin",
+    "head.3.bias": "pytorch_model-00004-of-00004.bin",
+    "head.3.weight": "pytorch_model-00004-of-00004.bin",
+    "pos_emb.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.0.layer.0.SelfAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.0.layer.0.SelfAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.0.layer.0.SelfAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.0.layer.0.SelfAttention.relative_attention_bias.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.0.layer.0.SelfAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.0.layer.0.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.0.layer.1.EncDecAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.0.layer.1.EncDecAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.0.layer.1.EncDecAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.0.layer.1.EncDecAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.0.layer.1.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.0.layer.2.DenseReluDense.wi_0.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.0.layer.2.DenseReluDense.wi_1.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.0.layer.2.DenseReluDense.wo.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.0.layer.2.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.1.layer.0.SelfAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.1.layer.0.SelfAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.1.layer.0.SelfAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.1.layer.0.SelfAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.1.layer.0.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.1.layer.1.EncDecAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.1.layer.1.EncDecAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.1.layer.1.EncDecAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.1.layer.1.EncDecAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.1.layer.1.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.1.layer.2.DenseReluDense.wi_0.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.1.layer.2.DenseReluDense.wi_1.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.1.layer.2.DenseReluDense.wo.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.1.layer.2.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.10.layer.0.SelfAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.10.layer.0.SelfAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.10.layer.0.SelfAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.10.layer.0.SelfAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.10.layer.0.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.10.layer.1.EncDecAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.10.layer.1.EncDecAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.10.layer.1.EncDecAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.10.layer.1.EncDecAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.10.layer.1.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.10.layer.2.DenseReluDense.wi_0.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.10.layer.2.DenseReluDense.wi_1.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.10.layer.2.DenseReluDense.wo.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.10.layer.2.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.11.layer.0.SelfAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.11.layer.0.SelfAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.11.layer.0.SelfAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.11.layer.0.SelfAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.11.layer.0.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.11.layer.1.EncDecAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.11.layer.1.EncDecAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.11.layer.1.EncDecAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.11.layer.1.EncDecAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.11.layer.1.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.11.layer.2.DenseReluDense.wi_0.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.11.layer.2.DenseReluDense.wi_1.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.11.layer.2.DenseReluDense.wo.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.11.layer.2.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.2.layer.0.SelfAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.2.layer.0.SelfAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.2.layer.0.SelfAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.2.layer.0.SelfAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.2.layer.0.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.2.layer.1.EncDecAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.2.layer.1.EncDecAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.2.layer.1.EncDecAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.2.layer.1.EncDecAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.2.layer.1.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.2.layer.2.DenseReluDense.wi_0.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.2.layer.2.DenseReluDense.wi_1.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.2.layer.2.DenseReluDense.wo.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.2.layer.2.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.3.layer.0.SelfAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.3.layer.0.SelfAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.3.layer.0.SelfAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.3.layer.0.SelfAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.3.layer.0.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.3.layer.1.EncDecAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.3.layer.1.EncDecAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.3.layer.1.EncDecAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.3.layer.1.EncDecAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.3.layer.1.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.3.layer.2.DenseReluDense.wi_0.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.3.layer.2.DenseReluDense.wi_1.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.3.layer.2.DenseReluDense.wo.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.3.layer.2.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.4.layer.0.SelfAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.4.layer.0.SelfAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.4.layer.0.SelfAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.4.layer.0.SelfAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.4.layer.0.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.4.layer.1.EncDecAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.4.layer.1.EncDecAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.4.layer.1.EncDecAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.4.layer.1.EncDecAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.4.layer.1.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.4.layer.2.DenseReluDense.wi_0.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.4.layer.2.DenseReluDense.wi_1.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.4.layer.2.DenseReluDense.wo.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.4.layer.2.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.5.layer.0.SelfAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.5.layer.0.SelfAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.5.layer.0.SelfAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.5.layer.0.SelfAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.5.layer.0.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.5.layer.1.EncDecAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.5.layer.1.EncDecAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.5.layer.1.EncDecAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.5.layer.1.EncDecAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.5.layer.1.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.5.layer.2.DenseReluDense.wi_0.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.5.layer.2.DenseReluDense.wi_1.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.5.layer.2.DenseReluDense.wo.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.5.layer.2.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.6.layer.0.SelfAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.6.layer.0.SelfAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.6.layer.0.SelfAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.6.layer.0.SelfAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.6.layer.0.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.6.layer.1.EncDecAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.6.layer.1.EncDecAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.6.layer.1.EncDecAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.6.layer.1.EncDecAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.6.layer.1.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.6.layer.2.DenseReluDense.wi_0.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.6.layer.2.DenseReluDense.wi_1.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.6.layer.2.DenseReluDense.wo.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.6.layer.2.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.7.layer.0.SelfAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.7.layer.0.SelfAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.7.layer.0.SelfAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.7.layer.0.SelfAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.7.layer.0.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.7.layer.1.EncDecAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.7.layer.1.EncDecAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.7.layer.1.EncDecAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.7.layer.1.EncDecAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.7.layer.1.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.7.layer.2.DenseReluDense.wi_0.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.7.layer.2.DenseReluDense.wi_1.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.7.layer.2.DenseReluDense.wo.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.7.layer.2.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.8.layer.0.SelfAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.8.layer.0.SelfAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.8.layer.0.SelfAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.8.layer.0.SelfAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.8.layer.0.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.8.layer.1.EncDecAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.8.layer.1.EncDecAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.8.layer.1.EncDecAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.8.layer.1.EncDecAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.8.layer.1.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.8.layer.2.DenseReluDense.wi_0.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.8.layer.2.DenseReluDense.wi_1.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.8.layer.2.DenseReluDense.wo.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.8.layer.2.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.9.layer.0.SelfAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.9.layer.0.SelfAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.9.layer.0.SelfAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.9.layer.0.SelfAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.9.layer.0.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.9.layer.1.EncDecAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.9.layer.1.EncDecAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.9.layer.1.EncDecAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.9.layer.1.EncDecAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.9.layer.1.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.9.layer.2.DenseReluDense.wi_0.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.9.layer.2.DenseReluDense.wi_1.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.9.layer.2.DenseReluDense.wo.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.block.9.layer.2.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.decoder.embed_tokens.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.decoder.final_layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.encoder.block.0.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.0.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.0.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.0.layer.0.SelfAttention.relative_attention_bias.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.0.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.0.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.0.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.0.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.0.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.0.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.1.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.1.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.1.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.1.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.1.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.1.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.1.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.1.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.1.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.10.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.10.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.10.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.10.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.10.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.10.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.10.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.10.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.10.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.11.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.11.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.11.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.11.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.11.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.11.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.11.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.11.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.11.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.12.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.12.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.12.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.12.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.12.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.12.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.12.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.12.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.12.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.13.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.13.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.13.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.13.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.13.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.13.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.13.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.13.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.13.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.14.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.14.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.14.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.14.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.14.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.14.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.14.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.14.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.14.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.15.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.15.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.15.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.15.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.15.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.15.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.15.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.15.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.15.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.16.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.16.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.16.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.16.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.16.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.16.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.16.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.16.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.16.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.17.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.17.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.17.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.17.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.17.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.17.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.17.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.17.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.17.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.18.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.18.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.18.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.18.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.18.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.18.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.18.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.18.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.18.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.19.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.19.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.19.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.19.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.19.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.19.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.19.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.19.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.19.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.2.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.2.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.2.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.2.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.2.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.2.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.2.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.2.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.2.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.20.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.20.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.20.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.20.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.20.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.20.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.20.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.20.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.20.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.21.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.21.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.21.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.21.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.21.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.21.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.21.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.21.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.21.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.22.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.22.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.22.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.22.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.22.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.22.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.22.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.22.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.22.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.23.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.23.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.23.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.23.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.23.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.23.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.23.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.23.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.23.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.24.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.24.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.24.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.24.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.24.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.24.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.24.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.24.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.24.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.25.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.25.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.25.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.25.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.25.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.25.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.25.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.25.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.25.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.26.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.26.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.26.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.26.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.26.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.26.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.26.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.26.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.26.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.27.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.27.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.27.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.27.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.27.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.27.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.27.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.27.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.27.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.28.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.28.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.28.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.28.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.28.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.28.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.28.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.28.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.28.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.29.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.29.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.29.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.29.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.29.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.29.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.29.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.29.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.29.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.3.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.3.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.3.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.3.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.3.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.3.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.3.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.3.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.3.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.30.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.30.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.30.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.30.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.30.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.30.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.30.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.30.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.30.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.31.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.31.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.31.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.31.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.31.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.31.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.31.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.31.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.31.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.32.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.32.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.32.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.32.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.32.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.32.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.32.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.32.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.32.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.33.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.33.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.33.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.33.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.33.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.33.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.33.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.33.layer.1.DenseReluDense.wo.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.33.layer.1.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.34.layer.0.SelfAttention.k.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.34.layer.0.SelfAttention.o.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.34.layer.0.SelfAttention.q.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.34.layer.0.SelfAttention.v.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.34.layer.0.layer_norm.weight": "pytorch_model-00002-of-00004.bin",
+    "t5.encoder.block.34.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.encoder.block.34.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.encoder.block.34.layer.1.DenseReluDense.wo.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.encoder.block.34.layer.1.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.encoder.block.35.layer.0.SelfAttention.k.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.encoder.block.35.layer.0.SelfAttention.o.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.encoder.block.35.layer.0.SelfAttention.q.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.encoder.block.35.layer.0.SelfAttention.v.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.encoder.block.35.layer.0.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.encoder.block.35.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.encoder.block.35.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.encoder.block.35.layer.1.DenseReluDense.wo.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.encoder.block.35.layer.1.layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.encoder.block.4.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.4.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.4.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.4.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.4.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.4.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.4.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.4.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.4.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.5.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.5.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.5.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.5.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.5.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.5.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.5.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.5.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.5.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.6.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.6.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.6.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.6.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.6.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.6.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.6.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.6.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.6.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.7.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.7.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.7.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.7.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.7.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.7.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.7.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.7.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.7.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.8.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.8.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.8.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.8.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.8.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.8.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.8.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.8.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.8.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.9.layer.0.SelfAttention.k.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.9.layer.0.SelfAttention.o.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.9.layer.0.SelfAttention.q.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.9.layer.0.SelfAttention.v.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.9.layer.0.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.9.layer.1.DenseReluDense.wi_0.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.9.layer.1.DenseReluDense.wi_1.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.9.layer.1.DenseReluDense.wo.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.block.9.layer.1.layer_norm.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.embed_tokens.weight": "pytorch_model-00001-of-00004.bin",
+    "t5.encoder.final_layer_norm.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.lm_head.weight": "pytorch_model-00003-of-00004.bin",
+    "t5.shared.weight": "pytorch_model-00001-of-00004.bin"
+  }
+}

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,150 @@

+{
+  "additional_special_tokens": [
+    "<extra_id_0>",
+    "<extra_id_1>",
+    "<extra_id_2>",
+    "<extra_id_3>",
+    "<extra_id_4>",
+    "<extra_id_5>",
+    "<extra_id_6>",
+    "<extra_id_7>",
+    "<extra_id_8>",
+    "<extra_id_9>",
+    "<extra_id_10>",
+    "<extra_id_11>",
+    "<extra_id_12>",
+    "<extra_id_13>",
+    "<extra_id_14>",
+    "<extra_id_15>",
+    "<extra_id_16>",
+    "<extra_id_17>",
+    "<extra_id_18>",
+    "<extra_id_19>",
+    "<extra_id_20>",
+    "<extra_id_21>",
+    "<extra_id_22>",
+    "<extra_id_23>",
+    "<extra_id_24>",
+    "<extra_id_25>",
+    "<extra_id_26>",
+    "<extra_id_27>",
+    "<extra_id_28>",
+    "<extra_id_29>",
+    "<extra_id_30>",
+    "<extra_id_31>",
+    "<extra_id_32>",
+    "<extra_id_33>",
+    "<extra_id_34>",
+    "<extra_id_35>",
+    "<extra_id_36>",
+    "<extra_id_37>",
+    "<extra_id_38>",
+    "<extra_id_39>",
+    "<extra_id_40>",
+    "<extra_id_41>",
+    "<extra_id_42>",
+    "<extra_id_43>",
+    "<extra_id_44>",
+    "<extra_id_45>",
+    "<extra_id_46>",
+    "<extra_id_47>",
+    "<extra_id_48>",
+    "<extra_id_49>",
+    "<extra_id_50>",
+    "<extra_id_51>",
+    "<extra_id_52>",
+    "<extra_id_53>",
+    "<extra_id_54>",
+    "<extra_id_55>",
+    "<extra_id_56>",
+    "<extra_id_57>",
+    "<extra_id_58>",
+    "<extra_id_59>",
+    "<extra_id_60>",
+    "<extra_id_61>",
+    "<extra_id_62>",
+    "<extra_id_63>",
+    "<extra_id_64>",
+    "<extra_id_65>",
+    "<extra_id_66>",
+    "<extra_id_67>",
+    "<extra_id_68>",
+    "<extra_id_69>",
+    "<extra_id_70>",
+    "<extra_id_71>",
+    "<extra_id_72>",
+    "<extra_id_73>",
+    "<extra_id_74>",
+    "<extra_id_75>",
+    "<extra_id_76>",
+    "<extra_id_77>",
+    "<extra_id_78>",
+    "<extra_id_79>",
+    "<extra_id_80>",
+    "<extra_id_81>",
+    "<extra_id_82>",
+    "<extra_id_83>",
+    "<extra_id_84>",
+    "<extra_id_85>",
+    "<extra_id_86>",
+    "<extra_id_87>",
+    "<extra_id_88>",
+    "<extra_id_89>",
+    "<extra_id_90>",
+    "<extra_id_91>",
+    "<extra_id_92>",
+    "<extra_id_93>",
+    "<extra_id_94>",
+    "<extra_id_95>",
+    "<extra_id_96>",
+    "<extra_id_97>",
+    "<extra_id_98>",
+    "<extra_id_99>",
+    "<extra_id_100>",
+    "<extra_id_101>",
+    "<extra_id_102>",
+    "<extra_id_103>",
+    "<extra_id_104>",
+    "<extra_id_105>",
+    "<extra_id_106>",
+    "<extra_id_107>",
+    "<extra_id_108>",
+    "<extra_id_109>",
+    "<extra_id_110>",
+    "<extra_id_111>",
+    "<extra_id_112>",
+    "<extra_id_113>",
+    "<extra_id_114>",
+    "<extra_id_115>",
+    "<extra_id_116>",
+    "<extra_id_117>",
+    "<extra_id_118>",
+    "<extra_id_119>",
+    "<extra_id_120>",
+    "<extra_id_121>",
+    "<extra_id_122>",
+    "<extra_id_123>",
+    "<extra_id_124>"
+  ],
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<pad>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,1163 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "259": {
+      "content": "<extra_id_0>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "260": {
+      "content": "<extra_id_1>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "261": {
+      "content": "<extra_id_2>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "262": {
+      "content": "<extra_id_3>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "263": {
+      "content": "<extra_id_4>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "264": {
+      "content": "<extra_id_5>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "265": {
+      "content": "<extra_id_6>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "266": {
+      "content": "<extra_id_7>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "267": {
+      "content": "<extra_id_8>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "268": {
+      "content": "<extra_id_9>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "269": {
+      "content": "<extra_id_10>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "270": {
+      "content": "<extra_id_11>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "271": {
+      "content": "<extra_id_12>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "272": {
+      "content": "<extra_id_13>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "273": {
+      "content": "<extra_id_14>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "274": {
+      "content": "<extra_id_15>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "275": {
+      "content": "<extra_id_16>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "276": {
+      "content": "<extra_id_17>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "277": {
+      "content": "<extra_id_18>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "278": {
+      "content": "<extra_id_19>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "279": {
+      "content": "<extra_id_20>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "280": {
+      "content": "<extra_id_21>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "281": {
+      "content": "<extra_id_22>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "282": {
+      "content": "<extra_id_23>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "283": {
+      "content": "<extra_id_24>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "284": {
+      "content": "<extra_id_25>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "285": {
+      "content": "<extra_id_26>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "286": {
+      "content": "<extra_id_27>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "287": {
+      "content": "<extra_id_28>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "288": {
+      "content": "<extra_id_29>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "289": {
+      "content": "<extra_id_30>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "290": {
+      "content": "<extra_id_31>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "291": {
+      "content": "<extra_id_32>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "292": {
+      "content": "<extra_id_33>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "293": {
+      "content": "<extra_id_34>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "294": {
+      "content": "<extra_id_35>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "295": {
+      "content": "<extra_id_36>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "296": {
+      "content": "<extra_id_37>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "297": {
+      "content": "<extra_id_38>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "298": {
+      "content": "<extra_id_39>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "299": {
+      "content": "<extra_id_40>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "300": {
+      "content": "<extra_id_41>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "301": {
+      "content": "<extra_id_42>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "302": {
+      "content": "<extra_id_43>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "303": {
+      "content": "<extra_id_44>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "304": {
+      "content": "<extra_id_45>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "305": {
+      "content": "<extra_id_46>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "306": {
+      "content": "<extra_id_47>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "307": {
+      "content": "<extra_id_48>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "308": {
+      "content": "<extra_id_49>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "309": {
+      "content": "<extra_id_50>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "310": {
+      "content": "<extra_id_51>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "311": {
+      "content": "<extra_id_52>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "312": {
+      "content": "<extra_id_53>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "313": {
+      "content": "<extra_id_54>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "314": {
+      "content": "<extra_id_55>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "315": {
+      "content": "<extra_id_56>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "316": {
+      "content": "<extra_id_57>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "317": {
+      "content": "<extra_id_58>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "318": {
+      "content": "<extra_id_59>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "319": {
+      "content": "<extra_id_60>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "320": {
+      "content": "<extra_id_61>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "321": {
+      "content": "<extra_id_62>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "322": {
+      "content": "<extra_id_63>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "323": {
+      "content": "<extra_id_64>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "324": {
+      "content": "<extra_id_65>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "325": {
+      "content": "<extra_id_66>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "326": {
+      "content": "<extra_id_67>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "327": {
+      "content": "<extra_id_68>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "328": {
+      "content": "<extra_id_69>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "329": {
+      "content": "<extra_id_70>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "330": {
+      "content": "<extra_id_71>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "331": {
+      "content": "<extra_id_72>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "332": {
+      "content": "<extra_id_73>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "333": {
+      "content": "<extra_id_74>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "334": {
+      "content": "<extra_id_75>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "335": {
+      "content": "<extra_id_76>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "336": {
+      "content": "<extra_id_77>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "337": {
+      "content": "<extra_id_78>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "338": {
+      "content": "<extra_id_79>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "339": {
+      "content": "<extra_id_80>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "340": {
+      "content": "<extra_id_81>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "341": {
+      "content": "<extra_id_82>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "342": {
+      "content": "<extra_id_83>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "343": {
+      "content": "<extra_id_84>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "344": {
+      "content": "<extra_id_85>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "345": {
+      "content": "<extra_id_86>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "346": {
+      "content": "<extra_id_87>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "347": {
+      "content": "<extra_id_88>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "348": {
+      "content": "<extra_id_89>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "349": {
+      "content": "<extra_id_90>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "350": {
+      "content": "<extra_id_91>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "351": {
+      "content": "<extra_id_92>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "352": {
+      "content": "<extra_id_93>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "353": {
+      "content": "<extra_id_94>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "354": {
+      "content": "<extra_id_95>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "355": {
+      "content": "<extra_id_96>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "356": {
+      "content": "<extra_id_97>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "357": {
+      "content": "<extra_id_98>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "358": {
+      "content": "<extra_id_99>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "359": {
+      "content": "<extra_id_100>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "360": {
+      "content": "<extra_id_101>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "361": {
+      "content": "<extra_id_102>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "362": {
+      "content": "<extra_id_103>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "363": {
+      "content": "<extra_id_104>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "364": {
+      "content": "<extra_id_105>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "365": {
+      "content": "<extra_id_106>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "366": {
+      "content": "<extra_id_107>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "367": {
+      "content": "<extra_id_108>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "368": {
+      "content": "<extra_id_109>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "369": {
+      "content": "<extra_id_110>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "370": {
+      "content": "<extra_id_111>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "371": {
+      "content": "<extra_id_112>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "372": {
+      "content": "<extra_id_113>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "373": {
+      "content": "<extra_id_114>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "374": {
+      "content": "<extra_id_115>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "375": {
+      "content": "<extra_id_116>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "376": {
+      "content": "<extra_id_117>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "377": {
+      "content": "<extra_id_118>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "378": {
+      "content": "<extra_id_119>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "379": {
+      "content": "<extra_id_120>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "380": {
+      "content": "<extra_id_121>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "381": {
+      "content": "<extra_id_122>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "382": {
+      "content": "<extra_id_123>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "383": {
+      "content": "<extra_id_124>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [
+    "<extra_id_0>",
+    "<extra_id_1>",
+    "<extra_id_2>",
+    "<extra_id_3>",
+    "<extra_id_4>",
+    "<extra_id_5>",
+    "<extra_id_6>",
+    "<extra_id_7>",
+    "<extra_id_8>",
+    "<extra_id_9>",
+    "<extra_id_10>",
+    "<extra_id_11>",
+    "<extra_id_12>",
+    "<extra_id_13>",
+    "<extra_id_14>",
+    "<extra_id_15>",
+    "<extra_id_16>",
+    "<extra_id_17>",
+    "<extra_id_18>",
+    "<extra_id_19>",
+    "<extra_id_20>",
+    "<extra_id_21>",
+    "<extra_id_22>",
+    "<extra_id_23>",
+    "<extra_id_24>",
+    "<extra_id_25>",
+    "<extra_id_26>",
+    "<extra_id_27>",
+    "<extra_id_28>",
+    "<extra_id_29>",
+    "<extra_id_30>",
+    "<extra_id_31>",
+    "<extra_id_32>",
+    "<extra_id_33>",
+    "<extra_id_34>",
+    "<extra_id_35>",
+    "<extra_id_36>",
+    "<extra_id_37>",
+    "<extra_id_38>",
+    "<extra_id_39>",
+    "<extra_id_40>",
+    "<extra_id_41>",
+    "<extra_id_42>",
+    "<extra_id_43>",
+    "<extra_id_44>",
+    "<extra_id_45>",
+    "<extra_id_46>",
+    "<extra_id_47>",
+    "<extra_id_48>",
+    "<extra_id_49>",
+    "<extra_id_50>",
+    "<extra_id_51>",
+    "<extra_id_52>",
+    "<extra_id_53>",
+    "<extra_id_54>",
+    "<extra_id_55>",
+    "<extra_id_56>",
+    "<extra_id_57>",
+    "<extra_id_58>",
+    "<extra_id_59>",
+    "<extra_id_60>",
+    "<extra_id_61>",
+    "<extra_id_62>",
+    "<extra_id_63>",
+    "<extra_id_64>",
+    "<extra_id_65>",
+    "<extra_id_66>",
+    "<extra_id_67>",
+    "<extra_id_68>",
+    "<extra_id_69>",
+    "<extra_id_70>",
+    "<extra_id_71>",
+    "<extra_id_72>",
+    "<extra_id_73>",
+    "<extra_id_74>",
+    "<extra_id_75>",
+    "<extra_id_76>",
+    "<extra_id_77>",
+    "<extra_id_78>",
+    "<extra_id_79>",
+    "<extra_id_80>",
+    "<extra_id_81>",
+    "<extra_id_82>",
+    "<extra_id_83>",
+    "<extra_id_84>",
+    "<extra_id_85>",
+    "<extra_id_86>",
+    "<extra_id_87>",
+    "<extra_id_88>",
+    "<extra_id_89>",
+    "<extra_id_90>",
+    "<extra_id_91>",
+    "<extra_id_92>",
+    "<extra_id_93>",
+    "<extra_id_94>",
+    "<extra_id_95>",
+    "<extra_id_96>",
+    "<extra_id_97>",
+    "<extra_id_98>",
+    "<extra_id_99>",
+    "<extra_id_100>",
+    "<extra_id_101>",
+    "<extra_id_102>",
+    "<extra_id_103>",
+    "<extra_id_104>",
+    "<extra_id_105>",
+    "<extra_id_106>",
+    "<extra_id_107>",
+    "<extra_id_108>",
+    "<extra_id_109>",
+    "<extra_id_110>",
+    "<extra_id_111>",
+    "<extra_id_112>",
+    "<extra_id_113>",
+    "<extra_id_114>",
+    "<extra_id_115>",
+    "<extra_id_116>",
+    "<extra_id_117>",
+    "<extra_id_118>",
+    "<extra_id_119>",
+    "<extra_id_120>",
+    "<extra_id_121>",
+    "<extra_id_122>",
+    "<extra_id_123>",
+    "<extra_id_124>"
+  ],
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "</s>",
+  "extra_ids": 0,
+  "extra_special_tokens": {},
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "<pad>",
+  "tokenizer_class": "ByT5Tokenizer",
+  "unk_token": "<unk>"
+}