ShaswatRobotics
/

world_model_test

Model card Files Files and versions

ShaswatRobotics commited on Dec 29, 2025

Commit

f04cbea

·

verified ·

1 Parent(s): cb06601

Update iris/src/tokenizer.py

Files changed (1) hide show

iris/src/tokenizer.py +9 -8

iris/src/tokenizer.py CHANGED Viewed

@@ -12,15 +12,16 @@ from .models.lpips import LPIPS
 from .models.nets import Encoder, Decoder
 class Tokenizer(nn.Module):
-    def __init__(self, vocab_size: int, embed_dim: int, encoder: Encoder, decoder: Decoder, with_lpips: bool = True) -> None:
         super().__init__()
-        self.vocab_size = vocab_size
-        self.encoder = encoder
-        self.pre_quant_conv = torch.nn.Conv2d(encoder.config.z_channels, embed_dim, 1)
-        self.embedding = nn.Embedding(vocab_size, embed_dim)
-        self.post_quant_conv = torch.nn.Conv2d(embed_dim, decoder.config.z_channels, 1)
-        self.decoder = decoder
-        self.embedding.weight.data.uniform_(-1.0 / vocab_size, 1.0 / vocab_size)
         self.lpips = LPIPS().eval() if with_lpips else None
     def __repr__(self) -> str:

 from .models.nets import Encoder, Decoder
 class Tokenizer(nn.Module):
+    def __init__(self, config: dict, with_lpips: bool = True) -> None:
         super().__init__()
+        self.vocab_size = config["vocab_size"]
+        self.embed_dim = config["embed_dim"]
+        self.encoder = Encoder(config)
+        self.pre_quant_conv = torch.nn.Conv2d(encoder.config.z_channels, self.embed_dim, 1)
+        self.embedding = nn.Embedding(self.vocab_size, self.embed_dim)
+        self.post_quant_conv = torch.nn.Conv2d(self.embed_dim, decoder.config.z_channels, 1)
+        self.decoder = Decoder(config)
+        self.embedding.weight.data.uniform_(-1.0 / self.vocab_size, 1.0 / self.vocab_size)
         self.lpips = LPIPS().eval() if with_lpips else None
     def __repr__(self) -> str: