Abner0803
/

GRU_Transformer_simple

Model card Files Files and versions

Abner0803 commited on Jan 10

Commit

b5fde4b

·

verified ·

1 Parent(s): 35fbe61

Create README.md

Files changed (1) hide show

README.md +55 -0

README.md ADDED Viewed

	@@ -0,0 +1,55 @@

+## Model Structure
+```python
+class GRUTransformerSimple(nn.Module):
+    def __init__(
+        self,
+        d_feat: int = 8,
+        hidden_size: int = 64,
+        num_layers: int = 1,
+        dropout: float = 0.0,
+    ) -> None:
+        super().__init__()
+        self.transformer_encoder_layer = nn.TransformerEncoderLayer(
+            d_model=hidden_size,
+            nhead=4,
+            dim_feedforward=hidden_size * 4,
+            dropout=dropout,
+            activation="relu",
+            batch_first=False,
+        )
+        self.transformer_encoder = nn.TransformerEncoder(
+            self.transformer_encoder_layer, num_layers=num_layers
+        )
+        self.gru = nn.GRU(
+            input_size=d_feat,
+            hidden_size=hidden_size,
+            num_layers=num_layers,
+            batch_first=True,
+            dropout=dropout,
+        )
+        self.out = nn.Sequential(
+            nn.Linear(hidden_size, hidden_size), nn.GELU(), nn.Linear(hidden_size, 1)
+        )
+    def forward(self, x: torch.Tensor) -> torch.Tensor:
+        b, t, s, f = x.shape
+        x = x.permute(0, 2, 1, 3).reshape(b * s, t, f)
+        gru_out, _ = self.gru(x)  # [b * s, t, h]
+        gru_out = gru_out.permute(1, 0, 2).contiguous()  # [t, b * s, h]
+        tfm_out = self.transformer_encoder(gru_out)  # [t, b * s, h]
+        tfm_out = tfm_out[-1].reshape(b, s, -1)  # [b, s, h]
+        final_out = self.out(tfm_out).squeeze(-1)  # [b, s]
+        return final_out
+```
+## Model Config
+```yaml
+d_feat: 8
+hidden_size: 64
+num_layers: 1
+dropout: 0.0
+```