Upload weight-space autoencoder (encoder + decoder) and configuration

Browse files

Files changed (5) hide show

README.md +42 -0
config.yaml +111 -0
decoder.pt +3 -0
encoder.pt +3 -0
tokenizer_config.json +7 -0

README.md ADDED Viewed

	@@ -0,0 +1,42 @@

+---
+tags:
+- weight-space-learning
+- neural-network-autoencoder
+- autoencoder
+- transformer
+datasets:
+- maximuspowers/muat-fourier-5
+---
+# Weight-Space Autoencoder (TRANSFORMER)
+This model is a weight-space autoencoder trained on neural network activation weights/signatures.
+It includes both an encoder (compresses weights into latent representations) and a decoder (reconstructs weights from latent codes).
+## Model Description
+- **Architecture**: Transformer encoder-decoder
+- **Training Dataset**: maximuspowers/muat-fourier-5
+- **Input Mode**: signature
+- **Latent Dimension**: 256
+## Tokenization
+- **Chunk Size**: 64 weight values per token
+- **Max Tokens**: 512
+- **Metadata**: True
+## Training Config
+- **Loss Function**: cosine
+- **Optimizer**: adam
+- **Learning Rate**: 0.0001
+- **Batch Size**: 16
+## Performance Metrics (Test Set)
+- **MSE**: 0.299696
+- **MAE**: 0.303521
+- **RMSE**: 0.547445
+- **Cosine Similarity**: 0.8642
+- **R² Score**: 0.0638

config.yaml ADDED Viewed

	@@ -0,0 +1,111 @@

+architecture:
+  latent_dim: 256
+  mlp:
+    decoder:
+      activation: relu
+      batch_norm: true
+      dropout: 0.2
+      hidden_dims:
+      - 256
+      - 384
+      - 512
+    encoder:
+      activation: relu
+      batch_norm: true
+      dropout: 0.2
+      hidden_dims:
+      - 512
+      - 384
+      - 256
+    token_pooling: mean
+  transformer:
+    decoder:
+      activation: relu
+      d_model: 512
+      dim_feedforward: 2048
+      dropout: 0.1
+      num_heads: 8
+      num_layers: 6
+    encoder:
+      activation: relu
+      d_model: 512
+      dim_feedforward: 2048
+      dropout: 0.1
+      num_heads: 8
+      num_layers: 6
+      pooling: mean
+      positional_encoding: learned
+  type: transformer
+dataloader:
+  num_workers: 0
+  pin_memory: true
+dataset:
+  hf_dataset: maximuspowers/muat-fourier-5
+  input_mode: signature
+  max_dimensions:
+    max_hidden_layers: 6
+    max_neurons_per_layer: 8
+    max_sequence_length: 5
+  neuron_profile:
+    methods:
+    - fourier
+  random_seed: 42
+  test_split: 0.1
+  train_split: 0.8
+  val_split: 0.1
+device:
+  type: auto
+evaluation:
+  metrics:
+  - mse
+  - mae
+  - rmse
+  - cosine_similarity
+  - relative_error
+  - r2_score
+  per_layer_metrics: false
+hub:
+  enabled: true
+  private: false
+  push_logs: true
+  push_metrics: true
+  push_model: true
+  repo_id: maximuspowers/sig-autoencoder-fourier-5
+  token: <REDACTED>
+logging:
+  checkpoint:
+    enabled: true
+    mode: min
+    monitor: val_loss
+    save_best_only: true
+  tensorboard:
+    auto_launch: true
+    enabled: true
+    log_interval: 10
+    port: 6006
+  verbose: true
+loss:
+  type: cosine
+run_dir: /Users/max/Desktop/muat/model_zoo/runs/train-encoder-decoder_config_2025-12-10_13-14-11
+run_log_cleanup: false
+tokenization:
+  chunk_size: 64
+  include_metadata: true
+  max_tokens: 512
+training:
+  batch_size: 16
+  early_stopping:
+    enabled: true
+    mode: min
+    monitor: val_loss
+    patience: 5
+  epochs: 100
+  learning_rate: 0.0001
+  lr_scheduler:
+    enabled: true
+    factor: 0.5
+    min_lr: 1.0e-06
+    patience: 3
+    type: reduce_on_plateau
+  optimizer: adam
+  weight_decay: 0.0001

decoder.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a45a2663fc4303166220a9800ddc9166f0649d6709331b5a8b0207c5d8ae41cb
+size 102657998

encoder.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9deab4af43381f8b2516638e872c770b3b7fee2f44e57a1c86f0b4e4b8fce98e
+size 77405804

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "chunk_size": 64,
+  "max_tokens": 512,
+  "include_metadata": true,
+  "metadata_features": 5,
+  "token_dim": 69
+}