Allanatrix commited on Apr 18

Commit

97ced61

verified ·

1 Parent(s): 920e102

Upload NexaMass V3 safetensors weights and release metadata

Browse files

Files changed (30) hide show

README.md +7 -4
config.json +63 -0
configs/foundation_config.json +98 -0
configs/runtime_requirements.json +21 -0
configs/structure_alignment_config.json +162 -0
metadata/Final_V3_manifest.json +10 -0
metadata/archive/20260413T201817Z/latest_checkpoint.txt +1 -0
metadata/archive/20260413T202042Z/latest_checkpoint.txt +1 -0
metadata/archive/20260413T213902Z/day1_validation_report.json +2475 -0
metadata/archive/20260413T213902Z/latest_checkpoint.txt +1 -0
metadata/archive/20260413T213902Z/latest_metrics.json +169 -0
metadata/archive/20260413T213902Z/perf_summary.json +16 -0
metadata/archive/20260413T213902Z/results.md +171 -0
metadata/checksums.sha256 +29 -0
metadata/closeout_receipt.json +9 -0
metadata/day1_validation_report.json +2475 -0
metadata/eval_coverage.json +46 -0
metadata/fast_eval_surface.json +14 -0
metadata/latest_checkpoint.txt +1 -0
metadata/latest_metrics.json +169 -0
metadata/perf_summary.json +16 -0
metadata/results.md +171 -0
metadata/training_surface.json +68 -0
model_index.json +48 -0
runtime/README.md +14 -0
runtime/nexamass_encoder.py +139 -0
weights/Final_V3-model_state.pt +3 -0
weights/Final_V3-model_state.safetensors +3 -0
weights/NexaMass-V3-Struct-model_state.pt +3 -0
weights/NexaMass-V3-Struct-model_state.safetensors +3 -0

README.md CHANGED Viewed

@@ -30,7 +30,7 @@ The model was developed as part of the Nexa MS/MS pipeline. The foundation check
 ## Model Summary
-`NexaMass-V3-Struct` is an encoder-only transformer with approximately `12.38M` trainable parameters. The checkpoint is approximately `153 MB`, making it substantially smaller than many public MS/MS representation or chemistry foundation checkpoints. The model uses `256` peak tokens, an input feature width of `8`, hidden dimension `384`, `6` transformer layers, `8` attention heads, feed-forward dimension `1536`, dropout `0.1`, SSL projection dimension `192`, RDKit Morgan fingerprint dimension `2048`, target projection dimension `256`, and retrieval MLP hidden dimension `512`.
 The model contains a spectral transformer backbone, an SSL projection head, a Morgan fingerprint structure head, a spectrum-side retrieval query projection, a fingerprint-side target projection, and experimental retrieval/reranking heads. The strongest current inference surface is the Morgan fingerprint prediction and candidate-bank decode path. The trained retrieval projection is included for research, but it is not promoted as a reliable final decision layer.
@@ -40,6 +40,9 @@ Use this model to embed MS/MS spectra, build nearest-neighbor or clustering anal
 Do not use this model as an unrestricted de novo structure generator. Do not treat the top-ranked candidate as a production-grade molecular identification without external validation. Do not treat the raw confidence or score gap as calibrated probability. Candidate outputs should be validated with chemistry-aware checks such as RDKit sanitization, formula and exact-mass agreement, precursor/adduct compatibility, fingerprint similarity, and spectrum-to-candidate consistency.
 ## Inference Contract
 The recommended inference path is spectrum-to-embedding plus candidate-bank decoding. A spectrum is converted into a normalized embedding and a `2048`-dimensional Morgan fingerprint probability vector. That vector is compared against candidate molecular fingerprints from a known bank. The output should be a ranked shortlist with validation metadata, not a single unqualified structure claim.
@@ -60,9 +63,9 @@ The structure-aligned checkpoint, `NexaMass-V3-Struct`, resumed from the foundat
 ## Evaluation
-The structure-aligned checkpoint reached validation structure BCE `0.0653`, validation fingerprint cosine `0.4255`, and embedding standard deviation `0.0722` in the V26 alignment run. A candidate-bank structure gallery over `20` displayed validation examples recovered `11` exact fingerprint-decoded molecular identities through the fingerprint decode path. The same gallery recovered `0` exact identities through the trained retrieval projection, which is why the card treats ranking as an open decision-layer problem rather than a solved property.
-On a MassSpecGym retrieval adapter using the frozen V3 projected-dot scorer, the model reached validation Hit@1 `0.1162`, Hit@5 `0.1915`, and Hit@20 `0.3328`. On the MassSpecGym test dataloader under Hit@k-only evaluation, it reached Hit@1 `0.0627`, Hit@5 `0.1753`, and Hit@20 `0.3505`. This places the model above lower MassSpecGym retrieval baselines such as Random, DeepSets, Fingerprint FFN, and DeepSets with Fourier features, but below specialized retrieval systems such as MIST. The result should be interpreted as evidence of useful top-k narrowing, not leaderboard-grade retrieval.
 Internal larger-bank pressure tests also support a bounded interpretation. On a roughly `29k` unique-identity candidate bank, the frozen projected-dot scorer beat random and compressed candidate rank substantially, but exact local discrimination remained weak. The best current read is that the model contains real structure and retrieval signal, while top-1 ranking and calibrated confidence require additional downstream machinery.
@@ -78,7 +81,7 @@ MS/MS structure inference can affect downstream scientific interpretation. Users
 ## Citation
-If you use this model, cite the NexaMass project release and the accompanying technical report or paper draft when available. Relevant background work includes DreaMS for self-supervised MS/MS representation learning, MassSpecGym for benchmark framing, CSI:FingerID for fingerprint-mediated candidate search, and related spectra-structure retrieval and de novo generation systems such as MIST, MSNovelist, CMSSP, CSU-MS2, MSBERT, Spec2Mol, and MS2Mol.
 ## Recommended Name

 ## Model Summary
+`NexaMass-V3-Struct` is an encoder-only transformer with `14,106,690` trainable parameters. The full training checkpoint is approximately `153 MB` in object storage, while the public model-state weights are approximately `54 MB` per checkpoint and are provided in both PyTorch and Safetensors formats, making the released model substantially smaller than many public MS/MS representation or chemistry foundation checkpoints. The model uses `256` peak tokens, an input feature width of `8`, hidden dimension `384`, `6` transformer layers, `8` attention heads, feed-forward dimension `1536`, dropout `0.1`, SSL projection dimension `192`, RDKit Morgan fingerprint dimension `2048`, target projection dimension `256`, and retrieval MLP hidden dimension `512`.
 The model contains a spectral transformer backbone, an SSL projection head, a Morgan fingerprint structure head, a spectrum-side retrieval query projection, a fingerprint-side target projection, and experimental retrieval/reranking heads. The strongest current inference surface is the Morgan fingerprint prediction and candidate-bank decode path. The trained retrieval projection is included for research, but it is not promoted as a reliable final decision layer.
 Do not use this model as an unrestricted de novo structure generator. Do not treat the top-ranked candidate as a production-grade molecular identification without external validation. Do not treat the raw confidence or score gap as calibrated probability. Candidate outputs should be validated with chemistry-aware checks such as RDKit sanitization, formula and exact-mass agreement, precursor/adduct compatibility, fingerprint similarity, and spectrum-to-candidate consistency.
+The preferred public inference files are `weights/NexaMass-V3-Struct-model_state.safetensors` and `weights/Final_V3-model_state.safetensors`. PyTorch model-state `.pt` fallbacks are included for compatibility. Optimizer-bearing full training checkpoints are retained in Wasabi/object storage and are not part of the public Hugging Face payload.
 ## Inference Contract
 The recommended inference path is spectrum-to-embedding plus candidate-bank decoding. A spectrum is converted into a normalized embedding and a `2048`-dimensional Morgan fingerprint probability vector. That vector is compared against candidate molecular fingerprints from a known bank. The output should be a ranked shortlist with validation metadata, not a single unqualified structure claim.
 ## Evaluation
+The structure-aligned checkpoint reached validation structure BCE `0.0653`, validation fingerprint cosine `0.4255`, and embedding standard deviation `0.0722` in the V26 alignment run. A candidate-bank structure gallery over `20` displayed validation examples matched the ground-truth candidate identity in `11` cases through the fingerprint decode path. The same gallery matched `0` exact identities through the trained retrieval projection, which is why the card treats ranking as an open decision-layer problem rather than a solved property.
+On a MassSpecGym retrieval adapter using the frozen V3 projected-dot scorer, the model reached validation Hit@1 `0.1162`, Hit@5 `0.1915`, and Hit@20 `0.3328`. On the MassSpecGym test dataloader under Hit@k-only evaluation, it reached Hit@1 `0.0627`, Hit@5 `0.1753`, and Hit@20 `0.3505`. This Hit@20-only adapter comparison places the model above lower MassSpecGym retrieval baselines such as Random, DeepSets, Fingerprint FFN, and DeepSets with Fourier features, but below specialized retrieval systems such as MIST. The result should be interpreted as evidence of useful top-k narrowing, not leaderboard-grade retrieval.
 Internal larger-bank pressure tests also support a bounded interpretation. On a roughly `29k` unique-identity candidate bank, the frozen projected-dot scorer beat random and compressed candidate rank substantially, but exact local discrimination remained weak. The best current read is that the model contains real structure and retrieval signal, while top-1 ranking and calibrated confidence require additional downstream machinery.
 ## Citation
+If you use this model, cite the NexaMass project release and the accompanying technical report when available. Relevant background work includes DreaMS for self-supervised MS/MS representation learning, MassSpecGym for benchmark framing, CSI:FingerID for fingerprint-mediated candidate search, and related spectra-structure retrieval and de novo generation systems such as MIST, MSNovelist, CMSSP, CSU-MS2, MSBERT, Spec2Mol, and MS2Mol.
 ## Recommended Name

config.json ADDED Viewed

	@@ -0,0 +1,63 @@

+{
+  "architecture_config": {
+    "collision_max": 200.0,
+    "dropout": 0.1,
+    "fingerprint_dim": 2048,
+    "heads": 8,
+    "layers": 6,
+    "max_peaks": 256,
+    "metadata_scale": 0.02,
+    "model_dim": 384,
+    "mz_max": 2000.0,
+    "projection_dim": 192,
+    "retrieval_mlp_hidden_dim": 512,
+    "target_projection_dim": 256
+  },
+  "architectures": [
+    "NexaMassSpectralEncoder"
+  ],
+  "foundation_checkpoint": "weights/Final_V3-model_state.safetensors",
+  "foundation_checkpoint_format": "safetensors",
+  "foundation_pytorch_model_state_checkpoint": "weights/Final_V3-model_state.pt",
+  "full_training_checkpoints": {
+    "location": "Wasabi object storage",
+    "note": "Optimizer-bearing full training checkpoints are intentionally not part of the public Hugging Face payload; the public release contains model-state weights only."
+  },
+  "input_contract": {
+    "feature_width": 8,
+    "mask": "boolean valid-peak mask, shape [batch, max_peaks]",
+    "max_peaks": 256,
+    "metadata_embeddings": [
+      "adduct_id",
+      "instrument_id"
+    ],
+    "per_peak_features": [
+      "mz",
+      "intensity",
+      "mz_to_precursor",
+      "peak_rank",
+      "precursor_mz",
+      "charge",
+      "collision_energy",
+      "peak_count"
+    ]
+  },
+  "library_name": "pytorch",
+  "model_type": "nexamass",
+  "not_supported": [
+    "unrestricted de novo molecule generation",
+    "calibrated top-1 molecular identification without external validation"
+  ],
+  "outputs": {
+    "morgan_fingerprint_logits": 2048,
+    "retrieval_target_dim": 256,
+    "ssl_projection_dim": 192,
+    "structure_query_dim": 256
+  },
+  "parameter_count": 14106690,
+  "primary_checkpoint": "weights/NexaMass-V3-Struct-model_state.safetensors",
+  "primary_checkpoint_format": "safetensors",
+  "pytorch_model_state_checkpoint": "weights/NexaMass-V3-Struct-model_state.pt",
+  "recommended_inference": "Use the structure-aligned model-state checkpoint for spectrum embeddings and Morgan fingerprint probability vectors, then compare against a candidate molecular fingerprint bank.",
+  "task": "MS/MS spectral representation learning and RDKit Morgan fingerprint alignment"
+}

configs/foundation_config.json ADDED Viewed

	@@ -0,0 +1,98 @@

+{
+  "checkpoint": {
+    "bytes": 151419519,
+    "config": {
+      "collision_max": 200.0,
+      "dropout": 0.1,
+      "fingerprint_dim": 2048,
+      "heads": 8,
+      "layers": 6,
+      "max_peaks": 256,
+      "metadata_scale": 0.02,
+      "model_dim": 384,
+      "mz_max": 2000.0,
+      "projection_dim": 192,
+      "retrieval_mlp_hidden_dim": 512,
+      "target_projection_dim": 256
+    },
+    "created_at": "2026-04-13T19:01:18Z",
+    "file": "weights/Final_V3.pt",
+    "metrics_keys": [
+      "backbone_lr",
+      "contrastive_loss",
+      "covariance_loss",
+      "covariance_to_contrastive_ratio",
+      "covariance_weight",
+      "dataloader_time_sec",
+      "dataloader_wait_pct_300s",
+      "dataloader_wait_pct_60s",
+      "dataloader_wait_pct_900s",
+      "dataloader_wait_pct_run",
+      "distributed_rank",
+      "distributed_world_size",
+      "effective_batch_size",
+      "effective_hard_negative_scale",
+      "effective_retrieval_weight",
+      "effective_structure_bce_weight",
+      "embedding_std",
+      "global_batch_size",
+      "gpu_active_fraction",
+      "gpu_count_observed",
+      "gpu_max_memory_gb",
+      "gpu_mem_used_mean_gb",
+      "gpu_mem_util_mean_pct",
+      "gpu_memory_utilization",
+      "gpu_snapshot_available",
+      "gpu_util_max_pct",
+      "gpu_util_mean_pct",
+      "gpu_util_min_pct",
+      "grad_norm",
+      "local_batch_size",
+      "lr",
+      "mfu_estimate",
+      "msms_objective",
+      "optimizer_step",
+      "regularizer_ramp",
+      "resumed_from_checkpoint",
+      "retrieval_head_lr",
+      "samples_per_sec",
+      "samples_per_sec_300s",
+      "samples_per_sec_60s",
+      "samples_per_sec_900s",
+      "samples_per_sec_run_mean",
+      "step_time_cv_300s",
+      "step_time_cv_60s",
+      "step_time_cv_900s",
+      "step_time_sec",
+      "structure_bce_locked",
+      "structure_bce_loss",
+      "structure_fingerprint_cosine",
+      "structure_head_lr",
+      "structure_retrieval_loss",
+      "structure_retrieval_skipped",
+      "structure_target_backend",
+      "structure_to_ssl_ratio",
+      "train_loss",
+      "train_loss_ema",
+      "train_retrieval_bank_size",
+      "variance_loss",
+      "variance_weight",
+      "weighted_covariance_loss",
+      "weighted_regularizer_to_contrastive_ratio",
+      "weighted_ssl_loss",
+      "weighted_structure_bce_loss",
+      "weighted_structure_retrieval_loss",
+      "weighted_variance_loss"
+    ],
+    "model_state_bytes": 56473018,
+    "model_state_file": "weights/Final_V3-model_state.pt",
+    "param_count": 14106690,
+    "state_tensors": 103,
+    "step": 81001
+  },
+  "dataset": "GeMS-derived deterministic Parquet shard campaign",
+  "name": "NexaMass-V3 foundation checkpoint",
+  "objective_summary": "self-supervised spectral contrastive representation learning with structure-facing foundation instrumentation",
+  "phase": "self_supervised_ssl_structure_foundation",
+  "processed_samples_approx": 201000000
+}

configs/runtime_requirements.json ADDED Viewed

	@@ -0,0 +1,21 @@

+{
+  "core_packages": [
+    "torch",
+    "numpy",
+    "pyarrow",
+    "rdkit"
+  ],
+  "framework": "PyTorch",
+  "load_example": [
+    "payload = torch.load(\"weights/NexaMass-V3-Struct-model_state.pt\", map_location=\"cpu\")",
+    "cfg = ModelConfig(**payload[\"args-derived config or configs/config.json\"])",
+    "model = SpectralEncoder(cfg)",
+    "model.load_state_dict(payload[\"model_state\"], strict=True)"
+  ],
+  "optional_packages": [
+    "qdrant-client",
+    "huggingface-hub"
+  ],
+  "python": ">=3.11",
+  "reference_runtime": "Nexa_compute scripts.msms.inspect_msms_checkpoint_structure.SpectralEncoder"
+}

configs/structure_alignment_config.json ADDED Viewed

	@@ -0,0 +1,162 @@

+{
+  "checkpoint": {
+    "bytes": 160482975,
+    "config": {
+      "collision_max": 200.0,
+      "dropout": 0.1,
+      "fingerprint_dim": 2048,
+      "heads": 8,
+      "layers": 6,
+      "max_peaks": 256,
+      "metadata_scale": 0.02,
+      "model_dim": 384,
+      "mz_max": 2000.0,
+      "projection_dim": 192,
+      "retrieval_mlp_hidden_dim": 512,
+      "target_projection_dim": 256
+    },
+    "created_at": "2026-04-13T21:34:38Z",
+    "file": "weights/NexaMass-V3-Struct.pt",
+    "metrics_keys": [
+      "backbone_lr",
+      "contrastive_loss",
+      "covariance_loss",
+      "covariance_to_contrastive_ratio",
+      "covariance_weight",
+      "dataloader_time_sec",
+      "dataloader_wait_pct_300s",
+      "dataloader_wait_pct_60s",
+      "dataloader_wait_pct_900s",
+      "dataloader_wait_pct_run",
+      "distributed_rank",
+      "distributed_world_size",
+      "effective_batch_size",
+      "effective_hard_negative_scale",
+      "effective_retrieval_weight",
+      "effective_structure_bce_weight",
+      "embedding_std",
+      "global_batch_size",
+      "gpu_active_fraction",
+      "gpu_count_observed",
+      "gpu_max_memory_gb",
+      "gpu_mem_used_mean_gb",
+      "gpu_mem_util_mean_pct",
+      "gpu_memory_utilization",
+      "gpu_snapshot_available",
+      "gpu_util_max_pct",
+      "gpu_util_mean_pct",
+      "gpu_util_min_pct",
+      "grad_norm",
+      "local_batch_size",
+      "lr",
+      "mfu_estimate",
+      "msms_objective",
+      "optimizer_step",
+      "regularizer_ramp",
+      "resumed_from_checkpoint",
+      "retrieval_head_lr",
+      "samples_per_sec",
+      "samples_per_sec_300s",
+      "samples_per_sec_60s",
+      "samples_per_sec_900s",
+      "samples_per_sec_run_mean",
+      "step_time_cv_300s",
+      "step_time_cv_60s",
+      "step_time_cv_900s",
+      "step_time_sec",
+      "structure_bce_locked",
+      "structure_bce_loss",
+      "structure_candidate_count",
+      "structure_clear_fraction",
+      "structure_clear_hit_at_1",
+      "structure_close_fraction",
+      "structure_close_hit_at_1",
+      "structure_confidence_bucket_score_mean",
+      "structure_confidence_bucket_score_mode",
+      "structure_confidence_candidate_count",
+      "structure_confidence_clear_threshold",
+      "structure_confidence_close_threshold",
+      "structure_confidence_eval_key_mode",
+      "structure_confidence_separation",
+      "structure_correct_logit_mean",
+      "structure_fingerprint_cosine",
+      "structure_hard_negative_bonus_applied",
+      "structure_hard_negative_bonus_mean",
+      "structure_hard_negative_scale",
+      "structure_head_lr",
+      "structure_hit_at_1",
+      "structure_hit_at_20",
+      "structure_hit_at_5",
+      "structure_local_ce_loss",
+      "structure_local_ce_loss_weight",
+      "structure_local_rerank_loss",
+      "structure_local_rerank_loss_weight",
+      "structure_local_rerank_score_scale",
+      "structure_logit_margin_mean",
+      "structure_margin_loss",
+      "structure_margin_loss_weight",
+      "structure_missing_formula_fraction",
+      "structure_missing_inchikey_fraction",
+      "structure_pairwise_logistic_loss",
+      "structure_pairwise_logistic_loss_weight",
+      "structure_positive_count_mean",
+      "structure_post_label_candidate_count",
+      "structure_post_precursor_candidate_count",
+      "structure_prefilter_candidate_count",
+      "structure_retrieval_logit_std",
+      "structure_retrieval_loss",
+      "structure_retrieval_scorer",
+      "structure_retrieval_target_mode",
+      "structure_skipped_query_fraction",
+      "structure_soft_target_exact_mix",
+      "structure_soft_target_loss",
+      "structure_soft_target_loss_weight",
+      "structure_target_backend",
+      "structure_target_equivalent_count_mean",
+      "structure_target_identity_collision_count",
+      "structure_target_rank_mean",
+      "structure_to_ssl_ratio",
+      "structure_top1_top2_gap_mean",
+      "structure_top1_top2_gap_norm_mean",
+      "structure_top_negative_logit_mean",
+      "structure_uncertain_fraction",
+      "structure_uncertain_hit_at_1",
+      "structure_valid_query_fraction",
+      "train_loss",
+      "train_loss_ema",
+      "train_retrieval_bank_size",
+      "variance_loss",
+      "variance_weight",
+      "weighted_covariance_loss",
+      "weighted_regularizer_to_contrastive_ratio",
+      "weighted_ssl_loss",
+      "weighted_structure_bce_loss",
+      "weighted_structure_retrieval_loss",
+      "weighted_variance_loss"
+    ],
+    "model_state_bytes": 56474172,
+    "model_state_file": "weights/NexaMass-V3-Struct-model_state.pt",
+    "param_count": 14106690,
+    "state_tensors": 103,
+    "step": 91001
+  },
+  "dataset": "corrected labeled GeMS handoff surface with enforced molecular labels",
+  "evaluation_summary": {
+    "embedding_std": 0.0722,
+    "gallery_exact_fingerprint_decodes": 11,
+    "gallery_size": 20,
+    "massspecgym_test_hit20_adapter": 0.3505,
+    "validation_fingerprint_cosine": 0.4255,
+    "validation_structure_bce": 0.0653
+  },
+  "name": "NexaMass-V3-Struct alignment checkpoint",
+  "objective_weights": {
+    "retrieval_local_ce_loss_weight": 0.4,
+    "retrieval_soft_target_loss_weight": 0.3,
+    "retrieval_weight": 0.6,
+    "ssl_preservation_weight": 0.05,
+    "structure_bce_weight": 1.0
+  },
+  "parent_checkpoint": "weights/Final_V3-model_state.pt",
+  "phase": "RDKit Morgan fingerprint structure alignment"
+}

metadata/Final_V3_manifest.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "model_name": "Final_V3",
+  "created_at_utc": "2026-04-13T19:53:04Z",
+  "source_checkpoint": "/home/ubuntu/artifacts/nexa_mol/v1_full_pretrain/phase1_blackwell_v3/current_checkpoint.pt",
+  "checkpoint_alias": "/home/ubuntu/artifacts/nexa_mol/v1_full_pretrain/phase1_blackwell_v3/Final_V3.pt",
+  "bytes": 151419519,
+  "run_name": "gems_v1_full_pretrain_blackwell_phase1_v3",
+  "dataset_root": "/home/ubuntu/data/gems_v1_v1_full_pretrain_phase1_v3",
+  "phase": "ssl_structure_foundation_final_v3"
+}

metadata/archive/20260413T201817Z/latest_checkpoint.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ /home/ubuntu/artifacts/nexa_mol/final_v3_structure_alignment/v26_r1/current_checkpoint.pt

metadata/archive/20260413T202042Z/latest_checkpoint.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ /home/ubuntu/artifacts/nexa_mol/final_v3_structure_alignment/v26_r1/current_checkpoint.pt

metadata/archive/20260413T213902Z/day1_validation_report.json ADDED Viewed

	@@ -0,0 +1,2475 @@

+{
+  "analysis_basis": [
+    "docs/projects/msms_pipeline/Technical_Plan.md",
+    "docs/projects/msms_pipeline/Engineering.md"
+  ],
+  "created_at": "2026-04-13T21:36:19Z",
+  "dataset_root": "/home/ubuntu/data/gems_v1_handoff_labeled_v26",
+  "debug_metric_pressures": {
+    "gpu_max_memory_gb": {
+      "desired_direction": "stable",
+      "early_mean": 13.252925169950275,
+      "improvement_pct": 100.0,
+      "improvement_pct_clipped": 100.0,
+      "last": 13.279157161712646,
+      "late_mean": 13.279157161712646,
+      "mid_mean": 13.279059082097401,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_confidence_separation": {
+      "desired_direction": "higher",
+      "early_mean": -0.007918493679557749,
+      "improvement_pct": -531.5617836245987,
+      "improvement_pct_clipped": -100.0,
+      "last": -0.0040241447277367115,
+      "late_mean": -0.05001017991881603,
+      "mid_mean": -0.032136323077151974,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "structure_correct_logit_mean": {
+      "desired_direction": "higher",
+      "early_mean": 6.134031791907514,
+      "improvement_pct": 47.305071917778086,
+      "improvement_pct_clipped": 47.305071917778086,
+      "last": 9.1875,
+      "late_mean": 9.035739942528735,
+      "mid_mean": 9.474891618497109,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_fingerprint_cosine": {
+      "desired_direction": "higher",
+      "early_mean": 0.3965519580968543,
+      "improvement_pct": 17.58747890372286,
+      "improvement_pct_clipped": 17.58747890372286,
+      "last": 0.46021854877471924,
+      "late_mean": 0.46629545006943846,
+      "mid_mean": 0.4464927057310336,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_hit_at_1": {
+      "desired_direction": "higher",
+      "early_mean": 0.007880238439306358,
+      "improvement_pct": 549.6830023383724,
+      "improvement_pct_clipped": 100.0,
+      "last": 0.00390625,
+      "late_mean": 0.051196569683908046,
+      "mid_mean": 0.032706376445086706,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_hit_at_20": {
+      "desired_direction": "higher",
+      "early_mean": 0.10721865968208093,
+      "improvement_pct": 239.4614028144399,
+      "improvement_pct_clipped": 100.0,
+      "last": 0.1171875,
+      "late_mean": 0.3639659662356322,
+      "mid_mean": 0.28105807442196534,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_hit_at_5": {
+      "desired_direction": "higher",
+      "early_mean": 0.03360955563583815,
+      "improvement_pct": 402.47008675709174,
+      "improvement_pct_clipped": 100.0,
+      "last": 0.029296875,
+      "late_mean": 0.16887796336206898,
+      "mid_mean": 0.11673591040462428,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_logit_margin_mean": {
+      "desired_direction": "higher",
+      "early_mean": -1.1263999277456647,
+      "improvement_pct": 1.2274364862230593,
+      "improvement_pct_clipped": 1.2274364862230593,
+      "last": -1.0078125,
+      "late_mean": -1.1125740840517242,
+      "mid_mean": -1.0154725885115607,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "structure_retrieval_logit_std": {
+      "desired_direction": "higher",
+      "early_mean": 1.0455416592559375,
+      "improvement_pct": 112.05988926255111,
+      "improvement_pct_clipped": 100.0,
+      "last": 0.9839304089546204,
+      "late_mean": 2.2171744848119803,
+      "mid_mean": 2.0036371215919537,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_retrieval_loss": {
+      "desired_direction": "lower",
+      "early_mean": 10.237479978903181,
+      "improvement_pct": 10.094066619063353,
+      "improvement_pct_clipped": 10.094066619063353,
+      "last": 10.630162239074707,
+      "late_mean": 9.204101929719421,
+      "mid_mean": 9.41523380775672,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_target_rank_mean": {
+      "desired_direction": "lower",
+      "early_mean": 351.84337743858384,
+      "improvement_pct": 58.80171764880722,
+      "improvement_pct_clipped": 58.80171764880722,
+      "last": 314.703125,
+      "late_mean": 144.9534280711207,
+      "mid_mean": 176.16389315390174,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_top1_top2_gap_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.09793567106213873,
+      "improvement_pct": 59.221149173532794,
+      "improvement_pct_clipped": 59.221149173532794,
+      "last": 0.0986328125,
+      "late_mean": 0.1559343009159483,
+      "mid_mean": 0.12284365968208093,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_top1_top2_gap_norm_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.12215662799301864,
+      "improvement_pct": -35.653274040957065,
+      "improvement_pct_clipped": -35.653274040957065,
+      "last": 0.10155132412910461,
+      "late_mean": 0.07860379065547524,
+      "mid_mean": 0.07032911504236604,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "structure_top_negative_logit_mean": {
+      "desired_direction": "lower",
+      "early_mean": 7.262102601156069,
+      "improvement_pct": -39.724147080005764,
+      "improvement_pct_clipped": -39.724147080005764,
+      "last": 10.1875,
+      "late_mean": 10.14691091954023,
+      "mid_mean": 10.490606936416185,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "structure_uncertain_fraction": {
+      "desired_direction": "lower",
+      "early_mean": 0.924663565751445,
+      "improvement_pct": -6.108024336610137,
+      "improvement_pct_clipped": -6.108024336610137,
+      "last": 0.970703125,
+      "late_mean": 0.9811422413793104,
+      "mid_mean": 0.984747561416185,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "train_loss_ema": {
+      "desired_direction": "lower",
+      "early_mean": 6.265581717362126,
+      "improvement_pct": 10.455707205061195,
+      "improvement_pct_clipped": 10.455707205061195,
+      "last": 6.519052214060582,
+      "late_mean": 5.610470838300897,
+      "mid_mean": 5.8371378655061745,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_ssl_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.0849772497183745,
+      "improvement_pct": 2.3192742421198114,
+      "improvement_pct_clipped": 2.3192742421198114,
+      "last": 1.0397093277424574,
+      "late_mean": 1.0598136518327963,
+      "mid_mean": 1.0747967428483425,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "val_structure_correct_logit_mean": {
+      "desired_direction": "higher",
+      "early_mean": 8.0311279296875,
+      "improvement_pct": 16.44145855816145,
+      "improvement_pct_clipped": 16.44145855816145,
+      "last": 9.49462890625,
+      "late_mean": 9.3515625,
+      "mid_mean": 8.441162109375,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_structure_retrieval_logit_std": {
+      "desired_direction": "higher",
+      "early_mean": 1.2326001720502973,
+      "improvement_pct": 102.32641409365677,
+      "improvement_pct_clipped": 100.0,
+      "last": 2.6622845763340592,
+      "late_mean": 2.49387572822161,
+      "mid_mean": 2.022283688886091,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_structure_retrieval_loss": {
+      "desired_direction": "lower",
+      "early_mean": 11.562767315655947,
+      "improvement_pct": 4.864921250164783,
+      "improvement_pct_clipped": 4.864921250164783,
+      "last": 10.882395941764116,
+      "late_mean": 11.000247791409492,
+      "mid_mean": 12.150514367967844,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "val_structure_top1_top2_gap_norm_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.06950851557485294,
+      "improvement_pct": -16.826381575968767,
+      "improvement_pct_clipped": -16.826381575968767,
+      "last": 0.05411380449368153,
+      "late_mean": 0.0578127475164365,
+      "mid_mean": 0.07577372609375743,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "val_structure_top_negative_logit_mean": {
+      "desired_direction": "lower",
+      "early_mean": 9.2255859375,
+      "improvement_pct": -16.07653223245475,
+      "improvement_pct_clipped": -16.07653223245475,
+      "last": 10.714599609375,
+      "late_mean": 10.708740234375,
+      "mid_mean": 10.51171875,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "weighted_regularizer_to_contrastive_ratio": {
+      "desired_direction": "lower",
+      "early_mean": 0.0667222202939108,
+      "improvement_pct": 54.60656419810926,
+      "improvement_pct_clipped": 54.60656419810926,
+      "last": 0.028996589606316913,
+      "late_mean": 0.03028750823471251,
+      "mid_mean": 0.0329437448262181,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    }
+  },
+  "debug_metric_pressures_display": {
+    "gpu_max_memory_gb": {
+      "desired_direction": "stable",
+      "early_mean": 13.252925169950275,
+      "goal_display": "goal \u2248",
+      "improvement_pct": 100.0,
+      "improvement_pct_display": "+100.00%",
+      "last": 13.279157161712646,
+      "late_mean": 13.279157161712646,
+      "mid_mean": 13.279059082097401,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2248 | \u2197 +100.00% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_confidence_separation": {
+      "desired_direction": "higher",
+      "early_mean": -0.007918493679557749,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -531.5617836245987,
+      "improvement_pct_clipped": -100.0,
+      "improvement_pct_clipped_display": "-100.00%",
+      "improvement_pct_display": "-531.56%",
+      "last": -0.0040241447277367115,
+      "late_mean": -0.05001017991881603,
+      "mid_mean": -0.032136323077151974,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -531.56% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "structure_correct_logit_mean": {
+      "desired_direction": "higher",
+      "early_mean": 6.134031791907514,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 47.305071917778086,
+      "improvement_pct_display": "+47.31%",
+      "last": 9.1875,
+      "late_mean": 9.035739942528735,
+      "mid_mean": 9.474891618497109,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +47.31% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_fingerprint_cosine": {
+      "desired_direction": "higher",
+      "early_mean": 0.3965519580968543,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 17.58747890372286,
+      "improvement_pct_display": "+17.59%",
+      "last": 0.46021854877471924,
+      "late_mean": 0.46629545006943846,
+      "mid_mean": 0.4464927057310336,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +17.59% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_hit_at_1": {
+      "desired_direction": "higher",
+      "early_mean": 0.007880238439306358,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 549.6830023383724,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+549.68%",
+      "last": 0.00390625,
+      "late_mean": 0.051196569683908046,
+      "mid_mean": 0.032706376445086706,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +549.68% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_hit_at_20": {
+      "desired_direction": "higher",
+      "early_mean": 0.10721865968208093,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 239.4614028144399,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+239.46%",
+      "last": 0.1171875,
+      "late_mean": 0.3639659662356322,
+      "mid_mean": 0.28105807442196534,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +239.46% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_hit_at_5": {
+      "desired_direction": "higher",
+      "early_mean": 0.03360955563583815,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 402.47008675709174,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+402.47%",
+      "last": 0.029296875,
+      "late_mean": 0.16887796336206898,
+      "mid_mean": 0.11673591040462428,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +402.47% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_logit_margin_mean": {
+      "desired_direction": "higher",
+      "early_mean": -1.1263999277456647,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 1.2274364862230593,
+      "improvement_pct_display": "+1.23%",
+      "last": -1.0078125,
+      "late_mean": -1.1125740840517242,
+      "mid_mean": -1.0154725885115607,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2191 | \u2192 +1.23% flat",
+      "trend_label": "flat"
+    },
+    "structure_retrieval_logit_std": {
+      "desired_direction": "higher",
+      "early_mean": 1.0455416592559375,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 112.05988926255111,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+112.06%",
+      "last": 0.9839304089546204,
+      "late_mean": 2.2171744848119803,
+      "mid_mean": 2.0036371215919537,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +112.06% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_retrieval_loss": {
+      "desired_direction": "lower",
+      "early_mean": 10.237479978903181,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 10.094066619063353,
+      "improvement_pct_display": "+10.09%",
+      "last": 10.630162239074707,
+      "late_mean": 9.204101929719421,
+      "mid_mean": 9.41523380775672,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +10.09% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_target_rank_mean": {
+      "desired_direction": "lower",
+      "early_mean": 351.84337743858384,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 58.80171764880722,
+      "improvement_pct_display": "+58.80%",
+      "last": 314.703125,
+      "late_mean": 144.9534280711207,
+      "mid_mean": 176.16389315390174,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +58.80% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_top1_top2_gap_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.09793567106213873,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 59.221149173532794,
+      "improvement_pct_display": "+59.22%",
+      "last": 0.0986328125,
+      "late_mean": 0.1559343009159483,
+      "mid_mean": 0.12284365968208093,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +59.22% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_top1_top2_gap_norm_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.12215662799301864,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -35.653274040957065,
+      "improvement_pct_display": "-35.65%",
+      "last": 0.10155132412910461,
+      "late_mean": 0.07860379065547524,
+      "mid_mean": 0.07032911504236604,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -35.65% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "structure_top_negative_logit_mean": {
+      "desired_direction": "lower",
+      "early_mean": 7.262102601156069,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -39.724147080005764,
+      "improvement_pct_display": "-39.72%",
+      "last": 10.1875,
+      "late_mean": 10.14691091954023,
+      "mid_mean": 10.490606936416185,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2193 | \u2198 -39.72% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "structure_uncertain_fraction": {
+      "desired_direction": "lower",
+      "early_mean": 0.924663565751445,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -6.108024336610137,
+      "improvement_pct_display": "-6.11%",
+      "last": 0.970703125,
+      "late_mean": 0.9811422413793104,
+      "mid_mean": 0.984747561416185,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2193 | \u2198 -6.11% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "train_loss_ema": {
+      "desired_direction": "lower",
+      "early_mean": 6.265581717362126,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 10.455707205061195,
+      "improvement_pct_display": "+10.46%",
+      "last": 6.519052214060582,
+      "late_mean": 5.610470838300897,
+      "mid_mean": 5.8371378655061745,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +10.46% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_ssl_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.0849772497183745,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 2.3192742421198114,
+      "improvement_pct_display": "+2.32%",
+      "last": 1.0397093277424574,
+      "late_mean": 1.0598136518327963,
+      "mid_mean": 1.0747967428483425,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2193 | \u2192 +2.32% flat",
+      "trend_label": "flat"
+    },
+    "val_structure_correct_logit_mean": {
+      "desired_direction": "higher",
+      "early_mean": 8.0311279296875,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 16.44145855816145,
+      "improvement_pct_display": "+16.44%",
+      "last": 9.49462890625,
+      "late_mean": 9.3515625,
+      "mid_mean": 8.441162109375,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +16.44% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_structure_retrieval_logit_std": {
+      "desired_direction": "higher",
+      "early_mean": 1.2326001720502973,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 102.32641409365677,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+102.33%",
+      "last": 2.6622845763340592,
+      "late_mean": 2.49387572822161,
+      "mid_mean": 2.022283688886091,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +102.33% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_structure_retrieval_loss": {
+      "desired_direction": "lower",
+      "early_mean": 11.562767315655947,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 4.864921250164783,
+      "improvement_pct_display": "+4.86%",
+      "last": 10.882395941764116,
+      "late_mean": 11.000247791409492,
+      "mid_mean": 12.150514367967844,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2193 | \u2192 +4.86% flat",
+      "trend_label": "flat"
+    },
+    "val_structure_top1_top2_gap_norm_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.06950851557485294,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -16.826381575968767,
+      "improvement_pct_display": "-16.83%",
+      "last": 0.05411380449368153,
+      "late_mean": 0.0578127475164365,
+      "mid_mean": 0.07577372609375743,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -16.83% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "val_structure_top_negative_logit_mean": {
+      "desired_direction": "lower",
+      "early_mean": 9.2255859375,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -16.07653223245475,
+      "improvement_pct_display": "-16.08%",
+      "last": 10.714599609375,
+      "late_mean": 10.708740234375,
+      "mid_mean": 10.51171875,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2193 | \u2198 -16.08% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "weighted_regularizer_to_contrastive_ratio": {
+      "desired_direction": "lower",
+      "early_mean": 0.0667222202939108,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 54.60656419810926,
+      "improvement_pct_display": "+54.61%",
+      "last": 0.028996589606316913,
+      "late_mean": 0.03028750823471251,
+      "mid_mean": 0.0329437448262181,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +54.61% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    }
+  },
+  "debug_metrics": {
+    "contrastive_loss": 0.5768923759460449,
+    "covariance_loss": 10.012618064880371,
+    "dataloader_wait_pct_300s": 0.0382592069912683,
+    "dataloader_wait_pct_60s": 0.0961140629935623,
+    "dataloader_wait_pct_900s": 0.066640439237091,
+    "dataloader_wait_pct_run": 0.06717802801040498,
+    "gpu_active_fraction": 1.0,
+    "gpu_max_memory_gb": 13.279157161712646,
+    "gpu_mem_used_mean_gb": 14.1943359375,
+    "gpu_mem_util_mean_pct": 14.848754175733243,
+    "gpu_snapshot_available": 1.0,
+    "gpu_util_max_pct": 54.0,
+    "gpu_util_mean_pct": 36.0,
+    "gpu_util_min_pct": 18.0,
+    "grad_norm": 1.7659728527069092,
+    "mfu_estimate": 0.06267708747552383,
+    "samples_per_sec": 1399.0203442084614,
+    "samples_per_sec_300s": 1547.033197547462,
+    "samples_per_sec_60s": 1399.0203442084614,
+    "samples_per_sec_900s": 1512.7885250414204,
+    "samples_per_sec_run_mean": 1533.0231795943853,
+    "step_time_cv_300s": 0.06743440395418321,
+    "step_time_cv_900s": 0.09218780075615579,
+    "step_time_sec": 0.3659703749981418,
+    "structure_bce_loss": 0.08383000642061234,
+    "structure_close_fraction": 0.029296875,
+    "structure_confidence_candidate_count": 2126.0,
+    "structure_confidence_separation": -0.0040241447277367115,
+    "structure_correct_logit_mean": 9.1875,
+    "structure_fingerprint_cosine": 0.46021854877471924,
+    "structure_hit_at_1": 0.00390625,
+    "structure_hit_at_20": 0.1171875,
+    "structure_hit_at_5": 0.029296875,
+    "structure_logit_margin_mean": -1.0078125,
+    "structure_retrieval_logit_std": 0.9839304089546204,
+    "structure_retrieval_loss": 10.630162239074707,
+    "structure_target_rank_mean": 314.703125,
+    "structure_top1_top2_gap_mean": 0.0986328125,
+    "structure_top1_top2_gap_norm_mean": 0.10155132412910461,
+    "structure_top_negative_logit_mean": 10.1875,
+    "structure_uncertain_fraction": 0.970703125,
+    "structure_uncertain_hit_at_1": 0.0040241447277367115,
+    "train_loss": 6.491608619689941,
+    "train_loss_ema": 6.519052214060582,
+    "val_loss": 6.646750174145564,
+    "val_ssl_loss": 1.0397093277424574,
+    "val_structure_close_fraction": 0.0077972412109375,
+    "val_structure_close_hit_at_1": 0.014835291571216658,
+    "val_structure_confidence_candidate_count": 4096.0,
+    "val_structure_confidence_separation": -0.027957430157584895,
+    "val_structure_correct_logit_mean": 9.49462890625,
+    "val_structure_retrieval_logit_std": 2.6622845763340592,
+    "val_structure_retrieval_loss": 10.882395941764116,
+    "val_structure_top1_top2_gap_mean": 0.11855697631835938,
+    "val_structure_top1_top2_gap_norm_mean": 0.05411380449368153,
+    "val_structure_top_negative_logit_mean": 10.714599609375,
+    "val_structure_uncertain_fraction": 0.9922027587890625,
+    "val_structure_uncertain_hit_at_1": 0.027957430157584895,
+    "variance_loss": 0.00213623046875,
+    "weighted_regularizer_to_contrastive_ratio": 0.028996589606316913
+  },
+  "eval_coverage": {
+    "configured_test_shard_count": 2,
+    "configured_test_shards": [
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/test/shard_20260313_051433_00000.parquet",
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/test/shard_20260313_051454_00000.parquet"
+    ],
+    "configured_val_shard_count": 2,
+    "configured_val_shards": [
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051433_00000.parquet",
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051454_00000.parquet"
+    ],
+    "created_at": "2026-04-13T21:36:17Z",
+    "eval_batch_limit": 256,
+    "eval_batches_per_shard_limit": 0,
+    "eval_loader_mode": "stream",
+    "eval_mode": "deep",
+    "full_holdout_coverage": 0.0,
+    "full_holdout_sweep": false,
+    "full_test_coverage": 0.0,
+    "full_val_coverage": 1.0,
+    "missing_test_shards": [
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/test/shard_20260313_051433_00000.parquet",
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/test/shard_20260313_051454_00000.parquet"
+    ],
+    "missing_val_shards": [],
+    "observed_eval_batches": 256,
+    "observed_eval_samples": 131072,
+    "observed_test_shard_count": 0,
+    "observed_test_shards": [],
+    "observed_val_shard_count": 2,
+    "observed_val_shards": [
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051433_00000.parquet",
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051454_00000.parquet"
+    ],
+    "per_shard_batch_count": {
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051433_00000.parquet": 128,
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051454_00000.parquet": 128
+    },
+    "per_shard_sample_count": {
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051433_00000.parquet": 65536,
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051454_00000.parquet": 65536
+    },
+    "run_step": 10000,
+    "step": 91001,
+    "unexpected_eval_shards": []
+  },
+  "failure_modes": [
+    {
+      "detail": "Observed shard counts {'train': 4, 'val': 2, 'test': 2}; the canonical Day 1 loader contract requires all splits to be readable.",
+      "name": "dataset_shards_accessible",
+      "status": "pass"
+    },
+    {
+      "detail": "Training batches continued to arrive with positive throughput and no iterator stall.",
+      "name": "dataloader_streaming_stable",
+      "status": "pass"
+    },
+    {
+      "detail": "Technical_Plan requires zero NaN or Inf tensors and finite train/val loss.",
+      "name": "non_finite_loss_or_tensor_failure",
+      "status": "pass"
+    },
+    {
+      "detail": "Engineering.md expects slope-aware monitoring; missing validation or retrieval metrics make trend judgment weaker.",
+      "name": "validation_observability_gap",
+      "status": "pass"
+    },
+    {
+      "detail": "Technical_Plan Day 1 success requires stable GPU memory through the bounded run.",
+      "name": "gpu_memory_instability",
+      "status": "pass"
+    },
+    {
+      "detail": "Checkpoint save and reload is an explicit Day 1 success criterion.",
+      "name": "checkpoint_save_reload_failure",
+      "status": "pass"
+    },
+    {
+      "detail": "Engineering.md expects embedding variance monitoring and non-collapsed representations.",
+      "name": "embedding_collapse",
+      "status": "pass"
+    },
+    {
+      "detail": "The current instability mode is regularization overpowering the SSL objective and producing jagged total loss.",
+      "name": "regularizer_dominance",
+      "status": "pass"
+    },
+    {
+      "detail": "Once the bridge phase begins, Technical_Plan requires retrieval-oriented validation rather than only augmented contrastive loss.",
+      "name": "structure_supervision_gap",
+      "status": "pass"
+    },
+    {
+      "detail": "Structure-first qualification now requires explicit confidence diagnostics such as top-1/top-2 separation and uncertainty buckets, not just broader retrieval metrics.",
+      "name": "confidence_surface_gap",
+      "status": "pass"
+    },
+    {
+      "detail": "The bridge phase should prefer chemistry-grounded fingerprint targets; hashed fallback targets weaken the retrieval signal.",
+      "name": "chemistry_target_backend_gap",
+      "status": "pass"
+    },
+    {
+      "detail": "Bridge runs must improve retrieval after fingerprint fit saturates; fitting BCE while val Hit@20 stays at candidate-bank baseline means ranking is not generalizing.",
+      "name": "bridge_fit_without_ranking",
+      "status": "pass"
+    },
+    {
+      "detail": "Engineering.md flags acquisition-artefact shortcut risk; adduct and instrument embeddings remain deliberately down-scaled.",
+      "name": "metadata_shortcutting",
+      "status": "watch"
+    }
+  ],
+  "fast_eval_surface": {
+    "batch_size": 512,
+    "batches_per_shard": 0,
+    "configured_val_shard_count": 2,
+    "configured_val_shards": [
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051433_00000.parquet",
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051454_00000.parquet"
+    ],
+    "created_at": "2026-04-13T20:20:58Z",
+    "loader_mode": "stream",
+    "per_shard_batch_count": {},
+    "per_shard_row_count": {},
+    "row_count": 0
+  },
+  "metric_pressure_summary": {
+    "average_improvement_pct": 34.52368967199551,
+    "metric_count": 39,
+    "overall_arrow": "\u2197",
+    "overall_pressure": "pressure_up",
+    "pressure_down_count": 11,
+    "pressure_none_count": 7,
+    "pressure_up_count": 21,
+    "pressure_up_fraction": 0.5384615384615384,
+    "weighted_improvement_pct": 21.88570985770741,
+    "weighted_pressure_score": 0.2838709677419355
+  },
+  "metric_pressure_summary_display": {
+    "average_improvement_pct": 34.52368967199551,
+    "average_improvement_pct_display": "+34.52%",
+    "metric_count": 39,
+    "overall_arrow": "\u2197",
+    "overall_display": "\u2197 improving (+21.89% weighted)",
+    "overall_label": "improving",
+    "overall_pressure": "pressure_up",
+    "pressure_down_count": 11,
+    "pressure_none_count": 7,
+    "pressure_up_count": 21,
+    "pressure_up_fraction": 0.5384615384615384,
+    "pressure_up_fraction_display": "+53.85%",
+    "weighted_improvement_pct": 21.88570985770741,
+    "weighted_improvement_pct_display": "+21.89%",
+    "weighted_pressure_score": 0.2838709677419355
+  },
+  "metric_pressures": {
+    "contrastive_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.409792113166324,
+      "improvement_pct": -1.6400841264380104,
+      "improvement_pct_clipped": -1.6400841264380104,
+      "last": 0.5768923759460449,
+      "late_mean": 1.43291388983014,
+      "mid_mean": 1.3598130204084982,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "gpu_max_memory_gb": {
+      "desired_direction": "stable",
+      "early_mean": 13.252925169950275,
+      "improvement_pct": 100.0,
+      "improvement_pct_clipped": 100.0,
+      "last": 13.279157161712646,
+      "late_mean": 13.279157161712646,
+      "mid_mean": 13.279059082097401,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "grad_norm": {
+      "desired_direction": "stable",
+      "early_mean": 4.638080189338309,
+      "improvement_pct": -100.0,
+      "improvement_pct_clipped": -100.0,
+      "last": 1.7659728527069092,
+      "late_mean": 6.072961742165445,
+      "mid_mean": 4.979553528603791,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "samples_per_sec": {
+      "desired_direction": "higher",
+      "early_mean": 1575.5664566260843,
+      "improvement_pct": -2.8825714693532967,
+      "improvement_pct_clipped": -2.8825714693532967,
+      "last": 1399.0203442084614,
+      "late_mean": 1530.1496274666802,
+      "mid_mean": 1531.3735887168505,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "structure_bce_loss": {
+      "desired_direction": "lower",
+      "early_mean": 0.12293951650489272,
+      "improvement_pct": 39.749156913940595,
+      "improvement_pct_clipped": 39.749156913940595,
+      "last": 0.08383000642061234,
+      "late_mean": 0.07407209518012302,
+      "mid_mean": 0.07652380578004556,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_confidence_separation": {
+      "desired_direction": "higher",
+      "early_mean": -0.007918493679557749,
+      "improvement_pct": -531.5617836245987,
+      "improvement_pct_clipped": -100.0,
+      "last": -0.0040241447277367115,
+      "late_mean": -0.05001017991881603,
+      "mid_mean": -0.032136323077151974,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "structure_correct_logit_mean": {
+      "desired_direction": "higher",
+      "early_mean": 6.134031791907514,
+      "improvement_pct": 47.305071917778086,
+      "improvement_pct_clipped": 47.305071917778086,
+      "last": 9.1875,
+      "late_mean": 9.035739942528735,
+      "mid_mean": 9.474891618497109,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_fingerprint_cosine": {
+      "desired_direction": "higher",
+      "early_mean": 0.3965519580968543,
+      "improvement_pct": 17.58747890372286,
+      "improvement_pct_clipped": 17.58747890372286,
+      "last": 0.46021854877471924,
+      "late_mean": 0.46629545006943846,
+      "mid_mean": 0.4464927057310336,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_hit_at_1": {
+      "desired_direction": "higher",
+      "early_mean": 0.007880238439306358,
+      "improvement_pct": 549.6830023383724,
+      "improvement_pct_clipped": 100.0,
+      "last": 0.00390625,
+      "late_mean": 0.051196569683908046,
+      "mid_mean": 0.032706376445086706,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_hit_at_20": {
+      "desired_direction": "higher",
+      "early_mean": 0.10721865968208093,
+      "improvement_pct": 239.4614028144399,
+      "improvement_pct_clipped": 100.0,
+      "last": 0.1171875,
+      "late_mean": 0.3639659662356322,
+      "mid_mean": 0.28105807442196534,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_hit_at_5": {
+      "desired_direction": "higher",
+      "early_mean": 0.03360955563583815,
+      "improvement_pct": 402.47008675709174,
+      "improvement_pct_clipped": 100.0,
+      "last": 0.029296875,
+      "late_mean": 0.16887796336206898,
+      "mid_mean": 0.11673591040462428,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_logit_margin_mean": {
+      "desired_direction": "higher",
+      "early_mean": -1.1263999277456647,
+      "improvement_pct": 1.2274364862230593,
+      "improvement_pct_clipped": 1.2274364862230593,
+      "last": -1.0078125,
+      "late_mean": -1.1125740840517242,
+      "mid_mean": -1.0154725885115607,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "structure_retrieval_logit_std": {
+      "desired_direction": "higher",
+      "early_mean": 1.0455416592559375,
+      "improvement_pct": 112.05988926255111,
+      "improvement_pct_clipped": 100.0,
+      "last": 0.9839304089546204,
+      "late_mean": 2.2171744848119803,
+      "mid_mean": 2.0036371215919537,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_retrieval_loss": {
+      "desired_direction": "lower",
+      "early_mean": 10.237479978903181,
+      "improvement_pct": 10.094066619063353,
+      "improvement_pct_clipped": 10.094066619063353,
+      "last": 10.630162239074707,
+      "late_mean": 9.204101929719421,
+      "mid_mean": 9.41523380775672,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_target_rank_mean": {
+      "desired_direction": "lower",
+      "early_mean": 351.84337743858384,
+      "improvement_pct": 58.80171764880722,
+      "improvement_pct_clipped": 58.80171764880722,
+      "last": 314.703125,
+      "late_mean": 144.9534280711207,
+      "mid_mean": 176.16389315390174,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_top1_top2_gap_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.09793567106213873,
+      "improvement_pct": 59.221149173532794,
+      "improvement_pct_clipped": 59.221149173532794,
+      "last": 0.0986328125,
+      "late_mean": 0.1559343009159483,
+      "mid_mean": 0.12284365968208093,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_top1_top2_gap_norm_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.12215662799301864,
+      "improvement_pct": -35.653274040957065,
+      "improvement_pct_clipped": -35.653274040957065,
+      "last": 0.10155132412910461,
+      "late_mean": 0.07860379065547524,
+      "mid_mean": 0.07032911504236604,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "structure_top_negative_logit_mean": {
+      "desired_direction": "lower",
+      "early_mean": 7.262102601156069,
+      "improvement_pct": -39.724147080005764,
+      "improvement_pct_clipped": -39.724147080005764,
+      "last": 10.1875,
+      "late_mean": 10.14691091954023,
+      "mid_mean": 10.490606936416185,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "structure_uncertain_fraction": {
+      "desired_direction": "lower",
+      "early_mean": 0.924663565751445,
+      "improvement_pct": -6.108024336610137,
+      "improvement_pct_clipped": -6.108024336610137,
+      "last": 0.970703125,
+      "late_mean": 0.9811422413793104,
+      "mid_mean": 0.984747561416185,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "train_loss": {
+      "desired_direction": "lower",
+      "early_mean": 6.340343519442343,
+      "improvement_pct": 10.566866163080938,
+      "improvement_pct_clipped": 10.566866163080938,
+      "last": 6.491608619689941,
+      "late_mean": 5.670367905463295,
+      "mid_mean": 5.795929590401622,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "train_loss_ema": {
+      "desired_direction": "lower",
+      "early_mean": 6.265581717362126,
+      "improvement_pct": 10.455707205061195,
+      "improvement_pct_clipped": 10.455707205061195,
+      "last": 6.519052214060582,
+      "late_mean": 5.610470838300897,
+      "mid_mean": 5.8371378655061745,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_hit_at_1": {
+      "desired_direction": "higher",
+      "early_mean": 0.0079345703125,
+      "improvement_pct": 207.78846153846155,
+      "improvement_pct_clipped": 100.0,
+      "last": 0.0282135009765625,
+      "late_mean": 0.02442169189453125,
+      "mid_mean": 0.01372528076171875,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "val_hit_at_20": {
+      "desired_direction": "higher",
+      "early_mean": 0.08158111572265625,
+      "improvement_pct": 76.67165435331526,
+      "improvement_pct_clipped": 76.67165435331526,
+      "last": 0.15270233154296875,
+      "late_mean": 0.14413070678710938,
+      "mid_mean": 0.094146728515625,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_hit_at_5": {
+      "desired_direction": "higher",
+      "early_mean": 0.0288543701171875,
+      "improvement_pct": 134.8492860920148,
+      "improvement_pct_clipped": 100.0,
+      "last": 0.0726776123046875,
+      "late_mean": 0.0677642822265625,
+      "mid_mean": 0.0425567626953125,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.2876316868363775,
+      "improvement_pct": -55.82459156154955,
+      "improvement_pct_clipped": -55.82459156154955,
+      "last": 6.646750174145564,
+      "late_mean": 2.006446816829876,
+      "mid_mean": 2.20697861268016,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "val_ssl_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.0849772497183745,
+      "improvement_pct": 2.3192742421198114,
+      "improvement_pct_clipped": 2.3192742421198114,
+      "last": 1.0397093277424574,
+      "late_mean": 1.0598136518327963,
+      "mid_mean": 1.0747967428483425,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "val_structure_bce_loss": {
+      "desired_direction": "lower",
+      "early_mean": 0.0771060927848642,
+      "improvement_pct": 12.199713989530546,
+      "improvement_pct_clipped": 12.199713989530546,
+      "last": 0.06532714269997086,
+      "late_mean": 0.06769936999660872,
+      "mid_mean": 0.07029345531468391,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_structure_confidence_separation": {
+      "desired_direction": "higher",
+      "early_mean": -0.00795668972114072,
+      "improvement_pct": -204.85499246505236,
+      "improvement_pct_clipped": -100.0,
+      "last": -0.027957430157584895,
+      "late_mean": -0.024256365849851136,
+      "mid_mean": -0.01309866098972634,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "val_structure_correct_logit_mean": {
+      "desired_direction": "higher",
+      "early_mean": 8.0311279296875,
+      "improvement_pct": 16.44145855816145,
+      "improvement_pct_clipped": 16.44145855816145,
+      "last": 9.49462890625,
+      "late_mean": 9.3515625,
+      "mid_mean": 8.441162109375,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_structure_fingerprint_cosine": {
+      "desired_direction": "higher",
+      "early_mean": 0.4147872725734487,
+      "improvement_pct": 0.17175282510408285,
+      "improvement_pct_clipped": 0.17175282510408285,
+      "last": 0.4255251376889646,
+      "late_mean": 0.4154996814322658,
+      "mid_mean": 0.4204998221830465,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "val_structure_logit_margin_mean": {
+      "desired_direction": "higher",
+      "early_mean": -1.194091796875,
+      "improvement_pct": -13.669239419341647,
+      "improvement_pct_clipped": -13.669239419341647,
+      "last": -1.221923828125,
+      "late_mean": -1.3573150634765625,
+      "mid_mean": -2.0707931518554688,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "val_structure_retrieval_logit_std": {
+      "desired_direction": "higher",
+      "early_mean": 1.2326001720502973,
+      "improvement_pct": 102.32641409365677,
+      "improvement_pct_clipped": 100.0,
+      "last": 2.6622845763340592,
+      "late_mean": 2.49387572822161,
+      "mid_mean": 2.022283688886091,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_structure_retrieval_loss": {
+      "desired_direction": "lower",
+      "early_mean": 11.562767315655947,
+      "improvement_pct": 4.864921250164783,
+      "improvement_pct_clipped": 4.864921250164783,
+      "last": 10.882395941764116,
+      "late_mean": 11.000247791409492,
+      "mid_mean": 12.150514367967844,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "val_structure_target_rank_mean": {
+      "desired_direction": "lower",
+      "early_mean": 760.7540435791016,
+      "improvement_pct": 45.44775026271755,
+      "improvement_pct_clipped": 45.44775026271755,
+      "last": 379.8781280517578,
+      "late_mean": 415.0084457397461,
+      "mid_mean": 683.3385162353516,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_structure_top1_top2_gap_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.07839679718017578,
+      "improvement_pct": 54.90785232041847,
+      "improvement_pct_clipped": 54.90785232041847,
+      "last": 0.11855697631835938,
+      "late_mean": 0.12144279479980469,
+      "mid_mean": 0.1310901641845703,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_structure_top1_top2_gap_norm_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.06950851557485294,
+      "improvement_pct": -16.826381575968767,
+      "improvement_pct_clipped": -16.826381575968767,
+      "last": 0.05411380449368153,
+      "late_mean": 0.0578127475164365,
+      "mid_mean": 0.07577372609375743,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "val_structure_top_negative_logit_mean": {
+      "desired_direction": "lower",
+      "early_mean": 9.2255859375,
+      "improvement_pct": -16.07653223245475,
+      "improvement_pct_clipped": -16.07653223245475,
+      "last": 10.714599609375,
+      "late_mean": 10.708740234375,
+      "mid_mean": 10.51171875,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "val_structure_uncertain_fraction": {
+      "desired_direction": "lower",
+      "early_mean": 0.9941177368164062,
+      "improvement_pct": -0.03261678728482514,
+      "improvement_pct_clipped": -0.03261678728482514,
+      "last": 0.9922027587890625,
+      "late_mean": 0.9944419860839844,
+      "mid_mean": 0.9762382507324219,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "weighted_regularizer_to_contrastive_ratio": {
+      "desired_direction": "lower",
+      "early_mean": 0.0667222202939108,
+      "improvement_pct": 54.60656419810926,
+      "improvement_pct_clipped": 54.60656419810926,
+      "last": 0.028996589606316913,
+      "late_mean": 0.03028750823471251,
+      "mid_mean": 0.0329437448262181,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    }
+  },
+  "metric_pressures_display": {
+    "contrastive_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.409792113166324,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -1.6400841264380104,
+      "improvement_pct_display": "-1.64%",
+      "last": 0.5768923759460449,
+      "late_mean": 1.43291388983014,
+      "mid_mean": 1.3598130204084982,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2193 | \u2192 -1.64% flat",
+      "trend_label": "flat"
+    },
+    "gpu_max_memory_gb": {
+      "desired_direction": "stable",
+      "early_mean": 13.252925169950275,
+      "goal_display": "goal \u2248",
+      "improvement_pct": 100.0,
+      "improvement_pct_display": "+100.00%",
+      "last": 13.279157161712646,
+      "late_mean": 13.279157161712646,
+      "mid_mean": 13.279059082097401,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2248 | \u2197 +100.00% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "grad_norm": {
+      "desired_direction": "stable",
+      "early_mean": 4.638080189338309,
+      "goal_display": "goal \u2248",
+      "improvement_pct": -100.0,
+      "improvement_pct_display": "-100.00%",
+      "last": 1.7659728527069092,
+      "late_mean": 6.072961742165445,
+      "mid_mean": 4.979553528603791,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2248 | \u2198 -100.00% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "samples_per_sec": {
+      "desired_direction": "higher",
+      "early_mean": 1575.5664566260843,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -2.8825714693532967,
+      "improvement_pct_display": "-2.88%",
+      "last": 1399.0203442084614,
+      "late_mean": 1530.1496274666802,
+      "mid_mean": 1531.3735887168505,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -2.88% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "structure_bce_loss": {
+      "desired_direction": "lower",
+      "early_mean": 0.12293951650489272,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 39.749156913940595,
+      "improvement_pct_display": "+39.75%",
+      "last": 0.08383000642061234,
+      "late_mean": 0.07407209518012302,
+      "mid_mean": 0.07652380578004556,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +39.75% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_confidence_separation": {
+      "desired_direction": "higher",
+      "early_mean": -0.007918493679557749,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -531.5617836245987,
+      "improvement_pct_clipped": -100.0,
+      "improvement_pct_clipped_display": "-100.00%",
+      "improvement_pct_display": "-531.56%",
+      "last": -0.0040241447277367115,
+      "late_mean": -0.05001017991881603,
+      "mid_mean": -0.032136323077151974,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -531.56% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "structure_correct_logit_mean": {
+      "desired_direction": "higher",
+      "early_mean": 6.134031791907514,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 47.305071917778086,
+      "improvement_pct_display": "+47.31%",
+      "last": 9.1875,
+      "late_mean": 9.035739942528735,
+      "mid_mean": 9.474891618497109,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +47.31% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_fingerprint_cosine": {
+      "desired_direction": "higher",
+      "early_mean": 0.3965519580968543,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 17.58747890372286,
+      "improvement_pct_display": "+17.59%",
+      "last": 0.46021854877471924,
+      "late_mean": 0.46629545006943846,
+      "mid_mean": 0.4464927057310336,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +17.59% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_hit_at_1": {
+      "desired_direction": "higher",
+      "early_mean": 0.007880238439306358,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 549.6830023383724,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+549.68%",
+      "last": 0.00390625,
+      "late_mean": 0.051196569683908046,
+      "mid_mean": 0.032706376445086706,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +549.68% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_hit_at_20": {
+      "desired_direction": "higher",
+      "early_mean": 0.10721865968208093,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 239.4614028144399,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+239.46%",
+      "last": 0.1171875,
+      "late_mean": 0.3639659662356322,
+      "mid_mean": 0.28105807442196534,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +239.46% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_hit_at_5": {
+      "desired_direction": "higher",
+      "early_mean": 0.03360955563583815,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 402.47008675709174,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+402.47%",
+      "last": 0.029296875,
+      "late_mean": 0.16887796336206898,
+      "mid_mean": 0.11673591040462428,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +402.47% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_logit_margin_mean": {
+      "desired_direction": "higher",
+      "early_mean": -1.1263999277456647,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 1.2274364862230593,
+      "improvement_pct_display": "+1.23%",
+      "last": -1.0078125,
+      "late_mean": -1.1125740840517242,
+      "mid_mean": -1.0154725885115607,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2191 | \u2192 +1.23% flat",
+      "trend_label": "flat"
+    },
+    "structure_retrieval_logit_std": {
+      "desired_direction": "higher",
+      "early_mean": 1.0455416592559375,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 112.05988926255111,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+112.06%",
+      "last": 0.9839304089546204,
+      "late_mean": 2.2171744848119803,
+      "mid_mean": 2.0036371215919537,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +112.06% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_retrieval_loss": {
+      "desired_direction": "lower",
+      "early_mean": 10.237479978903181,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 10.094066619063353,
+      "improvement_pct_display": "+10.09%",
+      "last": 10.630162239074707,
+      "late_mean": 9.204101929719421,
+      "mid_mean": 9.41523380775672,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +10.09% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_target_rank_mean": {
+      "desired_direction": "lower",
+      "early_mean": 351.84337743858384,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 58.80171764880722,
+      "improvement_pct_display": "+58.80%",
+      "last": 314.703125,
+      "late_mean": 144.9534280711207,
+      "mid_mean": 176.16389315390174,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +58.80% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_top1_top2_gap_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.09793567106213873,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 59.221149173532794,
+      "improvement_pct_display": "+59.22%",
+      "last": 0.0986328125,
+      "late_mean": 0.1559343009159483,
+      "mid_mean": 0.12284365968208093,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +59.22% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_top1_top2_gap_norm_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.12215662799301864,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -35.653274040957065,
+      "improvement_pct_display": "-35.65%",
+      "last": 0.10155132412910461,
+      "late_mean": 0.07860379065547524,
+      "mid_mean": 0.07032911504236604,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -35.65% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "structure_top_negative_logit_mean": {
+      "desired_direction": "lower",
+      "early_mean": 7.262102601156069,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -39.724147080005764,
+      "improvement_pct_display": "-39.72%",
+      "last": 10.1875,
+      "late_mean": 10.14691091954023,
+      "mid_mean": 10.490606936416185,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2193 | \u2198 -39.72% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "structure_uncertain_fraction": {
+      "desired_direction": "lower",
+      "early_mean": 0.924663565751445,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -6.108024336610137,
+      "improvement_pct_display": "-6.11%",
+      "last": 0.970703125,
+      "late_mean": 0.9811422413793104,
+      "mid_mean": 0.984747561416185,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2193 | \u2198 -6.11% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "train_loss": {
+      "desired_direction": "lower",
+      "early_mean": 6.340343519442343,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 10.566866163080938,
+      "improvement_pct_display": "+10.57%",
+      "last": 6.491608619689941,
+      "late_mean": 5.670367905463295,
+      "mid_mean": 5.795929590401622,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +10.57% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "train_loss_ema": {
+      "desired_direction": "lower",
+      "early_mean": 6.265581717362126,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 10.455707205061195,
+      "improvement_pct_display": "+10.46%",
+      "last": 6.519052214060582,
+      "late_mean": 5.610470838300897,
+      "mid_mean": 5.8371378655061745,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +10.46% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_hit_at_1": {
+      "desired_direction": "higher",
+      "early_mean": 0.0079345703125,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 207.78846153846155,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+207.79%",
+      "last": 0.0282135009765625,
+      "late_mean": 0.02442169189453125,
+      "mid_mean": 0.01372528076171875,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2191 | \u2192 +207.79% flat",
+      "trend_label": "flat"
+    },
+    "val_hit_at_20": {
+      "desired_direction": "higher",
+      "early_mean": 0.08158111572265625,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 76.67165435331526,
+      "improvement_pct_display": "+76.67%",
+      "last": 0.15270233154296875,
+      "late_mean": 0.14413070678710938,
+      "mid_mean": 0.094146728515625,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +76.67% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_hit_at_5": {
+      "desired_direction": "higher",
+      "early_mean": 0.0288543701171875,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 134.8492860920148,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+134.85%",
+      "last": 0.0726776123046875,
+      "late_mean": 0.0677642822265625,
+      "mid_mean": 0.0425567626953125,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +134.85% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.2876316868363775,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -55.82459156154955,
+      "improvement_pct_display": "-55.82%",
+      "last": 6.646750174145564,
+      "late_mean": 2.006446816829876,
+      "mid_mean": 2.20697861268016,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2193 | \u2198 -55.82% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "val_ssl_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.0849772497183745,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 2.3192742421198114,
+      "improvement_pct_display": "+2.32%",
+      "last": 1.0397093277424574,
+      "late_mean": 1.0598136518327963,
+      "mid_mean": 1.0747967428483425,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2193 | \u2192 +2.32% flat",
+      "trend_label": "flat"
+    },
+    "val_structure_bce_loss": {
+      "desired_direction": "lower",
+      "early_mean": 0.0771060927848642,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 12.199713989530546,
+      "improvement_pct_display": "+12.20%",
+      "last": 0.06532714269997086,
+      "late_mean": 0.06769936999660872,
+      "mid_mean": 0.07029345531468391,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +12.20% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_structure_confidence_separation": {
+      "desired_direction": "higher",
+      "early_mean": -0.00795668972114072,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -204.85499246505236,
+      "improvement_pct_clipped": -100.0,
+      "improvement_pct_clipped_display": "-100.00%",
+      "improvement_pct_display": "-204.85%",
+      "last": -0.027957430157584895,
+      "late_mean": -0.024256365849851136,
+      "mid_mean": -0.01309866098972634,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -204.85% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "val_structure_correct_logit_mean": {
+      "desired_direction": "higher",
+      "early_mean": 8.0311279296875,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 16.44145855816145,
+      "improvement_pct_display": "+16.44%",
+      "last": 9.49462890625,
+      "late_mean": 9.3515625,
+      "mid_mean": 8.441162109375,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +16.44% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_structure_fingerprint_cosine": {
+      "desired_direction": "higher",
+      "early_mean": 0.4147872725734487,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 0.17175282510408285,
+      "improvement_pct_display": "+0.17%",
+      "last": 0.4255251376889646,
+      "late_mean": 0.4154996814322658,
+      "mid_mean": 0.4204998221830465,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2191 | \u2192 +0.17% flat",
+      "trend_label": "flat"
+    },
+    "val_structure_logit_margin_mean": {
+      "desired_direction": "higher",
+      "early_mean": -1.194091796875,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -13.669239419341647,
+      "improvement_pct_display": "-13.67%",
+      "last": -1.221923828125,
+      "late_mean": -1.3573150634765625,
+      "mid_mean": -2.0707931518554688,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -13.67% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "val_structure_retrieval_logit_std": {
+      "desired_direction": "higher",
+      "early_mean": 1.2326001720502973,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 102.32641409365677,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+102.33%",
+      "last": 2.6622845763340592,
+      "late_mean": 2.49387572822161,
+      "mid_mean": 2.022283688886091,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +102.33% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_structure_retrieval_loss": {
+      "desired_direction": "lower",
+      "early_mean": 11.562767315655947,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 4.864921250164783,
+      "improvement_pct_display": "+4.86%",
+      "last": 10.882395941764116,
+      "late_mean": 11.000247791409492,
+      "mid_mean": 12.150514367967844,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2193 | \u2192 +4.86% flat",
+      "trend_label": "flat"
+    },
+    "val_structure_target_rank_mean": {
+      "desired_direction": "lower",
+      "early_mean": 760.7540435791016,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 45.44775026271755,
+      "improvement_pct_display": "+45.45%",
+      "last": 379.8781280517578,
+      "late_mean": 415.0084457397461,
+      "mid_mean": 683.3385162353516,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +45.45% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_structure_top1_top2_gap_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.07839679718017578,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 54.90785232041847,
+      "improvement_pct_display": "+54.91%",
+      "last": 0.11855697631835938,
+      "late_mean": 0.12144279479980469,
+      "mid_mean": 0.1310901641845703,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +54.91% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_structure_top1_top2_gap_norm_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.06950851557485294,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -16.826381575968767,
+      "improvement_pct_display": "-16.83%",
+      "last": 0.05411380449368153,
+      "late_mean": 0.0578127475164365,
+      "mid_mean": 0.07577372609375743,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -16.83% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "val_structure_top_negative_logit_mean": {
+      "desired_direction": "lower",
+      "early_mean": 9.2255859375,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -16.07653223245475,
+      "improvement_pct_display": "-16.08%",
+      "last": 10.714599609375,
+      "late_mean": 10.708740234375,
+      "mid_mean": 10.51171875,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2193 | \u2198 -16.08% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "val_structure_uncertain_fraction": {
+      "desired_direction": "lower",
+      "early_mean": 0.9941177368164062,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -0.03261678728482514,
+      "improvement_pct_display": "-0.03%",
+      "last": 0.9922027587890625,
+      "late_mean": 0.9944419860839844,
+      "mid_mean": 0.9762382507324219,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2193 | \u2192 -0.03% flat",
+      "trend_label": "flat"
+    },
+    "weighted_regularizer_to_contrastive_ratio": {
+      "desired_direction": "lower",
+      "early_mean": 0.0667222202939108,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 54.60656419810926,
+      "improvement_pct_display": "+54.61%",
+      "last": 0.028996589606316913,
+      "late_mean": 0.03028750823471251,
+      "mid_mean": 0.0329437448262181,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +54.61% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    }
+  },
+  "metrics": {
+    "backbone_lr": 3.886130904636371e-06,
+    "checkpoint_path": "/home/ubuntu/artifacts/nexa_mol/final_v3_structure_alignment/v26_r1/current_checkpoint.pt",
+    "checkpoint_reloaded": 1.0,
+    "contrastive_loss": 0.5768923759460449,
+    "covariance_loss": 10.012618064880371,
+    "covariance_to_contrastive_ratio": 17.356128252623712,
+    "covariance_weight": 0.0015,
+    "dataloader_time_sec": 0.00035174899676349014,
+    "dataloader_wait_pct_300s": 0.0382592069912683,
+    "dataloader_wait_pct_60s": 0.0961140629935623,
+    "dataloader_wait_pct_900s": 0.066640439237091,
+    "dataloader_wait_pct_run": 0.06717802801040498,
+    "different_inchikey_mean_cosine": 0.004679911238535274,
+    "distributed_rank": 0.0,
+    "distributed_world_size": 1.0,
+    "effective_batch_size": 512.0,
+    "effective_hard_negative_scale": 1.0,
+    "effective_retrieval_weight": 0.6,
+    "effective_structure_bce_weight": 1.0,
+    "embedding_mean_norm": 1.0,
+    "embedding_offdiag_mean_cosine": 0.009513536468148232,
+    "embedding_std": 0.07216806709766388,
+    "global_batch_size": 512.0,
+    "gpu_active_fraction": 1.0,
+    "gpu_count_observed": 2.0,
+    "gpu_max_memory_gb": 13.279157161712646,
+    "gpu_mem_used_mean_gb": 14.1943359375,
+    "gpu_mem_util_mean_pct": 14.848754175733243,
+    "gpu_memory_stable": true,
+    "gpu_memory_utilization": 0.13982381154325935,
+    "gpu_snapshot_available": 1.0,
+    "gpu_util_max_pct": 54.0,
+    "gpu_util_mean_pct": 36.0,
+    "gpu_util_min_pct": 18.0,
+    "grad_norm": 1.7659728527069092,
+    "holdout_full_coverage": 0.0,
+    "local_batch_size": 512.0,
+    "lr": 3.886130904636371e-06,
+    "mfu_estimate": 0.06267708747552383,
+    "msms_objective": "hybrid",
+    "optimizer_step": 1.0,
+    "regularizer_ramp": 1.0,
+    "resume_checkpoint_path": "/home/ubuntu/artifacts/nexa_mol/final_v3_structure_alignment/v26_r1/current_checkpoint.pt",
+    "resume_start_step": 81002.0,
+    "resumed_from_checkpoint": 1.0,
+    "retrieval_head_lr": 1.9430654523181854e-05,
+    "same_inchikey_mean_cosine": 0.16267980930137343,
+    "samples_per_sec": 1399.0203442084614,
+    "samples_per_sec_300s": 1547.033197547462,
+    "samples_per_sec_60s": 1399.0203442084614,
+    "samples_per_sec_900s": 1512.7885250414204,
+    "samples_per_sec_run_mean": 1533.0231795943853,
+    "step_time_cv_300s": 0.06743440395418321,
+    "step_time_cv_60s": 0.0,
+    "step_time_cv_900s": 0.09218780075615579,
+    "step_time_sec": 0.3659703749981418,
+    "structure_bce_locked": 0.0,
+    "structure_bce_loss": 0.08383000642061234,
+    "structure_candidate_count": 2126.0,
+    "structure_clear_fraction": 0.0,
+    "structure_clear_hit_at_1": 0.0,
+    "structure_close_fraction": 0.029296875,
+    "structure_close_hit_at_1": 0.0,
+    "structure_confidence_bucket_score_mean": 0.10155132412910461,
+    "structure_confidence_bucket_score_mode": "normalized_gap",
+    "structure_confidence_candidate_count": 2126.0,
+    "structure_confidence_clear_threshold": 1.0,
+    "structure_confidence_close_threshold": 0.35,
+    "structure_confidence_eval_key_mode": "target_identity",
+    "structure_confidence_separation": -0.0040241447277367115,
+    "structure_correct_logit_mean": 9.1875,
+    "structure_fingerprint_cosine": 0.46021854877471924,
+    "structure_hard_negative_bonus_applied": 1.0,
+    "structure_hard_negative_bonus_mean": 0.060302734375,
+    "structure_hard_negative_scale": 1.0,
+    "structure_head_lr": 1.9430654523181854e-05,
+    "structure_hit_at_1": 0.00390625,
+    "structure_hit_at_20": 0.1171875,
+    "structure_hit_at_5": 0.029296875,
+    "structure_local_ce_loss": 3.545562744140625,
+    "structure_local_ce_loss_weight": 0.4,
+    "structure_local_rerank_loss": 0.0,
+    "structure_local_rerank_loss_weight": 0.0,
+    "structure_local_rerank_score_scale": 1.0,
+    "structure_logit_margin_mean": -1.0078125,
+    "structure_margin_loss": 0.0,
+    "structure_margin_loss_weight": 0.0,
+    "structure_missing_formula_fraction": 0.0,
+    "structure_missing_inchikey_fraction": 0.0,
+    "structure_pairwise_logistic_loss": 0.0,
+    "structure_pairwise_logistic_loss_weight": 0.0,
+    "structure_positive_count_mean": 1.0,
+    "structure_post_label_candidate_count": 2126.0,
+    "structure_post_precursor_candidate_count": 2128.0,
+    "structure_prefilter_candidate_count": 2128.0,
+    "structure_retrieval_logit_std": 0.9839304089546204,
+    "structure_retrieval_loss": 10.630162239074707,
+    "structure_retrieval_scorer": "projected_dot",
+    "structure_retrieval_target_mode": "sample",
+    "structure_skipped_query_fraction": 0.0,
+    "structure_soft_target_exact_mix": 0.4,
+    "structure_soft_target_loss": 7.523618221282959,
+    "structure_soft_target_loss_weight": 0.3,
+    "structure_target_backend": "rdkit_morgan",
+    "structure_target_equivalent_count_mean": 1.0,
+    "structure_target_identity_collision_count": 0.0,
+    "structure_target_rank_mean": 314.703125,
+    "structure_to_ssl_ratio": 217.7124787233957,
+    "structure_top1_top2_gap_mean": 0.0986328125,
+    "structure_top1_top2_gap_norm_mean": 0.10155132412910461,
+    "structure_top_negative_logit_mean": 10.1875,
+    "structure_uncertain_fraction": 0.970703125,
+    "structure_uncertain_hit_at_1": 0.0040241447277367115,
+    "structure_valid_query_fraction": 1.0,
+    "test_expected_shard_count": 2.0,
+    "test_full_coverage": 0.0,
+    "test_observed_shard_count": 0.0,
+    "train_loss": 6.491608619689941,
+    "train_loss_ema": 6.519052214060582,
+    "train_retrieval_bank_size": 4096.0,
+    "val_deep_eval_single_view": 0.0,
+    "val_deep_eval_structure_only": 0.0,
+    "val_effective_structure_bce_weight": 1.0,
+    "val_eval_loader_mode": "stream",
+    "val_eval_mode": "deep",
+    "val_expected_shard_count": 2.0,
+    "val_full_coverage": 1.0,
+    "val_hit_at_1": 0.0282135009765625,
+    "val_hit_at_20": 0.15270233154296875,
+    "val_hit_at_5": 0.0726776123046875,
+    "val_loss": 6.646750174145564,
+    "val_observed_eval_batches": 256.0,
+    "val_observed_shard_count": 2.0,
+    "val_ssl_loss": 1.0397093277424574,
+    "val_structure_bce_loss": 0.06532714269997086,
+    "val_structure_candidate_count": 4119.69140625,
+    "val_structure_clear_fraction": 0.0,
+    "val_structure_clear_hit_at_1": 0.0,
+    "val_structure_close_fraction": 0.0077972412109375,
+    "val_structure_close_hit_at_1": 0.014835291571216658,
+    "val_structure_confidence_candidate_count": 4096.0,
+    "val_structure_confidence_separation": -0.027957430157584895,
+    "val_structure_correct_logit_mean": 9.49462890625,
+    "val_structure_fingerprint_cosine": 0.4255251376889646,
+    "val_structure_logit_margin_mean": -1.221923828125,
+    "val_structure_missing_formula_fraction": 0.0,
+    "val_structure_missing_inchikey_fraction": 0.0,
+    "val_structure_retrieval_logit_std": 2.6622845763340592,
+    "val_structure_retrieval_loss": 10.882395941764116,
+    "val_structure_target_equivalent_count_mean": 1.0,
+    "val_structure_target_identity_collision_count": 23.69140625,
+    "val_structure_target_rank_mean": 379.8781280517578,
+    "val_structure_top1_top2_gap_mean": 0.11855697631835938,
+    "val_structure_top1_top2_gap_norm_mean": 0.05411380449368153,
+    "val_structure_top_negative_logit_mean": 10.714599609375,
+    "val_structure_uncertain_fraction": 0.9922027587890625,
+    "val_structure_uncertain_hit_at_1": 0.027957430157584895,
+    "variance_loss": 0.00213623046875,
+    "variance_weight": 0.8,
+    "weighted_covariance_loss": 0.015018927097320557,
+    "weighted_regularizer_to_contrastive_ratio": 0.028996589606316913,
+    "weighted_ssl_loss": 0.02968101501464844,
+    "weighted_structure_bce_loss": 0.08383000642061234,
+    "weighted_structure_retrieval_loss": 6.378097343444824,
+    "weighted_variance_loss": 0.001708984375
+  },
+  "primary_metric_pressure_summary": {
+    "average_improvement_pct": -14.247321653690681,
+    "metric_count": 12,
+    "overall_arrow": "\u2197",
+    "overall_pressure": "pressure_up",
+    "pressure_down_count": 4,
+    "pressure_none_count": 3,
+    "pressure_up_count": 5,
+    "pressure_up_fraction": 0.4166666666666667,
+    "weighted_improvement_pct": -4.446275812252011,
+    "weighted_pressure_score": 0.1702127659574468
+  },
+  "primary_metric_pressure_summary_display": {
+    "average_improvement_pct": -14.247321653690681,
+    "average_improvement_pct_display": "-14.25%",
+    "metric_count": 12,
+    "overall_arrow": "\u2197",
+    "overall_display": "\u2197 improving (-4.45% weighted)",
+    "overall_label": "improving",
+    "overall_pressure": "pressure_up",
+    "pressure_down_count": 4,
+    "pressure_none_count": 3,
+    "pressure_up_count": 5,
+    "pressure_up_fraction": 0.4166666666666667,
+    "pressure_up_fraction_display": "+41.67%",
+    "weighted_improvement_pct": -4.446275812252011,
+    "weighted_improvement_pct_display": "-4.45%",
+    "weighted_pressure_score": 0.1702127659574468
+  },
+  "primary_metric_pressures": {
+    "contrastive_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.409792113166324,
+      "improvement_pct": -1.6400841264380104,
+      "improvement_pct_clipped": -1.6400841264380104,
+      "last": 0.5768923759460449,
+      "late_mean": 1.43291388983014,
+      "mid_mean": 1.3598130204084982,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "grad_norm": {
+      "desired_direction": "stable",
+      "early_mean": 4.638080189338309,
+      "improvement_pct": -100.0,
+      "improvement_pct_clipped": -100.0,
+      "last": 1.7659728527069092,
+      "late_mean": 6.072961742165445,
+      "mid_mean": 4.979553528603791,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "samples_per_sec": {
+      "desired_direction": "higher",
+      "early_mean": 1575.5664566260843,
+      "improvement_pct": -2.8825714693532967,
+      "improvement_pct_clipped": -2.8825714693532967,
+      "last": 1399.0203442084614,
+      "late_mean": 1530.1496274666802,
+      "mid_mean": 1531.3735887168505,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "structure_bce_loss": {
+      "desired_direction": "lower",
+      "early_mean": 0.12293951650489272,
+      "improvement_pct": 39.749156913940595,
+      "improvement_pct_clipped": 39.749156913940595,
+      "last": 0.08383000642061234,
+      "late_mean": 0.07407209518012302,
+      "mid_mean": 0.07652380578004556,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "train_loss": {
+      "desired_direction": "lower",
+      "early_mean": 6.340343519442343,
+      "improvement_pct": 10.566866163080938,
+      "improvement_pct_clipped": 10.566866163080938,
+      "last": 6.491608619689941,
+      "late_mean": 5.670367905463295,
+      "mid_mean": 5.795929590401622,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_hit_at_20": {
+      "desired_direction": "higher",
+      "early_mean": 0.08158111572265625,
+      "improvement_pct": 76.67165435331526,
+      "improvement_pct_clipped": 76.67165435331526,
+      "last": 0.15270233154296875,
+      "late_mean": 0.14413070678710938,
+      "mid_mean": 0.094146728515625,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.2876316868363775,
+      "improvement_pct": -55.82459156154955,
+      "improvement_pct_clipped": -55.82459156154955,
+      "last": 6.646750174145564,
+      "late_mean": 2.006446816829876,
+      "mid_mean": 2.20697861268016,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "val_structure_bce_loss": {
+      "desired_direction": "lower",
+      "early_mean": 0.0771060927848642,
+      "improvement_pct": 12.199713989530546,
+      "improvement_pct_clipped": 12.199713989530546,
+      "last": 0.06532714269997086,
+      "late_mean": 0.06769936999660872,
+      "mid_mean": 0.07029345531468391,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_structure_confidence_separation": {
+      "desired_direction": "higher",
+      "early_mean": -0.00795668972114072,
+      "improvement_pct": -204.85499246505236,
+      "improvement_pct_clipped": -100.0,
+      "last": -0.027957430157584895,
+      "late_mean": -0.024256365849851136,
+      "mid_mean": -0.01309866098972634,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "val_structure_fingerprint_cosine": {
+      "desired_direction": "higher",
+      "early_mean": 0.4147872725734487,
+      "improvement_pct": 0.17175282510408285,
+      "improvement_pct_clipped": 0.17175282510408285,
+      "last": 0.4255251376889646,
+      "late_mean": 0.4154996814322658,
+      "mid_mean": 0.4204998221830465,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "val_structure_top1_top2_gap_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.07839679718017578,
+      "improvement_pct": 54.90785232041847,
+      "improvement_pct_clipped": 54.90785232041847,
+      "last": 0.11855697631835938,
+      "late_mean": 0.12144279479980469,
+      "mid_mean": 0.1310901641845703,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_structure_uncertain_fraction": {
+      "desired_direction": "lower",
+      "early_mean": 0.9941177368164062,
+      "improvement_pct": -0.03261678728482514,
+      "improvement_pct_clipped": -0.03261678728482514,
+      "last": 0.9922027587890625,
+      "late_mean": 0.9944419860839844,
+      "mid_mean": 0.9762382507324219,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    }
+  },
+  "primary_metric_pressures_display": {
+    "contrastive_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.409792113166324,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -1.6400841264380104,
+      "improvement_pct_display": "-1.64%",
+      "last": 0.5768923759460449,
+      "late_mean": 1.43291388983014,
+      "mid_mean": 1.3598130204084982,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2193 | \u2192 -1.64% flat",
+      "trend_label": "flat"
+    },
+    "grad_norm": {
+      "desired_direction": "stable",
+      "early_mean": 4.638080189338309,
+      "goal_display": "goal \u2248",
+      "improvement_pct": -100.0,
+      "improvement_pct_display": "-100.00%",
+      "last": 1.7659728527069092,
+      "late_mean": 6.072961742165445,
+      "mid_mean": 4.979553528603791,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2248 | \u2198 -100.00% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "samples_per_sec": {
+      "desired_direction": "higher",
+      "early_mean": 1575.5664566260843,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -2.8825714693532967,
+      "improvement_pct_display": "-2.88%",
+      "last": 1399.0203442084614,
+      "late_mean": 1530.1496274666802,
+      "mid_mean": 1531.3735887168505,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -2.88% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "structure_bce_loss": {
+      "desired_direction": "lower",
+      "early_mean": 0.12293951650489272,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 39.749156913940595,
+      "improvement_pct_display": "+39.75%",
+      "last": 0.08383000642061234,
+      "late_mean": 0.07407209518012302,
+      "mid_mean": 0.07652380578004556,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +39.75% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "train_loss": {
+      "desired_direction": "lower",
+      "early_mean": 6.340343519442343,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 10.566866163080938,
+      "improvement_pct_display": "+10.57%",
+      "last": 6.491608619689941,
+      "late_mean": 5.670367905463295,
+      "mid_mean": 5.795929590401622,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +10.57% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_hit_at_20": {
+      "desired_direction": "higher",
+      "early_mean": 0.08158111572265625,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 76.67165435331526,
+      "improvement_pct_display": "+76.67%",
+      "last": 0.15270233154296875,
+      "late_mean": 0.14413070678710938,
+      "mid_mean": 0.094146728515625,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +76.67% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.2876316868363775,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -55.82459156154955,
+      "improvement_pct_display": "-55.82%",
+      "last": 6.646750174145564,
+      "late_mean": 2.006446816829876,
+      "mid_mean": 2.20697861268016,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2193 | \u2198 -55.82% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "val_structure_bce_loss": {
+      "desired_direction": "lower",
+      "early_mean": 0.0771060927848642,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 12.199713989530546,
+      "improvement_pct_display": "+12.20%",
+      "last": 0.06532714269997086,
+      "late_mean": 0.06769936999660872,
+      "mid_mean": 0.07029345531468391,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +12.20% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_structure_confidence_separation": {
+      "desired_direction": "higher",
+      "early_mean": -0.00795668972114072,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -204.85499246505236,
+      "improvement_pct_clipped": -100.0,
+      "improvement_pct_clipped_display": "-100.00%",
+      "improvement_pct_display": "-204.85%",
+      "last": -0.027957430157584895,
+      "late_mean": -0.024256365849851136,
+      "mid_mean": -0.01309866098972634,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -204.85% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "val_structure_fingerprint_cosine": {
+      "desired_direction": "higher",
+      "early_mean": 0.4147872725734487,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 0.17175282510408285,
+      "improvement_pct_display": "+0.17%",
+      "last": 0.4255251376889646,
+      "late_mean": 0.4154996814322658,
+      "mid_mean": 0.4204998221830465,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2191 | \u2192 +0.17% flat",
+      "trend_label": "flat"
+    },
+    "val_structure_top1_top2_gap_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.07839679718017578,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 54.90785232041847,
+      "improvement_pct_display": "+54.91%",
+      "last": 0.11855697631835938,
+      "late_mean": 0.12144279479980469,
+      "mid_mean": 0.1310901641845703,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +54.91% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_structure_uncertain_fraction": {
+      "desired_direction": "lower",
+      "early_mean": 0.9941177368164062,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -0.03261678728482514,
+      "improvement_pct_display": "-0.03%",
+      "last": 0.9922027587890625,
+      "late_mean": 0.9944419860839844,
+      "mid_mean": 0.9762382507324219,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2193 | \u2192 -0.03% flat",
+      "trend_label": "flat"
+    }
+  },
+  "primary_metrics": {
+    "contrastive_loss": 0.5768923759460449,
+    "different_inchikey_mean_cosine": 0.004679911238535274,
+    "embedding_std": 0.07216806709766388,
+    "grad_norm": 1.7659728527069092,
+    "samples_per_sec": 1399.0203442084614,
+    "structure_bce_loss": 0.08383000642061234,
+    "train_loss": 6.491608619689941,
+    "val_hit_at_20": 0.15270233154296875,
+    "val_loss": 6.646750174145564,
+    "val_structure_bce_loss": 0.06532714269997086,
+    "val_structure_candidate_count": 4119.69140625,
+    "val_structure_clear_hit_at_1": 0.0,
+    "val_structure_confidence_separation": -0.027957430157584895,
+    "val_structure_fingerprint_cosine": 0.4255251376889646,
+    "val_structure_top1_top2_gap_mean": 0.11855697631835938,
+    "val_structure_uncertain_fraction": 0.9922027587890625
+  },
+  "run_name": "final_v3_structure_alignment_v26_r1",
+  "shard_counts": {
+    "test": 2,
+    "train": 4,
+    "val": 2
+  }
+}

metadata/archive/20260413T213902Z/latest_checkpoint.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ /home/ubuntu/artifacts/nexa_mol/final_v3_structure_alignment/v26_r1/current_checkpoint.pt

metadata/archive/20260413T213902Z/latest_metrics.json ADDED Viewed

	@@ -0,0 +1,169 @@

+{
+  "backbone_lr": 3.886130904636371e-06,
+  "checkpoint_path": "/home/ubuntu/artifacts/nexa_mol/final_v3_structure_alignment/v26_r1/current_checkpoint.pt",
+  "checkpoint_reloaded": 1.0,
+  "contrastive_loss": 0.5768923759460449,
+  "covariance_loss": 10.012618064880371,
+  "covariance_to_contrastive_ratio": 17.356128252623712,
+  "covariance_weight": 0.0015,
+  "dataloader_time_sec": 0.00035174899676349014,
+  "dataloader_wait_pct_300s": 0.0382592069912683,
+  "dataloader_wait_pct_60s": 0.0961140629935623,
+  "dataloader_wait_pct_900s": 0.066640439237091,
+  "dataloader_wait_pct_run": 0.06717802801040498,
+  "different_inchikey_mean_cosine": 0.004679911238535274,
+  "distributed_rank": 0.0,
+  "distributed_world_size": 1.0,
+  "effective_batch_size": 512.0,
+  "effective_hard_negative_scale": 1.0,
+  "effective_retrieval_weight": 0.6,
+  "effective_structure_bce_weight": 1.0,
+  "embedding_mean_norm": 1.0,
+  "embedding_offdiag_mean_cosine": 0.009513536468148232,
+  "embedding_std": 0.07216806709766388,
+  "final_report": 1.0,
+  "global_batch_size": 512.0,
+  "gpu_active_fraction": 1.0,
+  "gpu_count_observed": 2.0,
+  "gpu_max_memory_gb": 13.279157161712646,
+  "gpu_mem_used_mean_gb": 14.1943359375,
+  "gpu_mem_util_mean_pct": 14.848754175733243,
+  "gpu_memory_stable": true,
+  "gpu_memory_utilization": 0.13982381154325935,
+  "gpu_snapshot_available": 1.0,
+  "gpu_util_max_pct": 54.0,
+  "gpu_util_mean_pct": 36.0,
+  "gpu_util_min_pct": 18.0,
+  "grad_norm": 1.7659728527069092,
+  "holdout_full_coverage": 0.0,
+  "local_batch_size": 512.0,
+  "lr": 3.886130904636371e-06,
+  "mfu_estimate": 0.06267708747552383,
+  "msms_objective": "hybrid",
+  "optimizer_step": 1.0,
+  "regularizer_ramp": 1.0,
+  "resume_checkpoint_path": "/home/ubuntu/artifacts/nexa_mol/final_v3_structure_alignment/v26_r1/current_checkpoint.pt",
+  "resume_start_step": 81002.0,
+  "resumed_from_checkpoint": 1.0,
+  "retrieval_head_lr": 1.9430654523181854e-05,
+  "same_inchikey_mean_cosine": 0.16267980930137343,
+  "samples_per_sec": 1399.0203442084614,
+  "samples_per_sec_300s": 1547.033197547462,
+  "samples_per_sec_60s": 1399.0203442084614,
+  "samples_per_sec_900s": 1512.7885250414204,
+  "samples_per_sec_run_mean": 1533.0231795943853,
+  "step": 91001,
+  "step_time_cv_300s": 0.06743440395418321,
+  "step_time_cv_60s": 0.0,
+  "step_time_cv_900s": 0.09218780075615579,
+  "step_time_sec": 0.3659703749981418,
+  "structure_bce_locked": 0.0,
+  "structure_bce_loss": 0.08383000642061234,
+  "structure_candidate_count": 2126.0,
+  "structure_clear_fraction": 0.0,
+  "structure_clear_hit_at_1": 0.0,
+  "structure_close_fraction": 0.029296875,
+  "structure_close_hit_at_1": 0.0,
+  "structure_confidence_bucket_score_mean": 0.10155132412910461,
+  "structure_confidence_bucket_score_mode": "normalized_gap",
+  "structure_confidence_candidate_count": 2126.0,
+  "structure_confidence_clear_threshold": 1.0,
+  "structure_confidence_close_threshold": 0.35,
+  "structure_confidence_eval_key_mode": "target_identity",
+  "structure_confidence_separation": -0.0040241447277367115,
+  "structure_correct_logit_mean": 9.1875,
+  "structure_fingerprint_cosine": 0.46021854877471924,
+  "structure_hard_negative_bonus_applied": 1.0,
+  "structure_hard_negative_bonus_mean": 0.060302734375,
+  "structure_hard_negative_scale": 1.0,
+  "structure_head_lr": 1.9430654523181854e-05,
+  "structure_hit_at_1": 0.00390625,
+  "structure_hit_at_20": 0.1171875,
+  "structure_hit_at_5": 0.029296875,
+  "structure_local_ce_loss": 3.545562744140625,
+  "structure_local_ce_loss_weight": 0.4,
+  "structure_local_rerank_loss": 0.0,
+  "structure_local_rerank_loss_weight": 0.0,
+  "structure_local_rerank_score_scale": 1.0,
+  "structure_logit_margin_mean": -1.0078125,
+  "structure_margin_loss": 0.0,
+  "structure_margin_loss_weight": 0.0,
+  "structure_missing_formula_fraction": 0.0,
+  "structure_missing_inchikey_fraction": 0.0,
+  "structure_pairwise_logistic_loss": 0.0,
+  "structure_pairwise_logistic_loss_weight": 0.0,
+  "structure_positive_count_mean": 1.0,
+  "structure_post_label_candidate_count": 2126.0,
+  "structure_post_precursor_candidate_count": 2128.0,
+  "structure_prefilter_candidate_count": 2128.0,
+  "structure_retrieval_logit_std": 0.9839304089546204,
+  "structure_retrieval_loss": 10.630162239074707,
+  "structure_retrieval_scorer": "projected_dot",
+  "structure_retrieval_target_mode": "sample",
+  "structure_skipped_query_fraction": 0.0,
+  "structure_soft_target_exact_mix": 0.4,
+  "structure_soft_target_loss": 7.523618221282959,
+  "structure_soft_target_loss_weight": 0.3,
+  "structure_target_backend": "rdkit_morgan",
+  "structure_target_equivalent_count_mean": 1.0,
+  "structure_target_identity_collision_count": 0.0,
+  "structure_target_rank_mean": 314.703125,
+  "structure_to_ssl_ratio": 217.7124787233957,
+  "structure_top1_top2_gap_mean": 0.0986328125,
+  "structure_top1_top2_gap_norm_mean": 0.10155132412910461,
+  "structure_top_negative_logit_mean": 10.1875,
+  "structure_uncertain_fraction": 0.970703125,
+  "structure_uncertain_hit_at_1": 0.0040241447277367115,
+  "structure_valid_query_fraction": 1.0,
+  "test_expected_shard_count": 2.0,
+  "test_full_coverage": 0.0,
+  "test_observed_shard_count": 0.0,
+  "train_loss": 6.491608619689941,
+  "train_loss_ema": 6.519052214060582,
+  "train_retrieval_bank_size": 4096.0,
+  "val_deep_eval_single_view": 0.0,
+  "val_deep_eval_structure_only": 0.0,
+  "val_effective_structure_bce_weight": 1.0,
+  "val_eval_loader_mode": "stream",
+  "val_eval_mode": "deep",
+  "val_expected_shard_count": 2.0,
+  "val_full_coverage": 1.0,
+  "val_hit_at_1": 0.0282135009765625,
+  "val_hit_at_20": 0.15270233154296875,
+  "val_hit_at_5": 0.0726776123046875,
+  "val_loss": 6.646750174145564,
+  "val_observed_eval_batches": 256.0,
+  "val_observed_shard_count": 2.0,
+  "val_ssl_loss": 1.0397093277424574,
+  "val_structure_bce_loss": 0.06532714269997086,
+  "val_structure_candidate_count": 4119.69140625,
+  "val_structure_clear_fraction": 0.0,
+  "val_structure_clear_hit_at_1": 0.0,
+  "val_structure_close_fraction": 0.0077972412109375,
+  "val_structure_close_hit_at_1": 0.014835291571216658,
+  "val_structure_confidence_candidate_count": 4096.0,
+  "val_structure_confidence_separation": -0.027957430157584895,
+  "val_structure_correct_logit_mean": 9.49462890625,
+  "val_structure_fingerprint_cosine": 0.4255251376889646,
+  "val_structure_logit_margin_mean": -1.221923828125,
+  "val_structure_missing_formula_fraction": 0.0,
+  "val_structure_missing_inchikey_fraction": 0.0,
+  "val_structure_retrieval_logit_std": 2.6622845763340592,
+  "val_structure_retrieval_loss": 10.882395941764116,
+  "val_structure_target_equivalent_count_mean": 1.0,
+  "val_structure_target_identity_collision_count": 23.69140625,
+  "val_structure_target_rank_mean": 379.8781280517578,
+  "val_structure_top1_top2_gap_mean": 0.11855697631835938,
+  "val_structure_top1_top2_gap_norm_mean": 0.05411380449368153,
+  "val_structure_top_negative_logit_mean": 10.714599609375,
+  "val_structure_uncertain_fraction": 0.9922027587890625,
+  "val_structure_uncertain_hit_at_1": 0.027957430157584895,
+  "variance_loss": 0.00213623046875,
+  "variance_weight": 0.8,
+  "weighted_covariance_loss": 0.015018927097320557,
+  "weighted_regularizer_to_contrastive_ratio": 0.028996589606316913,
+  "weighted_ssl_loss": 0.02968101501464844,
+  "weighted_structure_bce_loss": 0.08383000642061234,
+  "weighted_structure_retrieval_loss": 6.378097343444824,
+  "weighted_variance_loss": 0.001708984375
+}

metadata/archive/20260413T213902Z/perf_summary.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+  "logged_points": 521,
+  "train_loss_min": 3.2278988361358643,
+  "train_loss_max": 7.677141189575195,
+  "train_loss_last": 6.491608619689941,
+  "train_loss_ema_last": 6.519052214060582,
+  "weighted_regularizer_ratio_median": 0.02686493425176378,
+  "weighted_regularizer_ratio_p90": 0.09558363904110317,
+  "samples_per_sec_mean": 1545.3851888056406,
+  "samples_per_sec_min": 930.5498563655322,
+  "samples_per_sec_max": 2247.460787425693,
+  "step_time_mean": 0.33468720350667036,
+  "mfu_mean": 0.06923433462788683,
+  "mfu_max": 0.10068781126337953,
+  "gpu_mem_max_gb": 13.279157161712646
+}

metadata/archive/20260413T213902Z/results.md ADDED Viewed

	@@ -0,0 +1,171 @@

+# MS/MS Training Run Result
+- Run name: `final_v3_structure_alignment_v26_r1`
+- Created at: `2026-04-13T21:36:19Z`
+- Dataset root: `/home/ubuntu/data/gems_v1_handoff_labeled_v26`
+- Shard counts: `{'train': 4, 'val': 2, 'test': 2}`
+## Primary Metrics
+- `train_loss`: `6.491608619689941`
+- `val_loss`: `6.646750174145564`
+- `grad_norm`: `1.7659728527069092`
+- `contrastive_loss`: `0.5768923759460449`
+- `structure_bce_loss`: `0.08383000642061234`
+- `val_structure_bce_loss`: `0.06532714269997086`
+- `val_structure_fingerprint_cosine`: `0.4255251376889646`
+- `different_inchikey_mean_cosine`: `0.004679911238535274`
+- `embedding_std`: `0.07216806709766388`
+- `val_hit_at_20`: `0.15270233154296875`
+- `val_structure_candidate_count`: `4119.69140625`
+- `val_structure_top1_top2_gap_mean`: `0.11855697631835938`
+- `val_structure_uncertain_fraction`: `0.9922027587890625`
+- `val_structure_clear_hit_at_1`: `0.0`
+- `val_structure_confidence_separation`: `-0.027957430157584895`
+- `samples_per_sec`: `1399.0203442084614`
+## Failure Mode Assessment
+- `dataset_shards_accessible`: pass. Observed shard counts {'train': 4, 'val': 2, 'test': 2}; the canonical Day 1 loader contract requires all splits to be readable.
+- `dataloader_streaming_stable`: pass. Training batches continued to arrive with positive throughput and no iterator stall.
+- `non_finite_loss_or_tensor_failure`: pass. Technical_Plan requires zero NaN or Inf tensors and finite train/val loss.
+- `validation_observability_gap`: pass. Engineering.md expects slope-aware monitoring; missing validation or retrieval metrics make trend judgment weaker.
+- `gpu_memory_instability`: pass. Technical_Plan Day 1 success requires stable GPU memory through the bounded run.
+- `checkpoint_save_reload_failure`: pass. Checkpoint save and reload is an explicit Day 1 success criterion.
+- `embedding_collapse`: pass. Engineering.md expects embedding variance monitoring and non-collapsed representations.
+- `regularizer_dominance`: pass. The current instability mode is regularization overpowering the SSL objective and producing jagged total loss.
+- `structure_supervision_gap`: pass. Once the bridge phase begins, Technical_Plan requires retrieval-oriented validation rather than only augmented contrastive loss.
+- `confidence_surface_gap`: pass. Structure-first qualification now requires explicit confidence diagnostics such as top-1/top-2 separation and uncertainty buckets, not just broader retrieval metrics.
+- `chemistry_target_backend_gap`: pass. The bridge phase should prefer chemistry-grounded fingerprint targets; hashed fallback targets weaken the retrieval signal.
+- `bridge_fit_without_ranking`: pass. Bridge runs must improve retrieval after fingerprint fit saturates; fitting BCE while val Hit@20 stays at candidate-bank baseline means ranking is not generalizing.
+- `metadata_shortcutting`: watch. Engineering.md flags acquisition-artefact shortcut risk; adduct and instrument embeddings remain deliberately down-scaled.
+## Pressure Summary
+- all metrics overall: `↗ improving (+21.89% weighted)`
+- all metrics weighted improvement: `+21.89%`
+- all metrics average improvement: `+34.52%`
+- all metrics weighted pressure score: `0.284`
+- all metrics counts: `up=21` `none=7` `down=11` `up_fraction=+53.85%`
+- primary metrics overall: `↗ improving (-4.45% weighted)`
+- primary metrics weighted improvement: `-4.45%`
+## Metric Pressure
+- `train_loss`: `goal ↓ | ↗ +10.57% improving` (early `6.340343519442343`, mid `5.795929590401622`, late `5.670367905463295`, last `6.491608619689941`)
+- `train_loss_ema`: `goal ↓ | ↗ +10.46% improving` (early `6.265581717362126`, mid `5.8371378655061745`, late `5.610470838300897`, last `6.519052214060582`)
+- `contrastive_loss`: `goal ↓ | → -1.64% flat` (early `1.409792113166324`, mid `1.3598130204084982`, late `1.43291388983014`, last `0.5768923759460449`)
+- `val_loss`: `goal ↓ | ↘ -55.82% worsening` (early `1.2876316868363775`, mid `2.20697861268016`, late `2.006446816829876`, last `6.646750174145564`)
+- `val_ssl_loss`: `goal ↓ | → +2.32% flat` (early `1.0849772497183745`, mid `1.0747967428483425`, late `1.0598136518327963`, last `1.0397093277424574`)
+- `structure_bce_loss`: `goal ↓ | ↗ +39.75% improving` (early `0.12293951650489272`, mid `0.07652380578004556`, late `0.07407209518012302`, last `0.08383000642061234`)
+- `val_structure_bce_loss`: `goal ↓ | ↗ +12.20% improving` (early `0.0771060927848642`, mid `0.07029345531468391`, late `0.06769936999660872`, last `0.06532714269997086`)
+- `structure_retrieval_loss`: `goal ↓ | ↗ +10.09% improving` (early `10.237479978903181`, mid `9.41523380775672`, late `9.204101929719421`, last `10.630162239074707`)
+- `val_structure_retrieval_loss`: `goal ↓ | → +4.86% flat` (early `11.562767315655947`, mid `12.150514367967844`, late `11.000247791409492`, last `10.882395941764116`)
+- `structure_fingerprint_cosine`: `goal ↑ | ↗ +17.59% improving` (early `0.3965519580968543`, mid `0.4464927057310336`, late `0.46629545006943846`, last `0.46021854877471924`)
+- `val_structure_fingerprint_cosine`: `goal ↑ | → +0.17% flat` (early `0.4147872725734487`, mid `0.4204998221830465`, late `0.4154996814322658`, last `0.4255251376889646`)
+- `structure_target_rank_mean`: `goal ↓ | ↗ +58.80% improving` (early `351.84337743858384`, mid `176.16389315390174`, late `144.9534280711207`, last `314.703125`)
+- `val_structure_target_rank_mean`: `goal ↓ | ↗ +45.45% improving` (early `760.7540435791016`, mid `683.3385162353516`, late `415.0084457397461`, last `379.8781280517578`)
+- `structure_correct_logit_mean`: `goal ↑ | ↗ +47.31% improving` (early `6.134031791907514`, mid `9.474891618497109`, late `9.035739942528735`, last `9.1875`)
+- `val_structure_correct_logit_mean`: `goal ↑ | ↗ +16.44% improving` (early `8.0311279296875`, mid `8.441162109375`, late `9.3515625`, last `9.49462890625`)
+- `structure_top_negative_logit_mean`: `goal ↓ | ↘ -39.72% worsening` (early `7.262102601156069`, mid `10.490606936416185`, late `10.14691091954023`, last `10.1875`)
+- `val_structure_top_negative_logit_mean`: `goal ↓ | ↘ -16.08% worsening` (early `9.2255859375`, mid `10.51171875`, late `10.708740234375`, last `10.714599609375`)
+- `structure_logit_margin_mean`: `goal ↑ | → +1.23% flat` (early `-1.1263999277456647`, mid `-1.0154725885115607`, late `-1.1125740840517242`, last `-1.0078125`)
+- `val_structure_logit_margin_mean`: `goal ↑ | ↘ -13.67% worsening` (early `-1.194091796875`, mid `-2.0707931518554688`, late `-1.3573150634765625`, last `-1.221923828125`)
+- `structure_retrieval_logit_std`: `goal ↑ | ↗ +112.06% improving` (early `1.0455416592559375`, mid `2.0036371215919537`, late `2.2171744848119803`, last `0.9839304089546204`)
+- `val_structure_retrieval_logit_std`: `goal ↑ | ↗ +102.33% improving` (early `1.2326001720502973`, mid `2.022283688886091`, late `2.49387572822161`, last `2.6622845763340592`)
+- `structure_top1_top2_gap_mean`: `goal ↑ | ↗ +59.22% improving` (early `0.09793567106213873`, mid `0.12284365968208093`, late `0.1559343009159483`, last `0.0986328125`)
+- `val_structure_top1_top2_gap_mean`: `goal ↑ | ↗ +54.91% improving` (early `0.07839679718017578`, mid `0.1310901641845703`, late `0.12144279479980469`, last `0.11855697631835938`)
+- `structure_top1_top2_gap_norm_mean`: `goal ↑ | ↘ -35.65% worsening` (early `0.12215662799301864`, mid `0.07032911504236604`, late `0.07860379065547524`, last `0.10155132412910461`)
+- `val_structure_top1_top2_gap_norm_mean`: `goal ↑ | ↘ -16.83% worsening` (early `0.06950851557485294`, mid `0.07577372609375743`, late `0.0578127475164365`, last `0.05411380449368153`)
+- `structure_uncertain_fraction`: `goal ↓ | ↘ -6.11% worsening` (early `0.924663565751445`, mid `0.984747561416185`, late `0.9811422413793104`, last `0.970703125`)
+- `val_structure_uncertain_fraction`: `goal ↓ | → -0.03% flat` (early `0.9941177368164062`, mid `0.9762382507324219`, late `0.9944419860839844`, last `0.9922027587890625`)
+- `structure_confidence_separation`: `goal ↑ | ↘ -531.56% worsening` (early `-0.007918493679557749`, mid `-0.032136323077151974`, late `-0.05001017991881603`, last `-0.0040241447277367115`)
+- `val_structure_confidence_separation`: `goal ↑ | ↘ -204.85% worsening` (early `-0.00795668972114072`, mid `-0.01309866098972634`, late `-0.024256365849851136`, last `-0.027957430157584895`)
+- `structure_hit_at_1`: `goal ↑ | ↗ +549.68% improving` (early `0.007880238439306358`, mid `0.032706376445086706`, late `0.051196569683908046`, last `0.00390625`)
+- `structure_hit_at_5`: `goal ↑ | ↗ +402.47% improving` (early `0.03360955563583815`, mid `0.11673591040462428`, late `0.16887796336206898`, last `0.029296875`)
+- `structure_hit_at_20`: `goal ↑ | ↗ +239.46% improving` (early `0.10721865968208093`, mid `0.28105807442196534`, late `0.3639659662356322`, last `0.1171875`)
+- `val_hit_at_1`: `goal ↑ | → +207.79% flat` (early `0.0079345703125`, mid `0.01372528076171875`, late `0.02442169189453125`, last `0.0282135009765625`)
+- `val_hit_at_5`: `goal ↑ | ↗ +134.85% improving` (early `0.0288543701171875`, mid `0.0425567626953125`, late `0.0677642822265625`, last `0.0726776123046875`)
+- `val_hit_at_20`: `goal ↑ | ↗ +76.67% improving` (early `0.08158111572265625`, mid `0.094146728515625`, late `0.14413070678710938`, last `0.15270233154296875`)
+- `weighted_regularizer_to_contrastive_ratio`: `goal ↓ | ↗ +54.61% improving` (early `0.0667222202939108`, mid `0.0329437448262181`, late `0.03028750823471251`, last `0.028996589606316913`)
+- `samples_per_sec`: `goal ↑ | ↘ -2.88% worsening` (early `1575.5664566260843`, mid `1531.3735887168505`, late `1530.1496274666802`, last `1399.0203442084614`)
+- `gpu_max_memory_gb`: `goal ≈ | ↗ +100.00% improving` (early `13.252925169950275`, mid `13.279059082097401`, late `13.279157161712646`, last `13.279157161712646`)
+- `grad_norm`: `goal ≈ | ↘ -100.00% worsening` (early `4.638080189338309`, mid `4.979553528603791`, late `6.072961742165445`, last `1.7659728527069092`)
+## Primary Metric Pressure
+- `train_loss`: `goal ↓ | ↗ +10.57% improving` (early `6.340343519442343`, mid `5.795929590401622`, late `5.670367905463295`, last `6.491608619689941`)
+- `val_loss`: `goal ↓ | ↘ -55.82% worsening` (early `1.2876316868363775`, mid `2.20697861268016`, late `2.006446816829876`, last `6.646750174145564`)
+- `grad_norm`: `goal ≈ | ↘ -100.00% worsening` (early `4.638080189338309`, mid `4.979553528603791`, late `6.072961742165445`, last `1.7659728527069092`)
+- `contrastive_loss`: `goal ↓ | → -1.64% flat` (early `1.409792113166324`, mid `1.3598130204084982`, late `1.43291388983014`, last `0.5768923759460449`)
+- `structure_bce_loss`: `goal ↓ | ↗ +39.75% improving` (early `0.12293951650489272`, mid `0.07652380578004556`, late `0.07407209518012302`, last `0.08383000642061234`)
+- `val_structure_bce_loss`: `goal ↓ | ↗ +12.20% improving` (early `0.0771060927848642`, mid `0.07029345531468391`, late `0.06769936999660872`, last `0.06532714269997086`)
+- `val_structure_fingerprint_cosine`: `goal ↑ | → +0.17% flat` (early `0.4147872725734487`, mid `0.4204998221830465`, late `0.4154996814322658`, last `0.4255251376889646`)
+- `val_hit_at_20`: `goal ↑ | ↗ +76.67% improving` (early `0.08158111572265625`, mid `0.094146728515625`, late `0.14413070678710938`, last `0.15270233154296875`)
+- `val_structure_top1_top2_gap_mean`: `goal ↑ | ↗ +54.91% improving` (early `0.07839679718017578`, mid `0.1310901641845703`, late `0.12144279479980469`, last `0.11855697631835938`)
+- `val_structure_uncertain_fraction`: `goal ↓ | → -0.03% flat` (early `0.9941177368164062`, mid `0.9762382507324219`, late `0.9944419860839844`, last `0.9922027587890625`)
+- `val_structure_confidence_separation`: `goal ↑ | ↘ -204.85% worsening` (early `-0.00795668972114072`, mid `-0.01309866098972634`, late `-0.024256365849851136`, last `-0.027957430157584895`)
+- `samples_per_sec`: `goal ↑ | ↘ -2.88% worsening` (early `1575.5664566260843`, mid `1531.3735887168505`, late `1530.1496274666802`, last `1399.0203442084614`)
+## Debug Metrics
+- `train_loss`: `6.491608619689941`
+- `train_loss_ema`: `6.519052214060582`
+- `val_loss`: `6.646750174145564`
+- `contrastive_loss`: `0.5768923759460449`
+- `val_ssl_loss`: `1.0397093277424574`
+- `variance_loss`: `0.00213623046875`
+- `covariance_loss`: `10.012618064880371`
+- `structure_bce_loss`: `0.08383000642061234`
+- `structure_retrieval_loss`: `10.630162239074707`
+- `val_structure_retrieval_loss`: `10.882395941764116`
+- `structure_fingerprint_cosine`: `0.46021854877471924`
+- `structure_hit_at_1`: `0.00390625`
+- `structure_hit_at_5`: `0.029296875`
+- `structure_hit_at_20`: `0.1171875`
+- `structure_target_rank_mean`: `314.703125`
+- `structure_logit_margin_mean`: `-1.0078125`
+- `structure_retrieval_logit_std`: `0.9839304089546204`
+- `val_structure_retrieval_logit_std`: `2.6622845763340592`
+- `structure_correct_logit_mean`: `9.1875`
+- `structure_top_negative_logit_mean`: `10.1875`
+- `val_structure_correct_logit_mean`: `9.49462890625`
+- `val_structure_top_negative_logit_mean`: `10.714599609375`
+- `structure_top1_top2_gap_mean`: `0.0986328125`
+- `structure_top1_top2_gap_norm_mean`: `0.10155132412910461`
+- `structure_confidence_candidate_count`: `2126.0`
+- `structure_close_fraction`: `0.029296875`
+- `structure_uncertain_fraction`: `0.970703125`
+- `structure_uncertain_hit_at_1`: `0.0040241447277367115`
+- `structure_confidence_separation`: `-0.0040241447277367115`
+- `val_structure_top1_top2_gap_mean`: `0.11855697631835938`
+- `val_structure_top1_top2_gap_norm_mean`: `0.05411380449368153`
+- `val_structure_confidence_candidate_count`: `4096.0`
+- `val_structure_close_fraction`: `0.0077972412109375`
+- `val_structure_uncertain_fraction`: `0.9922027587890625`
+- `val_structure_close_hit_at_1`: `0.014835291571216658`
+- `val_structure_uncertain_hit_at_1`: `0.027957430157584895`
+- `val_structure_confidence_separation`: `-0.027957430157584895`
+- `grad_norm`: `1.7659728527069092`
+- `weighted_regularizer_to_contrastive_ratio`: `0.028996589606316913`
+- `samples_per_sec`: `1399.0203442084614`
+- `samples_per_sec_60s`: `1399.0203442084614`
+- `samples_per_sec_300s`: `1547.033197547462`
+- `samples_per_sec_900s`: `1512.7885250414204`
+- `samples_per_sec_run_mean`: `1533.0231795943853`
+- `gpu_max_memory_gb`: `13.279157161712646`
+- `gpu_util_mean_pct`: `36.0`
+- `gpu_util_min_pct`: `18.0`
+- `gpu_util_max_pct`: `54.0`
+- `gpu_active_fraction`: `1.0`
+- `gpu_mem_used_mean_gb`: `14.1943359375`
+- `gpu_mem_util_mean_pct`: `14.848754175733243`
+- `gpu_snapshot_available`: `1.0`
+- `step_time_sec`: `0.3659703749981418`
+- `step_time_cv_300s`: `0.06743440395418321`
+- `step_time_cv_900s`: `0.09218780075615579`
+- `dataloader_wait_pct_60s`: `0.0961140629935623`
+- `dataloader_wait_pct_300s`: `0.0382592069912683`
+- `dataloader_wait_pct_900s`: `0.066640439237091`
+- `dataloader_wait_pct_run`: `0.06717802801040498`
+- `mfu_estimate`: `0.06267708747552383`

metadata/checksums.sha256 ADDED Viewed

	@@ -0,0 +1,29 @@

+cef7a30afbc0f4c107dc791039b42edf61bff2337023f9d80b6ff5a2a94bbf29  README.md
+3c5d7e36bbc4d76a4158562380e32c82248a7b9e4035117d0bbaf900e8184e0c  config.json
+4046e164198deb550b34a4fc54bed0d5b40ccc57a646db5f8c56e261519d8e57  configs/foundation_config.json
+3b45ebb5770bed57ef75be985fba71513fffdb9ba075d21ab280208e3efa02a4  configs/runtime_requirements.json
+1debd145d109a2c27d435f8250bcb577366fd143d3977ac48effeeb7674c200f  configs/structure_alignment_config.json
+6a792005b4d2a70b53215b461a36fd9608a39df5898bb1d0a8b35f5af824177c  metadata/Final_V3_manifest.json
+e5fb430337eb1516bd168f019e1733b1baf37eb568776e009fb6f348c88e4537  metadata/archive/20260413T201817Z/latest_checkpoint.txt
+e5fb430337eb1516bd168f019e1733b1baf37eb568776e009fb6f348c88e4537  metadata/archive/20260413T202042Z/latest_checkpoint.txt
+a11f8a97e622078c7c0f2fa3f62525f13ed71ff0304deabe84656a7a576855c5  metadata/archive/20260413T213902Z/day1_validation_report.json
+e5fb430337eb1516bd168f019e1733b1baf37eb568776e009fb6f348c88e4537  metadata/archive/20260413T213902Z/latest_checkpoint.txt
+3e77984c10d6e0f9e8205a142dce9a4c3d513a719b39afda4095b27b92e2cbf2  metadata/archive/20260413T213902Z/latest_metrics.json
+c983893fe5aaf41c63a5d16cf0fdf055196785f23b2cd2ca4cd0a8812fc1ada6  metadata/archive/20260413T213902Z/perf_summary.json
+2135caf8c7d03112bd8b7fea56da9cf466b1d0f668809d984c33420b179111a8  metadata/archive/20260413T213902Z/results.md
+631653ad2feae896c11e3ae34f29ec90c317070d5c729bc5178ac3e7d2f23f2d  metadata/closeout_receipt.json
+a11f8a97e622078c7c0f2fa3f62525f13ed71ff0304deabe84656a7a576855c5  metadata/day1_validation_report.json
+6ef7558b9352003473eae0d9b03d9af20b1bd428865378cc5608bfd33cb0d97a  metadata/eval_coverage.json
+0ae4aef28a9733a7bb7f4a2422c09d7dc4f8a8238807be0e5c8e58843c2f3e32  metadata/fast_eval_surface.json
+e5fb430337eb1516bd168f019e1733b1baf37eb568776e009fb6f348c88e4537  metadata/latest_checkpoint.txt
+3e77984c10d6e0f9e8205a142dce9a4c3d513a719b39afda4095b27b92e2cbf2  metadata/latest_metrics.json
+c983893fe5aaf41c63a5d16cf0fdf055196785f23b2cd2ca4cd0a8812fc1ada6  metadata/perf_summary.json
+2135caf8c7d03112bd8b7fea56da9cf466b1d0f668809d984c33420b179111a8  metadata/results.md
+d25e392e32ea4aa38534689591582c99ae5d75e007f74390d57d79983adc665a  metadata/training_surface.json
+3a5746d461f17c831bcd08c4180482f7a8424b06e248eaa595202e73929726f0  model_index.json
+d3f6e70ec0b19c0fd8569a4ebd328a117508fe9b333274971967d2da2f9954ff  runtime/README.md
+896284beda3cff6c54e6c3e291ed5c0b2ad8ae708df880831137dee5ed7380db  runtime/nexamass_encoder.py
+c16f3bb2ab7c2612b6b84a3359abeaf0a1cb1c055399beac21b39521424328b5  weights/Final_V3-model_state.pt
+870b30c7bb6a340a460306882fe631d76282f233baf3920ca3a45c363eaf0ee6  weights/Final_V3-model_state.safetensors
+bde396a7448b6972bcb784a465812b4d5b819f8d0c76cf2fba7066db7be9da1f  weights/NexaMass-V3-Struct-model_state.pt
+6e006a6fa4ba6b8f127c7eabc9eaf6b7b64675e0136dee3ca1655bb3a4a3eadd  weights/NexaMass-V3-Struct-model_state.safetensors

metadata/closeout_receipt.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "created_at": "2026-04-13T21:47:04Z",
+  "dataset_receipt_path": "/home/ubuntu/artifacts/nexa_mol/final_v3_structure_alignment/v26_r1/dataset_receipt.json",
+  "dataset_snapshot_uploaded": false,
+  "remote_checkpoint_uri": "wasabi:nexa-ms/models/dreams_pretrain_v1/checkpoints",
+  "remote_dataset_uri": "wasabi:nexa-ms/processed/gems_v1/receipts",
+  "remote_log_uri": "wasabi:nexa-ms/models/dreams_pretrain_v1/logs",
+  "run_name": "final_v3_structure_alignment_v26_r1"
+}

metadata/day1_validation_report.json ADDED Viewed

	@@ -0,0 +1,2475 @@

+{
+  "analysis_basis": [
+    "docs/projects/msms_pipeline/Technical_Plan.md",
+    "docs/projects/msms_pipeline/Engineering.md"
+  ],
+  "created_at": "2026-04-13T21:36:19Z",
+  "dataset_root": "/home/ubuntu/data/gems_v1_handoff_labeled_v26",
+  "debug_metric_pressures": {
+    "gpu_max_memory_gb": {
+      "desired_direction": "stable",
+      "early_mean": 13.252925169950275,
+      "improvement_pct": 100.0,
+      "improvement_pct_clipped": 100.0,
+      "last": 13.279157161712646,
+      "late_mean": 13.279157161712646,
+      "mid_mean": 13.279059082097401,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_confidence_separation": {
+      "desired_direction": "higher",
+      "early_mean": -0.007918493679557749,
+      "improvement_pct": -531.5617836245987,
+      "improvement_pct_clipped": -100.0,
+      "last": -0.0040241447277367115,
+      "late_mean": -0.05001017991881603,
+      "mid_mean": -0.032136323077151974,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "structure_correct_logit_mean": {
+      "desired_direction": "higher",
+      "early_mean": 6.134031791907514,
+      "improvement_pct": 47.305071917778086,
+      "improvement_pct_clipped": 47.305071917778086,
+      "last": 9.1875,
+      "late_mean": 9.035739942528735,
+      "mid_mean": 9.474891618497109,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_fingerprint_cosine": {
+      "desired_direction": "higher",
+      "early_mean": 0.3965519580968543,
+      "improvement_pct": 17.58747890372286,
+      "improvement_pct_clipped": 17.58747890372286,
+      "last": 0.46021854877471924,
+      "late_mean": 0.46629545006943846,
+      "mid_mean": 0.4464927057310336,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_hit_at_1": {
+      "desired_direction": "higher",
+      "early_mean": 0.007880238439306358,
+      "improvement_pct": 549.6830023383724,
+      "improvement_pct_clipped": 100.0,
+      "last": 0.00390625,
+      "late_mean": 0.051196569683908046,
+      "mid_mean": 0.032706376445086706,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_hit_at_20": {
+      "desired_direction": "higher",
+      "early_mean": 0.10721865968208093,
+      "improvement_pct": 239.4614028144399,
+      "improvement_pct_clipped": 100.0,
+      "last": 0.1171875,
+      "late_mean": 0.3639659662356322,
+      "mid_mean": 0.28105807442196534,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_hit_at_5": {
+      "desired_direction": "higher",
+      "early_mean": 0.03360955563583815,
+      "improvement_pct": 402.47008675709174,
+      "improvement_pct_clipped": 100.0,
+      "last": 0.029296875,
+      "late_mean": 0.16887796336206898,
+      "mid_mean": 0.11673591040462428,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_logit_margin_mean": {
+      "desired_direction": "higher",
+      "early_mean": -1.1263999277456647,
+      "improvement_pct": 1.2274364862230593,
+      "improvement_pct_clipped": 1.2274364862230593,
+      "last": -1.0078125,
+      "late_mean": -1.1125740840517242,
+      "mid_mean": -1.0154725885115607,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "structure_retrieval_logit_std": {
+      "desired_direction": "higher",
+      "early_mean": 1.0455416592559375,
+      "improvement_pct": 112.05988926255111,
+      "improvement_pct_clipped": 100.0,
+      "last": 0.9839304089546204,
+      "late_mean": 2.2171744848119803,
+      "mid_mean": 2.0036371215919537,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_retrieval_loss": {
+      "desired_direction": "lower",
+      "early_mean": 10.237479978903181,
+      "improvement_pct": 10.094066619063353,
+      "improvement_pct_clipped": 10.094066619063353,
+      "last": 10.630162239074707,
+      "late_mean": 9.204101929719421,
+      "mid_mean": 9.41523380775672,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_target_rank_mean": {
+      "desired_direction": "lower",
+      "early_mean": 351.84337743858384,
+      "improvement_pct": 58.80171764880722,
+      "improvement_pct_clipped": 58.80171764880722,
+      "last": 314.703125,
+      "late_mean": 144.9534280711207,
+      "mid_mean": 176.16389315390174,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_top1_top2_gap_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.09793567106213873,
+      "improvement_pct": 59.221149173532794,
+      "improvement_pct_clipped": 59.221149173532794,
+      "last": 0.0986328125,
+      "late_mean": 0.1559343009159483,
+      "mid_mean": 0.12284365968208093,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_top1_top2_gap_norm_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.12215662799301864,
+      "improvement_pct": -35.653274040957065,
+      "improvement_pct_clipped": -35.653274040957065,
+      "last": 0.10155132412910461,
+      "late_mean": 0.07860379065547524,
+      "mid_mean": 0.07032911504236604,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "structure_top_negative_logit_mean": {
+      "desired_direction": "lower",
+      "early_mean": 7.262102601156069,
+      "improvement_pct": -39.724147080005764,
+      "improvement_pct_clipped": -39.724147080005764,
+      "last": 10.1875,
+      "late_mean": 10.14691091954023,
+      "mid_mean": 10.490606936416185,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "structure_uncertain_fraction": {
+      "desired_direction": "lower",
+      "early_mean": 0.924663565751445,
+      "improvement_pct": -6.108024336610137,
+      "improvement_pct_clipped": -6.108024336610137,
+      "last": 0.970703125,
+      "late_mean": 0.9811422413793104,
+      "mid_mean": 0.984747561416185,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "train_loss_ema": {
+      "desired_direction": "lower",
+      "early_mean": 6.265581717362126,
+      "improvement_pct": 10.455707205061195,
+      "improvement_pct_clipped": 10.455707205061195,
+      "last": 6.519052214060582,
+      "late_mean": 5.610470838300897,
+      "mid_mean": 5.8371378655061745,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_ssl_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.0849772497183745,
+      "improvement_pct": 2.3192742421198114,
+      "improvement_pct_clipped": 2.3192742421198114,
+      "last": 1.0397093277424574,
+      "late_mean": 1.0598136518327963,
+      "mid_mean": 1.0747967428483425,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "val_structure_correct_logit_mean": {
+      "desired_direction": "higher",
+      "early_mean": 8.0311279296875,
+      "improvement_pct": 16.44145855816145,
+      "improvement_pct_clipped": 16.44145855816145,
+      "last": 9.49462890625,
+      "late_mean": 9.3515625,
+      "mid_mean": 8.441162109375,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_structure_retrieval_logit_std": {
+      "desired_direction": "higher",
+      "early_mean": 1.2326001720502973,
+      "improvement_pct": 102.32641409365677,
+      "improvement_pct_clipped": 100.0,
+      "last": 2.6622845763340592,
+      "late_mean": 2.49387572822161,
+      "mid_mean": 2.022283688886091,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_structure_retrieval_loss": {
+      "desired_direction": "lower",
+      "early_mean": 11.562767315655947,
+      "improvement_pct": 4.864921250164783,
+      "improvement_pct_clipped": 4.864921250164783,
+      "last": 10.882395941764116,
+      "late_mean": 11.000247791409492,
+      "mid_mean": 12.150514367967844,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "val_structure_top1_top2_gap_norm_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.06950851557485294,
+      "improvement_pct": -16.826381575968767,
+      "improvement_pct_clipped": -16.826381575968767,
+      "last": 0.05411380449368153,
+      "late_mean": 0.0578127475164365,
+      "mid_mean": 0.07577372609375743,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "val_structure_top_negative_logit_mean": {
+      "desired_direction": "lower",
+      "early_mean": 9.2255859375,
+      "improvement_pct": -16.07653223245475,
+      "improvement_pct_clipped": -16.07653223245475,
+      "last": 10.714599609375,
+      "late_mean": 10.708740234375,
+      "mid_mean": 10.51171875,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "weighted_regularizer_to_contrastive_ratio": {
+      "desired_direction": "lower",
+      "early_mean": 0.0667222202939108,
+      "improvement_pct": 54.60656419810926,
+      "improvement_pct_clipped": 54.60656419810926,
+      "last": 0.028996589606316913,
+      "late_mean": 0.03028750823471251,
+      "mid_mean": 0.0329437448262181,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    }
+  },
+  "debug_metric_pressures_display": {
+    "gpu_max_memory_gb": {
+      "desired_direction": "stable",
+      "early_mean": 13.252925169950275,
+      "goal_display": "goal \u2248",
+      "improvement_pct": 100.0,
+      "improvement_pct_display": "+100.00%",
+      "last": 13.279157161712646,
+      "late_mean": 13.279157161712646,
+      "mid_mean": 13.279059082097401,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2248 | \u2197 +100.00% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_confidence_separation": {
+      "desired_direction": "higher",
+      "early_mean": -0.007918493679557749,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -531.5617836245987,
+      "improvement_pct_clipped": -100.0,
+      "improvement_pct_clipped_display": "-100.00%",
+      "improvement_pct_display": "-531.56%",
+      "last": -0.0040241447277367115,
+      "late_mean": -0.05001017991881603,
+      "mid_mean": -0.032136323077151974,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -531.56% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "structure_correct_logit_mean": {
+      "desired_direction": "higher",
+      "early_mean": 6.134031791907514,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 47.305071917778086,
+      "improvement_pct_display": "+47.31%",
+      "last": 9.1875,
+      "late_mean": 9.035739942528735,
+      "mid_mean": 9.474891618497109,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +47.31% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_fingerprint_cosine": {
+      "desired_direction": "higher",
+      "early_mean": 0.3965519580968543,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 17.58747890372286,
+      "improvement_pct_display": "+17.59%",
+      "last": 0.46021854877471924,
+      "late_mean": 0.46629545006943846,
+      "mid_mean": 0.4464927057310336,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +17.59% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_hit_at_1": {
+      "desired_direction": "higher",
+      "early_mean": 0.007880238439306358,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 549.6830023383724,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+549.68%",
+      "last": 0.00390625,
+      "late_mean": 0.051196569683908046,
+      "mid_mean": 0.032706376445086706,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +549.68% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_hit_at_20": {
+      "desired_direction": "higher",
+      "early_mean": 0.10721865968208093,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 239.4614028144399,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+239.46%",
+      "last": 0.1171875,
+      "late_mean": 0.3639659662356322,
+      "mid_mean": 0.28105807442196534,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +239.46% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_hit_at_5": {
+      "desired_direction": "higher",
+      "early_mean": 0.03360955563583815,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 402.47008675709174,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+402.47%",
+      "last": 0.029296875,
+      "late_mean": 0.16887796336206898,
+      "mid_mean": 0.11673591040462428,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +402.47% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_logit_margin_mean": {
+      "desired_direction": "higher",
+      "early_mean": -1.1263999277456647,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 1.2274364862230593,
+      "improvement_pct_display": "+1.23%",
+      "last": -1.0078125,
+      "late_mean": -1.1125740840517242,
+      "mid_mean": -1.0154725885115607,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2191 | \u2192 +1.23% flat",
+      "trend_label": "flat"
+    },
+    "structure_retrieval_logit_std": {
+      "desired_direction": "higher",
+      "early_mean": 1.0455416592559375,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 112.05988926255111,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+112.06%",
+      "last": 0.9839304089546204,
+      "late_mean": 2.2171744848119803,
+      "mid_mean": 2.0036371215919537,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +112.06% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_retrieval_loss": {
+      "desired_direction": "lower",
+      "early_mean": 10.237479978903181,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 10.094066619063353,
+      "improvement_pct_display": "+10.09%",
+      "last": 10.630162239074707,
+      "late_mean": 9.204101929719421,
+      "mid_mean": 9.41523380775672,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +10.09% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_target_rank_mean": {
+      "desired_direction": "lower",
+      "early_mean": 351.84337743858384,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 58.80171764880722,
+      "improvement_pct_display": "+58.80%",
+      "last": 314.703125,
+      "late_mean": 144.9534280711207,
+      "mid_mean": 176.16389315390174,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +58.80% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_top1_top2_gap_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.09793567106213873,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 59.221149173532794,
+      "improvement_pct_display": "+59.22%",
+      "last": 0.0986328125,
+      "late_mean": 0.1559343009159483,
+      "mid_mean": 0.12284365968208093,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +59.22% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_top1_top2_gap_norm_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.12215662799301864,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -35.653274040957065,
+      "improvement_pct_display": "-35.65%",
+      "last": 0.10155132412910461,
+      "late_mean": 0.07860379065547524,
+      "mid_mean": 0.07032911504236604,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -35.65% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "structure_top_negative_logit_mean": {
+      "desired_direction": "lower",
+      "early_mean": 7.262102601156069,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -39.724147080005764,
+      "improvement_pct_display": "-39.72%",
+      "last": 10.1875,
+      "late_mean": 10.14691091954023,
+      "mid_mean": 10.490606936416185,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2193 | \u2198 -39.72% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "structure_uncertain_fraction": {
+      "desired_direction": "lower",
+      "early_mean": 0.924663565751445,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -6.108024336610137,
+      "improvement_pct_display": "-6.11%",
+      "last": 0.970703125,
+      "late_mean": 0.9811422413793104,
+      "mid_mean": 0.984747561416185,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2193 | \u2198 -6.11% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "train_loss_ema": {
+      "desired_direction": "lower",
+      "early_mean": 6.265581717362126,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 10.455707205061195,
+      "improvement_pct_display": "+10.46%",
+      "last": 6.519052214060582,
+      "late_mean": 5.610470838300897,
+      "mid_mean": 5.8371378655061745,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +10.46% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_ssl_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.0849772497183745,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 2.3192742421198114,
+      "improvement_pct_display": "+2.32%",
+      "last": 1.0397093277424574,
+      "late_mean": 1.0598136518327963,
+      "mid_mean": 1.0747967428483425,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2193 | \u2192 +2.32% flat",
+      "trend_label": "flat"
+    },
+    "val_structure_correct_logit_mean": {
+      "desired_direction": "higher",
+      "early_mean": 8.0311279296875,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 16.44145855816145,
+      "improvement_pct_display": "+16.44%",
+      "last": 9.49462890625,
+      "late_mean": 9.3515625,
+      "mid_mean": 8.441162109375,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +16.44% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_structure_retrieval_logit_std": {
+      "desired_direction": "higher",
+      "early_mean": 1.2326001720502973,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 102.32641409365677,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+102.33%",
+      "last": 2.6622845763340592,
+      "late_mean": 2.49387572822161,
+      "mid_mean": 2.022283688886091,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +102.33% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_structure_retrieval_loss": {
+      "desired_direction": "lower",
+      "early_mean": 11.562767315655947,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 4.864921250164783,
+      "improvement_pct_display": "+4.86%",
+      "last": 10.882395941764116,
+      "late_mean": 11.000247791409492,
+      "mid_mean": 12.150514367967844,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2193 | \u2192 +4.86% flat",
+      "trend_label": "flat"
+    },
+    "val_structure_top1_top2_gap_norm_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.06950851557485294,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -16.826381575968767,
+      "improvement_pct_display": "-16.83%",
+      "last": 0.05411380449368153,
+      "late_mean": 0.0578127475164365,
+      "mid_mean": 0.07577372609375743,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -16.83% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "val_structure_top_negative_logit_mean": {
+      "desired_direction": "lower",
+      "early_mean": 9.2255859375,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -16.07653223245475,
+      "improvement_pct_display": "-16.08%",
+      "last": 10.714599609375,
+      "late_mean": 10.708740234375,
+      "mid_mean": 10.51171875,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2193 | \u2198 -16.08% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "weighted_regularizer_to_contrastive_ratio": {
+      "desired_direction": "lower",
+      "early_mean": 0.0667222202939108,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 54.60656419810926,
+      "improvement_pct_display": "+54.61%",
+      "last": 0.028996589606316913,
+      "late_mean": 0.03028750823471251,
+      "mid_mean": 0.0329437448262181,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +54.61% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    }
+  },
+  "debug_metrics": {
+    "contrastive_loss": 0.5768923759460449,
+    "covariance_loss": 10.012618064880371,
+    "dataloader_wait_pct_300s": 0.0382592069912683,
+    "dataloader_wait_pct_60s": 0.0961140629935623,
+    "dataloader_wait_pct_900s": 0.066640439237091,
+    "dataloader_wait_pct_run": 0.06717802801040498,
+    "gpu_active_fraction": 1.0,
+    "gpu_max_memory_gb": 13.279157161712646,
+    "gpu_mem_used_mean_gb": 14.1943359375,
+    "gpu_mem_util_mean_pct": 14.848754175733243,
+    "gpu_snapshot_available": 1.0,
+    "gpu_util_max_pct": 54.0,
+    "gpu_util_mean_pct": 36.0,
+    "gpu_util_min_pct": 18.0,
+    "grad_norm": 1.7659728527069092,
+    "mfu_estimate": 0.06267708747552383,
+    "samples_per_sec": 1399.0203442084614,
+    "samples_per_sec_300s": 1547.033197547462,
+    "samples_per_sec_60s": 1399.0203442084614,
+    "samples_per_sec_900s": 1512.7885250414204,
+    "samples_per_sec_run_mean": 1533.0231795943853,
+    "step_time_cv_300s": 0.06743440395418321,
+    "step_time_cv_900s": 0.09218780075615579,
+    "step_time_sec": 0.3659703749981418,
+    "structure_bce_loss": 0.08383000642061234,
+    "structure_close_fraction": 0.029296875,
+    "structure_confidence_candidate_count": 2126.0,
+    "structure_confidence_separation": -0.0040241447277367115,
+    "structure_correct_logit_mean": 9.1875,
+    "structure_fingerprint_cosine": 0.46021854877471924,
+    "structure_hit_at_1": 0.00390625,
+    "structure_hit_at_20": 0.1171875,
+    "structure_hit_at_5": 0.029296875,
+    "structure_logit_margin_mean": -1.0078125,
+    "structure_retrieval_logit_std": 0.9839304089546204,
+    "structure_retrieval_loss": 10.630162239074707,
+    "structure_target_rank_mean": 314.703125,
+    "structure_top1_top2_gap_mean": 0.0986328125,
+    "structure_top1_top2_gap_norm_mean": 0.10155132412910461,
+    "structure_top_negative_logit_mean": 10.1875,
+    "structure_uncertain_fraction": 0.970703125,
+    "structure_uncertain_hit_at_1": 0.0040241447277367115,
+    "train_loss": 6.491608619689941,
+    "train_loss_ema": 6.519052214060582,
+    "val_loss": 6.646750174145564,
+    "val_ssl_loss": 1.0397093277424574,
+    "val_structure_close_fraction": 0.0077972412109375,
+    "val_structure_close_hit_at_1": 0.014835291571216658,
+    "val_structure_confidence_candidate_count": 4096.0,
+    "val_structure_confidence_separation": -0.027957430157584895,
+    "val_structure_correct_logit_mean": 9.49462890625,
+    "val_structure_retrieval_logit_std": 2.6622845763340592,
+    "val_structure_retrieval_loss": 10.882395941764116,
+    "val_structure_top1_top2_gap_mean": 0.11855697631835938,
+    "val_structure_top1_top2_gap_norm_mean": 0.05411380449368153,
+    "val_structure_top_negative_logit_mean": 10.714599609375,
+    "val_structure_uncertain_fraction": 0.9922027587890625,
+    "val_structure_uncertain_hit_at_1": 0.027957430157584895,
+    "variance_loss": 0.00213623046875,
+    "weighted_regularizer_to_contrastive_ratio": 0.028996589606316913
+  },
+  "eval_coverage": {
+    "configured_test_shard_count": 2,
+    "configured_test_shards": [
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/test/shard_20260313_051433_00000.parquet",
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/test/shard_20260313_051454_00000.parquet"
+    ],
+    "configured_val_shard_count": 2,
+    "configured_val_shards": [
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051433_00000.parquet",
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051454_00000.parquet"
+    ],
+    "created_at": "2026-04-13T21:36:17Z",
+    "eval_batch_limit": 256,
+    "eval_batches_per_shard_limit": 0,
+    "eval_loader_mode": "stream",
+    "eval_mode": "deep",
+    "full_holdout_coverage": 0.0,
+    "full_holdout_sweep": false,
+    "full_test_coverage": 0.0,
+    "full_val_coverage": 1.0,
+    "missing_test_shards": [
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/test/shard_20260313_051433_00000.parquet",
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/test/shard_20260313_051454_00000.parquet"
+    ],
+    "missing_val_shards": [],
+    "observed_eval_batches": 256,
+    "observed_eval_samples": 131072,
+    "observed_test_shard_count": 0,
+    "observed_test_shards": [],
+    "observed_val_shard_count": 2,
+    "observed_val_shards": [
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051433_00000.parquet",
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051454_00000.parquet"
+    ],
+    "per_shard_batch_count": {
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051433_00000.parquet": 128,
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051454_00000.parquet": 128
+    },
+    "per_shard_sample_count": {
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051433_00000.parquet": 65536,
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051454_00000.parquet": 65536
+    },
+    "run_step": 10000,
+    "step": 91001,
+    "unexpected_eval_shards": []
+  },
+  "failure_modes": [
+    {
+      "detail": "Observed shard counts {'train': 4, 'val': 2, 'test': 2}; the canonical Day 1 loader contract requires all splits to be readable.",
+      "name": "dataset_shards_accessible",
+      "status": "pass"
+    },
+    {
+      "detail": "Training batches continued to arrive with positive throughput and no iterator stall.",
+      "name": "dataloader_streaming_stable",
+      "status": "pass"
+    },
+    {
+      "detail": "Technical_Plan requires zero NaN or Inf tensors and finite train/val loss.",
+      "name": "non_finite_loss_or_tensor_failure",
+      "status": "pass"
+    },
+    {
+      "detail": "Engineering.md expects slope-aware monitoring; missing validation or retrieval metrics make trend judgment weaker.",
+      "name": "validation_observability_gap",
+      "status": "pass"
+    },
+    {
+      "detail": "Technical_Plan Day 1 success requires stable GPU memory through the bounded run.",
+      "name": "gpu_memory_instability",
+      "status": "pass"
+    },
+    {
+      "detail": "Checkpoint save and reload is an explicit Day 1 success criterion.",
+      "name": "checkpoint_save_reload_failure",
+      "status": "pass"
+    },
+    {
+      "detail": "Engineering.md expects embedding variance monitoring and non-collapsed representations.",
+      "name": "embedding_collapse",
+      "status": "pass"
+    },
+    {
+      "detail": "The current instability mode is regularization overpowering the SSL objective and producing jagged total loss.",
+      "name": "regularizer_dominance",
+      "status": "pass"
+    },
+    {
+      "detail": "Once the bridge phase begins, Technical_Plan requires retrieval-oriented validation rather than only augmented contrastive loss.",
+      "name": "structure_supervision_gap",
+      "status": "pass"
+    },
+    {
+      "detail": "Structure-first qualification now requires explicit confidence diagnostics such as top-1/top-2 separation and uncertainty buckets, not just broader retrieval metrics.",
+      "name": "confidence_surface_gap",
+      "status": "pass"
+    },
+    {
+      "detail": "The bridge phase should prefer chemistry-grounded fingerprint targets; hashed fallback targets weaken the retrieval signal.",
+      "name": "chemistry_target_backend_gap",
+      "status": "pass"
+    },
+    {
+      "detail": "Bridge runs must improve retrieval after fingerprint fit saturates; fitting BCE while val Hit@20 stays at candidate-bank baseline means ranking is not generalizing.",
+      "name": "bridge_fit_without_ranking",
+      "status": "pass"
+    },
+    {
+      "detail": "Engineering.md flags acquisition-artefact shortcut risk; adduct and instrument embeddings remain deliberately down-scaled.",
+      "name": "metadata_shortcutting",
+      "status": "watch"
+    }
+  ],
+  "fast_eval_surface": {
+    "batch_size": 512,
+    "batches_per_shard": 0,
+    "configured_val_shard_count": 2,
+    "configured_val_shards": [
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051433_00000.parquet",
+      "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051454_00000.parquet"
+    ],
+    "created_at": "2026-04-13T20:20:58Z",
+    "loader_mode": "stream",
+    "per_shard_batch_count": {},
+    "per_shard_row_count": {},
+    "row_count": 0
+  },
+  "metric_pressure_summary": {
+    "average_improvement_pct": 34.52368967199551,
+    "metric_count": 39,
+    "overall_arrow": "\u2197",
+    "overall_pressure": "pressure_up",
+    "pressure_down_count": 11,
+    "pressure_none_count": 7,
+    "pressure_up_count": 21,
+    "pressure_up_fraction": 0.5384615384615384,
+    "weighted_improvement_pct": 21.88570985770741,
+    "weighted_pressure_score": 0.2838709677419355
+  },
+  "metric_pressure_summary_display": {
+    "average_improvement_pct": 34.52368967199551,
+    "average_improvement_pct_display": "+34.52%",
+    "metric_count": 39,
+    "overall_arrow": "\u2197",
+    "overall_display": "\u2197 improving (+21.89% weighted)",
+    "overall_label": "improving",
+    "overall_pressure": "pressure_up",
+    "pressure_down_count": 11,
+    "pressure_none_count": 7,
+    "pressure_up_count": 21,
+    "pressure_up_fraction": 0.5384615384615384,
+    "pressure_up_fraction_display": "+53.85%",
+    "weighted_improvement_pct": 21.88570985770741,
+    "weighted_improvement_pct_display": "+21.89%",
+    "weighted_pressure_score": 0.2838709677419355
+  },
+  "metric_pressures": {
+    "contrastive_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.409792113166324,
+      "improvement_pct": -1.6400841264380104,
+      "improvement_pct_clipped": -1.6400841264380104,
+      "last": 0.5768923759460449,
+      "late_mean": 1.43291388983014,
+      "mid_mean": 1.3598130204084982,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "gpu_max_memory_gb": {
+      "desired_direction": "stable",
+      "early_mean": 13.252925169950275,
+      "improvement_pct": 100.0,
+      "improvement_pct_clipped": 100.0,
+      "last": 13.279157161712646,
+      "late_mean": 13.279157161712646,
+      "mid_mean": 13.279059082097401,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "grad_norm": {
+      "desired_direction": "stable",
+      "early_mean": 4.638080189338309,
+      "improvement_pct": -100.0,
+      "improvement_pct_clipped": -100.0,
+      "last": 1.7659728527069092,
+      "late_mean": 6.072961742165445,
+      "mid_mean": 4.979553528603791,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "samples_per_sec": {
+      "desired_direction": "higher",
+      "early_mean": 1575.5664566260843,
+      "improvement_pct": -2.8825714693532967,
+      "improvement_pct_clipped": -2.8825714693532967,
+      "last": 1399.0203442084614,
+      "late_mean": 1530.1496274666802,
+      "mid_mean": 1531.3735887168505,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "structure_bce_loss": {
+      "desired_direction": "lower",
+      "early_mean": 0.12293951650489272,
+      "improvement_pct": 39.749156913940595,
+      "improvement_pct_clipped": 39.749156913940595,
+      "last": 0.08383000642061234,
+      "late_mean": 0.07407209518012302,
+      "mid_mean": 0.07652380578004556,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_confidence_separation": {
+      "desired_direction": "higher",
+      "early_mean": -0.007918493679557749,
+      "improvement_pct": -531.5617836245987,
+      "improvement_pct_clipped": -100.0,
+      "last": -0.0040241447277367115,
+      "late_mean": -0.05001017991881603,
+      "mid_mean": -0.032136323077151974,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "structure_correct_logit_mean": {
+      "desired_direction": "higher",
+      "early_mean": 6.134031791907514,
+      "improvement_pct": 47.305071917778086,
+      "improvement_pct_clipped": 47.305071917778086,
+      "last": 9.1875,
+      "late_mean": 9.035739942528735,
+      "mid_mean": 9.474891618497109,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_fingerprint_cosine": {
+      "desired_direction": "higher",
+      "early_mean": 0.3965519580968543,
+      "improvement_pct": 17.58747890372286,
+      "improvement_pct_clipped": 17.58747890372286,
+      "last": 0.46021854877471924,
+      "late_mean": 0.46629545006943846,
+      "mid_mean": 0.4464927057310336,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_hit_at_1": {
+      "desired_direction": "higher",
+      "early_mean": 0.007880238439306358,
+      "improvement_pct": 549.6830023383724,
+      "improvement_pct_clipped": 100.0,
+      "last": 0.00390625,
+      "late_mean": 0.051196569683908046,
+      "mid_mean": 0.032706376445086706,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_hit_at_20": {
+      "desired_direction": "higher",
+      "early_mean": 0.10721865968208093,
+      "improvement_pct": 239.4614028144399,
+      "improvement_pct_clipped": 100.0,
+      "last": 0.1171875,
+      "late_mean": 0.3639659662356322,
+      "mid_mean": 0.28105807442196534,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_hit_at_5": {
+      "desired_direction": "higher",
+      "early_mean": 0.03360955563583815,
+      "improvement_pct": 402.47008675709174,
+      "improvement_pct_clipped": 100.0,
+      "last": 0.029296875,
+      "late_mean": 0.16887796336206898,
+      "mid_mean": 0.11673591040462428,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_logit_margin_mean": {
+      "desired_direction": "higher",
+      "early_mean": -1.1263999277456647,
+      "improvement_pct": 1.2274364862230593,
+      "improvement_pct_clipped": 1.2274364862230593,
+      "last": -1.0078125,
+      "late_mean": -1.1125740840517242,
+      "mid_mean": -1.0154725885115607,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "structure_retrieval_logit_std": {
+      "desired_direction": "higher",
+      "early_mean": 1.0455416592559375,
+      "improvement_pct": 112.05988926255111,
+      "improvement_pct_clipped": 100.0,
+      "last": 0.9839304089546204,
+      "late_mean": 2.2171744848119803,
+      "mid_mean": 2.0036371215919537,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_retrieval_loss": {
+      "desired_direction": "lower",
+      "early_mean": 10.237479978903181,
+      "improvement_pct": 10.094066619063353,
+      "improvement_pct_clipped": 10.094066619063353,
+      "last": 10.630162239074707,
+      "late_mean": 9.204101929719421,
+      "mid_mean": 9.41523380775672,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_target_rank_mean": {
+      "desired_direction": "lower",
+      "early_mean": 351.84337743858384,
+      "improvement_pct": 58.80171764880722,
+      "improvement_pct_clipped": 58.80171764880722,
+      "last": 314.703125,
+      "late_mean": 144.9534280711207,
+      "mid_mean": 176.16389315390174,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_top1_top2_gap_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.09793567106213873,
+      "improvement_pct": 59.221149173532794,
+      "improvement_pct_clipped": 59.221149173532794,
+      "last": 0.0986328125,
+      "late_mean": 0.1559343009159483,
+      "mid_mean": 0.12284365968208093,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "structure_top1_top2_gap_norm_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.12215662799301864,
+      "improvement_pct": -35.653274040957065,
+      "improvement_pct_clipped": -35.653274040957065,
+      "last": 0.10155132412910461,
+      "late_mean": 0.07860379065547524,
+      "mid_mean": 0.07032911504236604,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "structure_top_negative_logit_mean": {
+      "desired_direction": "lower",
+      "early_mean": 7.262102601156069,
+      "improvement_pct": -39.724147080005764,
+      "improvement_pct_clipped": -39.724147080005764,
+      "last": 10.1875,
+      "late_mean": 10.14691091954023,
+      "mid_mean": 10.490606936416185,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "structure_uncertain_fraction": {
+      "desired_direction": "lower",
+      "early_mean": 0.924663565751445,
+      "improvement_pct": -6.108024336610137,
+      "improvement_pct_clipped": -6.108024336610137,
+      "last": 0.970703125,
+      "late_mean": 0.9811422413793104,
+      "mid_mean": 0.984747561416185,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "train_loss": {
+      "desired_direction": "lower",
+      "early_mean": 6.340343519442343,
+      "improvement_pct": 10.566866163080938,
+      "improvement_pct_clipped": 10.566866163080938,
+      "last": 6.491608619689941,
+      "late_mean": 5.670367905463295,
+      "mid_mean": 5.795929590401622,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "train_loss_ema": {
+      "desired_direction": "lower",
+      "early_mean": 6.265581717362126,
+      "improvement_pct": 10.455707205061195,
+      "improvement_pct_clipped": 10.455707205061195,
+      "last": 6.519052214060582,
+      "late_mean": 5.610470838300897,
+      "mid_mean": 5.8371378655061745,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_hit_at_1": {
+      "desired_direction": "higher",
+      "early_mean": 0.0079345703125,
+      "improvement_pct": 207.78846153846155,
+      "improvement_pct_clipped": 100.0,
+      "last": 0.0282135009765625,
+      "late_mean": 0.02442169189453125,
+      "mid_mean": 0.01372528076171875,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "val_hit_at_20": {
+      "desired_direction": "higher",
+      "early_mean": 0.08158111572265625,
+      "improvement_pct": 76.67165435331526,
+      "improvement_pct_clipped": 76.67165435331526,
+      "last": 0.15270233154296875,
+      "late_mean": 0.14413070678710938,
+      "mid_mean": 0.094146728515625,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_hit_at_5": {
+      "desired_direction": "higher",
+      "early_mean": 0.0288543701171875,
+      "improvement_pct": 134.8492860920148,
+      "improvement_pct_clipped": 100.0,
+      "last": 0.0726776123046875,
+      "late_mean": 0.0677642822265625,
+      "mid_mean": 0.0425567626953125,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.2876316868363775,
+      "improvement_pct": -55.82459156154955,
+      "improvement_pct_clipped": -55.82459156154955,
+      "last": 6.646750174145564,
+      "late_mean": 2.006446816829876,
+      "mid_mean": 2.20697861268016,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "val_ssl_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.0849772497183745,
+      "improvement_pct": 2.3192742421198114,
+      "improvement_pct_clipped": 2.3192742421198114,
+      "last": 1.0397093277424574,
+      "late_mean": 1.0598136518327963,
+      "mid_mean": 1.0747967428483425,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "val_structure_bce_loss": {
+      "desired_direction": "lower",
+      "early_mean": 0.0771060927848642,
+      "improvement_pct": 12.199713989530546,
+      "improvement_pct_clipped": 12.199713989530546,
+      "last": 0.06532714269997086,
+      "late_mean": 0.06769936999660872,
+      "mid_mean": 0.07029345531468391,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_structure_confidence_separation": {
+      "desired_direction": "higher",
+      "early_mean": -0.00795668972114072,
+      "improvement_pct": -204.85499246505236,
+      "improvement_pct_clipped": -100.0,
+      "last": -0.027957430157584895,
+      "late_mean": -0.024256365849851136,
+      "mid_mean": -0.01309866098972634,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "val_structure_correct_logit_mean": {
+      "desired_direction": "higher",
+      "early_mean": 8.0311279296875,
+      "improvement_pct": 16.44145855816145,
+      "improvement_pct_clipped": 16.44145855816145,
+      "last": 9.49462890625,
+      "late_mean": 9.3515625,
+      "mid_mean": 8.441162109375,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_structure_fingerprint_cosine": {
+      "desired_direction": "higher",
+      "early_mean": 0.4147872725734487,
+      "improvement_pct": 0.17175282510408285,
+      "improvement_pct_clipped": 0.17175282510408285,
+      "last": 0.4255251376889646,
+      "late_mean": 0.4154996814322658,
+      "mid_mean": 0.4204998221830465,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "val_structure_logit_margin_mean": {
+      "desired_direction": "higher",
+      "early_mean": -1.194091796875,
+      "improvement_pct": -13.669239419341647,
+      "improvement_pct_clipped": -13.669239419341647,
+      "last": -1.221923828125,
+      "late_mean": -1.3573150634765625,
+      "mid_mean": -2.0707931518554688,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "val_structure_retrieval_logit_std": {
+      "desired_direction": "higher",
+      "early_mean": 1.2326001720502973,
+      "improvement_pct": 102.32641409365677,
+      "improvement_pct_clipped": 100.0,
+      "last": 2.6622845763340592,
+      "late_mean": 2.49387572822161,
+      "mid_mean": 2.022283688886091,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_structure_retrieval_loss": {
+      "desired_direction": "lower",
+      "early_mean": 11.562767315655947,
+      "improvement_pct": 4.864921250164783,
+      "improvement_pct_clipped": 4.864921250164783,
+      "last": 10.882395941764116,
+      "late_mean": 11.000247791409492,
+      "mid_mean": 12.150514367967844,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "val_structure_target_rank_mean": {
+      "desired_direction": "lower",
+      "early_mean": 760.7540435791016,
+      "improvement_pct": 45.44775026271755,
+      "improvement_pct_clipped": 45.44775026271755,
+      "last": 379.8781280517578,
+      "late_mean": 415.0084457397461,
+      "mid_mean": 683.3385162353516,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_structure_top1_top2_gap_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.07839679718017578,
+      "improvement_pct": 54.90785232041847,
+      "improvement_pct_clipped": 54.90785232041847,
+      "last": 0.11855697631835938,
+      "late_mean": 0.12144279479980469,
+      "mid_mean": 0.1310901641845703,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_structure_top1_top2_gap_norm_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.06950851557485294,
+      "improvement_pct": -16.826381575968767,
+      "improvement_pct_clipped": -16.826381575968767,
+      "last": 0.05411380449368153,
+      "late_mean": 0.0578127475164365,
+      "mid_mean": 0.07577372609375743,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "val_structure_top_negative_logit_mean": {
+      "desired_direction": "lower",
+      "early_mean": 9.2255859375,
+      "improvement_pct": -16.07653223245475,
+      "improvement_pct_clipped": -16.07653223245475,
+      "last": 10.714599609375,
+      "late_mean": 10.708740234375,
+      "mid_mean": 10.51171875,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "val_structure_uncertain_fraction": {
+      "desired_direction": "lower",
+      "early_mean": 0.9941177368164062,
+      "improvement_pct": -0.03261678728482514,
+      "improvement_pct_clipped": -0.03261678728482514,
+      "last": 0.9922027587890625,
+      "late_mean": 0.9944419860839844,
+      "mid_mean": 0.9762382507324219,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "weighted_regularizer_to_contrastive_ratio": {
+      "desired_direction": "lower",
+      "early_mean": 0.0667222202939108,
+      "improvement_pct": 54.60656419810926,
+      "improvement_pct_clipped": 54.60656419810926,
+      "last": 0.028996589606316913,
+      "late_mean": 0.03028750823471251,
+      "mid_mean": 0.0329437448262181,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    }
+  },
+  "metric_pressures_display": {
+    "contrastive_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.409792113166324,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -1.6400841264380104,
+      "improvement_pct_display": "-1.64%",
+      "last": 0.5768923759460449,
+      "late_mean": 1.43291388983014,
+      "mid_mean": 1.3598130204084982,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2193 | \u2192 -1.64% flat",
+      "trend_label": "flat"
+    },
+    "gpu_max_memory_gb": {
+      "desired_direction": "stable",
+      "early_mean": 13.252925169950275,
+      "goal_display": "goal \u2248",
+      "improvement_pct": 100.0,
+      "improvement_pct_display": "+100.00%",
+      "last": 13.279157161712646,
+      "late_mean": 13.279157161712646,
+      "mid_mean": 13.279059082097401,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2248 | \u2197 +100.00% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "grad_norm": {
+      "desired_direction": "stable",
+      "early_mean": 4.638080189338309,
+      "goal_display": "goal \u2248",
+      "improvement_pct": -100.0,
+      "improvement_pct_display": "-100.00%",
+      "last": 1.7659728527069092,
+      "late_mean": 6.072961742165445,
+      "mid_mean": 4.979553528603791,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2248 | \u2198 -100.00% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "samples_per_sec": {
+      "desired_direction": "higher",
+      "early_mean": 1575.5664566260843,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -2.8825714693532967,
+      "improvement_pct_display": "-2.88%",
+      "last": 1399.0203442084614,
+      "late_mean": 1530.1496274666802,
+      "mid_mean": 1531.3735887168505,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -2.88% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "structure_bce_loss": {
+      "desired_direction": "lower",
+      "early_mean": 0.12293951650489272,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 39.749156913940595,
+      "improvement_pct_display": "+39.75%",
+      "last": 0.08383000642061234,
+      "late_mean": 0.07407209518012302,
+      "mid_mean": 0.07652380578004556,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +39.75% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_confidence_separation": {
+      "desired_direction": "higher",
+      "early_mean": -0.007918493679557749,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -531.5617836245987,
+      "improvement_pct_clipped": -100.0,
+      "improvement_pct_clipped_display": "-100.00%",
+      "improvement_pct_display": "-531.56%",
+      "last": -0.0040241447277367115,
+      "late_mean": -0.05001017991881603,
+      "mid_mean": -0.032136323077151974,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -531.56% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "structure_correct_logit_mean": {
+      "desired_direction": "higher",
+      "early_mean": 6.134031791907514,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 47.305071917778086,
+      "improvement_pct_display": "+47.31%",
+      "last": 9.1875,
+      "late_mean": 9.035739942528735,
+      "mid_mean": 9.474891618497109,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +47.31% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_fingerprint_cosine": {
+      "desired_direction": "higher",
+      "early_mean": 0.3965519580968543,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 17.58747890372286,
+      "improvement_pct_display": "+17.59%",
+      "last": 0.46021854877471924,
+      "late_mean": 0.46629545006943846,
+      "mid_mean": 0.4464927057310336,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +17.59% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_hit_at_1": {
+      "desired_direction": "higher",
+      "early_mean": 0.007880238439306358,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 549.6830023383724,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+549.68%",
+      "last": 0.00390625,
+      "late_mean": 0.051196569683908046,
+      "mid_mean": 0.032706376445086706,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +549.68% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_hit_at_20": {
+      "desired_direction": "higher",
+      "early_mean": 0.10721865968208093,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 239.4614028144399,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+239.46%",
+      "last": 0.1171875,
+      "late_mean": 0.3639659662356322,
+      "mid_mean": 0.28105807442196534,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +239.46% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_hit_at_5": {
+      "desired_direction": "higher",
+      "early_mean": 0.03360955563583815,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 402.47008675709174,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+402.47%",
+      "last": 0.029296875,
+      "late_mean": 0.16887796336206898,
+      "mid_mean": 0.11673591040462428,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +402.47% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_logit_margin_mean": {
+      "desired_direction": "higher",
+      "early_mean": -1.1263999277456647,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 1.2274364862230593,
+      "improvement_pct_display": "+1.23%",
+      "last": -1.0078125,
+      "late_mean": -1.1125740840517242,
+      "mid_mean": -1.0154725885115607,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2191 | \u2192 +1.23% flat",
+      "trend_label": "flat"
+    },
+    "structure_retrieval_logit_std": {
+      "desired_direction": "higher",
+      "early_mean": 1.0455416592559375,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 112.05988926255111,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+112.06%",
+      "last": 0.9839304089546204,
+      "late_mean": 2.2171744848119803,
+      "mid_mean": 2.0036371215919537,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +112.06% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_retrieval_loss": {
+      "desired_direction": "lower",
+      "early_mean": 10.237479978903181,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 10.094066619063353,
+      "improvement_pct_display": "+10.09%",
+      "last": 10.630162239074707,
+      "late_mean": 9.204101929719421,
+      "mid_mean": 9.41523380775672,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +10.09% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_target_rank_mean": {
+      "desired_direction": "lower",
+      "early_mean": 351.84337743858384,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 58.80171764880722,
+      "improvement_pct_display": "+58.80%",
+      "last": 314.703125,
+      "late_mean": 144.9534280711207,
+      "mid_mean": 176.16389315390174,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +58.80% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_top1_top2_gap_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.09793567106213873,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 59.221149173532794,
+      "improvement_pct_display": "+59.22%",
+      "last": 0.0986328125,
+      "late_mean": 0.1559343009159483,
+      "mid_mean": 0.12284365968208093,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +59.22% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "structure_top1_top2_gap_norm_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.12215662799301864,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -35.653274040957065,
+      "improvement_pct_display": "-35.65%",
+      "last": 0.10155132412910461,
+      "late_mean": 0.07860379065547524,
+      "mid_mean": 0.07032911504236604,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -35.65% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "structure_top_negative_logit_mean": {
+      "desired_direction": "lower",
+      "early_mean": 7.262102601156069,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -39.724147080005764,
+      "improvement_pct_display": "-39.72%",
+      "last": 10.1875,
+      "late_mean": 10.14691091954023,
+      "mid_mean": 10.490606936416185,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2193 | \u2198 -39.72% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "structure_uncertain_fraction": {
+      "desired_direction": "lower",
+      "early_mean": 0.924663565751445,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -6.108024336610137,
+      "improvement_pct_display": "-6.11%",
+      "last": 0.970703125,
+      "late_mean": 0.9811422413793104,
+      "mid_mean": 0.984747561416185,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2193 | \u2198 -6.11% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "train_loss": {
+      "desired_direction": "lower",
+      "early_mean": 6.340343519442343,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 10.566866163080938,
+      "improvement_pct_display": "+10.57%",
+      "last": 6.491608619689941,
+      "late_mean": 5.670367905463295,
+      "mid_mean": 5.795929590401622,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +10.57% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "train_loss_ema": {
+      "desired_direction": "lower",
+      "early_mean": 6.265581717362126,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 10.455707205061195,
+      "improvement_pct_display": "+10.46%",
+      "last": 6.519052214060582,
+      "late_mean": 5.610470838300897,
+      "mid_mean": 5.8371378655061745,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +10.46% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_hit_at_1": {
+      "desired_direction": "higher",
+      "early_mean": 0.0079345703125,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 207.78846153846155,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+207.79%",
+      "last": 0.0282135009765625,
+      "late_mean": 0.02442169189453125,
+      "mid_mean": 0.01372528076171875,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2191 | \u2192 +207.79% flat",
+      "trend_label": "flat"
+    },
+    "val_hit_at_20": {
+      "desired_direction": "higher",
+      "early_mean": 0.08158111572265625,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 76.67165435331526,
+      "improvement_pct_display": "+76.67%",
+      "last": 0.15270233154296875,
+      "late_mean": 0.14413070678710938,
+      "mid_mean": 0.094146728515625,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +76.67% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_hit_at_5": {
+      "desired_direction": "higher",
+      "early_mean": 0.0288543701171875,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 134.8492860920148,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+134.85%",
+      "last": 0.0726776123046875,
+      "late_mean": 0.0677642822265625,
+      "mid_mean": 0.0425567626953125,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +134.85% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.2876316868363775,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -55.82459156154955,
+      "improvement_pct_display": "-55.82%",
+      "last": 6.646750174145564,
+      "late_mean": 2.006446816829876,
+      "mid_mean": 2.20697861268016,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2193 | \u2198 -55.82% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "val_ssl_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.0849772497183745,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 2.3192742421198114,
+      "improvement_pct_display": "+2.32%",
+      "last": 1.0397093277424574,
+      "late_mean": 1.0598136518327963,
+      "mid_mean": 1.0747967428483425,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2193 | \u2192 +2.32% flat",
+      "trend_label": "flat"
+    },
+    "val_structure_bce_loss": {
+      "desired_direction": "lower",
+      "early_mean": 0.0771060927848642,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 12.199713989530546,
+      "improvement_pct_display": "+12.20%",
+      "last": 0.06532714269997086,
+      "late_mean": 0.06769936999660872,
+      "mid_mean": 0.07029345531468391,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +12.20% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_structure_confidence_separation": {
+      "desired_direction": "higher",
+      "early_mean": -0.00795668972114072,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -204.85499246505236,
+      "improvement_pct_clipped": -100.0,
+      "improvement_pct_clipped_display": "-100.00%",
+      "improvement_pct_display": "-204.85%",
+      "last": -0.027957430157584895,
+      "late_mean": -0.024256365849851136,
+      "mid_mean": -0.01309866098972634,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -204.85% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "val_structure_correct_logit_mean": {
+      "desired_direction": "higher",
+      "early_mean": 8.0311279296875,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 16.44145855816145,
+      "improvement_pct_display": "+16.44%",
+      "last": 9.49462890625,
+      "late_mean": 9.3515625,
+      "mid_mean": 8.441162109375,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +16.44% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_structure_fingerprint_cosine": {
+      "desired_direction": "higher",
+      "early_mean": 0.4147872725734487,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 0.17175282510408285,
+      "improvement_pct_display": "+0.17%",
+      "last": 0.4255251376889646,
+      "late_mean": 0.4154996814322658,
+      "mid_mean": 0.4204998221830465,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2191 | \u2192 +0.17% flat",
+      "trend_label": "flat"
+    },
+    "val_structure_logit_margin_mean": {
+      "desired_direction": "higher",
+      "early_mean": -1.194091796875,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -13.669239419341647,
+      "improvement_pct_display": "-13.67%",
+      "last": -1.221923828125,
+      "late_mean": -1.3573150634765625,
+      "mid_mean": -2.0707931518554688,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -13.67% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "val_structure_retrieval_logit_std": {
+      "desired_direction": "higher",
+      "early_mean": 1.2326001720502973,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 102.32641409365677,
+      "improvement_pct_clipped": 100.0,
+      "improvement_pct_clipped_display": "+100.00%",
+      "improvement_pct_display": "+102.33%",
+      "last": 2.6622845763340592,
+      "late_mean": 2.49387572822161,
+      "mid_mean": 2.022283688886091,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +102.33% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_structure_retrieval_loss": {
+      "desired_direction": "lower",
+      "early_mean": 11.562767315655947,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 4.864921250164783,
+      "improvement_pct_display": "+4.86%",
+      "last": 10.882395941764116,
+      "late_mean": 11.000247791409492,
+      "mid_mean": 12.150514367967844,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2193 | \u2192 +4.86% flat",
+      "trend_label": "flat"
+    },
+    "val_structure_target_rank_mean": {
+      "desired_direction": "lower",
+      "early_mean": 760.7540435791016,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 45.44775026271755,
+      "improvement_pct_display": "+45.45%",
+      "last": 379.8781280517578,
+      "late_mean": 415.0084457397461,
+      "mid_mean": 683.3385162353516,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +45.45% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_structure_top1_top2_gap_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.07839679718017578,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 54.90785232041847,
+      "improvement_pct_display": "+54.91%",
+      "last": 0.11855697631835938,
+      "late_mean": 0.12144279479980469,
+      "mid_mean": 0.1310901641845703,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +54.91% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_structure_top1_top2_gap_norm_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.06950851557485294,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -16.826381575968767,
+      "improvement_pct_display": "-16.83%",
+      "last": 0.05411380449368153,
+      "late_mean": 0.0578127475164365,
+      "mid_mean": 0.07577372609375743,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -16.83% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "val_structure_top_negative_logit_mean": {
+      "desired_direction": "lower",
+      "early_mean": 9.2255859375,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -16.07653223245475,
+      "improvement_pct_display": "-16.08%",
+      "last": 10.714599609375,
+      "late_mean": 10.708740234375,
+      "mid_mean": 10.51171875,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2193 | \u2198 -16.08% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "val_structure_uncertain_fraction": {
+      "desired_direction": "lower",
+      "early_mean": 0.9941177368164062,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -0.03261678728482514,
+      "improvement_pct_display": "-0.03%",
+      "last": 0.9922027587890625,
+      "late_mean": 0.9944419860839844,
+      "mid_mean": 0.9762382507324219,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2193 | \u2192 -0.03% flat",
+      "trend_label": "flat"
+    },
+    "weighted_regularizer_to_contrastive_ratio": {
+      "desired_direction": "lower",
+      "early_mean": 0.0667222202939108,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 54.60656419810926,
+      "improvement_pct_display": "+54.61%",
+      "last": 0.028996589606316913,
+      "late_mean": 0.03028750823471251,
+      "mid_mean": 0.0329437448262181,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +54.61% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    }
+  },
+  "metrics": {
+    "backbone_lr": 3.886130904636371e-06,
+    "checkpoint_path": "/home/ubuntu/artifacts/nexa_mol/final_v3_structure_alignment/v26_r1/current_checkpoint.pt",
+    "checkpoint_reloaded": 1.0,
+    "contrastive_loss": 0.5768923759460449,
+    "covariance_loss": 10.012618064880371,
+    "covariance_to_contrastive_ratio": 17.356128252623712,
+    "covariance_weight": 0.0015,
+    "dataloader_time_sec": 0.00035174899676349014,
+    "dataloader_wait_pct_300s": 0.0382592069912683,
+    "dataloader_wait_pct_60s": 0.0961140629935623,
+    "dataloader_wait_pct_900s": 0.066640439237091,
+    "dataloader_wait_pct_run": 0.06717802801040498,
+    "different_inchikey_mean_cosine": 0.004679911238535274,
+    "distributed_rank": 0.0,
+    "distributed_world_size": 1.0,
+    "effective_batch_size": 512.0,
+    "effective_hard_negative_scale": 1.0,
+    "effective_retrieval_weight": 0.6,
+    "effective_structure_bce_weight": 1.0,
+    "embedding_mean_norm": 1.0,
+    "embedding_offdiag_mean_cosine": 0.009513536468148232,
+    "embedding_std": 0.07216806709766388,
+    "global_batch_size": 512.0,
+    "gpu_active_fraction": 1.0,
+    "gpu_count_observed": 2.0,
+    "gpu_max_memory_gb": 13.279157161712646,
+    "gpu_mem_used_mean_gb": 14.1943359375,
+    "gpu_mem_util_mean_pct": 14.848754175733243,
+    "gpu_memory_stable": true,
+    "gpu_memory_utilization": 0.13982381154325935,
+    "gpu_snapshot_available": 1.0,
+    "gpu_util_max_pct": 54.0,
+    "gpu_util_mean_pct": 36.0,
+    "gpu_util_min_pct": 18.0,
+    "grad_norm": 1.7659728527069092,
+    "holdout_full_coverage": 0.0,
+    "local_batch_size": 512.0,
+    "lr": 3.886130904636371e-06,
+    "mfu_estimate": 0.06267708747552383,
+    "msms_objective": "hybrid",
+    "optimizer_step": 1.0,
+    "regularizer_ramp": 1.0,
+    "resume_checkpoint_path": "/home/ubuntu/artifacts/nexa_mol/final_v3_structure_alignment/v26_r1/current_checkpoint.pt",
+    "resume_start_step": 81002.0,
+    "resumed_from_checkpoint": 1.0,
+    "retrieval_head_lr": 1.9430654523181854e-05,
+    "same_inchikey_mean_cosine": 0.16267980930137343,
+    "samples_per_sec": 1399.0203442084614,
+    "samples_per_sec_300s": 1547.033197547462,
+    "samples_per_sec_60s": 1399.0203442084614,
+    "samples_per_sec_900s": 1512.7885250414204,
+    "samples_per_sec_run_mean": 1533.0231795943853,
+    "step_time_cv_300s": 0.06743440395418321,
+    "step_time_cv_60s": 0.0,
+    "step_time_cv_900s": 0.09218780075615579,
+    "step_time_sec": 0.3659703749981418,
+    "structure_bce_locked": 0.0,
+    "structure_bce_loss": 0.08383000642061234,
+    "structure_candidate_count": 2126.0,
+    "structure_clear_fraction": 0.0,
+    "structure_clear_hit_at_1": 0.0,
+    "structure_close_fraction": 0.029296875,
+    "structure_close_hit_at_1": 0.0,
+    "structure_confidence_bucket_score_mean": 0.10155132412910461,
+    "structure_confidence_bucket_score_mode": "normalized_gap",
+    "structure_confidence_candidate_count": 2126.0,
+    "structure_confidence_clear_threshold": 1.0,
+    "structure_confidence_close_threshold": 0.35,
+    "structure_confidence_eval_key_mode": "target_identity",
+    "structure_confidence_separation": -0.0040241447277367115,
+    "structure_correct_logit_mean": 9.1875,
+    "structure_fingerprint_cosine": 0.46021854877471924,
+    "structure_hard_negative_bonus_applied": 1.0,
+    "structure_hard_negative_bonus_mean": 0.060302734375,
+    "structure_hard_negative_scale": 1.0,
+    "structure_head_lr": 1.9430654523181854e-05,
+    "structure_hit_at_1": 0.00390625,
+    "structure_hit_at_20": 0.1171875,
+    "structure_hit_at_5": 0.029296875,
+    "structure_local_ce_loss": 3.545562744140625,
+    "structure_local_ce_loss_weight": 0.4,
+    "structure_local_rerank_loss": 0.0,
+    "structure_local_rerank_loss_weight": 0.0,
+    "structure_local_rerank_score_scale": 1.0,
+    "structure_logit_margin_mean": -1.0078125,
+    "structure_margin_loss": 0.0,
+    "structure_margin_loss_weight": 0.0,
+    "structure_missing_formula_fraction": 0.0,
+    "structure_missing_inchikey_fraction": 0.0,
+    "structure_pairwise_logistic_loss": 0.0,
+    "structure_pairwise_logistic_loss_weight": 0.0,
+    "structure_positive_count_mean": 1.0,
+    "structure_post_label_candidate_count": 2126.0,
+    "structure_post_precursor_candidate_count": 2128.0,
+    "structure_prefilter_candidate_count": 2128.0,
+    "structure_retrieval_logit_std": 0.9839304089546204,
+    "structure_retrieval_loss": 10.630162239074707,
+    "structure_retrieval_scorer": "projected_dot",
+    "structure_retrieval_target_mode": "sample",
+    "structure_skipped_query_fraction": 0.0,
+    "structure_soft_target_exact_mix": 0.4,
+    "structure_soft_target_loss": 7.523618221282959,
+    "structure_soft_target_loss_weight": 0.3,
+    "structure_target_backend": "rdkit_morgan",
+    "structure_target_equivalent_count_mean": 1.0,
+    "structure_target_identity_collision_count": 0.0,
+    "structure_target_rank_mean": 314.703125,
+    "structure_to_ssl_ratio": 217.7124787233957,
+    "structure_top1_top2_gap_mean": 0.0986328125,
+    "structure_top1_top2_gap_norm_mean": 0.10155132412910461,
+    "structure_top_negative_logit_mean": 10.1875,
+    "structure_uncertain_fraction": 0.970703125,
+    "structure_uncertain_hit_at_1": 0.0040241447277367115,
+    "structure_valid_query_fraction": 1.0,
+    "test_expected_shard_count": 2.0,
+    "test_full_coverage": 0.0,
+    "test_observed_shard_count": 0.0,
+    "train_loss": 6.491608619689941,
+    "train_loss_ema": 6.519052214060582,
+    "train_retrieval_bank_size": 4096.0,
+    "val_deep_eval_single_view": 0.0,
+    "val_deep_eval_structure_only": 0.0,
+    "val_effective_structure_bce_weight": 1.0,
+    "val_eval_loader_mode": "stream",
+    "val_eval_mode": "deep",
+    "val_expected_shard_count": 2.0,
+    "val_full_coverage": 1.0,
+    "val_hit_at_1": 0.0282135009765625,
+    "val_hit_at_20": 0.15270233154296875,
+    "val_hit_at_5": 0.0726776123046875,
+    "val_loss": 6.646750174145564,
+    "val_observed_eval_batches": 256.0,
+    "val_observed_shard_count": 2.0,
+    "val_ssl_loss": 1.0397093277424574,
+    "val_structure_bce_loss": 0.06532714269997086,
+    "val_structure_candidate_count": 4119.69140625,
+    "val_structure_clear_fraction": 0.0,
+    "val_structure_clear_hit_at_1": 0.0,
+    "val_structure_close_fraction": 0.0077972412109375,
+    "val_structure_close_hit_at_1": 0.014835291571216658,
+    "val_structure_confidence_candidate_count": 4096.0,
+    "val_structure_confidence_separation": -0.027957430157584895,
+    "val_structure_correct_logit_mean": 9.49462890625,
+    "val_structure_fingerprint_cosine": 0.4255251376889646,
+    "val_structure_logit_margin_mean": -1.221923828125,
+    "val_structure_missing_formula_fraction": 0.0,
+    "val_structure_missing_inchikey_fraction": 0.0,
+    "val_structure_retrieval_logit_std": 2.6622845763340592,
+    "val_structure_retrieval_loss": 10.882395941764116,
+    "val_structure_target_equivalent_count_mean": 1.0,
+    "val_structure_target_identity_collision_count": 23.69140625,
+    "val_structure_target_rank_mean": 379.8781280517578,
+    "val_structure_top1_top2_gap_mean": 0.11855697631835938,
+    "val_structure_top1_top2_gap_norm_mean": 0.05411380449368153,
+    "val_structure_top_negative_logit_mean": 10.714599609375,
+    "val_structure_uncertain_fraction": 0.9922027587890625,
+    "val_structure_uncertain_hit_at_1": 0.027957430157584895,
+    "variance_loss": 0.00213623046875,
+    "variance_weight": 0.8,
+    "weighted_covariance_loss": 0.015018927097320557,
+    "weighted_regularizer_to_contrastive_ratio": 0.028996589606316913,
+    "weighted_ssl_loss": 0.02968101501464844,
+    "weighted_structure_bce_loss": 0.08383000642061234,
+    "weighted_structure_retrieval_loss": 6.378097343444824,
+    "weighted_variance_loss": 0.001708984375
+  },
+  "primary_metric_pressure_summary": {
+    "average_improvement_pct": -14.247321653690681,
+    "metric_count": 12,
+    "overall_arrow": "\u2197",
+    "overall_pressure": "pressure_up",
+    "pressure_down_count": 4,
+    "pressure_none_count": 3,
+    "pressure_up_count": 5,
+    "pressure_up_fraction": 0.4166666666666667,
+    "weighted_improvement_pct": -4.446275812252011,
+    "weighted_pressure_score": 0.1702127659574468
+  },
+  "primary_metric_pressure_summary_display": {
+    "average_improvement_pct": -14.247321653690681,
+    "average_improvement_pct_display": "-14.25%",
+    "metric_count": 12,
+    "overall_arrow": "\u2197",
+    "overall_display": "\u2197 improving (-4.45% weighted)",
+    "overall_label": "improving",
+    "overall_pressure": "pressure_up",
+    "pressure_down_count": 4,
+    "pressure_none_count": 3,
+    "pressure_up_count": 5,
+    "pressure_up_fraction": 0.4166666666666667,
+    "pressure_up_fraction_display": "+41.67%",
+    "weighted_improvement_pct": -4.446275812252011,
+    "weighted_improvement_pct_display": "-4.45%",
+    "weighted_pressure_score": 0.1702127659574468
+  },
+  "primary_metric_pressures": {
+    "contrastive_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.409792113166324,
+      "improvement_pct": -1.6400841264380104,
+      "improvement_pct_clipped": -1.6400841264380104,
+      "last": 0.5768923759460449,
+      "late_mean": 1.43291388983014,
+      "mid_mean": 1.3598130204084982,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "grad_norm": {
+      "desired_direction": "stable",
+      "early_mean": 4.638080189338309,
+      "improvement_pct": -100.0,
+      "improvement_pct_clipped": -100.0,
+      "last": 1.7659728527069092,
+      "late_mean": 6.072961742165445,
+      "mid_mean": 4.979553528603791,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "samples_per_sec": {
+      "desired_direction": "higher",
+      "early_mean": 1575.5664566260843,
+      "improvement_pct": -2.8825714693532967,
+      "improvement_pct_clipped": -2.8825714693532967,
+      "last": 1399.0203442084614,
+      "late_mean": 1530.1496274666802,
+      "mid_mean": 1531.3735887168505,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "structure_bce_loss": {
+      "desired_direction": "lower",
+      "early_mean": 0.12293951650489272,
+      "improvement_pct": 39.749156913940595,
+      "improvement_pct_clipped": 39.749156913940595,
+      "last": 0.08383000642061234,
+      "late_mean": 0.07407209518012302,
+      "mid_mean": 0.07652380578004556,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "train_loss": {
+      "desired_direction": "lower",
+      "early_mean": 6.340343519442343,
+      "improvement_pct": 10.566866163080938,
+      "improvement_pct_clipped": 10.566866163080938,
+      "last": 6.491608619689941,
+      "late_mean": 5.670367905463295,
+      "mid_mean": 5.795929590401622,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_hit_at_20": {
+      "desired_direction": "higher",
+      "early_mean": 0.08158111572265625,
+      "improvement_pct": 76.67165435331526,
+      "improvement_pct_clipped": 76.67165435331526,
+      "last": 0.15270233154296875,
+      "late_mean": 0.14413070678710938,
+      "mid_mean": 0.094146728515625,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.2876316868363775,
+      "improvement_pct": -55.82459156154955,
+      "improvement_pct_clipped": -55.82459156154955,
+      "last": 6.646750174145564,
+      "late_mean": 2.006446816829876,
+      "mid_mean": 2.20697861268016,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "val_structure_bce_loss": {
+      "desired_direction": "lower",
+      "early_mean": 0.0771060927848642,
+      "improvement_pct": 12.199713989530546,
+      "improvement_pct_clipped": 12.199713989530546,
+      "last": 0.06532714269997086,
+      "late_mean": 0.06769936999660872,
+      "mid_mean": 0.07029345531468391,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_structure_confidence_separation": {
+      "desired_direction": "higher",
+      "early_mean": -0.00795668972114072,
+      "improvement_pct": -204.85499246505236,
+      "improvement_pct_clipped": -100.0,
+      "last": -0.027957430157584895,
+      "late_mean": -0.024256365849851136,
+      "mid_mean": -0.01309866098972634,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_score": -1.0
+    },
+    "val_structure_fingerprint_cosine": {
+      "desired_direction": "higher",
+      "early_mean": 0.4147872725734487,
+      "improvement_pct": 0.17175282510408285,
+      "improvement_pct_clipped": 0.17175282510408285,
+      "last": 0.4255251376889646,
+      "late_mean": 0.4154996814322658,
+      "mid_mean": 0.4204998221830465,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    },
+    "val_structure_top1_top2_gap_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.07839679718017578,
+      "improvement_pct": 54.90785232041847,
+      "improvement_pct_clipped": 54.90785232041847,
+      "last": 0.11855697631835938,
+      "late_mean": 0.12144279479980469,
+      "mid_mean": 0.1310901641845703,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_score": 1.0
+    },
+    "val_structure_uncertain_fraction": {
+      "desired_direction": "lower",
+      "early_mean": 0.9941177368164062,
+      "improvement_pct": -0.03261678728482514,
+      "improvement_pct_clipped": -0.03261678728482514,
+      "last": 0.9922027587890625,
+      "late_mean": 0.9944419860839844,
+      "mid_mean": 0.9762382507324219,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_score": 0.0
+    }
+  },
+  "primary_metric_pressures_display": {
+    "contrastive_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.409792113166324,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -1.6400841264380104,
+      "improvement_pct_display": "-1.64%",
+      "last": 0.5768923759460449,
+      "late_mean": 1.43291388983014,
+      "mid_mean": 1.3598130204084982,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2193 | \u2192 -1.64% flat",
+      "trend_label": "flat"
+    },
+    "grad_norm": {
+      "desired_direction": "stable",
+      "early_mean": 4.638080189338309,
+      "goal_display": "goal \u2248",
+      "improvement_pct": -100.0,
+      "improvement_pct_display": "-100.00%",
+      "last": 1.7659728527069092,
+      "late_mean": 6.072961742165445,
+      "mid_mean": 4.979553528603791,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2248 | \u2198 -100.00% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "samples_per_sec": {
+      "desired_direction": "higher",
+      "early_mean": 1575.5664566260843,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -2.8825714693532967,
+      "improvement_pct_display": "-2.88%",
+      "last": 1399.0203442084614,
+      "late_mean": 1530.1496274666802,
+      "mid_mean": 1531.3735887168505,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -2.88% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "structure_bce_loss": {
+      "desired_direction": "lower",
+      "early_mean": 0.12293951650489272,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 39.749156913940595,
+      "improvement_pct_display": "+39.75%",
+      "last": 0.08383000642061234,
+      "late_mean": 0.07407209518012302,
+      "mid_mean": 0.07652380578004556,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +39.75% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "train_loss": {
+      "desired_direction": "lower",
+      "early_mean": 6.340343519442343,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 10.566866163080938,
+      "improvement_pct_display": "+10.57%",
+      "last": 6.491608619689941,
+      "late_mean": 5.670367905463295,
+      "mid_mean": 5.795929590401622,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +10.57% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_hit_at_20": {
+      "desired_direction": "higher",
+      "early_mean": 0.08158111572265625,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 76.67165435331526,
+      "improvement_pct_display": "+76.67%",
+      "last": 0.15270233154296875,
+      "late_mean": 0.14413070678710938,
+      "mid_mean": 0.094146728515625,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +76.67% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_loss": {
+      "desired_direction": "lower",
+      "early_mean": 1.2876316868363775,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -55.82459156154955,
+      "improvement_pct_display": "-55.82%",
+      "last": 6.646750174145564,
+      "late_mean": 2.006446816829876,
+      "mid_mean": 2.20697861268016,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2193 | \u2198 -55.82% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "val_structure_bce_loss": {
+      "desired_direction": "lower",
+      "early_mean": 0.0771060927848642,
+      "goal_display": "goal \u2193",
+      "improvement_pct": 12.199713989530546,
+      "improvement_pct_display": "+12.20%",
+      "last": 0.06532714269997086,
+      "late_mean": 0.06769936999660872,
+      "mid_mean": 0.07029345531468391,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2193 | \u2197 +12.20% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_structure_confidence_separation": {
+      "desired_direction": "higher",
+      "early_mean": -0.00795668972114072,
+      "goal_display": "goal \u2191",
+      "improvement_pct": -204.85499246505236,
+      "improvement_pct_clipped": -100.0,
+      "improvement_pct_clipped_display": "-100.00%",
+      "improvement_pct_display": "-204.85%",
+      "last": -0.027957430157584895,
+      "late_mean": -0.024256365849851136,
+      "mid_mean": -0.01309866098972634,
+      "pressure": "pressure_down",
+      "pressure_arrow": "\u2198",
+      "pressure_display": "goal \u2191 | \u2198 -204.85% worsening",
+      "pressure_score": -1.0,
+      "trend_label": "worsening"
+    },
+    "val_structure_fingerprint_cosine": {
+      "desired_direction": "higher",
+      "early_mean": 0.4147872725734487,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 0.17175282510408285,
+      "improvement_pct_display": "+0.17%",
+      "last": 0.4255251376889646,
+      "late_mean": 0.4154996814322658,
+      "mid_mean": 0.4204998221830465,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2191 | \u2192 +0.17% flat",
+      "trend_label": "flat"
+    },
+    "val_structure_top1_top2_gap_mean": {
+      "desired_direction": "higher",
+      "early_mean": 0.07839679718017578,
+      "goal_display": "goal \u2191",
+      "improvement_pct": 54.90785232041847,
+      "improvement_pct_display": "+54.91%",
+      "last": 0.11855697631835938,
+      "late_mean": 0.12144279479980469,
+      "mid_mean": 0.1310901641845703,
+      "pressure": "pressure_up",
+      "pressure_arrow": "\u2197",
+      "pressure_display": "goal \u2191 | \u2197 +54.91% improving",
+      "pressure_score": 1.0,
+      "trend_label": "improving"
+    },
+    "val_structure_uncertain_fraction": {
+      "desired_direction": "lower",
+      "early_mean": 0.9941177368164062,
+      "goal_display": "goal \u2193",
+      "improvement_pct": -0.03261678728482514,
+      "improvement_pct_display": "-0.03%",
+      "last": 0.9922027587890625,
+      "late_mean": 0.9944419860839844,
+      "mid_mean": 0.9762382507324219,
+      "pressure": "pressure_none",
+      "pressure_arrow": "\u2192",
+      "pressure_display": "goal \u2193 | \u2192 -0.03% flat",
+      "trend_label": "flat"
+    }
+  },
+  "primary_metrics": {
+    "contrastive_loss": 0.5768923759460449,
+    "different_inchikey_mean_cosine": 0.004679911238535274,
+    "embedding_std": 0.07216806709766388,
+    "grad_norm": 1.7659728527069092,
+    "samples_per_sec": 1399.0203442084614,
+    "structure_bce_loss": 0.08383000642061234,
+    "train_loss": 6.491608619689941,
+    "val_hit_at_20": 0.15270233154296875,
+    "val_loss": 6.646750174145564,
+    "val_structure_bce_loss": 0.06532714269997086,
+    "val_structure_candidate_count": 4119.69140625,
+    "val_structure_clear_hit_at_1": 0.0,
+    "val_structure_confidence_separation": -0.027957430157584895,
+    "val_structure_fingerprint_cosine": 0.4255251376889646,
+    "val_structure_top1_top2_gap_mean": 0.11855697631835938,
+    "val_structure_uncertain_fraction": 0.9922027587890625
+  },
+  "run_name": "final_v3_structure_alignment_v26_r1",
+  "shard_counts": {
+    "test": 2,
+    "train": 4,
+    "val": 2
+  }
+}

metadata/eval_coverage.json ADDED Viewed

	@@ -0,0 +1,46 @@

+{
+  "created_at": "2026-04-13T21:36:17Z",
+  "step": 91001,
+  "run_step": 10000,
+  "eval_mode": "deep",
+  "eval_loader_mode": "stream",
+  "eval_batch_limit": 256,
+  "eval_batches_per_shard_limit": 0,
+  "full_holdout_sweep": false,
+  "configured_val_shard_count": 2,
+  "configured_val_shards": [
+    "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051433_00000.parquet",
+    "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051454_00000.parquet"
+  ],
+  "configured_test_shard_count": 2,
+  "configured_test_shards": [
+    "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/test/shard_20260313_051433_00000.parquet",
+    "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/test/shard_20260313_051454_00000.parquet"
+  ],
+  "observed_val_shard_count": 2,
+  "observed_val_shards": [
+    "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051433_00000.parquet",
+    "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051454_00000.parquet"
+  ],
+  "missing_val_shards": [],
+  "observed_test_shard_count": 0,
+  "observed_test_shards": [],
+  "missing_test_shards": [
+    "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/test/shard_20260313_051433_00000.parquet",
+    "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/test/shard_20260313_051454_00000.parquet"
+  ],
+  "unexpected_eval_shards": [],
+  "observed_eval_batches": 256,
+  "observed_eval_samples": 131072,
+  "per_shard_batch_count": {
+    "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051433_00000.parquet": 128,
+    "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051454_00000.parquet": 128
+  },
+  "per_shard_sample_count": {
+    "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051433_00000.parquet": 65536,
+    "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051454_00000.parquet": 65536
+  },
+  "full_val_coverage": 1.0,
+  "full_test_coverage": 0.0,
+  "full_holdout_coverage": 0.0
+}

metadata/fast_eval_surface.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "created_at": "2026-04-13T20:20:58Z",
+  "loader_mode": "stream",
+  "configured_val_shard_count": 2,
+  "configured_val_shards": [
+    "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051433_00000.parquet",
+    "/home/ubuntu/data/gems_v1_handoff_labeled_v26/shards/val/shard_20260313_051454_00000.parquet"
+  ],
+  "batches_per_shard": 0,
+  "batch_size": 512,
+  "row_count": 0,
+  "per_shard_row_count": {},
+  "per_shard_batch_count": {}
+}

metadata/latest_checkpoint.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ /home/ubuntu/artifacts/nexa_mol/final_v3_structure_alignment/v26_r1/current_checkpoint.pt

metadata/latest_metrics.json ADDED Viewed

	@@ -0,0 +1,169 @@

+{
+  "backbone_lr": 3.886130904636371e-06,
+  "checkpoint_path": "/home/ubuntu/artifacts/nexa_mol/final_v3_structure_alignment/v26_r1/current_checkpoint.pt",
+  "checkpoint_reloaded": 1.0,
+  "contrastive_loss": 0.5768923759460449,
+  "covariance_loss": 10.012618064880371,
+  "covariance_to_contrastive_ratio": 17.356128252623712,
+  "covariance_weight": 0.0015,
+  "dataloader_time_sec": 0.00035174899676349014,
+  "dataloader_wait_pct_300s": 0.0382592069912683,
+  "dataloader_wait_pct_60s": 0.0961140629935623,
+  "dataloader_wait_pct_900s": 0.066640439237091,
+  "dataloader_wait_pct_run": 0.06717802801040498,
+  "different_inchikey_mean_cosine": 0.004679911238535274,
+  "distributed_rank": 0.0,
+  "distributed_world_size": 1.0,
+  "effective_batch_size": 512.0,
+  "effective_hard_negative_scale": 1.0,
+  "effective_retrieval_weight": 0.6,
+  "effective_structure_bce_weight": 1.0,
+  "embedding_mean_norm": 1.0,
+  "embedding_offdiag_mean_cosine": 0.009513536468148232,
+  "embedding_std": 0.07216806709766388,
+  "final_report": 1.0,
+  "global_batch_size": 512.0,
+  "gpu_active_fraction": 1.0,
+  "gpu_count_observed": 2.0,
+  "gpu_max_memory_gb": 13.279157161712646,
+  "gpu_mem_used_mean_gb": 14.1943359375,
+  "gpu_mem_util_mean_pct": 14.848754175733243,
+  "gpu_memory_stable": true,
+  "gpu_memory_utilization": 0.13982381154325935,
+  "gpu_snapshot_available": 1.0,
+  "gpu_util_max_pct": 54.0,
+  "gpu_util_mean_pct": 36.0,
+  "gpu_util_min_pct": 18.0,
+  "grad_norm": 1.7659728527069092,
+  "holdout_full_coverage": 0.0,
+  "local_batch_size": 512.0,
+  "lr": 3.886130904636371e-06,
+  "mfu_estimate": 0.06267708747552383,
+  "msms_objective": "hybrid",
+  "optimizer_step": 1.0,
+  "regularizer_ramp": 1.0,
+  "resume_checkpoint_path": "/home/ubuntu/artifacts/nexa_mol/final_v3_structure_alignment/v26_r1/current_checkpoint.pt",
+  "resume_start_step": 81002.0,
+  "resumed_from_checkpoint": 1.0,
+  "retrieval_head_lr": 1.9430654523181854e-05,
+  "same_inchikey_mean_cosine": 0.16267980930137343,
+  "samples_per_sec": 1399.0203442084614,
+  "samples_per_sec_300s": 1547.033197547462,
+  "samples_per_sec_60s": 1399.0203442084614,
+  "samples_per_sec_900s": 1512.7885250414204,
+  "samples_per_sec_run_mean": 1533.0231795943853,
+  "step": 91001,
+  "step_time_cv_300s": 0.06743440395418321,
+  "step_time_cv_60s": 0.0,
+  "step_time_cv_900s": 0.09218780075615579,
+  "step_time_sec": 0.3659703749981418,
+  "structure_bce_locked": 0.0,
+  "structure_bce_loss": 0.08383000642061234,
+  "structure_candidate_count": 2126.0,
+  "structure_clear_fraction": 0.0,
+  "structure_clear_hit_at_1": 0.0,
+  "structure_close_fraction": 0.029296875,
+  "structure_close_hit_at_1": 0.0,
+  "structure_confidence_bucket_score_mean": 0.10155132412910461,
+  "structure_confidence_bucket_score_mode": "normalized_gap",
+  "structure_confidence_candidate_count": 2126.0,
+  "structure_confidence_clear_threshold": 1.0,
+  "structure_confidence_close_threshold": 0.35,
+  "structure_confidence_eval_key_mode": "target_identity",
+  "structure_confidence_separation": -0.0040241447277367115,
+  "structure_correct_logit_mean": 9.1875,
+  "structure_fingerprint_cosine": 0.46021854877471924,
+  "structure_hard_negative_bonus_applied": 1.0,
+  "structure_hard_negative_bonus_mean": 0.060302734375,
+  "structure_hard_negative_scale": 1.0,
+  "structure_head_lr": 1.9430654523181854e-05,
+  "structure_hit_at_1": 0.00390625,
+  "structure_hit_at_20": 0.1171875,
+  "structure_hit_at_5": 0.029296875,
+  "structure_local_ce_loss": 3.545562744140625,
+  "structure_local_ce_loss_weight": 0.4,
+  "structure_local_rerank_loss": 0.0,
+  "structure_local_rerank_loss_weight": 0.0,
+  "structure_local_rerank_score_scale": 1.0,
+  "structure_logit_margin_mean": -1.0078125,
+  "structure_margin_loss": 0.0,
+  "structure_margin_loss_weight": 0.0,
+  "structure_missing_formula_fraction": 0.0,
+  "structure_missing_inchikey_fraction": 0.0,
+  "structure_pairwise_logistic_loss": 0.0,
+  "structure_pairwise_logistic_loss_weight": 0.0,
+  "structure_positive_count_mean": 1.0,
+  "structure_post_label_candidate_count": 2126.0,
+  "structure_post_precursor_candidate_count": 2128.0,
+  "structure_prefilter_candidate_count": 2128.0,
+  "structure_retrieval_logit_std": 0.9839304089546204,
+  "structure_retrieval_loss": 10.630162239074707,
+  "structure_retrieval_scorer": "projected_dot",
+  "structure_retrieval_target_mode": "sample",
+  "structure_skipped_query_fraction": 0.0,
+  "structure_soft_target_exact_mix": 0.4,
+  "structure_soft_target_loss": 7.523618221282959,
+  "structure_soft_target_loss_weight": 0.3,
+  "structure_target_backend": "rdkit_morgan",
+  "structure_target_equivalent_count_mean": 1.0,
+  "structure_target_identity_collision_count": 0.0,
+  "structure_target_rank_mean": 314.703125,
+  "structure_to_ssl_ratio": 217.7124787233957,
+  "structure_top1_top2_gap_mean": 0.0986328125,
+  "structure_top1_top2_gap_norm_mean": 0.10155132412910461,
+  "structure_top_negative_logit_mean": 10.1875,
+  "structure_uncertain_fraction": 0.970703125,
+  "structure_uncertain_hit_at_1": 0.0040241447277367115,
+  "structure_valid_query_fraction": 1.0,
+  "test_expected_shard_count": 2.0,
+  "test_full_coverage": 0.0,
+  "test_observed_shard_count": 0.0,
+  "train_loss": 6.491608619689941,
+  "train_loss_ema": 6.519052214060582,
+  "train_retrieval_bank_size": 4096.0,
+  "val_deep_eval_single_view": 0.0,
+  "val_deep_eval_structure_only": 0.0,
+  "val_effective_structure_bce_weight": 1.0,
+  "val_eval_loader_mode": "stream",
+  "val_eval_mode": "deep",
+  "val_expected_shard_count": 2.0,
+  "val_full_coverage": 1.0,
+  "val_hit_at_1": 0.0282135009765625,
+  "val_hit_at_20": 0.15270233154296875,
+  "val_hit_at_5": 0.0726776123046875,
+  "val_loss": 6.646750174145564,
+  "val_observed_eval_batches": 256.0,
+  "val_observed_shard_count": 2.0,
+  "val_ssl_loss": 1.0397093277424574,
+  "val_structure_bce_loss": 0.06532714269997086,
+  "val_structure_candidate_count": 4119.69140625,
+  "val_structure_clear_fraction": 0.0,
+  "val_structure_clear_hit_at_1": 0.0,
+  "val_structure_close_fraction": 0.0077972412109375,
+  "val_structure_close_hit_at_1": 0.014835291571216658,
+  "val_structure_confidence_candidate_count": 4096.0,
+  "val_structure_confidence_separation": -0.027957430157584895,
+  "val_structure_correct_logit_mean": 9.49462890625,
+  "val_structure_fingerprint_cosine": 0.4255251376889646,
+  "val_structure_logit_margin_mean": -1.221923828125,
+  "val_structure_missing_formula_fraction": 0.0,
+  "val_structure_missing_inchikey_fraction": 0.0,
+  "val_structure_retrieval_logit_std": 2.6622845763340592,
+  "val_structure_retrieval_loss": 10.882395941764116,
+  "val_structure_target_equivalent_count_mean": 1.0,
+  "val_structure_target_identity_collision_count": 23.69140625,
+  "val_structure_target_rank_mean": 379.8781280517578,
+  "val_structure_top1_top2_gap_mean": 0.11855697631835938,
+  "val_structure_top1_top2_gap_norm_mean": 0.05411380449368153,
+  "val_structure_top_negative_logit_mean": 10.714599609375,
+  "val_structure_uncertain_fraction": 0.9922027587890625,
+  "val_structure_uncertain_hit_at_1": 0.027957430157584895,
+  "variance_loss": 0.00213623046875,
+  "variance_weight": 0.8,
+  "weighted_covariance_loss": 0.015018927097320557,
+  "weighted_regularizer_to_contrastive_ratio": 0.028996589606316913,
+  "weighted_ssl_loss": 0.02968101501464844,
+  "weighted_structure_bce_loss": 0.08383000642061234,
+  "weighted_structure_retrieval_loss": 6.378097343444824,
+  "weighted_variance_loss": 0.001708984375
+}

metadata/perf_summary.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+  "logged_points": 521,
+  "train_loss_min": 3.2278988361358643,
+  "train_loss_max": 7.677141189575195,
+  "train_loss_last": 6.491608619689941,
+  "train_loss_ema_last": 6.519052214060582,
+  "weighted_regularizer_ratio_median": 0.02686493425176378,
+  "weighted_regularizer_ratio_p90": 0.09558363904110317,
+  "samples_per_sec_mean": 1545.3851888056406,
+  "samples_per_sec_min": 930.5498563655322,
+  "samples_per_sec_max": 2247.460787425693,
+  "step_time_mean": 0.33468720350667036,
+  "mfu_mean": 0.06923433462788683,
+  "mfu_max": 0.10068781126337953,
+  "gpu_mem_max_gb": 13.279157161712646
+}

metadata/results.md ADDED Viewed

	@@ -0,0 +1,171 @@

+# MS/MS Training Run Result
+- Run name: `final_v3_structure_alignment_v26_r1`
+- Created at: `2026-04-13T21:36:19Z`
+- Dataset root: `/home/ubuntu/data/gems_v1_handoff_labeled_v26`
+- Shard counts: `{'train': 4, 'val': 2, 'test': 2}`
+## Primary Metrics
+- `train_loss`: `6.491608619689941`
+- `val_loss`: `6.646750174145564`
+- `grad_norm`: `1.7659728527069092`
+- `contrastive_loss`: `0.5768923759460449`
+- `structure_bce_loss`: `0.08383000642061234`
+- `val_structure_bce_loss`: `0.06532714269997086`
+- `val_structure_fingerprint_cosine`: `0.4255251376889646`
+- `different_inchikey_mean_cosine`: `0.004679911238535274`
+- `embedding_std`: `0.07216806709766388`
+- `val_hit_at_20`: `0.15270233154296875`
+- `val_structure_candidate_count`: `4119.69140625`
+- `val_structure_top1_top2_gap_mean`: `0.11855697631835938`
+- `val_structure_uncertain_fraction`: `0.9922027587890625`
+- `val_structure_clear_hit_at_1`: `0.0`
+- `val_structure_confidence_separation`: `-0.027957430157584895`
+- `samples_per_sec`: `1399.0203442084614`
+## Failure Mode Assessment
+- `dataset_shards_accessible`: pass. Observed shard counts {'train': 4, 'val': 2, 'test': 2}; the canonical Day 1 loader contract requires all splits to be readable.
+- `dataloader_streaming_stable`: pass. Training batches continued to arrive with positive throughput and no iterator stall.
+- `non_finite_loss_or_tensor_failure`: pass. Technical_Plan requires zero NaN or Inf tensors and finite train/val loss.
+- `validation_observability_gap`: pass. Engineering.md expects slope-aware monitoring; missing validation or retrieval metrics make trend judgment weaker.
+- `gpu_memory_instability`: pass. Technical_Plan Day 1 success requires stable GPU memory through the bounded run.
+- `checkpoint_save_reload_failure`: pass. Checkpoint save and reload is an explicit Day 1 success criterion.
+- `embedding_collapse`: pass. Engineering.md expects embedding variance monitoring and non-collapsed representations.
+- `regularizer_dominance`: pass. The current instability mode is regularization overpowering the SSL objective and producing jagged total loss.
+- `structure_supervision_gap`: pass. Once the bridge phase begins, Technical_Plan requires retrieval-oriented validation rather than only augmented contrastive loss.
+- `confidence_surface_gap`: pass. Structure-first qualification now requires explicit confidence diagnostics such as top-1/top-2 separation and uncertainty buckets, not just broader retrieval metrics.
+- `chemistry_target_backend_gap`: pass. The bridge phase should prefer chemistry-grounded fingerprint targets; hashed fallback targets weaken the retrieval signal.
+- `bridge_fit_without_ranking`: pass. Bridge runs must improve retrieval after fingerprint fit saturates; fitting BCE while val Hit@20 stays at candidate-bank baseline means ranking is not generalizing.
+- `metadata_shortcutting`: watch. Engineering.md flags acquisition-artefact shortcut risk; adduct and instrument embeddings remain deliberately down-scaled.
+## Pressure Summary
+- all metrics overall: `↗ improving (+21.89% weighted)`
+- all metrics weighted improvement: `+21.89%`
+- all metrics average improvement: `+34.52%`
+- all metrics weighted pressure score: `0.284`
+- all metrics counts: `up=21` `none=7` `down=11` `up_fraction=+53.85%`
+- primary metrics overall: `↗ improving (-4.45% weighted)`
+- primary metrics weighted improvement: `-4.45%`
+## Metric Pressure
+- `train_loss`: `goal ↓ | ↗ +10.57% improving` (early `6.340343519442343`, mid `5.795929590401622`, late `5.670367905463295`, last `6.491608619689941`)
+- `train_loss_ema`: `goal ↓ | ↗ +10.46% improving` (early `6.265581717362126`, mid `5.8371378655061745`, late `5.610470838300897`, last `6.519052214060582`)
+- `contrastive_loss`: `goal ↓ | → -1.64% flat` (early `1.409792113166324`, mid `1.3598130204084982`, late `1.43291388983014`, last `0.5768923759460449`)
+- `val_loss`: `goal ↓ | ↘ -55.82% worsening` (early `1.2876316868363775`, mid `2.20697861268016`, late `2.006446816829876`, last `6.646750174145564`)
+- `val_ssl_loss`: `goal ↓ | → +2.32% flat` (early `1.0849772497183745`, mid `1.0747967428483425`, late `1.0598136518327963`, last `1.0397093277424574`)
+- `structure_bce_loss`: `goal ↓ | ↗ +39.75% improving` (early `0.12293951650489272`, mid `0.07652380578004556`, late `0.07407209518012302`, last `0.08383000642061234`)
+- `val_structure_bce_loss`: `goal ↓ | ↗ +12.20% improving` (early `0.0771060927848642`, mid `0.07029345531468391`, late `0.06769936999660872`, last `0.06532714269997086`)
+- `structure_retrieval_loss`: `goal ↓ | ↗ +10.09% improving` (early `10.237479978903181`, mid `9.41523380775672`, late `9.204101929719421`, last `10.630162239074707`)
+- `val_structure_retrieval_loss`: `goal ↓ | → +4.86% flat` (early `11.562767315655947`, mid `12.150514367967844`, late `11.000247791409492`, last `10.882395941764116`)
+- `structure_fingerprint_cosine`: `goal ↑ | ↗ +17.59% improving` (early `0.3965519580968543`, mid `0.4464927057310336`, late `0.46629545006943846`, last `0.46021854877471924`)
+- `val_structure_fingerprint_cosine`: `goal ↑ | → +0.17% flat` (early `0.4147872725734487`, mid `0.4204998221830465`, late `0.4154996814322658`, last `0.4255251376889646`)
+- `structure_target_rank_mean`: `goal ↓ | ↗ +58.80% improving` (early `351.84337743858384`, mid `176.16389315390174`, late `144.9534280711207`, last `314.703125`)
+- `val_structure_target_rank_mean`: `goal ↓ | ↗ +45.45% improving` (early `760.7540435791016`, mid `683.3385162353516`, late `415.0084457397461`, last `379.8781280517578`)
+- `structure_correct_logit_mean`: `goal ↑ | ↗ +47.31% improving` (early `6.134031791907514`, mid `9.474891618497109`, late `9.035739942528735`, last `9.1875`)
+- `val_structure_correct_logit_mean`: `goal ↑ | ↗ +16.44% improving` (early `8.0311279296875`, mid `8.441162109375`, late `9.3515625`, last `9.49462890625`)
+- `structure_top_negative_logit_mean`: `goal ↓ | ↘ -39.72% worsening` (early `7.262102601156069`, mid `10.490606936416185`, late `10.14691091954023`, last `10.1875`)
+- `val_structure_top_negative_logit_mean`: `goal ↓ | ↘ -16.08% worsening` (early `9.2255859375`, mid `10.51171875`, late `10.708740234375`, last `10.714599609375`)
+- `structure_logit_margin_mean`: `goal ↑ | → +1.23% flat` (early `-1.1263999277456647`, mid `-1.0154725885115607`, late `-1.1125740840517242`, last `-1.0078125`)
+- `val_structure_logit_margin_mean`: `goal ↑ | ↘ -13.67% worsening` (early `-1.194091796875`, mid `-2.0707931518554688`, late `-1.3573150634765625`, last `-1.221923828125`)
+- `structure_retrieval_logit_std`: `goal ↑ | ↗ +112.06% improving` (early `1.0455416592559375`, mid `2.0036371215919537`, late `2.2171744848119803`, last `0.9839304089546204`)
+- `val_structure_retrieval_logit_std`: `goal ↑ | ↗ +102.33% improving` (early `1.2326001720502973`, mid `2.022283688886091`, late `2.49387572822161`, last `2.6622845763340592`)
+- `structure_top1_top2_gap_mean`: `goal ↑ | ↗ +59.22% improving` (early `0.09793567106213873`, mid `0.12284365968208093`, late `0.1559343009159483`, last `0.0986328125`)
+- `val_structure_top1_top2_gap_mean`: `goal ↑ | ↗ +54.91% improving` (early `0.07839679718017578`, mid `0.1310901641845703`, late `0.12144279479980469`, last `0.11855697631835938`)
+- `structure_top1_top2_gap_norm_mean`: `goal ↑ | ↘ -35.65% worsening` (early `0.12215662799301864`, mid `0.07032911504236604`, late `0.07860379065547524`, last `0.10155132412910461`)
+- `val_structure_top1_top2_gap_norm_mean`: `goal ↑ | ↘ -16.83% worsening` (early `0.06950851557485294`, mid `0.07577372609375743`, late `0.0578127475164365`, last `0.05411380449368153`)
+- `structure_uncertain_fraction`: `goal ↓ | ↘ -6.11% worsening` (early `0.924663565751445`, mid `0.984747561416185`, late `0.9811422413793104`, last `0.970703125`)
+- `val_structure_uncertain_fraction`: `goal ↓ | → -0.03% flat` (early `0.9941177368164062`, mid `0.9762382507324219`, late `0.9944419860839844`, last `0.9922027587890625`)
+- `structure_confidence_separation`: `goal ↑ | ↘ -531.56% worsening` (early `-0.007918493679557749`, mid `-0.032136323077151974`, late `-0.05001017991881603`, last `-0.0040241447277367115`)
+- `val_structure_confidence_separation`: `goal ↑ | ↘ -204.85% worsening` (early `-0.00795668972114072`, mid `-0.01309866098972634`, late `-0.024256365849851136`, last `-0.027957430157584895`)
+- `structure_hit_at_1`: `goal ↑ | ↗ +549.68% improving` (early `0.007880238439306358`, mid `0.032706376445086706`, late `0.051196569683908046`, last `0.00390625`)
+- `structure_hit_at_5`: `goal ↑ | ↗ +402.47% improving` (early `0.03360955563583815`, mid `0.11673591040462428`, late `0.16887796336206898`, last `0.029296875`)
+- `structure_hit_at_20`: `goal ↑ | ↗ +239.46% improving` (early `0.10721865968208093`, mid `0.28105807442196534`, late `0.3639659662356322`, last `0.1171875`)
+- `val_hit_at_1`: `goal ↑ | → +207.79% flat` (early `0.0079345703125`, mid `0.01372528076171875`, late `0.02442169189453125`, last `0.0282135009765625`)
+- `val_hit_at_5`: `goal ↑ | ↗ +134.85% improving` (early `0.0288543701171875`, mid `0.0425567626953125`, late `0.0677642822265625`, last `0.0726776123046875`)
+- `val_hit_at_20`: `goal ↑ | ↗ +76.67% improving` (early `0.08158111572265625`, mid `0.094146728515625`, late `0.14413070678710938`, last `0.15270233154296875`)
+- `weighted_regularizer_to_contrastive_ratio`: `goal ↓ | ↗ +54.61% improving` (early `0.0667222202939108`, mid `0.0329437448262181`, late `0.03028750823471251`, last `0.028996589606316913`)
+- `samples_per_sec`: `goal ↑ | ↘ -2.88% worsening` (early `1575.5664566260843`, mid `1531.3735887168505`, late `1530.1496274666802`, last `1399.0203442084614`)
+- `gpu_max_memory_gb`: `goal ≈ | ↗ +100.00% improving` (early `13.252925169950275`, mid `13.279059082097401`, late `13.279157161712646`, last `13.279157161712646`)
+- `grad_norm`: `goal ≈ | ↘ -100.00% worsening` (early `4.638080189338309`, mid `4.979553528603791`, late `6.072961742165445`, last `1.7659728527069092`)
+## Primary Metric Pressure
+- `train_loss`: `goal ↓ | ↗ +10.57% improving` (early `6.340343519442343`, mid `5.795929590401622`, late `5.670367905463295`, last `6.491608619689941`)
+- `val_loss`: `goal ↓ | ↘ -55.82% worsening` (early `1.2876316868363775`, mid `2.20697861268016`, late `2.006446816829876`, last `6.646750174145564`)
+- `grad_norm`: `goal ≈ | ↘ -100.00% worsening` (early `4.638080189338309`, mid `4.979553528603791`, late `6.072961742165445`, last `1.7659728527069092`)
+- `contrastive_loss`: `goal ↓ | → -1.64% flat` (early `1.409792113166324`, mid `1.3598130204084982`, late `1.43291388983014`, last `0.5768923759460449`)
+- `structure_bce_loss`: `goal ↓ | ↗ +39.75% improving` (early `0.12293951650489272`, mid `0.07652380578004556`, late `0.07407209518012302`, last `0.08383000642061234`)
+- `val_structure_bce_loss`: `goal ↓ | ↗ +12.20% improving` (early `0.0771060927848642`, mid `0.07029345531468391`, late `0.06769936999660872`, last `0.06532714269997086`)
+- `val_structure_fingerprint_cosine`: `goal ↑ | → +0.17% flat` (early `0.4147872725734487`, mid `0.4204998221830465`, late `0.4154996814322658`, last `0.4255251376889646`)
+- `val_hit_at_20`: `goal ↑ | ↗ +76.67% improving` (early `0.08158111572265625`, mid `0.094146728515625`, late `0.14413070678710938`, last `0.15270233154296875`)
+- `val_structure_top1_top2_gap_mean`: `goal ↑ | ↗ +54.91% improving` (early `0.07839679718017578`, mid `0.1310901641845703`, late `0.12144279479980469`, last `0.11855697631835938`)
+- `val_structure_uncertain_fraction`: `goal ↓ | → -0.03% flat` (early `0.9941177368164062`, mid `0.9762382507324219`, late `0.9944419860839844`, last `0.9922027587890625`)
+- `val_structure_confidence_separation`: `goal ↑ | ↘ -204.85% worsening` (early `-0.00795668972114072`, mid `-0.01309866098972634`, late `-0.024256365849851136`, last `-0.027957430157584895`)
+- `samples_per_sec`: `goal ↑ | ↘ -2.88% worsening` (early `1575.5664566260843`, mid `1531.3735887168505`, late `1530.1496274666802`, last `1399.0203442084614`)
+## Debug Metrics
+- `train_loss`: `6.491608619689941`
+- `train_loss_ema`: `6.519052214060582`
+- `val_loss`: `6.646750174145564`
+- `contrastive_loss`: `0.5768923759460449`
+- `val_ssl_loss`: `1.0397093277424574`
+- `variance_loss`: `0.00213623046875`
+- `covariance_loss`: `10.012618064880371`
+- `structure_bce_loss`: `0.08383000642061234`
+- `structure_retrieval_loss`: `10.630162239074707`
+- `val_structure_retrieval_loss`: `10.882395941764116`
+- `structure_fingerprint_cosine`: `0.46021854877471924`
+- `structure_hit_at_1`: `0.00390625`
+- `structure_hit_at_5`: `0.029296875`
+- `structure_hit_at_20`: `0.1171875`
+- `structure_target_rank_mean`: `314.703125`
+- `structure_logit_margin_mean`: `-1.0078125`
+- `structure_retrieval_logit_std`: `0.9839304089546204`
+- `val_structure_retrieval_logit_std`: `2.6622845763340592`
+- `structure_correct_logit_mean`: `9.1875`
+- `structure_top_negative_logit_mean`: `10.1875`
+- `val_structure_correct_logit_mean`: `9.49462890625`
+- `val_structure_top_negative_logit_mean`: `10.714599609375`
+- `structure_top1_top2_gap_mean`: `0.0986328125`
+- `structure_top1_top2_gap_norm_mean`: `0.10155132412910461`
+- `structure_confidence_candidate_count`: `2126.0`
+- `structure_close_fraction`: `0.029296875`
+- `structure_uncertain_fraction`: `0.970703125`
+- `structure_uncertain_hit_at_1`: `0.0040241447277367115`
+- `structure_confidence_separation`: `-0.0040241447277367115`
+- `val_structure_top1_top2_gap_mean`: `0.11855697631835938`
+- `val_structure_top1_top2_gap_norm_mean`: `0.05411380449368153`
+- `val_structure_confidence_candidate_count`: `4096.0`
+- `val_structure_close_fraction`: `0.0077972412109375`
+- `val_structure_uncertain_fraction`: `0.9922027587890625`
+- `val_structure_close_hit_at_1`: `0.014835291571216658`
+- `val_structure_uncertain_hit_at_1`: `0.027957430157584895`
+- `val_structure_confidence_separation`: `-0.027957430157584895`
+- `grad_norm`: `1.7659728527069092`
+- `weighted_regularizer_to_contrastive_ratio`: `0.028996589606316913`
+- `samples_per_sec`: `1399.0203442084614`
+- `samples_per_sec_60s`: `1399.0203442084614`
+- `samples_per_sec_300s`: `1547.033197547462`
+- `samples_per_sec_900s`: `1512.7885250414204`
+- `samples_per_sec_run_mean`: `1533.0231795943853`
+- `gpu_max_memory_gb`: `13.279157161712646`
+- `gpu_util_mean_pct`: `36.0`
+- `gpu_util_min_pct`: `18.0`
+- `gpu_util_max_pct`: `54.0`
+- `gpu_active_fraction`: `1.0`
+- `gpu_mem_used_mean_gb`: `14.1943359375`
+- `gpu_mem_util_mean_pct`: `14.848754175733243`
+- `gpu_snapshot_available`: `1.0`
+- `step_time_sec`: `0.3659703749981418`
+- `step_time_cv_300s`: `0.06743440395418321`
+- `step_time_cv_900s`: `0.09218780075615579`
+- `dataloader_wait_pct_60s`: `0.0961140629935623`
+- `dataloader_wait_pct_300s`: `0.0382592069912683`
+- `dataloader_wait_pct_900s`: `0.066640439237091`
+- `dataloader_wait_pct_run`: `0.06717802801040498`
+- `mfu_estimate`: `0.06267708747552383`

metadata/training_surface.json ADDED Viewed

	@@ -0,0 +1,68 @@

+{
+  "created_at": "2026-04-13T20:20:55Z",
+  "run_name": "final_v3_structure_alignment_v26_r1",
+  "wandb_project": "Nexa_Mol",
+  "wandb_run_name": "final_v3_structure_alignment_v26_r1",
+  "wandb_group": "Structure-Alignment",
+  "dataset_root": "/home/ubuntu/data/gems_v1_handoff_labeled_v26",
+  "selected_shards_json": "/home/ubuntu/data/gems_v1_handoff_labeled_v26/selected_shards.json",
+  "selected_shards_exists": true,
+  "phase_ready_marker": "",
+  "phase_ready_exists": false,
+  "phase_receipt_path": "",
+  "phase_receipt_exists": false,
+  "train_shard_surface_mode": "train_only",
+  "refresh_selected_shards_on_iterator_reset": false,
+  "parent_policy": "local_only",
+  "labeled_eval_root": "",
+  "query_dataset_root": "",
+  "bank_dataset_root": "",
+  "primary_checkpoint_run_name": "",
+  "fallback_checkpoint_run_name": "",
+  "local_parent_checkpoint": "/home/ubuntu/artifacts/nexa_mol/v1_full_pretrain/phase1_blackwell_v3/Final_V3.pt",
+  "current_checkpoint_path": "",
+  "current_checkpoint_exists": true,
+  "disable_auto_resume": true,
+  "resume_model_only": true,
+  "objective": "hybrid",
+  "ssl_weight": 0.05,
+  "structure_weight": 1.0,
+  "structure_post_saturation_weight": 0.0,
+  "structure_threshold": 0.0,
+  "structure_lock_patience": 0,
+  "train_retrieval_watch_only": false,
+  "freeze_retrieval_head": false,
+  "retrieval_weight": 0.6,
+  "batch_size": 512,
+  "eval_batch_size": 512,
+  "num_workers": 12,
+  "grad_accum_steps": 1,
+  "loader_prefetch_factor": 4,
+  "log_every": 20,
+  "sync_every": 1000,
+  "amp_mode": "",
+  "additional_steps": 10000,
+  "max_steps": 91001,
+  "eval_batches": 24,
+  "eval_batches_per_shard": 0,
+  "eval_start_after_steps": 0,
+  "deep_eval_every": 2000,
+  "deep_eval_start_after_steps": 2000,
+  "deep_eval_batches": 256,
+  "deep_eval_single_view": false,
+  "deep_eval_structure_only": false,
+  "active_train_shards": 0,
+  "prefetch_train_shards": 0,
+  "val_shards": 0,
+  "test_shards": 0,
+  "train_offset": 0,
+  "val_offset": 0,
+  "test_offset": 0,
+  "selected_shards_summary": {
+    "train_count": 4,
+    "val_count": 2,
+    "test_count": 2,
+    "prefetch_count": 0,
+    "subset_strategy": "v26_native_confidence_policy_subset"
+  }
+}

model_index.json ADDED Viewed

	@@ -0,0 +1,48 @@

+{
+  "model-index": [
+    {
+      "name": "NexaMass-V3-Struct",
+      "results": [
+        {
+          "dataset": {
+            "name": "GeMS-derived labeled validation surface",
+            "type": "roman-bushuiev/GeMS"
+          },
+          "metrics": [
+            {
+              "name": "Validation structure BCE",
+              "type": "binary_cross_entropy",
+              "value": 0.0653
+            },
+            {
+              "name": "Validation fingerprint cosine",
+              "type": "cosine_similarity",
+              "value": 0.4255
+            }
+          ],
+          "task": {
+            "name": "MS/MS structure-aware representation learning",
+            "type": "feature-extraction"
+          }
+        },
+        {
+          "dataset": {
+            "name": "MassSpecGym test dataloader",
+            "type": "massspecgym"
+          },
+          "metrics": [
+            {
+              "name": "Hit@20",
+              "type": "hit@20",
+              "value": 0.3505
+            }
+          ],
+          "task": {
+            "name": "MassSpecGym adapter sanity check",
+            "type": "retrieval"
+          }
+        }
+      ]
+    }
+  ]
+}

runtime/README.md ADDED Viewed

	@@ -0,0 +1,14 @@

+# NexaMass Runtime
+`nexamass_encoder.py` is a minimal PyTorch loader for the model-state files in this repository.
+Recommended checkpoint for inference:
+```python
+from runtime.nexamass_encoder import ModelConfig, load_nexamass_model_state
+model = load_nexamass_model_state("weights/NexaMass-V3-Struct-model_state.pt", ModelConfig())  # PyTorch fallback
+# Safetensors weights are also provided for safer tensor-only loading: weights/NexaMass-V3-Struct-model_state.safetensors
+```
+Use `weights/NexaMass-V3-Struct-model_state.safetensors` for the RDKit/Morgan-aligned model and `weights/Final_V3-model_state.safetensors` for the self-supervised foundation parent. PyTorch model-state `.pt` fallbacks are also included. Optimizer-bearing full training checkpoints remain in object storage and are intentionally excluded from this public HF payload.

runtime/nexamass_encoder.py ADDED Viewed

	@@ -0,0 +1,139 @@

+from __future__ import annotations
+from dataclasses import dataclass
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+@dataclass(frozen=True)
+class ModelConfig:
+    max_peaks: int = 256
+    mz_max: float = 2000.0
+    collision_max: float = 200.0
+    model_dim: int = 384
+    layers: int = 6
+    heads: int = 8
+    dropout: float = 0.1
+    projection_dim: int = 192
+    fingerprint_dim: int = 2048
+    target_projection_dim: int = 256
+    retrieval_mlp_hidden_dim: int = 512
+    metadata_scale: float = 0.02
+class NexaMassSpectralEncoder(nn.Module):
+    """Encoder-only MS/MS transformer used by NexaMass-V3-Struct.
+    Expected batch keys:
+    - mzs, ints, mz_to_precursor, peak_rank: float tensors [batch, max_peaks]
+    - precursor_mz, charge, collision_energy, peak_count: float tensors [batch]
+    - adduct_id, instrument_id: long tensors [batch]
+    - mask: bool tensor [batch, max_peaks], True for valid peaks
+    """
+    def __init__(self, cfg: ModelConfig) -> None:
+        super().__init__()
+        self.cfg = cfg
+        self.adduct_embedding = nn.Embedding(64, cfg.model_dim)
+        self.instrument_embedding = nn.Embedding(64, cfg.model_dim)
+        self.input_projection = nn.Linear(8, cfg.model_dim)
+        encoder_layer = nn.TransformerEncoderLayer(
+            d_model=cfg.model_dim,
+            nhead=cfg.heads,
+            dim_feedforward=cfg.model_dim * 4,
+            dropout=cfg.dropout,
+            activation="gelu",
+            batch_first=True,
+            norm_first=True,
+        )
+        try:
+            self.encoder = nn.TransformerEncoder(encoder_layer, num_layers=cfg.layers, enable_nested_tensor=False)
+        except TypeError:
+            self.encoder = nn.TransformerEncoder(encoder_layer, num_layers=cfg.layers)
+        self.final_norm = nn.LayerNorm(cfg.model_dim)
+        self.projection = nn.Sequential(
+            nn.Linear(cfg.model_dim, cfg.model_dim),
+            nn.GELU(),
+            nn.Dropout(cfg.dropout),
+            nn.Linear(cfg.model_dim, cfg.projection_dim),
+        )
+        self.structure_head = nn.Sequential(
+            nn.Linear(cfg.model_dim, cfg.model_dim),
+            nn.GELU(),
+            nn.Dropout(cfg.dropout),
+            nn.Linear(cfg.model_dim, cfg.fingerprint_dim),
+        )
+        self.structure_query = nn.Sequential(
+            nn.Linear(cfg.model_dim, cfg.model_dim),
+            nn.GELU(),
+            nn.Dropout(cfg.dropout),
+            nn.Linear(cfg.model_dim, cfg.target_projection_dim),
+        )
+        self.target_projection = nn.Sequential(
+            nn.Linear(cfg.fingerprint_dim, cfg.model_dim),
+            nn.GELU(),
+            nn.Dropout(cfg.dropout),
+            nn.Linear(cfg.model_dim, cfg.target_projection_dim),
+        )
+        self.retrieval_bilinear = nn.Linear(cfg.target_projection_dim, cfg.target_projection_dim, bias=False)
+        self.retrieval_pair_mlp = nn.Sequential(
+            nn.Linear(cfg.target_projection_dim * 4, cfg.retrieval_mlp_hidden_dim),
+            nn.GELU(),
+            nn.Dropout(cfg.dropout),
+            nn.Linear(cfg.retrieval_mlp_hidden_dim, 1),
+        )
+        self.local_rerank_mlp = nn.Sequential(
+            nn.Linear(cfg.target_projection_dim * 4 + 1, cfg.retrieval_mlp_hidden_dim),
+            nn.GELU(),
+            nn.Dropout(cfg.dropout),
+            nn.Linear(cfg.retrieval_mlp_hidden_dim, 1),
+        )
+    def encode(self, batch: dict[str, torch.Tensor]) -> torch.Tensor:
+        features = torch.stack(
+            [
+                batch["mzs"],
+                batch["ints"],
+                batch["mz_to_precursor"],
+                batch["peak_rank"],
+                batch["precursor_mz"].unsqueeze(-1).expand_as(batch["mzs"]),
+                batch["charge"].unsqueeze(-1).expand_as(batch["mzs"]),
+                batch["collision_energy"].unsqueeze(-1).expand_as(batch["mzs"]),
+                batch["peak_count"].unsqueeze(-1).expand_as(batch["mzs"]),
+            ],
+            dim=-1,
+        )
+        hidden = self.input_projection(features)
+        hidden = hidden + self.adduct_embedding(batch["adduct_id"])[:, None, :] * self.cfg.metadata_scale
+        hidden = hidden + self.instrument_embedding(batch["instrument_id"])[:, None, :] * self.cfg.metadata_scale
+        encoded = self.encoder(hidden, src_key_padding_mask=~batch["mask"])
+        encoded = self.final_norm(encoded)
+        mask = batch["mask"].unsqueeze(-1)
+        return (encoded * mask).sum(dim=1) / mask.sum(dim=1).clamp(min=1)
+    def forward_with_heads(
+        self, batch: dict[str, torch.Tensor]
+    ) -> tuple[torch.Tensor, torch.Tensor, torch.Tensor, torch.Tensor]:
+        pooled = self.encode(batch)
+        raw_projected = self.projection(pooled)
+        structure_logits = self.structure_head(pooled)
+        structure_query_raw = self.structure_query(pooled)
+        return F.normalize(raw_projected, dim=-1), raw_projected, structure_logits, structure_query_raw
+    def project_structure_targets(self, targets: torch.Tensor) -> torch.Tensor:
+        return F.normalize(self.target_projection(targets), dim=-1)
+def load_nexamass_model_state(
+    checkpoint_path: str,
+    cfg: ModelConfig | None = None,
+    map_location: str | torch.device = "cpu",
+) -> NexaMassSpectralEncoder:
+    payload = torch.load(checkpoint_path, map_location=map_location)
+    cfg = cfg or ModelConfig()
+    model = NexaMassSpectralEncoder(cfg)
+    model.load_state_dict(payload["model_state"], strict=True)
+    model.eval()
+    return model

weights/Final_V3-model_state.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c16f3bb2ab7c2612b6b84a3359abeaf0a1cb1c055399beac21b39521424328b5
+size 56473018

weights/Final_V3-model_state.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:870b30c7bb6a340a460306882fe631d76282f233baf3920ca3a45c363eaf0ee6
+size 56437128

weights/NexaMass-V3-Struct-model_state.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bde396a7448b6972bcb784a465812b4d5b819f8d0c76cf2fba7066db7be9da1f
+size 56474172

weights/NexaMass-V3-Struct-model_state.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6e006a6fa4ba6b8f127c7eabc9eaf6b7b64675e0136dee3ca1655bb3a4a3eadd
+size 56437136