dgcnz
/

REPR

Model card Files Files and versions

xet

Community

dgcnz commited on Jul 8, 2025

Commit

580bfdc

verified ·

1 Parent(s): abed276

Upload folder using huggingface_hub

Browse files

Files changed (1) hide show

outputs/2025-04-11/10-15-18/.hydra/config.yaml +148 -0

outputs/2025-04-11/10-15-18/.hydra/config.yaml ADDED Viewed

	@@ -0,0 +1,148 @@

+extras:
+  ignore_warnings: false
+  enforce_tags: true
+  print_config: true
+  theme: ansi_light
+task_name: pretrain
+tags:
+- pretrain
+- imagenet1k
+- partmae_v5_2
+- vit_b_16
+ckpt_path: null
+seed: 12345
+trainer:
+  accelerator: gpu
+  devices: 4
+  num_nodes: 1
+  precision: bf16-mixed
+  strategy: ddp
+  max_epochs: 200
+  min_epochs: null
+  accumulate_grad_batches: 1
+  gradient_clip_val: 0.3
+paths:
+  root_dir: ${oc.env:PROJECT_ROOT}
+  log_dir: ${paths.root_dir}/logs/
+  output_dir: ${hydra:runtime.output_dir}
+  work_dir: ${hydra:runtime.cwd}
+run:
+  dir: ${paths.log_dir}/${task_name}/runs/${now:%Y-%m-%d}_${now:%H-%M-%S}
+sweep:
+  dir: ${paths.log_dir}/${task_name}/multiruns/${now:%Y-%m-%d}_${now:%H-%M-%S}
+  subdir: ${hydra:job.num}
+job_logging:
+  handlers:
+    file:
+      filename: ${hydra:runtime.output_dir}/${task_name}.log
+data:
+  transform:
+    _target_: src.data.components.transforms.multi_crop_v3.ParametrizedMultiCropV3
+    canonical_size: 512
+    canonical_crop_scale:
+    - 0.9
+    - 1.0
+    global_crops_scale:
+    - 0.3
+    - 1.0
+    local_crops_scale:
+    - 0.05
+    - 0.3
+    n_global_crops: 1
+    n_local_crops: 5
+    distort_color: false
+  _target_: src.data.components.image_folder.ImageFolderNoLabels
+  root: /scratch-nvme/ml-datasets/imagenet/torchvision_ImageFolder/train
+model:
+  _target_: src.models.components.partmae_v5_2.PARTMaskedAutoEncoderViT
+  img_size: 224
+  canonical_img_size: 512
+  max_scale_ratio: 6.0
+  patch_size: 16
+  in_chans: 3
+  embed_dim: 768
+  depth: 12
+  num_heads: 12
+  mlp_ratio: 4
+  norm_layer:
+    _target_: torch.nn.LayerNorm
+    eps: 1.0e-06
+    _partial_: true
+  mask_ratio: 0.75
+  pos_mask_ratio: 0.75
+  num_views: 6
+  decoder_embed_dim: 512
+  decoder_depth: 8
+  decoder_num_heads: 16
+  sampler: stratified_jittered
+  criterion: l1
+  alpha_t: 0.5
+  alpha_ts: 0.8
+  alpha_s: 1.0
+  permute_segment_embed: true
+callbacks:
+  checkpoint:
+    _target_: src.callbacks.common.checkpoint.ModelCheckpoint
+    dirpath: ${paths.output_dir}
+    every_n_epochs: 25
+    save_last: true
+    verbose: true
+  metric_logger:
+    _target_: src.callbacks.common.metric_logger.MetricLogger
+    every_n_steps: 25
+  iter_timer:
+    _target_: src.callbacks.common.iter_timer.IterTimer
+    every_n_steps: 25
+logger:
+  wandb:
+    _target_: wandb.integration.lightning.fabric.WandbLogger
+    save_dir: ${paths.output_dir}
+    offline: false
+    id: null
+    anonymous: null
+    project: PART-pretrain
+    log_model: false
+    prefix: ''
+    group: imagenet1k/partmae_v5_2/vit_b_16
+    tags: []
+    job_type: ''
+scheduler:
+  _target_: timm.scheduler.cosine_lr.CosineLRScheduler
+  _partial_: true
+  t_initial: 125000
+  cycle_mul: 1.0
+  lr_min: 1.0e-06
+  cycle_decay: 0.1
+  warmup_lr_init: 1.0e-05
+  warmup_t: 6250
+  cycle_limit: 1
+  t_in_epochs: false
+  noise_range_t: null
+  noise_pct: 0.67
+  noise_std: 1.0
+  noise_seed: 42
+optimizer:
+  _target_: torch.optim.AdamW
+  _partial_: true
+  lr: ${eval:${blr} * ${trainer.accumulate_grad_batches} * ${trainer.num_nodes} *
+    ${trainer.devices} * ${train_dataloader.batch_size}  / 256}
+  weight_decay: 0.05
+  eps: 1.0e-08
+float32_matmul_precision: high
+cudnn_benchmark: true
+blr: 0.0001
+train_dataloader:
+  pin_memory: true
+  batch_size: 512
+  num_workers: 16
+  drop_last: true
+metric_collection:
+  _target_: src.models.components.metrics.partmae_v3.V3Metrics
+compile_kwargs:
+  fullgraph: true
+  mode: default
+compile_expr:
+  torch._subclasses.fake_tensor.CONSTANT_NUMEL_LIMIT: 100000
+  torch._dynamo.config.optimize_ddp: python_reducer
+  torch._dynamo.config.compiled_autograd: true
+compile: false