Upload folder using huggingface_hub

a961eca verified 12 months ago

437 kB

	[[34m2025-04-30 14:26:25[0m] Experiment directory created at ck_decoder_cnn/001-TokenFlow
	[[34m2025-04-30 14:26:25[0m] Namespace(data_path='/root/autodl-tmp/TokenFlow/train2017', data_face_path=None, cloud_save_path='./logs/tokenflow/', no_local_save=False, vq_model='TokenFlow', teacher='clipb_224', vq_ckpt='/root/autodl-tmp/TokenFlow/TokenFlow_checkpoint/tokenflow_clipb_32k_enhanced.pt', finetune=False, ema=False, codebook_size=32768, codebook_embed_dim=8, semantic_code_dim=32, codebook_l2_norm=True, codebook_weight=1.0, entropy_loss_ratio=0.0, commit_loss_beta=0.25, reconstruction_weight=1.0, reconstruction_loss='l2', perceptual_weight=1.0, disc_weight=0.5, disc_start=20000, disc_type='patchgan', disc_loss='hinge', gen_loss='hinge', compile=False, dropout_p=0.0, results_dir='ck_decoder_cnn', dataset='coco', image_size=224, epochs=1, lr=0.0001, weight_decay=0.05, beta1=0.9, beta2=0.95, max_grad_norm=1.0, global_batch_size=8, global_seed=0, num_workers=1, log_every=100, ckpt_every=5000, gradient_accumulation_steps=1, mixed_precision='bf16', infer_interpolate=False, enhanced_decoder=False, kmeans=False, finetune_decoder=False, rank=0, world_size=1, gpu=0, dist_url='env://', distributed=True, dist_backend='nccl')
	[[34m2025-04-30 14:26:25[0m] Starting rank=0, seed=0, world_size=1.
	[[34m2025-04-30 14:26:29[0m] VQ Model Parameters: 376,710,957
	[[34m2025-04-30 14:26:32[0m] Discriminator Parameters: 2,765,633
	[[34m2025-04-30 14:26:32[0m] Optimizing part parameters.
	[[34m2025-04-30 14:26:32[0m] no kmeans, args.lr = 0.0001
	[[34m2025-04-30 14:26:32[0m] Dataset contains 116,756 images (/root/autodl-tmp/TokenFlow/train2017)
	[[34m2025-04-30 14:26:33[0m] Loaded model from checkpoint.
	[[34m2025-04-30 14:26:33[0m] Optimizer starting from scratch.
	[[34m2025-04-30 14:26:33[0m] Discriminator starting from scratch.
	[[34m2025-04-30 14:26:33[0m] Discriminator optimizer starting from scratch.
	[[34m2025-04-30 14:26:33[0m] Resume training from checkpoint: /root/autodl-tmp/TokenFlow/TokenFlow_checkpoint/tokenflow_clipb_32k_enhanced.pt
	[[34m2025-04-30 14:26:33[0m] Initial state: steps=0, epochs=0
	[[34m2025-04-30 14:26:33[0m] Training for 1 epochs...
	[[34m2025-04-30 14:29:21[0m] Beginning epoch 0...
	[[34m2025-04-30 14:30:49[0m] (Generator) rec_loss: 0.1796, perceptual_loss: 0.7422, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9204, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5111, d_vqkd: 128274.5391, d_vqgan: 145431.3125
	[[34m2025-04-30 14:30:49[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.2734
	[[34m2025-04-30 14:30:49[0m] (step=0000100) Train Loss: 1.6152, Train Steps/Sec: 0.39
	[[34m2025-04-30 14:32:16[0m] (Generator) rec_loss: 0.1367, perceptual_loss: 0.6836, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9197, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5194, d_vqkd: 128174.8438, d_vqgan: 144185.8438
	[[34m2025-04-30 14:32:17[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3047, logits_fake: -1.3281
	[[34m2025-04-30 14:32:17[0m] (step=0000200) Train Loss: 1.4491, Train Steps/Sec: 1.14
	[[34m2025-04-30 14:33:44[0m] (Generator) rec_loss: 0.1483, perceptual_loss: 0.7031, vq_loss: 0.0257, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9190, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5374, d_vqkd: 128616.2188, d_vqgan: 146205.1562
	[[34m2025-04-30 14:33:44[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3516
	[[34m2025-04-30 14:33:44[0m] (step=0000300) Train Loss: 1.3890, Train Steps/Sec: 1.14
	[[34m2025-04-30 14:35:11[0m] (Generator) rec_loss: 0.1186, perceptual_loss: 0.6641, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9206, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5306, d_vqkd: 129389.1953, d_vqgan: 145608.9219
	[[34m2025-04-30 14:35:12[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3672
	[[34m2025-04-30 14:35:12[0m] (step=0000400) Train Loss: 1.3479, Train Steps/Sec: 1.14
	[[34m2025-04-30 14:36:39[0m] (Generator) rec_loss: 0.1142, perceptual_loss: 0.6328, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5128, d_vqkd: 128340.0547, d_vqgan: 144212.1719
	[[34m2025-04-30 14:36:39[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3594
	[[34m2025-04-30 14:36:39[0m] (step=0000500) Train Loss: 1.3241, Train Steps/Sec: 1.14
	[[34m2025-04-30 14:38:06[0m] (Generator) rec_loss: 0.1063, perceptual_loss: 0.6133, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9176, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5157, d_vqkd: 129047.6172, d_vqgan: 145168.8438
	[[34m2025-04-30 14:38:07[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3672
	[[34m2025-04-30 14:38:07[0m] (step=0000600) Train Loss: 1.3057, Train Steps/Sec: 1.14
	[[34m2025-04-30 14:39:34[0m] (Generator) rec_loss: 0.0775, perceptual_loss: 0.6094, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4881, d_vqkd: 128687.7031, d_vqgan: 144890.5156
	[[34m2025-04-30 14:39:34[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3750, logits_fake: -1.3672
	[[34m2025-04-30 14:39:34[0m] (step=0000700) Train Loss: 1.2781, Train Steps/Sec: 1.14
	[[34m2025-04-30 14:41:01[0m] (Generator) rec_loss: 0.0829, perceptual_loss: 0.5820, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9170, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5109, d_vqkd: 128256.9062, d_vqgan: 145044.8125
	[[34m2025-04-30 14:41:02[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3359
	[[34m2025-04-30 14:41:02[0m] (step=0000800) Train Loss: 1.2370, Train Steps/Sec: 1.14
	[[34m2025-04-30 14:42:29[0m] (Generator) rec_loss: 0.0742, perceptual_loss: 0.5820, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9195, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4986, d_vqkd: 128683.0547, d_vqgan: 145370.2656
	[[34m2025-04-30 14:42:29[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3516
	[[34m2025-04-30 14:42:29[0m] (step=0000900) Train Loss: 1.2390, Train Steps/Sec: 1.14
	[[34m2025-04-30 14:43:56[0m] (Generator) rec_loss: 0.1233, perceptual_loss: 0.6172, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9178, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5120, d_vqkd: 129011.5078, d_vqgan: 145388.3906
	[[34m2025-04-30 14:43:56[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3203
	[[34m2025-04-30 14:43:56[0m] (step=0001000) Train Loss: 1.2240, Train Steps/Sec: 1.14
	[[34m2025-04-30 14:45:23[0m] (Generator) rec_loss: 0.1262, perceptual_loss: 0.6094, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9206, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5004, d_vqkd: 128540.0078, d_vqgan: 145112.6562
	[[34m2025-04-30 14:45:24[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3672
	[[34m2025-04-30 14:45:24[0m] (step=0001100) Train Loss: 1.2064, Train Steps/Sec: 1.14
	[[34m2025-04-30 14:46:51[0m] (Generator) rec_loss: 0.0795, perceptual_loss: 0.5664, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9211, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4851, d_vqkd: 128371.2891, d_vqgan: 145027.5000
	[[34m2025-04-30 14:46:52[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.2969, logits_fake: -1.2969
	[[34m2025-04-30 14:46:52[0m] (step=0001200) Train Loss: 1.1811, Train Steps/Sec: 1.14
	[[34m2025-04-30 14:48:18[0m] (Generator) rec_loss: 0.0738, perceptual_loss: 0.5469, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9174, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4745, d_vqkd: 128500.2812, d_vqgan: 145257.2500
	[[34m2025-04-30 14:48:19[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3438
	[[34m2025-04-30 14:48:19[0m] (step=0001300) Train Loss: 1.1723, Train Steps/Sec: 1.14
	[[34m2025-04-30 14:49:46[0m] (Generator) rec_loss: 0.0902, perceptual_loss: 0.6055, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9211, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4853, d_vqkd: 128766.6250, d_vqgan: 145242.0625
	[[34m2025-04-30 14:49:46[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3438
	[[34m2025-04-30 14:49:46[0m] (step=0001400) Train Loss: 1.1692, Train Steps/Sec: 1.14
	[[34m2025-04-30 14:51:13[0m] (Generator) rec_loss: 0.1019, perceptual_loss: 0.5234, vq_loss: 0.0244, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9199, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4573, d_vqkd: 128548.5859, d_vqgan: 144814.0938
	[[34m2025-04-30 14:51:14[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3516
	[[34m2025-04-30 14:51:14[0m] (step=0001500) Train Loss: 1.1487, Train Steps/Sec: 1.14
	[[34m2025-04-30 14:52:41[0m] (Generator) rec_loss: 0.0781, perceptual_loss: 0.5430, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4480, d_vqkd: 128331.6953, d_vqgan: 144958.8125
	[[34m2025-04-30 14:52:41[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3516
	[[34m2025-04-30 14:52:41[0m] (step=0001600) Train Loss: 1.1458, Train Steps/Sec: 1.14
	[[34m2025-04-30 14:54:08[0m] (Generator) rec_loss: 0.0820, perceptual_loss: 0.5352, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9186, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4739, d_vqkd: 128173.3672, d_vqgan: 144285.2188
	[[34m2025-04-30 14:54:09[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3672
	[[34m2025-04-30 14:54:09[0m] (step=0001700) Train Loss: 1.1213, Train Steps/Sec: 1.14
	[[34m2025-04-30 14:55:36[0m] (Generator) rec_loss: 0.0863, perceptual_loss: 0.5625, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9188, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4663, d_vqkd: 128614.8438, d_vqgan: 145121.4531
	[[34m2025-04-30 14:55:36[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3438
	[[34m2025-04-30 14:55:36[0m] (step=0001800) Train Loss: 1.1118, Train Steps/Sec: 1.14
	[[34m2025-04-30 14:57:03[0m] (Generator) rec_loss: 0.0638, perceptual_loss: 0.5078, vq_loss: 0.0236, commit_loss: 0.0059, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4624, d_vqkd: 127730.9688, d_vqgan: 144807.2500
	[[34m2025-04-30 14:57:04[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3438
	[[34m2025-04-30 14:57:04[0m] (step=0001900) Train Loss: 1.0839, Train Steps/Sec: 1.14
	[[34m2025-04-30 14:58:31[0m] (Generator) rec_loss: 0.0853, perceptual_loss: 0.5430, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9176, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4632, d_vqkd: 128707.1875, d_vqgan: 144979.5625
	[[34m2025-04-30 14:58:31[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3516
	[[34m2025-04-30 14:58:31[0m] (step=0002000) Train Loss: 1.0720, Train Steps/Sec: 1.14
	[[34m2025-04-30 14:59:58[0m] (Generator) rec_loss: 0.0794, perceptual_loss: 0.5430, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9208, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4610, d_vqkd: 129328.8203, d_vqgan: 145437.9844
	[[34m2025-04-30 14:59:59[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.2969
	[[34m2025-04-30 14:59:59[0m] (step=0002100) Train Loss: 1.0636, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:01:26[0m] (Generator) rec_loss: 0.1287, perceptual_loss: 0.5234, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4416, d_vqkd: 129266.9141, d_vqgan: 145998.7812
	[[34m2025-04-30 15:01:26[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3516
	[[34m2025-04-30 15:01:26[0m] (step=0002200) Train Loss: 1.0468, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:02:53[0m] (Generator) rec_loss: 0.0891, perceptual_loss: 0.5391, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9152, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4551, d_vqkd: 129009.7891, d_vqgan: 144019.4844
	[[34m2025-04-30 15:02:54[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3438
	[[34m2025-04-30 15:02:54[0m] (step=0002300) Train Loss: 1.0393, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:04:21[0m] (Generator) rec_loss: 0.0718, perceptual_loss: 0.4863, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4204, d_vqkd: 128877.8047, d_vqgan: 145542.4531
	[[34m2025-04-30 15:04:21[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3359
	[[34m2025-04-30 15:04:21[0m] (step=0002400) Train Loss: 1.0229, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:05:48[0m] (Generator) rec_loss: 0.0578, perceptual_loss: 0.4785, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9170, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4094, d_vqkd: 128453.2500, d_vqgan: 145027.2344
	[[34m2025-04-30 15:05:49[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3438
	[[34m2025-04-30 15:05:49[0m] (step=0002500) Train Loss: 1.0208, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:07:16[0m] (Generator) rec_loss: 0.0673, perceptual_loss: 0.4473, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9176, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3571, d_vqkd: 129097.9922, d_vqgan: 144894.7344
	[[34m2025-04-30 15:07:16[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3359
	[[34m2025-04-30 15:07:16[0m] (step=0002600) Train Loss: 0.9911, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:08:43[0m] (Generator) rec_loss: 0.0570, perceptual_loss: 0.4375, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4206, d_vqkd: 129180.6250, d_vqgan: 144898.3906
	[[34m2025-04-30 15:08:44[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3516
	[[34m2025-04-30 15:08:44[0m] (step=0002700) Train Loss: 0.9900, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:10:11[0m] (Generator) rec_loss: 0.0744, perceptual_loss: 0.4492, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9204, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3751, d_vqkd: 128414.1172, d_vqgan: 145480.6406
	[[34m2025-04-30 15:10:11[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3125, logits_fake: -1.3281
	[[34m2025-04-30 15:10:11[0m] (step=0002800) Train Loss: 0.9716, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:11:38[0m] (Generator) rec_loss: 0.1025, perceptual_loss: 0.4805, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9171, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4029, d_vqkd: 128866.5781, d_vqgan: 145063.2188
	[[34m2025-04-30 15:11:39[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3359
	[[34m2025-04-30 15:11:39[0m] (step=0002900) Train Loss: 0.9499, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:13:06[0m] (Generator) rec_loss: 0.0972, perceptual_loss: 0.4609, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4000, d_vqkd: 128577.7031, d_vqgan: 145951.1719
	[[34m2025-04-30 15:13:06[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3516
	[[34m2025-04-30 15:13:06[0m] (step=0003000) Train Loss: 0.9364, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:14:33[0m] (Generator) rec_loss: 0.0532, perceptual_loss: 0.4219, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3819, d_vqkd: 128379.0938, d_vqgan: 145188.7344
	[[34m2025-04-30 15:14:34[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3359
	[[34m2025-04-30 15:14:34[0m] (step=0003100) Train Loss: 0.9359, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:16:00[0m] (Generator) rec_loss: 0.0749, perceptual_loss: 0.4648, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9159, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4226, d_vqkd: 128253.3438, d_vqgan: 145120.2812
	[[34m2025-04-30 15:16:01[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3438
	[[34m2025-04-30 15:16:01[0m] (step=0003200) Train Loss: 0.9206, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:17:28[0m] (Generator) rec_loss: 0.0746, perceptual_loss: 0.4473, vq_loss: 0.0258, commit_loss: 0.0065, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3993, d_vqkd: 128775.3516, d_vqgan: 145550.9688
	[[34m2025-04-30 15:17:28[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3516
	[[34m2025-04-30 15:17:28[0m] (step=0003300) Train Loss: 0.9209, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:18:55[0m] (Generator) rec_loss: 0.0588, perceptual_loss: 0.4102, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3695, d_vqkd: 129058.4609, d_vqgan: 145256.4688
	[[34m2025-04-30 15:18:56[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3516
	[[34m2025-04-30 15:18:56[0m] (step=0003400) Train Loss: 0.9108, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:20:23[0m] (Generator) rec_loss: 0.0560, perceptual_loss: 0.4180, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9162, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3628, d_vqkd: 128726.0625, d_vqgan: 144983.5938
	[[34m2025-04-30 15:20:23[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3125, logits_fake: -1.3203
	[[34m2025-04-30 15:20:23[0m] (step=0003500) Train Loss: 0.8937, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:21:50[0m] (Generator) rec_loss: 0.0554, perceptual_loss: 0.4238, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9155, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3623, d_vqkd: 127510.7578, d_vqgan: 144646.8750
	[[34m2025-04-30 15:21:51[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3203
	[[34m2025-04-30 15:21:51[0m] (step=0003600) Train Loss: 0.8876, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:23:18[0m] (Generator) rec_loss: 0.0700, perceptual_loss: 0.4062, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3647, d_vqkd: 128691.6562, d_vqgan: 145188.8594
	[[34m2025-04-30 15:23:18[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3594
	[[34m2025-04-30 15:23:18[0m] (step=0003700) Train Loss: 0.8722, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:24:45[0m] (Generator) rec_loss: 0.0475, perceptual_loss: 0.3867, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9180, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3694, d_vqkd: 128383.5781, d_vqgan: 145250.2500
	[[34m2025-04-30 15:24:46[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3359
	[[34m2025-04-30 15:24:46[0m] (step=0003800) Train Loss: 0.8690, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:26:13[0m] (Generator) rec_loss: 0.0546, perceptual_loss: 0.4062, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9200, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3550, d_vqkd: 128814.1953, d_vqgan: 144899.4375
	[[34m2025-04-30 15:26:13[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3359
	[[34m2025-04-30 15:26:13[0m] (step=0003900) Train Loss: 0.8574, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:27:40[0m] (Generator) rec_loss: 0.0639, perceptual_loss: 0.3828, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9162, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3335, d_vqkd: 128829.7031, d_vqgan: 145306.3281
	[[34m2025-04-30 15:27:41[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3281
	[[34m2025-04-30 15:27:41[0m] (step=0004000) Train Loss: 0.8601, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:29:08[0m] (Generator) rec_loss: 0.0498, perceptual_loss: 0.3809, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9179, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3735, d_vqkd: 128880.8984, d_vqgan: 144158.0781
	[[34m2025-04-30 15:29:08[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3047, logits_fake: -1.3281
	[[34m2025-04-30 15:29:08[0m] (step=0004100) Train Loss: 0.8386, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:30:35[0m] (Generator) rec_loss: 0.0838, perceptual_loss: 0.4141, vq_loss: 0.0257, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9189, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3730, d_vqkd: 128637.7266, d_vqgan: 146002.6094
	[[34m2025-04-30 15:30:36[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3438
	[[34m2025-04-30 15:30:36[0m] (step=0004200) Train Loss: 0.8411, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:32:03[0m] (Generator) rec_loss: 0.0492, perceptual_loss: 0.3848, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9192, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3372, d_vqkd: 127227.3125, d_vqgan: 145415.5938
	[[34m2025-04-30 15:32:03[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3516
	[[34m2025-04-30 15:32:03[0m] (step=0004300) Train Loss: 0.8392, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:33:30[0m] (Generator) rec_loss: 0.0466, perceptual_loss: 0.3672, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3528, d_vqkd: 128739.3281, d_vqgan: 145326.7656
	[[34m2025-04-30 15:33:31[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3359
	[[34m2025-04-30 15:33:31[0m] (step=0004400) Train Loss: 0.8313, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:34:57[0m] (Generator) rec_loss: 0.0609, perceptual_loss: 0.3906, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9178, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3505, d_vqkd: 129233.4844, d_vqgan: 146003.1562
	[[34m2025-04-30 15:34:58[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3516
	[[34m2025-04-30 15:34:58[0m] (step=0004500) Train Loss: 0.8333, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:36:25[0m] (Generator) rec_loss: 0.0572, perceptual_loss: 0.3965, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9195, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3784, d_vqkd: 128893.0703, d_vqgan: 144433.8125
	[[34m2025-04-30 15:36:25[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3281
	[[34m2025-04-30 15:36:25[0m] (step=0004600) Train Loss: 0.8373, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:37:52[0m] (Generator) rec_loss: 0.0722, perceptual_loss: 0.3926, vq_loss: 0.0239, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9195, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3616, d_vqkd: 127328.5938, d_vqgan: 145235.1250
	[[34m2025-04-30 15:37:53[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3438
	[[34m2025-04-30 15:37:53[0m] (step=0004700) Train Loss: 0.8252, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:39:20[0m] (Generator) rec_loss: 0.0646, perceptual_loss: 0.3906, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3626, d_vqkd: 128197.3594, d_vqgan: 145493.5781
	[[34m2025-04-30 15:39:20[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3281
	[[34m2025-04-30 15:39:20[0m] (step=0004800) Train Loss: 0.8181, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:40:47[0m] (Generator) rec_loss: 0.0751, perceptual_loss: 0.3730, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9160, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3427, d_vqkd: 128297.8984, d_vqgan: 144653.2500
	[[34m2025-04-30 15:40:48[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3750
	[[34m2025-04-30 15:40:48[0m] (step=0004900) Train Loss: 0.8190, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:42:15[0m] (Generator) rec_loss: 0.0578, perceptual_loss: 0.3887, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9169, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3894, d_vqkd: 128524.9844, d_vqgan: 144745.6719
	[[34m2025-04-30 15:42:15[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3359
	[[34m2025-04-30 15:42:15[0m] (step=0005000) Train Loss: 0.8113, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:42:18[0m] Saved checkpoint to ck_decoder_cnn/001-TokenFlow/checkpoints/0005000.pt
	[[34m2025-04-30 15:43:44[0m] (Generator) rec_loss: 0.0630, perceptual_loss: 0.3945, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9174, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3700, d_vqkd: 128452.2656, d_vqgan: 145346.2188
	[[34m2025-04-30 15:43:45[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3438
	[[34m2025-04-30 15:43:45[0m] (step=0005100) Train Loss: 0.8087, Train Steps/Sec: 1.12
	[[34m2025-04-30 15:45:12[0m] (Generator) rec_loss: 0.0858, perceptual_loss: 0.3594, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9188, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3281, d_vqkd: 129295.9688, d_vqgan: 145976.1250
	[[34m2025-04-30 15:45:12[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3672
	[[34m2025-04-30 15:45:12[0m] (step=0005200) Train Loss: 0.8046, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:46:39[0m] (Generator) rec_loss: 0.0570, perceptual_loss: 0.3555, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9174, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3389, d_vqkd: 128521.5938, d_vqgan: 144583.9531
	[[34m2025-04-30 15:46:40[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3594
	[[34m2025-04-30 15:46:40[0m] (step=0005300) Train Loss: 0.7951, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:48:07[0m] (Generator) rec_loss: 0.0760, perceptual_loss: 0.3574, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3379, d_vqkd: 128856.9219, d_vqgan: 145182.1875
	[[34m2025-04-30 15:48:07[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3047
	[[34m2025-04-30 15:48:07[0m] (step=0005400) Train Loss: 0.7958, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:49:34[0m] (Generator) rec_loss: 0.0539, perceptual_loss: 0.3438, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9210, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3291, d_vqkd: 128123.4922, d_vqgan: 145781.0000
	[[34m2025-04-30 15:49:35[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3281
	[[34m2025-04-30 15:49:35[0m] (step=0005500) Train Loss: 0.7950, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:51:02[0m] (Generator) rec_loss: 0.0449, perceptual_loss: 0.3418, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9189, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3275, d_vqkd: 128730.0234, d_vqgan: 145040.9375
	[[34m2025-04-30 15:51:02[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3281
	[[34m2025-04-30 15:51:02[0m] (step=0005600) Train Loss: 0.7983, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:52:29[0m] (Generator) rec_loss: 0.0454, perceptual_loss: 0.3340, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9168, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3376, d_vqkd: 128818.1406, d_vqgan: 144325.2500
	[[34m2025-04-30 15:52:30[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3750
	[[34m2025-04-30 15:52:30[0m] (step=0005700) Train Loss: 0.7894, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:53:57[0m] (Generator) rec_loss: 0.0605, perceptual_loss: 0.3477, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9168, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3073, d_vqkd: 128674.9219, d_vqgan: 145437.0938
	[[34m2025-04-30 15:53:57[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3750
	[[34m2025-04-30 15:53:58[0m] (step=0005800) Train Loss: 0.7823, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:55:25[0m] (Generator) rec_loss: 0.0532, perceptual_loss: 0.3496, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3262, d_vqkd: 128715.3438, d_vqgan: 145626.6719
	[[34m2025-04-30 15:55:25[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3438
	[[34m2025-04-30 15:55:25[0m] (step=0005900) Train Loss: 0.7860, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:56:52[0m] (Generator) rec_loss: 0.0623, perceptual_loss: 0.3496, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9164, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3391, d_vqkd: 128688.5469, d_vqgan: 145249.5625
	[[34m2025-04-30 15:56:53[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3438
	[[34m2025-04-30 15:56:53[0m] (step=0006000) Train Loss: 0.7793, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:58:20[0m] (Generator) rec_loss: 0.0621, perceptual_loss: 0.3633, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9155, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3468, d_vqkd: 128755.5391, d_vqgan: 145161.6406
	[[34m2025-04-30 15:58:20[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3516
	[[34m2025-04-30 15:58:20[0m] (step=0006100) Train Loss: 0.7889, Train Steps/Sec: 1.14
	[[34m2025-04-30 15:59:47[0m] (Generator) rec_loss: 0.0508, perceptual_loss: 0.3535, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9171, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3509, d_vqkd: 128848.3281, d_vqgan: 144812.1719
	[[34m2025-04-30 15:59:48[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3438
	[[34m2025-04-30 15:59:48[0m] (step=0006200) Train Loss: 0.7696, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:01:15[0m] (Generator) rec_loss: 0.1034, perceptual_loss: 0.3652, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9179, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3253, d_vqkd: 128615.7812, d_vqgan: 145341.3594
	[[34m2025-04-30 16:01:15[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3438
	[[34m2025-04-30 16:01:15[0m] (step=0006300) Train Loss: 0.7660, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:02:42[0m] (Generator) rec_loss: 0.0624, perceptual_loss: 0.3555, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9205, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3320, d_vqkd: 129020.4453, d_vqgan: 145458.2812
	[[34m2025-04-30 16:02:43[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3594
	[[34m2025-04-30 16:02:43[0m] (step=0006400) Train Loss: 0.7667, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:04:10[0m] (Generator) rec_loss: 0.0568, perceptual_loss: 0.3203, vq_loss: 0.0242, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9192, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2970, d_vqkd: 128339.0469, d_vqgan: 144909.9531
	[[34m2025-04-30 16:04:10[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3516
	[[34m2025-04-30 16:04:10[0m] (step=0006500) Train Loss: 0.7674, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:05:37[0m] (Generator) rec_loss: 0.0485, perceptual_loss: 0.3262, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3382, d_vqkd: 128875.7500, d_vqgan: 145706.6719
	[[34m2025-04-30 16:05:38[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3516
	[[34m2025-04-30 16:05:38[0m] (step=0006600) Train Loss: 0.7549, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:07:05[0m] (Generator) rec_loss: 0.0544, perceptual_loss: 0.3203, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9151, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3243, d_vqkd: 128446.4609, d_vqgan: 144754.2500
	[[34m2025-04-30 16:07:05[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3125
	[[34m2025-04-30 16:07:05[0m] (step=0006700) Train Loss: 0.7578, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:08:32[0m] (Generator) rec_loss: 0.0519, perceptual_loss: 0.3418, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3188, d_vqkd: 128805.0312, d_vqgan: 144807.3125
	[[34m2025-04-30 16:08:33[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3359
	[[34m2025-04-30 16:08:33[0m] (step=0006800) Train Loss: 0.7568, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:10:00[0m] (Generator) rec_loss: 0.0522, perceptual_loss: 0.3457, vq_loss: 0.0257, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9203, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3190, d_vqkd: 128826.3906, d_vqgan: 145774.2188
	[[34m2025-04-30 16:10:00[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3750, logits_fake: -1.3672
	[[34m2025-04-30 16:10:00[0m] (step=0006900) Train Loss: 0.7552, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:11:27[0m] (Generator) rec_loss: 0.0464, perceptual_loss: 0.3027, vq_loss: 0.0242, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9163, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3060, d_vqkd: 128018.7188, d_vqgan: 144755.6250
	[[34m2025-04-30 16:11:28[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3281
	[[34m2025-04-30 16:11:28[0m] (step=0007000) Train Loss: 0.7467, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:12:55[0m] (Generator) rec_loss: 0.0524, perceptual_loss: 0.3164, vq_loss: 0.0238, commit_loss: 0.0059, entropy_loss: 0.0000, codebook_usage: 0.9174, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3154, d_vqkd: 127603.7344, d_vqgan: 144884.6094
	[[34m2025-04-30 16:12:55[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3359
	[[34m2025-04-30 16:12:55[0m] (step=0007100) Train Loss: 0.7657, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:14:22[0m] (Generator) rec_loss: 0.0608, perceptual_loss: 0.3262, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9187, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3268, d_vqkd: 128052.5938, d_vqgan: 144930.8594
	[[34m2025-04-30 16:14:23[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3359
	[[34m2025-04-30 16:14:23[0m] (step=0007200) Train Loss: 0.7515, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:15:50[0m] (Generator) rec_loss: 0.0385, perceptual_loss: 0.3008, vq_loss: 0.0241, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9176, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3134, d_vqkd: 128737.3516, d_vqgan: 144508.0781
	[[34m2025-04-30 16:15:50[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3594
	[[34m2025-04-30 16:15:50[0m] (step=0007300) Train Loss: 0.7395, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:17:17[0m] (Generator) rec_loss: 0.0453, perceptual_loss: 0.3105, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9176, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3410, d_vqkd: 127963.4297, d_vqgan: 144776.3125
	[[34m2025-04-30 16:17:18[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3516
	[[34m2025-04-30 16:17:18[0m] (step=0007400) Train Loss: 0.7382, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:18:45[0m] (Generator) rec_loss: 0.0425, perceptual_loss: 0.3477, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9205, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3244, d_vqkd: 129260.0938, d_vqgan: 144992.9062
	[[34m2025-04-30 16:18:45[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3359
	[[34m2025-04-30 16:18:45[0m] (step=0007500) Train Loss: 0.7510, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:20:12[0m] (Generator) rec_loss: 0.0631, perceptual_loss: 0.3359, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9191, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3426, d_vqkd: 128389.7656, d_vqgan: 146441.9688
	[[34m2025-04-30 16:20:13[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3516
	[[34m2025-04-30 16:20:13[0m] (step=0007600) Train Loss: 0.7466, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:21:40[0m] (Generator) rec_loss: 0.0638, perceptual_loss: 0.3379, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9207, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3026, d_vqkd: 128648.1875, d_vqgan: 145293.0469
	[[34m2025-04-30 16:21:40[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3438
	[[34m2025-04-30 16:21:40[0m] (step=0007700) Train Loss: 0.7413, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:23:07[0m] (Generator) rec_loss: 0.0613, perceptual_loss: 0.3242, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9195, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2911, d_vqkd: 128993.1875, d_vqgan: 144874.0156
	[[34m2025-04-30 16:23:08[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3516
	[[34m2025-04-30 16:23:08[0m] (step=0007800) Train Loss: 0.7439, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:24:35[0m] (Generator) rec_loss: 0.0628, perceptual_loss: 0.3555, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9180, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3335, d_vqkd: 128638.5703, d_vqgan: 144713.3594
	[[34m2025-04-30 16:24:35[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3750, logits_fake: -1.3750
	[[34m2025-04-30 16:24:35[0m] (step=0007900) Train Loss: 0.7431, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:26:02[0m] (Generator) rec_loss: 0.0486, perceptual_loss: 0.3047, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9160, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2944, d_vqkd: 127950.0156, d_vqgan: 144917.8281
	[[34m2025-04-30 16:26:02[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3516
	[[34m2025-04-30 16:26:02[0m] (step=0008000) Train Loss: 0.7303, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:27:30[0m] (Generator) rec_loss: 0.0467, perceptual_loss: 0.3164, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9169, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3437, d_vqkd: 128613.9609, d_vqgan: 144790.8125
	[[34m2025-04-30 16:27:30[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3828, logits_fake: -1.3750
	[[34m2025-04-30 16:27:30[0m] (step=0008100) Train Loss: 0.7251, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:28:57[0m] (Generator) rec_loss: 0.0604, perceptual_loss: 0.3438, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3162, d_vqkd: 128084.8672, d_vqgan: 145393.9062
	[[34m2025-04-30 16:28:57[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3516
	[[34m2025-04-30 16:28:58[0m] (step=0008200) Train Loss: 0.7438, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:30:25[0m] (Generator) rec_loss: 0.0424, perceptual_loss: 0.3125, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9192, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3133, d_vqkd: 128530.1172, d_vqgan: 145367.1250
	[[34m2025-04-30 16:30:25[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3516
	[[34m2025-04-30 16:30:25[0m] (step=0008300) Train Loss: 0.7347, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:31:52[0m] (Generator) rec_loss: 0.0479, perceptual_loss: 0.3340, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9192, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3188, d_vqkd: 128352.5156, d_vqgan: 144846.8438
	[[34m2025-04-30 16:31:53[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3672
	[[34m2025-04-30 16:31:53[0m] (step=0008400) Train Loss: 0.7270, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:33:20[0m] (Generator) rec_loss: 0.0625, perceptual_loss: 0.2969, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9205, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2945, d_vqkd: 128264.8359, d_vqgan: 145099.8750
	[[34m2025-04-30 16:33:20[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3281
	[[34m2025-04-30 16:33:20[0m] (step=0008500) Train Loss: 0.7193, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:34:47[0m] (Generator) rec_loss: 0.0436, perceptual_loss: 0.3125, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9165, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2926, d_vqkd: 128117.2344, d_vqgan: 145255.5938
	[[34m2025-04-30 16:34:48[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3438
	[[34m2025-04-30 16:34:48[0m] (step=0008600) Train Loss: 0.7256, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:36:15[0m] (Generator) rec_loss: 0.0404, perceptual_loss: 0.2910, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9158, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2871, d_vqkd: 129067.2578, d_vqgan: 145048.0312
	[[34m2025-04-30 16:36:15[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3438
	[[34m2025-04-30 16:36:15[0m] (step=0008700) Train Loss: 0.7291, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:37:42[0m] (Generator) rec_loss: 0.0524, perceptual_loss: 0.3008, vq_loss: 0.0254, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9203, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2551, d_vqkd: 128838.4766, d_vqgan: 145869.0156
	[[34m2025-04-30 16:37:43[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3438
	[[34m2025-04-30 16:37:43[0m] (step=0008800) Train Loss: 0.7315, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:39:10[0m] (Generator) rec_loss: 0.0471, perceptual_loss: 0.3145, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9210, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3387, d_vqkd: 129049.2188, d_vqgan: 145349.5156
	[[34m2025-04-30 16:39:10[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3828, logits_fake: -1.3750
	[[34m2025-04-30 16:39:10[0m] (step=0008900) Train Loss: 0.7178, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:40:37[0m] (Generator) rec_loss: 0.0431, perceptual_loss: 0.3066, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9156, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3138, d_vqkd: 128428.2031, d_vqgan: 145312.9688
	[[34m2025-04-30 16:40:38[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3906, logits_fake: -1.3828
	[[34m2025-04-30 16:40:38[0m] (step=0009000) Train Loss: 0.7218, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:42:05[0m] (Generator) rec_loss: 0.0427, perceptual_loss: 0.3145, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2863, d_vqkd: 128820.4062, d_vqgan: 145110.6719
	[[34m2025-04-30 16:42:05[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3594
	[[34m2025-04-30 16:42:05[0m] (step=0009100) Train Loss: 0.7227, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:43:32[0m] (Generator) rec_loss: 0.0471, perceptual_loss: 0.3027, vq_loss: 0.0239, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9201, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3052, d_vqkd: 128435.1328, d_vqgan: 145220.9375
	[[34m2025-04-30 16:43:33[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3516
	[[34m2025-04-30 16:43:33[0m] (step=0009200) Train Loss: 0.7168, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:45:00[0m] (Generator) rec_loss: 0.0556, perceptual_loss: 0.2949, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9190, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2974, d_vqkd: 128705.5547, d_vqgan: 144781.9531
	[[34m2025-04-30 16:45:00[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3516
	[[34m2025-04-30 16:45:00[0m] (step=0009300) Train Loss: 0.7118, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:46:27[0m] (Generator) rec_loss: 0.0669, perceptual_loss: 0.3066, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9168, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2926, d_vqkd: 128460.2969, d_vqgan: 145486.6406
	[[34m2025-04-30 16:46:28[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3516
	[[34m2025-04-30 16:46:28[0m] (step=0009400) Train Loss: 0.7153, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:47:55[0m] (Generator) rec_loss: 0.0592, perceptual_loss: 0.3398, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9157, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3029, d_vqkd: 128392.6953, d_vqgan: 145312.0469
	[[34m2025-04-30 16:47:55[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3281
	[[34m2025-04-30 16:47:55[0m] (step=0009500) Train Loss: 0.7116, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:49:22[0m] (Generator) rec_loss: 0.0397, perceptual_loss: 0.2969, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9166, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2981, d_vqkd: 129354.6562, d_vqgan: 144972.0938
	[[34m2025-04-30 16:49:23[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3359
	[[34m2025-04-30 16:49:23[0m] (step=0009600) Train Loss: 0.7158, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:50:50[0m] (Generator) rec_loss: 0.0379, perceptual_loss: 0.3066, vq_loss: 0.0244, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9207, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3166, d_vqkd: 128835.3125, d_vqgan: 143996.8125
	[[34m2025-04-30 16:50:50[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3672
	[[34m2025-04-30 16:50:50[0m] (step=0009700) Train Loss: 0.7050, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:52:17[0m] (Generator) rec_loss: 0.0616, perceptual_loss: 0.3086, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9175, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2678, d_vqkd: 128729.9531, d_vqgan: 144682.0000
	[[34m2025-04-30 16:52:18[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3359
	[[34m2025-04-30 16:52:18[0m] (step=0009800) Train Loss: 0.7121, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:53:45[0m] (Generator) rec_loss: 0.0628, perceptual_loss: 0.3379, vq_loss: 0.0257, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9193, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3068, d_vqkd: 129371.9219, d_vqgan: 144929.7656
	[[34m2025-04-30 16:53:45[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3516
	[[34m2025-04-30 16:53:45[0m] (step=0009900) Train Loss: 0.7133, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:55:12[0m] (Generator) rec_loss: 0.0581, perceptual_loss: 0.3164, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9175, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3024, d_vqkd: 128289.4766, d_vqgan: 145280.1875
	[[34m2025-04-30 16:55:13[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3594
	[[34m2025-04-30 16:55:13[0m] (step=0010000) Train Loss: 0.7124, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:55:15[0m] Saved checkpoint to ck_decoder_cnn/001-TokenFlow/checkpoints/0010000.pt
	[[34m2025-04-30 16:56:42[0m] (Generator) rec_loss: 0.0529, perceptual_loss: 0.2988, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3040, d_vqkd: 128521.2344, d_vqgan: 145171.1250
	[[34m2025-04-30 16:56:43[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3281
	[[34m2025-04-30 16:56:43[0m] (step=0010100) Train Loss: 0.7127, Train Steps/Sec: 1.11
	[[34m2025-04-30 16:58:10[0m] (Generator) rec_loss: 0.0551, perceptual_loss: 0.3066, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2871, d_vqkd: 128089.4062, d_vqgan: 145711.7969
	[[34m2025-04-30 16:58:10[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3672
	[[34m2025-04-30 16:58:10[0m] (step=0010200) Train Loss: 0.6975, Train Steps/Sec: 1.14
	[[34m2025-04-30 16:59:37[0m] (Generator) rec_loss: 0.0410, perceptual_loss: 0.3184, vq_loss: 0.0240, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9180, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3238, d_vqkd: 126733.7578, d_vqgan: 143991.6094
	[[34m2025-04-30 16:59:38[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3672
	[[34m2025-04-30 16:59:38[0m] (step=0010300) Train Loss: 0.7035, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:01:05[0m] (Generator) rec_loss: 0.0844, perceptual_loss: 0.3398, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9202, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3047, d_vqkd: 128605.3984, d_vqgan: 144757.9844
	[[34m2025-04-30 17:01:05[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3047, logits_fake: -1.3359
	[[34m2025-04-30 17:01:05[0m] (step=0010400) Train Loss: 0.7095, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:02:32[0m] (Generator) rec_loss: 0.0435, perceptual_loss: 0.2949, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9167, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3004, d_vqkd: 128390.4062, d_vqgan: 145177.7500
	[[34m2025-04-30 17:02:32[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3750
	[[34m2025-04-30 17:02:32[0m] (step=0010500) Train Loss: 0.7053, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:03:59[0m] (Generator) rec_loss: 0.0514, perceptual_loss: 0.3125, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9201, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3642, d_vqkd: 128940.7891, d_vqgan: 144492.4375
	[[34m2025-04-30 17:04:00[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3125, logits_fake: -1.3281
	[[34m2025-04-30 17:04:00[0m] (step=0010600) Train Loss: 0.7069, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:05:27[0m] (Generator) rec_loss: 0.0519, perceptual_loss: 0.3066, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9171, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2896, d_vqkd: 128195.1406, d_vqgan: 145757.7031
	[[34m2025-04-30 17:05:27[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3125, logits_fake: -1.3047
	[[34m2025-04-30 17:05:27[0m] (step=0010700) Train Loss: 0.6967, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:06:54[0m] (Generator) rec_loss: 0.0486, perceptual_loss: 0.3242, vq_loss: 0.0234, commit_loss: 0.0059, entropy_loss: 0.0000, codebook_usage: 0.9202, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3437, d_vqkd: 127637.0781, d_vqgan: 144735.0000
	[[34m2025-04-30 17:06:55[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3281
	[[34m2025-04-30 17:06:55[0m] (step=0010800) Train Loss: 0.6992, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:08:22[0m] (Generator) rec_loss: 0.0466, perceptual_loss: 0.3066, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9163, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2945, d_vqkd: 128277.9688, d_vqgan: 144724.2812
	[[34m2025-04-30 17:08:22[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3047, logits_fake: -1.2969
	[[34m2025-04-30 17:08:22[0m] (step=0010900) Train Loss: 0.6996, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:09:49[0m] (Generator) rec_loss: 0.0412, perceptual_loss: 0.2754, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9169, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2930, d_vqkd: 128356.7031, d_vqgan: 144704.4062
	[[34m2025-04-30 17:09:50[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3125, logits_fake: -1.3203
	[[34m2025-04-30 17:09:50[0m] (step=0011000) Train Loss: 0.6978, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:11:17[0m] (Generator) rec_loss: 0.0449, perceptual_loss: 0.3008, vq_loss: 0.0254, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9198, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3178, d_vqkd: 128469.8438, d_vqgan: 145404.1719
	[[34m2025-04-30 17:11:17[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3125
	[[34m2025-04-30 17:11:17[0m] (step=0011100) Train Loss: 0.6982, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:12:44[0m] (Generator) rec_loss: 0.0420, perceptual_loss: 0.3008, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9159, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2961, d_vqkd: 128899.4062, d_vqgan: 144813.0312
	[[34m2025-04-30 17:12:45[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3281
	[[34m2025-04-30 17:12:45[0m] (step=0011200) Train Loss: 0.6913, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:14:12[0m] (Generator) rec_loss: 0.0499, perceptual_loss: 0.3281, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9179, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2860, d_vqkd: 128401.0391, d_vqgan: 144894.1094
	[[34m2025-04-30 17:14:12[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3438
	[[34m2025-04-30 17:14:12[0m] (step=0011300) Train Loss: 0.7012, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:15:39[0m] (Generator) rec_loss: 0.0619, perceptual_loss: 0.2871, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9159, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3202, d_vqkd: 129238.1094, d_vqgan: 144940.0938
	[[34m2025-04-30 17:15:40[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3672
	[[34m2025-04-30 17:15:40[0m] (step=0011400) Train Loss: 0.6912, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:17:06[0m] (Generator) rec_loss: 0.0479, perceptual_loss: 0.3281, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9175, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2999, d_vqkd: 128624.2891, d_vqgan: 145341.0312
	[[34m2025-04-30 17:17:07[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3281
	[[34m2025-04-30 17:17:07[0m] (step=0011500) Train Loss: 0.6923, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:18:34[0m] (Generator) rec_loss: 0.0622, perceptual_loss: 0.3105, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9167, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2794, d_vqkd: 128442.6094, d_vqgan: 144989.7812
	[[34m2025-04-30 17:18:35[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3203
	[[34m2025-04-30 17:18:35[0m] (step=0011600) Train Loss: 0.6946, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:20:02[0m] (Generator) rec_loss: 0.0571, perceptual_loss: 0.3477, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3496, d_vqkd: 128124.7422, d_vqgan: 144505.1719
	[[34m2025-04-30 17:20:02[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3281
	[[34m2025-04-30 17:20:02[0m] (step=0011700) Train Loss: 0.6975, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:21:29[0m] (Generator) rec_loss: 0.0439, perceptual_loss: 0.3086, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9165, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2958, d_vqkd: 128207.6641, d_vqgan: 144354.8594
	[[34m2025-04-30 17:21:30[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3281
	[[34m2025-04-30 17:21:30[0m] (step=0011800) Train Loss: 0.6929, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:22:57[0m] (Generator) rec_loss: 0.0578, perceptual_loss: 0.3262, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9162, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2962, d_vqkd: 128329.6641, d_vqgan: 145116.1406
	[[34m2025-04-30 17:22:57[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3203
	[[34m2025-04-30 17:22:57[0m] (step=0011900) Train Loss: 0.6906, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:24:24[0m] (Generator) rec_loss: 0.0358, perceptual_loss: 0.3066, vq_loss: 0.0261, commit_loss: 0.0065, entropy_loss: 0.0000, codebook_usage: 0.9165, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3142, d_vqkd: 128666.1484, d_vqgan: 146348.7344
	[[34m2025-04-30 17:24:25[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3438
	[[34m2025-04-30 17:24:25[0m] (step=0012000) Train Loss: 0.6906, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:25:52[0m] (Generator) rec_loss: 0.0531, perceptual_loss: 0.3320, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9184, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3390, d_vqkd: 128737.8203, d_vqgan: 145101.7812
	[[34m2025-04-30 17:25:52[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3516
	[[34m2025-04-30 17:25:52[0m] (step=0012100) Train Loss: 0.6845, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:27:19[0m] (Generator) rec_loss: 0.0578, perceptual_loss: 0.3262, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3102, d_vqkd: 127474.7266, d_vqgan: 145030.8125
	[[34m2025-04-30 17:27:20[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3672
	[[34m2025-04-30 17:27:20[0m] (step=0012200) Train Loss: 0.6880, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:28:47[0m] (Generator) rec_loss: 0.0508, perceptual_loss: 0.2891, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9158, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2882, d_vqkd: 128672.2344, d_vqgan: 144559.6875
	[[34m2025-04-30 17:28:47[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3750, logits_fake: -1.3672
	[[34m2025-04-30 17:28:47[0m] (step=0012300) Train Loss: 0.6780, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:30:14[0m] (Generator) rec_loss: 0.0631, perceptual_loss: 0.3184, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9178, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2981, d_vqkd: 127372.9844, d_vqgan: 144513.2031
	[[34m2025-04-30 17:30:15[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3516
	[[34m2025-04-30 17:30:15[0m] (step=0012400) Train Loss: 0.6804, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:31:41[0m] (Generator) rec_loss: 0.0522, perceptual_loss: 0.3125, vq_loss: 0.0254, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9169, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3059, d_vqkd: 128911.7266, d_vqgan: 144897.0156
	[[34m2025-04-30 17:31:42[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3438
	[[34m2025-04-30 17:31:42[0m] (step=0012500) Train Loss: 0.6842, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:33:09[0m] (Generator) rec_loss: 0.0315, perceptual_loss: 0.2832, vq_loss: 0.0228, commit_loss: 0.0057, entropy_loss: 0.0000, codebook_usage: 0.9170, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2625, d_vqkd: 127079.3828, d_vqgan: 144713.9375
	[[34m2025-04-30 17:33:09[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3438
	[[34m2025-04-30 17:33:09[0m] (step=0012600) Train Loss: 0.6868, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:34:36[0m] (Generator) rec_loss: 0.0580, perceptual_loss: 0.3242, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9201, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3236, d_vqkd: 128937.2812, d_vqgan: 144628.5938
	[[34m2025-04-30 17:34:37[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3281
	[[34m2025-04-30 17:34:37[0m] (step=0012700) Train Loss: 0.6865, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:36:04[0m] (Generator) rec_loss: 0.0480, perceptual_loss: 0.3047, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9162, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2890, d_vqkd: 128434.4844, d_vqgan: 145668.8750
	[[34m2025-04-30 17:36:04[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3594
	[[34m2025-04-30 17:36:04[0m] (step=0012800) Train Loss: 0.6761, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:37:31[0m] (Generator) rec_loss: 0.0538, perceptual_loss: 0.2793, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9186, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2988, d_vqkd: 128728.8438, d_vqgan: 144800.2344
	[[34m2025-04-30 17:37:32[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3203
	[[34m2025-04-30 17:37:32[0m] (step=0012900) Train Loss: 0.6763, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:38:59[0m] (Generator) rec_loss: 0.0481, perceptual_loss: 0.2891, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9169, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3165, d_vqkd: 129370.7812, d_vqgan: 145193.5000
	[[34m2025-04-30 17:38:59[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3594
	[[34m2025-04-30 17:38:59[0m] (step=0013000) Train Loss: 0.6824, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:40:26[0m] (Generator) rec_loss: 0.0478, perceptual_loss: 0.3164, vq_loss: 0.0258, commit_loss: 0.0065, entropy_loss: 0.0000, codebook_usage: 0.9190, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2857, d_vqkd: 128924.2422, d_vqgan: 145670.9062
	[[34m2025-04-30 17:40:27[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3359
	[[34m2025-04-30 17:40:27[0m] (step=0013100) Train Loss: 0.6780, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:41:54[0m] (Generator) rec_loss: 0.0553, perceptual_loss: 0.3086, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9180, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2910, d_vqkd: 129442.0078, d_vqgan: 144722.3906
	[[34m2025-04-30 17:41:54[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3125
	[[34m2025-04-30 17:41:54[0m] (step=0013200) Train Loss: 0.6829, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:43:21[0m] (Generator) rec_loss: 0.0525, perceptual_loss: 0.2969, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9184, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2742, d_vqkd: 128159.3672, d_vqgan: 144329.5938
	[[34m2025-04-30 17:43:22[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3516
	[[34m2025-04-30 17:43:22[0m] (step=0013300) Train Loss: 0.6889, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:44:49[0m] (Generator) rec_loss: 0.0562, perceptual_loss: 0.2988, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9178, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2632, d_vqkd: 128245.1406, d_vqgan: 145414.4219
	[[34m2025-04-30 17:44:49[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3438
	[[34m2025-04-30 17:44:49[0m] (step=0013400) Train Loss: 0.6754, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:46:16[0m] (Generator) rec_loss: 0.0609, perceptual_loss: 0.2969, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9197, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3064, d_vqkd: 128954.3594, d_vqgan: 144894.3594
	[[34m2025-04-30 17:46:17[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3828, logits_fake: -1.3828
	[[34m2025-04-30 17:46:17[0m] (step=0013500) Train Loss: 0.6782, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:47:44[0m] (Generator) rec_loss: 0.0621, perceptual_loss: 0.3008, vq_loss: 0.0254, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9136, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2852, d_vqkd: 128686.8906, d_vqgan: 145065.5156
	[[34m2025-04-30 17:47:44[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3438
	[[34m2025-04-30 17:47:44[0m] (step=0013600) Train Loss: 0.6802, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:49:11[0m] (Generator) rec_loss: 0.0576, perceptual_loss: 0.3105, vq_loss: 0.0257, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9163, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2883, d_vqkd: 129701.8281, d_vqgan: 145036.3906
	[[34m2025-04-30 17:49:12[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3594
	[[34m2025-04-30 17:49:12[0m] (step=0013700) Train Loss: 0.6741, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:50:39[0m] (Generator) rec_loss: 0.0491, perceptual_loss: 0.3203, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9175, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2830, d_vqkd: 128148.9609, d_vqgan: 144704.5156
	[[34m2025-04-30 17:50:39[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3281
	[[34m2025-04-30 17:50:39[0m] (step=0013800) Train Loss: 0.6746, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:52:06[0m] (Generator) rec_loss: 0.0482, perceptual_loss: 0.2949, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9175, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3057, d_vqkd: 128381.3750, d_vqgan: 144508.8281
	[[34m2025-04-30 17:52:07[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3359
	[[34m2025-04-30 17:52:07[0m] (step=0013900) Train Loss: 0.6685, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:53:34[0m] (Generator) rec_loss: 0.0686, perceptual_loss: 0.2773, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9164, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2903, d_vqkd: 128594.0312, d_vqgan: 145577.8438
	[[34m2025-04-30 17:53:34[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3359
	[[34m2025-04-30 17:53:34[0m] (step=0014000) Train Loss: 0.6757, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:55:01[0m] (Generator) rec_loss: 0.0435, perceptual_loss: 0.2812, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9159, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3006, d_vqkd: 128316.1406, d_vqgan: 145168.8906
	[[34m2025-04-30 17:55:02[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3516
	[[34m2025-04-30 17:55:02[0m] (step=0014100) Train Loss: 0.6787, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:56:29[0m] (Generator) rec_loss: 0.0416, perceptual_loss: 0.2871, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9175, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2668, d_vqkd: 129286.6641, d_vqgan: 144511.3125
	[[34m2025-04-30 17:56:29[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3125, logits_fake: -1.3047
	[[34m2025-04-30 17:56:29[0m] (step=0014200) Train Loss: 0.6635, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:57:56[0m] (Generator) rec_loss: 0.0579, perceptual_loss: 0.2969, vq_loss: 0.0239, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9189, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2874, d_vqkd: 127211.2734, d_vqgan: 145870.1250
	[[34m2025-04-30 17:57:57[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3594
	[[34m2025-04-30 17:57:57[0m] (step=0014300) Train Loss: 0.6746, Train Steps/Sec: 1.14
	[[34m2025-04-30 17:59:24[0m] (Generator) rec_loss: 0.0412, perceptual_loss: 0.2988, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9199, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2990, d_vqkd: 128899.1406, d_vqgan: 144566.5938
	[[34m2025-04-30 17:59:24[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3359
	[[34m2025-04-30 17:59:24[0m] (step=0014400) Train Loss: 0.6710, Train Steps/Sec: 1.14
	[[34m2025-04-30 18:00:51[0m] (Generator) rec_loss: 0.0682, perceptual_loss: 0.2832, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2842, d_vqkd: 128963.0938, d_vqgan: 144774.6250
	[[34m2025-04-30 18:00:52[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3672
	[[34m2025-04-30 18:00:52[0m] (step=0014500) Train Loss: 0.6637, Train Steps/Sec: 1.14
	[[34m2025-04-30 18:02:14[0m] Done!
	[[34m2025-04-30 19:03:30[0m] Experiment directory created at ck_decoder_cnn/001-TokenFlow
	[[34m2025-04-30 19:03:30[0m] Namespace(data_path='/root/autodl-tmp/TokenFlow/train2017', data_face_path=None, cloud_save_path='./logs/tokenflow/', no_local_save=False, vq_model='TokenFlow', teacher='clipb_224', vq_ckpt='/root/autodl-tmp/TokenFlow/TokenFlow_checkpoint/tokenflow_clipb_32k_enhanced.pt', finetune=False, ema=False, codebook_size=32768, codebook_embed_dim=8, semantic_code_dim=32, codebook_l2_norm=True, codebook_weight=1.0, entropy_loss_ratio=0.0, commit_loss_beta=0.25, reconstruction_weight=1.0, reconstruction_loss='l2', perceptual_weight=1.0, disc_weight=0.5, disc_start=20000, disc_type='patchgan', disc_loss='hinge', gen_loss='hinge', compile=False, dropout_p=0.0, results_dir='ck_decoder_cnn', dataset='coco', image_size=224, epochs=10, lr=0.0001, weight_decay=0.05, beta1=0.9, beta2=0.95, max_grad_norm=1.0, global_batch_size=8, global_seed=0, num_workers=1, log_every=100, ckpt_every=8000, gradient_accumulation_steps=1, mixed_precision='bf16', infer_interpolate=False, enhanced_decoder=False, kmeans=False, finetune_decoder=False, rank=0, world_size=1, gpu=0, dist_url='env://', distributed=True, dist_backend='nccl')
	[[34m2025-04-30 19:03:30[0m] Starting rank=0, seed=0, world_size=1.
	[[34m2025-04-30 19:03:34[0m] VQ Model Parameters: 376,710,957
	[[34m2025-04-30 19:03:38[0m] Discriminator Parameters: 2,765,633
	[[34m2025-04-30 19:03:38[0m] Optimizing part parameters.
	[[34m2025-04-30 19:03:38[0m] no kmeans, args.lr = 0.0001
	[[34m2025-04-30 19:03:38[0m] Dataset contains 116,756 images (/root/autodl-tmp/TokenFlow/train2017)
	[[34m2025-04-30 19:03:39[0m] Loaded model from checkpoint.
	[[34m2025-04-30 19:03:39[0m] Optimizer starting from scratch.
	[[34m2025-04-30 19:03:39[0m] Discriminator starting from scratch.
	[[34m2025-04-30 19:03:39[0m] Discriminator optimizer starting from scratch.
	[[34m2025-04-30 19:03:39[0m] Resume training from checkpoint: /root/autodl-tmp/TokenFlow/TokenFlow_checkpoint/tokenflow_clipb_32k_enhanced.pt
	[[34m2025-04-30 19:03:39[0m] Initial state: steps=0, epochs=0
	[[34m2025-04-30 19:03:39[0m] Training for 10 epochs...
	[[34m2025-04-30 19:03:59[0m] Beginning epoch 0...
	[[34m2025-04-30 19:05:27[0m] (Generator) rec_loss: 0.1865, perceptual_loss: 0.7500, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9206, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5082, d_vqkd: 128274.5391, d_vqgan: 145431.3125
	[[34m2025-04-30 19:05:27[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.2656
	[[34m2025-04-30 19:05:27[0m] (step=0000100) Train Loss: 1.5917, Train Steps/Sec: 0.92
	[[34m2025-04-30 19:06:55[0m] (Generator) rec_loss: 0.1520, perceptual_loss: 0.6875, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9204, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5120, d_vqkd: 128174.8438, d_vqgan: 144185.8438
	[[34m2025-04-30 19:06:55[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3047, logits_fake: -1.3438
	[[34m2025-04-30 19:06:55[0m] (step=0000200) Train Loss: 1.4375, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:08:22[0m] (Generator) rec_loss: 0.1415, perceptual_loss: 0.7031, vq_loss: 0.0257, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9205, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5229, d_vqkd: 128616.2188, d_vqgan: 146205.1562
	[[34m2025-04-30 19:08:23[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3438
	[[34m2025-04-30 19:08:23[0m] (step=0000300) Train Loss: 1.3819, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:09:50[0m] (Generator) rec_loss: 0.1251, perceptual_loss: 0.6523, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9193, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5236, d_vqkd: 129389.1953, d_vqgan: 145608.9219
	[[34m2025-04-30 19:09:50[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3906
	[[34m2025-04-30 19:09:50[0m] (step=0000400) Train Loss: 1.3477, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:11:17[0m] (Generator) rec_loss: 0.1037, perceptual_loss: 0.6484, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9178, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5158, d_vqkd: 128340.0547, d_vqgan: 144212.1719
	[[34m2025-04-30 19:11:18[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3672
	[[34m2025-04-30 19:11:18[0m] (step=0000500) Train Loss: 1.3198, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:12:45[0m] (Generator) rec_loss: 0.1105, perceptual_loss: 0.6172, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9171, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5108, d_vqkd: 129047.6172, d_vqgan: 145168.8438
	[[34m2025-04-30 19:12:45[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3984
	[[34m2025-04-30 19:12:45[0m] (step=0000600) Train Loss: 1.3111, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:14:12[0m] (Generator) rec_loss: 0.0750, perceptual_loss: 0.6055, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4852, d_vqkd: 128687.7031, d_vqgan: 144890.5156
	[[34m2025-04-30 19:14:13[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3750, logits_fake: -1.3594
	[[34m2025-04-30 19:14:13[0m] (step=0000700) Train Loss: 1.2829, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:15:40[0m] (Generator) rec_loss: 0.0735, perceptual_loss: 0.5898, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9171, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5048, d_vqkd: 128256.9062, d_vqgan: 145044.8125
	[[34m2025-04-30 19:15:40[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3672
	[[34m2025-04-30 19:15:40[0m] (step=0000800) Train Loss: 1.2418, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:17:07[0m] (Generator) rec_loss: 0.0661, perceptual_loss: 0.5938, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9205, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5032, d_vqkd: 128683.0547, d_vqgan: 145370.2656
	[[34m2025-04-30 19:17:08[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3594
	[[34m2025-04-30 19:17:08[0m] (step=0000900) Train Loss: 1.2408, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:18:35[0m] (Generator) rec_loss: 0.0978, perceptual_loss: 0.6094, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9193, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5186, d_vqkd: 129011.5078, d_vqgan: 145388.3906
	[[34m2025-04-30 19:18:35[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3359
	[[34m2025-04-30 19:18:35[0m] (step=0001000) Train Loss: 1.2292, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:20:02[0m] (Generator) rec_loss: 0.1040, perceptual_loss: 0.5938, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9221, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4905, d_vqkd: 128540.0078, d_vqgan: 145112.6562
	[[34m2025-04-30 19:20:02[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3828
	[[34m2025-04-30 19:20:02[0m] (step=0001100) Train Loss: 1.2136, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:21:30[0m] (Generator) rec_loss: 0.0771, perceptual_loss: 0.5625, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9212, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4820, d_vqkd: 128371.2891, d_vqgan: 145027.5000
	[[34m2025-04-30 19:21:30[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.2969, logits_fake: -1.3203
	[[34m2025-04-30 19:21:30[0m] (step=0001200) Train Loss: 1.1862, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:22:57[0m] (Generator) rec_loss: 0.0876, perceptual_loss: 0.5547, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9164, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4745, d_vqkd: 128500.2812, d_vqgan: 145257.2500
	[[34m2025-04-30 19:22:58[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3438
	[[34m2025-04-30 19:22:58[0m] (step=0001300) Train Loss: 1.1780, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:24:25[0m] (Generator) rec_loss: 0.0921, perceptual_loss: 0.5625, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9206, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4856, d_vqkd: 128766.6250, d_vqgan: 145242.0625
	[[34m2025-04-30 19:24:25[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3516
	[[34m2025-04-30 19:24:25[0m] (step=0001400) Train Loss: 1.1730, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:25:52[0m] (Generator) rec_loss: 0.1028, perceptual_loss: 0.5273, vq_loss: 0.0244, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9187, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4521, d_vqkd: 128548.5859, d_vqgan: 144814.0938
	[[34m2025-04-30 19:25:53[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3438
	[[34m2025-04-30 19:25:53[0m] (step=0001500) Train Loss: 1.1533, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:27:20[0m] (Generator) rec_loss: 0.0965, perceptual_loss: 0.5586, vq_loss: 0.0237, commit_loss: 0.0059, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4411, d_vqkd: 127203.2656, d_vqgan: 144592.8594
	[[34m2025-04-30 19:27:20[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3281
	[[34m2025-04-30 19:27:20[0m] (step=0001600) Train Loss: 1.1502, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:28:47[0m] (Generator) rec_loss: 0.0826, perceptual_loss: 0.5391, vq_loss: 0.0236, commit_loss: 0.0059, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4528, d_vqkd: 126899.0469, d_vqgan: 143947.0469
	[[34m2025-04-30 19:28:47[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3672
	[[34m2025-04-30 19:28:47[0m] (step=0001700) Train Loss: 1.1303, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:30:14[0m] (Generator) rec_loss: 0.0881, perceptual_loss: 0.5586, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9186, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4686, d_vqkd: 128614.8438, d_vqgan: 145121.4531
	[[34m2025-04-30 19:30:15[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3438
	[[34m2025-04-30 19:30:15[0m] (step=0001800) Train Loss: 1.1190, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:31:42[0m] (Generator) rec_loss: 0.0646, perceptual_loss: 0.5078, vq_loss: 0.0236, commit_loss: 0.0059, entropy_loss: 0.0000, codebook_usage: 0.9188, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4547, d_vqkd: 127730.3438, d_vqgan: 144786.3125
	[[34m2025-04-30 19:31:42[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3438
	[[34m2025-04-30 19:31:42[0m] (step=0001900) Train Loss: 1.0901, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:33:09[0m] (Generator) rec_loss: 0.0907, perceptual_loss: 0.5430, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9195, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4690, d_vqkd: 128707.1875, d_vqgan: 144979.5625
	[[34m2025-04-30 19:33:10[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3516
	[[34m2025-04-30 19:33:10[0m] (step=0002000) Train Loss: 1.0788, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:34:37[0m] (Generator) rec_loss: 0.0759, perceptual_loss: 0.5430, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9184, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4707, d_vqkd: 129328.8203, d_vqgan: 145437.9844
	[[34m2025-04-30 19:34:37[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.2969
	[[34m2025-04-30 19:34:37[0m] (step=0002100) Train Loss: 1.0707, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:36:04[0m] (Generator) rec_loss: 0.1252, perceptual_loss: 0.5352, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9153, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4470, d_vqkd: 129266.9141, d_vqgan: 145998.7812
	[[34m2025-04-30 19:36:05[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3594
	[[34m2025-04-30 19:36:05[0m] (step=0002200) Train Loss: 1.0634, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:37:32[0m] (Generator) rec_loss: 0.0866, perceptual_loss: 0.5312, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4437, d_vqkd: 129009.7891, d_vqgan: 144019.4844
	[[34m2025-04-30 19:37:32[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3281
	[[34m2025-04-30 19:37:32[0m] (step=0002300) Train Loss: 1.0461, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:38:59[0m] (Generator) rec_loss: 0.0718, perceptual_loss: 0.4922, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9166, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4327, d_vqkd: 128877.8047, d_vqgan: 145542.4531
	[[34m2025-04-30 19:39:00[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3438
	[[34m2025-04-30 19:39:00[0m] (step=0002400) Train Loss: 1.0345, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:40:27[0m] (Generator) rec_loss: 0.0618, perceptual_loss: 0.4629, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9156, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4099, d_vqkd: 128453.2500, d_vqgan: 145027.2344
	[[34m2025-04-30 19:40:27[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3438
	[[34m2025-04-30 19:40:27[0m] (step=0002500) Train Loss: 1.0387, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:41:54[0m] (Generator) rec_loss: 0.0700, perceptual_loss: 0.4629, vq_loss: 0.0234, commit_loss: 0.0058, entropy_loss: 0.0000, codebook_usage: 0.9174, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3923, d_vqkd: 128073.9141, d_vqgan: 144591.3750
	[[34m2025-04-30 19:41:55[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3438
	[[34m2025-04-30 19:41:55[0m] (step=0002600) Train Loss: 1.0106, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:43:22[0m] (Generator) rec_loss: 0.0595, perceptual_loss: 0.4531, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4299, d_vqkd: 129180.6250, d_vqgan: 144898.3906
	[[34m2025-04-30 19:43:22[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3516
	[[34m2025-04-30 19:43:22[0m] (step=0002700) Train Loss: 1.0088, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:44:49[0m] (Generator) rec_loss: 0.0739, perceptual_loss: 0.4590, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9216, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3992, d_vqkd: 128414.1172, d_vqgan: 145480.6406
	[[34m2025-04-30 19:44:50[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3125, logits_fake: -1.3281
	[[34m2025-04-30 19:44:50[0m] (step=0002800) Train Loss: 0.9891, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:46:17[0m] (Generator) rec_loss: 0.1022, perceptual_loss: 0.4902, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4093, d_vqkd: 128866.5781, d_vqgan: 145063.2188
	[[34m2025-04-30 19:46:17[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3516
	[[34m2025-04-30 19:46:17[0m] (step=0002900) Train Loss: 0.9718, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:47:44[0m] (Generator) rec_loss: 0.1057, perceptual_loss: 0.4746, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9166, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4152, d_vqkd: 128577.7031, d_vqgan: 145951.1719
	[[34m2025-04-30 19:47:45[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3516
	[[34m2025-04-30 19:47:45[0m] (step=0003000) Train Loss: 0.9671, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:49:12[0m] (Generator) rec_loss: 0.0584, perceptual_loss: 0.4395, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4039, d_vqkd: 128379.0938, d_vqgan: 145188.7344
	[[34m2025-04-30 19:49:12[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3281
	[[34m2025-04-30 19:49:12[0m] (step=0003100) Train Loss: 0.9634, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:50:39[0m] (Generator) rec_loss: 0.0798, perceptual_loss: 0.4707, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9188, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4143, d_vqkd: 128253.3438, d_vqgan: 145120.2812
	[[34m2025-04-30 19:50:40[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3516
	[[34m2025-04-30 19:50:40[0m] (step=0003200) Train Loss: 0.9455, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:52:07[0m] (Generator) rec_loss: 0.0814, perceptual_loss: 0.4629, vq_loss: 0.0258, commit_loss: 0.0065, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.4132, d_vqkd: 128775.3516, d_vqgan: 145550.9688
	[[34m2025-04-30 19:52:07[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3594
	[[34m2025-04-30 19:52:07[0m] (step=0003300) Train Loss: 0.9459, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:53:34[0m] (Generator) rec_loss: 0.0617, perceptual_loss: 0.4219, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9195, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3855, d_vqkd: 129058.4609, d_vqgan: 145256.4688
	[[34m2025-04-30 19:53:35[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3594
	[[34m2025-04-30 19:53:35[0m] (step=0003400) Train Loss: 0.9349, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:55:02[0m] (Generator) rec_loss: 0.0568, perceptual_loss: 0.4219, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9191, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3802, d_vqkd: 128726.0625, d_vqgan: 144983.5938
	[[34m2025-04-30 19:55:02[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3125, logits_fake: -1.3281
	[[34m2025-04-30 19:55:02[0m] (step=0003500) Train Loss: 0.9196, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:56:29[0m] (Generator) rec_loss: 0.0587, perceptual_loss: 0.4492, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9149, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3870, d_vqkd: 128886.2656, d_vqgan: 145175.0625
	[[34m2025-04-30 19:56:30[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3125
	[[34m2025-04-30 19:56:30[0m] (step=0003600) Train Loss: 0.9109, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:57:57[0m] (Generator) rec_loss: 0.0695, perceptual_loss: 0.4258, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3736, d_vqkd: 128691.6562, d_vqgan: 145188.8594
	[[34m2025-04-30 19:57:57[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3594
	[[34m2025-04-30 19:57:57[0m] (step=0003700) Train Loss: 0.8978, Train Steps/Sec: 1.14
	[[34m2025-04-30 19:59:24[0m] (Generator) rec_loss: 0.0518, perceptual_loss: 0.4004, vq_loss: 0.0239, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9192, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3704, d_vqkd: 127271.8984, d_vqgan: 144976.5312
	[[34m2025-04-30 19:59:24[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3203
	[[34m2025-04-30 19:59:24[0m] (step=0003800) Train Loss: 0.8977, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:00:51[0m] (Generator) rec_loss: 0.0550, perceptual_loss: 0.4238, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9190, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3718, d_vqkd: 128814.1953, d_vqgan: 144899.4375
	[[34m2025-04-30 20:00:52[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3438
	[[34m2025-04-30 20:00:52[0m] (step=0003900) Train Loss: 0.8863, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:02:19[0m] (Generator) rec_loss: 0.0668, perceptual_loss: 0.3984, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9190, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3474, d_vqkd: 128829.7031, d_vqgan: 145306.3281
	[[34m2025-04-30 20:02:19[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3281
	[[34m2025-04-30 20:02:19[0m] (step=0004000) Train Loss: 0.8863, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:03:46[0m] (Generator) rec_loss: 0.0499, perceptual_loss: 0.3809, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9168, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3809, d_vqkd: 128880.8984, d_vqgan: 144158.0781
	[[34m2025-04-30 20:03:47[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3047, logits_fake: -1.3203
	[[34m2025-04-30 20:03:47[0m] (step=0004100) Train Loss: 0.8664, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:05:14[0m] (Generator) rec_loss: 0.0805, perceptual_loss: 0.4297, vq_loss: 0.0257, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9188, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3968, d_vqkd: 128637.7266, d_vqgan: 146002.6094
	[[34m2025-04-30 20:05:14[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3438
	[[34m2025-04-30 20:05:14[0m] (step=0004200) Train Loss: 0.8711, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:06:41[0m] (Generator) rec_loss: 0.0514, perceptual_loss: 0.3828, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9171, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3520, d_vqkd: 128849.6484, d_vqgan: 145863.7188
	[[34m2025-04-30 20:06:42[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3594
	[[34m2025-04-30 20:06:42[0m] (step=0004300) Train Loss: 0.8605, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:08:09[0m] (Generator) rec_loss: 0.0477, perceptual_loss: 0.3809, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3665, d_vqkd: 128739.3281, d_vqgan: 145326.7656
	[[34m2025-04-30 20:08:09[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3359
	[[34m2025-04-30 20:08:09[0m] (step=0004400) Train Loss: 0.8552, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:09:36[0m] (Generator) rec_loss: 0.0604, perceptual_loss: 0.3945, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3563, d_vqkd: 129233.4844, d_vqgan: 146003.1562
	[[34m2025-04-30 20:09:37[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3516
	[[34m2025-04-30 20:09:37[0m] (step=0004500) Train Loss: 0.8508, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:11:04[0m] (Generator) rec_loss: 0.0622, perceptual_loss: 0.4043, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9195, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3907, d_vqkd: 128893.0703, d_vqgan: 144433.8125
	[[34m2025-04-30 20:11:04[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3359
	[[34m2025-04-30 20:11:04[0m] (step=0004600) Train Loss: 0.8531, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:12:31[0m] (Generator) rec_loss: 0.0699, perceptual_loss: 0.3984, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9209, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3650, d_vqkd: 128380.5469, d_vqgan: 145611.8594
	[[34m2025-04-30 20:12:31[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3438
	[[34m2025-04-30 20:12:31[0m] (step=0004700) Train Loss: 0.8484, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:13:59[0m] (Generator) rec_loss: 0.0632, perceptual_loss: 0.3945, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3693, d_vqkd: 128197.3594, d_vqgan: 145493.5781
	[[34m2025-04-30 20:13:59[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3203
	[[34m2025-04-30 20:13:59[0m] (step=0004800) Train Loss: 0.8447, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:15:26[0m] (Generator) rec_loss: 0.0733, perceptual_loss: 0.3848, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9168, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3630, d_vqkd: 128297.8984, d_vqgan: 144653.2500
	[[34m2025-04-30 20:15:27[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3594
	[[34m2025-04-30 20:15:27[0m] (step=0004900) Train Loss: 0.8294, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:16:54[0m] (Generator) rec_loss: 0.0628, perceptual_loss: 0.3867, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3924, d_vqkd: 128524.9844, d_vqgan: 144745.6719
	[[34m2025-04-30 20:16:54[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3281
	[[34m2025-04-30 20:16:54[0m] (step=0005000) Train Loss: 0.8319, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:18:21[0m] (Generator) rec_loss: 0.0598, perceptual_loss: 0.3965, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9176, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3759, d_vqkd: 128452.2656, d_vqgan: 145346.2188
	[[34m2025-04-30 20:18:21[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3438
	[[34m2025-04-30 20:18:21[0m] (step=0005100) Train Loss: 0.8267, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:19:48[0m] (Generator) rec_loss: 0.0845, perceptual_loss: 0.3730, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9170, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3264, d_vqkd: 129295.9688, d_vqgan: 145976.1250
	[[34m2025-04-30 20:19:49[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3672
	[[34m2025-04-30 20:19:49[0m] (step=0005200) Train Loss: 0.8236, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:21:16[0m] (Generator) rec_loss: 0.0605, perceptual_loss: 0.3652, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9175, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3573, d_vqkd: 128521.5938, d_vqgan: 144583.9531
	[[34m2025-04-30 20:21:16[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3438
	[[34m2025-04-30 20:21:16[0m] (step=0005300) Train Loss: 0.8138, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:22:43[0m] (Generator) rec_loss: 0.0770, perceptual_loss: 0.3633, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9180, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3543, d_vqkd: 128856.9219, d_vqgan: 145182.1875
	[[34m2025-04-30 20:22:44[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3047
	[[34m2025-04-30 20:22:44[0m] (step=0005400) Train Loss: 0.8123, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:24:11[0m] (Generator) rec_loss: 0.0612, perceptual_loss: 0.3516, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9206, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3354, d_vqkd: 128123.4922, d_vqgan: 145781.0000
	[[34m2025-04-30 20:24:11[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3359
	[[34m2025-04-30 20:24:11[0m] (step=0005500) Train Loss: 0.8101, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:25:38[0m] (Generator) rec_loss: 0.0493, perceptual_loss: 0.3594, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9190, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3491, d_vqkd: 128730.0234, d_vqgan: 145040.9375
	[[34m2025-04-30 20:25:38[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3359
	[[34m2025-04-30 20:25:38[0m] (step=0005600) Train Loss: 0.8099, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:27:05[0m] (Generator) rec_loss: 0.0459, perceptual_loss: 0.3340, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9160, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3525, d_vqkd: 128818.1406, d_vqgan: 144325.2500
	[[34m2025-04-30 20:27:06[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3750
	[[34m2025-04-30 20:27:06[0m] (step=0005700) Train Loss: 0.8052, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:28:33[0m] (Generator) rec_loss: 0.0647, perceptual_loss: 0.3574, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3225, d_vqkd: 128674.9219, d_vqgan: 145437.0938
	[[34m2025-04-30 20:28:33[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3750
	[[34m2025-04-30 20:28:33[0m] (step=0005800) Train Loss: 0.7984, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:30:00[0m] (Generator) rec_loss: 0.0570, perceptual_loss: 0.3555, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9178, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3481, d_vqkd: 128715.3438, d_vqgan: 145626.6719
	[[34m2025-04-30 20:30:01[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3438
	[[34m2025-04-30 20:30:01[0m] (step=0005900) Train Loss: 0.8044, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:31:28[0m] (Generator) rec_loss: 0.0621, perceptual_loss: 0.3496, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9164, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3324, d_vqkd: 128688.5469, d_vqgan: 145249.5625
	[[34m2025-04-30 20:31:29[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3438
	[[34m2025-04-30 20:31:29[0m] (step=0006000) Train Loss: 0.7928, Train Steps/Sec: 1.13
	[[34m2025-04-30 20:32:56[0m] (Generator) rec_loss: 0.0652, perceptual_loss: 0.3770, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9149, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3541, d_vqkd: 128755.5391, d_vqgan: 145161.6406
	[[34m2025-04-30 20:32:56[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3594
	[[34m2025-04-30 20:32:56[0m] (step=0006100) Train Loss: 0.8021, Train Steps/Sec: 1.15
	[[34m2025-04-30 20:34:23[0m] (Generator) rec_loss: 0.0521, perceptual_loss: 0.3672, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9170, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3714, d_vqkd: 128848.3281, d_vqgan: 144812.1719
	[[34m2025-04-30 20:34:23[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3359
	[[34m2025-04-30 20:34:24[0m] (step=0006200) Train Loss: 0.7869, Train Steps/Sec: 1.15
	[[34m2025-04-30 20:35:50[0m] (Generator) rec_loss: 0.1000, perceptual_loss: 0.3672, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9175, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3323, d_vqkd: 128615.7812, d_vqgan: 145341.3594
	[[34m2025-04-30 20:35:51[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3359
	[[34m2025-04-30 20:35:51[0m] (step=0006300) Train Loss: 0.7819, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:37:18[0m] (Generator) rec_loss: 0.0630, perceptual_loss: 0.3555, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9205, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3347, d_vqkd: 129020.4453, d_vqgan: 145458.2812
	[[34m2025-04-30 20:37:18[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3594
	[[34m2025-04-30 20:37:18[0m] (step=0006400) Train Loss: 0.7785, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:38:45[0m] (Generator) rec_loss: 0.0554, perceptual_loss: 0.3301, vq_loss: 0.0242, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9184, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2994, d_vqkd: 128339.0469, d_vqgan: 144909.9531
	[[34m2025-04-30 20:38:46[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3516
	[[34m2025-04-30 20:38:46[0m] (step=0006500) Train Loss: 0.7780, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:40:13[0m] (Generator) rec_loss: 0.0487, perceptual_loss: 0.3398, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9171, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3519, d_vqkd: 128875.7500, d_vqgan: 145706.6719
	[[34m2025-04-30 20:40:13[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3594
	[[34m2025-04-30 20:40:13[0m] (step=0006600) Train Loss: 0.7738, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:41:40[0m] (Generator) rec_loss: 0.0528, perceptual_loss: 0.3242, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9150, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3339, d_vqkd: 128446.4609, d_vqgan: 144754.2500
	[[34m2025-04-30 20:41:41[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3125
	[[34m2025-04-30 20:41:41[0m] (step=0006700) Train Loss: 0.7697, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:43:08[0m] (Generator) rec_loss: 0.0497, perceptual_loss: 0.3613, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9186, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3336, d_vqkd: 128805.0312, d_vqgan: 144807.3125
	[[34m2025-04-30 20:43:08[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3438
	[[34m2025-04-30 20:43:08[0m] (step=0006800) Train Loss: 0.7733, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:44:35[0m] (Generator) rec_loss: 0.0525, perceptual_loss: 0.3535, vq_loss: 0.0257, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9199, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3296, d_vqkd: 128826.3906, d_vqgan: 145774.2188
	[[34m2025-04-30 20:44:36[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3750, logits_fake: -1.3672
	[[34m2025-04-30 20:44:36[0m] (step=0006900) Train Loss: 0.7708, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:46:03[0m] (Generator) rec_loss: 0.0456, perceptual_loss: 0.3027, vq_loss: 0.0242, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9158, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3106, d_vqkd: 128018.7188, d_vqgan: 144755.6250
	[[34m2025-04-30 20:46:03[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3203
	[[34m2025-04-30 20:46:03[0m] (step=0007000) Train Loss: 0.7595, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:47:30[0m] (Generator) rec_loss: 0.0582, perceptual_loss: 0.3242, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9165, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3278, d_vqkd: 129255.4141, d_vqgan: 145309.2188
	[[34m2025-04-30 20:47:31[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3281
	[[34m2025-04-30 20:47:31[0m] (step=0007100) Train Loss: 0.7800, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:48:57[0m] (Generator) rec_loss: 0.0596, perceptual_loss: 0.3281, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9178, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3337, d_vqkd: 128052.5938, d_vqgan: 144930.8594
	[[34m2025-04-30 20:48:58[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3359
	[[34m2025-04-30 20:48:58[0m] (step=0007200) Train Loss: 0.7586, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:50:25[0m] (Generator) rec_loss: 0.0391, perceptual_loss: 0.3008, vq_loss: 0.0241, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9193, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3199, d_vqkd: 128737.3516, d_vqgan: 144508.0781
	[[34m2025-04-30 20:50:25[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3672
	[[34m2025-04-30 20:50:25[0m] (step=0007300) Train Loss: 0.7532, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:51:52[0m] (Generator) rec_loss: 0.0440, perceptual_loss: 0.3105, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9203, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3386, d_vqkd: 127963.4297, d_vqgan: 144776.3125
	[[34m2025-04-30 20:51:53[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3516
	[[34m2025-04-30 20:51:53[0m] (step=0007400) Train Loss: 0.7516, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:53:20[0m] (Generator) rec_loss: 0.0437, perceptual_loss: 0.3574, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9204, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3416, d_vqkd: 129260.0938, d_vqgan: 144992.9062
	[[34m2025-04-30 20:53:20[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3359
	[[34m2025-04-30 20:53:20[0m] (step=0007500) Train Loss: 0.7620, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:54:47[0m] (Generator) rec_loss: 0.0644, perceptual_loss: 0.3438, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3448, d_vqkd: 128389.7656, d_vqgan: 146441.9688
	[[34m2025-04-30 20:54:48[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3438
	[[34m2025-04-30 20:54:48[0m] (step=0007600) Train Loss: 0.7541, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:56:15[0m] (Generator) rec_loss: 0.0697, perceptual_loss: 0.3535, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9202, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3182, d_vqkd: 128648.1875, d_vqgan: 145293.0469
	[[34m2025-04-30 20:56:15[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3359
	[[34m2025-04-30 20:56:15[0m] (step=0007700) Train Loss: 0.7530, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:57:42[0m] (Generator) rec_loss: 0.0617, perceptual_loss: 0.3281, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9187, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3092, d_vqkd: 128993.1875, d_vqgan: 144874.0156
	[[34m2025-04-30 20:57:43[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3516
	[[34m2025-04-30 20:57:43[0m] (step=0007800) Train Loss: 0.7555, Train Steps/Sec: 1.14
	[[34m2025-04-30 20:59:10[0m] (Generator) rec_loss: 0.0661, perceptual_loss: 0.3594, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9188, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3302, d_vqkd: 128638.5703, d_vqgan: 144713.3594
	[[34m2025-04-30 20:59:10[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3750, logits_fake: -1.3672
	[[34m2025-04-30 20:59:10[0m] (step=0007900) Train Loss: 0.7583, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:00:37[0m] (Generator) rec_loss: 0.0469, perceptual_loss: 0.3027, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9156, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3097, d_vqkd: 127950.0156, d_vqgan: 144917.8281
	[[34m2025-04-30 21:00:37[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3594
	[[34m2025-04-30 21:00:37[0m] (step=0008000) Train Loss: 0.7392, Train Steps/Sec: 1.15
	[[34m2025-04-30 21:00:40[0m] Saved checkpoint to ck_decoder_cnn/001-TokenFlow/checkpoints/0008000.pt
	[[34m2025-04-30 21:02:07[0m] (Generator) rec_loss: 0.0481, perceptual_loss: 0.3242, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9164, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3520, d_vqkd: 128613.9609, d_vqgan: 144790.8125
	[[34m2025-04-30 21:02:07[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3828, logits_fake: -1.3672
	[[34m2025-04-30 21:02:07[0m] (step=0008100) Train Loss: 0.7392, Train Steps/Sec: 1.11
	[[34m2025-04-30 21:03:34[0m] (Generator) rec_loss: 0.0649, perceptual_loss: 0.3555, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9206, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3276, d_vqkd: 126643.9141, d_vqgan: 145026.8594
	[[34m2025-04-30 21:03:35[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3516
	[[34m2025-04-30 21:03:35[0m] (step=0008200) Train Loss: 0.7567, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:05:02[0m] (Generator) rec_loss: 0.0438, perceptual_loss: 0.3164, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9195, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3133, d_vqkd: 128530.1172, d_vqgan: 145367.1250
	[[34m2025-04-30 21:05:02[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3516
	[[34m2025-04-30 21:05:02[0m] (step=0008300) Train Loss: 0.7455, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:06:29[0m] (Generator) rec_loss: 0.0511, perceptual_loss: 0.3457, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3229, d_vqkd: 128352.5156, d_vqgan: 144846.8438
	[[34m2025-04-30 21:06:29[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3750
	[[34m2025-04-30 21:06:29[0m] (step=0008400) Train Loss: 0.7399, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:07:56[0m] (Generator) rec_loss: 0.0658, perceptual_loss: 0.3047, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9200, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3141, d_vqkd: 128264.8359, d_vqgan: 145099.8750
	[[34m2025-04-30 21:07:57[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3281
	[[34m2025-04-30 21:07:57[0m] (step=0008500) Train Loss: 0.7303, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:09:24[0m] (Generator) rec_loss: 0.0447, perceptual_loss: 0.3145, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3002, d_vqkd: 128117.2344, d_vqgan: 145255.5938
	[[34m2025-04-30 21:09:24[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3438
	[[34m2025-04-30 21:09:24[0m] (step=0008600) Train Loss: 0.7398, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:10:51[0m] (Generator) rec_loss: 0.0405, perceptual_loss: 0.2969, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2916, d_vqkd: 129067.2578, d_vqgan: 145048.0312
	[[34m2025-04-30 21:10:52[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3438
	[[34m2025-04-30 21:10:52[0m] (step=0008700) Train Loss: 0.7410, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:12:19[0m] (Generator) rec_loss: 0.0540, perceptual_loss: 0.3164, vq_loss: 0.0254, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9191, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2736, d_vqkd: 128838.4766, d_vqgan: 145869.0156
	[[34m2025-04-30 21:12:19[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3438
	[[34m2025-04-30 21:12:19[0m] (step=0008800) Train Loss: 0.7437, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:13:46[0m] (Generator) rec_loss: 0.0606, perceptual_loss: 0.3848, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9196, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3860, d_vqkd: 128026.6875, d_vqgan: 145027.7188
	[[34m2025-04-30 21:13:47[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3828, logits_fake: -1.3828
	[[34m2025-04-30 21:13:47[0m] (step=0008900) Train Loss: 0.7350, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:15:14[0m] (Generator) rec_loss: 0.0465, perceptual_loss: 0.3086, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9162, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3127, d_vqkd: 128428.2031, d_vqgan: 145312.9688
	[[34m2025-04-30 21:15:14[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3906, logits_fake: -1.3828
	[[34m2025-04-30 21:15:14[0m] (step=0009000) Train Loss: 0.7369, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:16:41[0m] (Generator) rec_loss: 0.0433, perceptual_loss: 0.3145, vq_loss: 0.0242, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3043, d_vqkd: 127431.9844, d_vqgan: 144616.6719
	[[34m2025-04-30 21:16:42[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3594
	[[34m2025-04-30 21:16:42[0m] (step=0009100) Train Loss: 0.7328, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:18:09[0m] (Generator) rec_loss: 0.0478, perceptual_loss: 0.3047, vq_loss: 0.0239, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9209, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3011, d_vqkd: 128435.1328, d_vqgan: 145220.9375
	[[34m2025-04-30 21:18:09[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3516
	[[34m2025-04-30 21:18:09[0m] (step=0009200) Train Loss: 0.7341, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:19:36[0m] (Generator) rec_loss: 0.0557, perceptual_loss: 0.3105, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9167, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3107, d_vqkd: 128705.5547, d_vqgan: 144781.9531
	[[34m2025-04-30 21:19:37[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3438
	[[34m2025-04-30 21:19:37[0m] (step=0009300) Train Loss: 0.7229, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:21:04[0m] (Generator) rec_loss: 0.0516, perceptual_loss: 0.3066, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9168, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2944, d_vqkd: 128460.2969, d_vqgan: 145486.6406
	[[34m2025-04-30 21:21:04[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3516
	[[34m2025-04-30 21:21:04[0m] (step=0009400) Train Loss: 0.7267, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:22:31[0m] (Generator) rec_loss: 0.0579, perceptual_loss: 0.3398, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9162, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3138, d_vqkd: 128392.6953, d_vqgan: 145312.0469
	[[34m2025-04-30 21:22:32[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3359
	[[34m2025-04-30 21:22:32[0m] (step=0009500) Train Loss: 0.7228, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:23:59[0m] (Generator) rec_loss: 0.0424, perceptual_loss: 0.3086, vq_loss: 0.0239, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9169, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3070, d_vqkd: 128356.2578, d_vqgan: 144641.5000
	[[34m2025-04-30 21:23:59[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3438
	[[34m2025-04-30 21:23:59[0m] (step=0009600) Train Loss: 0.7252, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:25:26[0m] (Generator) rec_loss: 0.0389, perceptual_loss: 0.3125, vq_loss: 0.0230, commit_loss: 0.0058, entropy_loss: 0.0000, codebook_usage: 0.9195, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3209, d_vqkd: 127581.5703, d_vqgan: 143484.7188
	[[34m2025-04-30 21:25:27[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3750
	[[34m2025-04-30 21:25:27[0m] (step=0009700) Train Loss: 0.7188, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:26:54[0m] (Generator) rec_loss: 0.0654, perceptual_loss: 0.3320, vq_loss: 0.0229, commit_loss: 0.0057, entropy_loss: 0.0000, codebook_usage: 0.9180, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2948, d_vqkd: 127614.2891, d_vqgan: 144267.0312
	[[34m2025-04-30 21:26:54[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3281
	[[34m2025-04-30 21:26:54[0m] (step=0009800) Train Loss: 0.7223, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:28:21[0m] (Generator) rec_loss: 0.0653, perceptual_loss: 0.3379, vq_loss: 0.0257, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9179, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3153, d_vqkd: 129371.9219, d_vqgan: 144929.7656
	[[34m2025-04-30 21:28:22[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3516
	[[34m2025-04-30 21:28:22[0m] (step=0009900) Train Loss: 0.7246, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:29:49[0m] (Generator) rec_loss: 0.0657, perceptual_loss: 0.3262, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9189, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3162, d_vqkd: 128289.4766, d_vqgan: 145280.1875
	[[34m2025-04-30 21:29:49[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3594
	[[34m2025-04-30 21:29:49[0m] (step=0010000) Train Loss: 0.7275, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:31:16[0m] (Generator) rec_loss: 0.0570, perceptual_loss: 0.3086, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9186, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2995, d_vqkd: 128521.2344, d_vqgan: 145171.1250
	[[34m2025-04-30 21:31:16[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3281
	[[34m2025-04-30 21:31:16[0m] (step=0010100) Train Loss: 0.7265, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:32:43[0m] (Generator) rec_loss: 0.0563, perceptual_loss: 0.3145, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9161, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2924, d_vqkd: 128089.4062, d_vqgan: 145711.7969
	[[34m2025-04-30 21:32:44[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3750
	[[34m2025-04-30 21:32:44[0m] (step=0010200) Train Loss: 0.7083, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:34:11[0m] (Generator) rec_loss: 0.0422, perceptual_loss: 0.3184, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3191, d_vqkd: 128402.6328, d_vqgan: 144359.2656
	[[34m2025-04-30 21:34:11[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3594
	[[34m2025-04-30 21:34:11[0m] (step=0010300) Train Loss: 0.7134, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:35:38[0m] (Generator) rec_loss: 0.0875, perceptual_loss: 0.3496, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9205, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3131, d_vqkd: 128605.3984, d_vqgan: 144757.9844
	[[34m2025-04-30 21:35:39[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3047, logits_fake: -1.3359
	[[34m2025-04-30 21:35:39[0m] (step=0010400) Train Loss: 0.7233, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:37:05[0m] (Generator) rec_loss: 0.0438, perceptual_loss: 0.2969, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9164, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3122, d_vqkd: 128390.4062, d_vqgan: 145177.7500
	[[34m2025-04-30 21:37:06[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3672
	[[34m2025-04-30 21:37:06[0m] (step=0010500) Train Loss: 0.7234, Train Steps/Sec: 1.15
	[[34m2025-04-30 21:38:33[0m] (Generator) rec_loss: 0.0513, perceptual_loss: 0.3203, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9193, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3626, d_vqkd: 128940.7891, d_vqgan: 144492.4375
	[[34m2025-04-30 21:38:33[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3125, logits_fake: -1.3359
	[[34m2025-04-30 21:38:33[0m] (step=0010600) Train Loss: 0.7237, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:40:00[0m] (Generator) rec_loss: 0.0493, perceptual_loss: 0.3066, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9176, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2916, d_vqkd: 128195.1406, d_vqgan: 145757.7031
	[[34m2025-04-30 21:40:01[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3125, logits_fake: -1.3125
	[[34m2025-04-30 21:40:01[0m] (step=0010700) Train Loss: 0.7098, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:41:27[0m] (Generator) rec_loss: 0.0351, perceptual_loss: 0.2754, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2933, d_vqkd: 128686.5781, d_vqgan: 145038.3906
	[[34m2025-04-30 21:41:28[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3359
	[[34m2025-04-30 21:41:28[0m] (step=0010800) Train Loss: 0.7071, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:42:55[0m] (Generator) rec_loss: 0.0471, perceptual_loss: 0.3184, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9159, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3073, d_vqkd: 128277.9688, d_vqgan: 144724.2812
	[[34m2025-04-30 21:42:55[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3047, logits_fake: -1.3047
	[[34m2025-04-30 21:42:55[0m] (step=0010900) Train Loss: 0.7143, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:44:22[0m] (Generator) rec_loss: 0.0403, perceptual_loss: 0.2734, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9174, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2895, d_vqkd: 128356.7031, d_vqgan: 144704.4062
	[[34m2025-04-30 21:44:23[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3125, logits_fake: -1.3203
	[[34m2025-04-30 21:44:23[0m] (step=0011000) Train Loss: 0.7099, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:45:49[0m] (Generator) rec_loss: 0.0474, perceptual_loss: 0.3008, vq_loss: 0.0254, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9215, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3136, d_vqkd: 128469.8438, d_vqgan: 145404.1719
	[[34m2025-04-30 21:45:50[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3125
	[[34m2025-04-30 21:45:50[0m] (step=0011100) Train Loss: 0.7109, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:47:17[0m] (Generator) rec_loss: 0.0428, perceptual_loss: 0.3027, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9192, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3027, d_vqkd: 128899.4062, d_vqgan: 144813.0312
	[[34m2025-04-30 21:47:17[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3203
	[[34m2025-04-30 21:47:17[0m] (step=0011200) Train Loss: 0.7054, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:48:44[0m] (Generator) rec_loss: 0.0513, perceptual_loss: 0.3340, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2880, d_vqkd: 128401.0391, d_vqgan: 144894.1094
	[[34m2025-04-30 21:48:45[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3438
	[[34m2025-04-30 21:48:45[0m] (step=0011300) Train Loss: 0.7102, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:50:12[0m] (Generator) rec_loss: 0.0658, perceptual_loss: 0.2910, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9184, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3237, d_vqkd: 129238.1094, d_vqgan: 144940.0938
	[[34m2025-04-30 21:50:12[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3594
	[[34m2025-04-30 21:50:12[0m] (step=0011400) Train Loss: 0.7064, Train Steps/Sec: 1.15
	[[34m2025-04-30 21:51:39[0m] (Generator) rec_loss: 0.0474, perceptual_loss: 0.3281, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3031, d_vqkd: 128624.2891, d_vqgan: 145341.0312
	[[34m2025-04-30 21:51:39[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3359
	[[34m2025-04-30 21:51:39[0m] (step=0011500) Train Loss: 0.7065, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:53:06[0m] (Generator) rec_loss: 0.0592, perceptual_loss: 0.3164, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2900, d_vqkd: 128442.6094, d_vqgan: 144989.7812
	[[34m2025-04-30 21:53:07[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3125
	[[34m2025-04-30 21:53:07[0m] (step=0011600) Train Loss: 0.7045, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:54:34[0m] (Generator) rec_loss: 0.0596, perceptual_loss: 0.3574, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3441, d_vqkd: 128124.7422, d_vqgan: 144505.1719
	[[34m2025-04-30 21:54:34[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3203
	[[34m2025-04-30 21:54:34[0m] (step=0011700) Train Loss: 0.7087, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:56:01[0m] (Generator) rec_loss: 0.0443, perceptual_loss: 0.3203, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9174, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3010, d_vqkd: 128207.6641, d_vqgan: 144354.8594
	[[34m2025-04-30 21:56:02[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3203
	[[34m2025-04-30 21:56:02[0m] (step=0011800) Train Loss: 0.7056, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:57:29[0m] (Generator) rec_loss: 0.0608, perceptual_loss: 0.3379, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9179, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2988, d_vqkd: 128329.6641, d_vqgan: 145116.1406
	[[34m2025-04-30 21:57:29[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3203
	[[34m2025-04-30 21:57:29[0m] (step=0011900) Train Loss: 0.6987, Train Steps/Sec: 1.14
	[[34m2025-04-30 21:58:56[0m] (Generator) rec_loss: 0.0406, perceptual_loss: 0.3262, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3289, d_vqkd: 127703.0469, d_vqgan: 146183.5312
	[[34m2025-04-30 21:58:56[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3516
	[[34m2025-04-30 21:58:56[0m] (step=0012000) Train Loss: 0.7080, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:00:23[0m] (Generator) rec_loss: 0.0528, perceptual_loss: 0.3340, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9204, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3530, d_vqkd: 128737.8203, d_vqgan: 145101.7812
	[[34m2025-04-30 22:00:24[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3516
	[[34m2025-04-30 22:00:24[0m] (step=0012100) Train Loss: 0.6967, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:01:51[0m] (Generator) rec_loss: 0.0563, perceptual_loss: 0.3223, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9190, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3106, d_vqkd: 127474.7266, d_vqgan: 145030.8125
	[[34m2025-04-30 22:01:51[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3672
	[[34m2025-04-30 22:01:51[0m] (step=0012200) Train Loss: 0.7029, Train Steps/Sec: 1.15
	[[34m2025-04-30 22:03:18[0m] (Generator) rec_loss: 0.0525, perceptual_loss: 0.2949, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9165, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2982, d_vqkd: 128672.2344, d_vqgan: 144559.6875
	[[34m2025-04-30 22:03:18[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3750, logits_fake: -1.3672
	[[34m2025-04-30 22:03:18[0m] (step=0012300) Train Loss: 0.6914, Train Steps/Sec: 1.15
	[[34m2025-04-30 22:04:45[0m] (Generator) rec_loss: 0.0635, perceptual_loss: 0.3320, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9171, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3125, d_vqkd: 128770.6250, d_vqgan: 145008.6719
	[[34m2025-04-30 22:04:46[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3438
	[[34m2025-04-30 22:04:46[0m] (step=0012400) Train Loss: 0.6981, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:06:13[0m] (Generator) rec_loss: 0.0535, perceptual_loss: 0.3223, vq_loss: 0.0254, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9166, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3269, d_vqkd: 128911.7266, d_vqgan: 144897.0156
	[[34m2025-04-30 22:06:13[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3359
	[[34m2025-04-30 22:06:13[0m] (step=0012500) Train Loss: 0.6926, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:07:40[0m] (Generator) rec_loss: 0.0318, perceptual_loss: 0.2871, vq_loss: 0.0229, commit_loss: 0.0057, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2765, d_vqkd: 127017.4141, d_vqgan: 144709.9062
	[[34m2025-04-30 22:07:41[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3516
	[[34m2025-04-30 22:07:41[0m] (step=0012600) Train Loss: 0.6959, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:09:07[0m] (Generator) rec_loss: 0.0598, perceptual_loss: 0.3223, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9212, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3103, d_vqkd: 128937.2812, d_vqgan: 144628.5938
	[[34m2025-04-30 22:09:08[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3281
	[[34m2025-04-30 22:09:08[0m] (step=0012700) Train Loss: 0.6951, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:10:35[0m] (Generator) rec_loss: 0.0491, perceptual_loss: 0.3125, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2996, d_vqkd: 128434.4844, d_vqgan: 145668.8750
	[[34m2025-04-30 22:10:35[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3672
	[[34m2025-04-30 22:10:35[0m] (step=0012800) Train Loss: 0.6905, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:12:02[0m] (Generator) rec_loss: 0.0536, perceptual_loss: 0.2891, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9197, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3002, d_vqkd: 128728.8438, d_vqgan: 144800.2344
	[[34m2025-04-30 22:12:03[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3203
	[[34m2025-04-30 22:12:03[0m] (step=0012900) Train Loss: 0.6903, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:13:30[0m] (Generator) rec_loss: 0.0488, perceptual_loss: 0.2910, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9167, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3076, d_vqkd: 129370.7812, d_vqgan: 145193.5000
	[[34m2025-04-30 22:13:30[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3594
	[[34m2025-04-30 22:13:30[0m] (step=0013000) Train Loss: 0.6946, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:14:57[0m] (Generator) rec_loss: 0.0470, perceptual_loss: 0.3223, vq_loss: 0.0258, commit_loss: 0.0065, entropy_loss: 0.0000, codebook_usage: 0.9178, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2995, d_vqkd: 128924.2422, d_vqgan: 145670.9062
	[[34m2025-04-30 22:14:58[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3281
	[[34m2025-04-30 22:14:58[0m] (step=0013100) Train Loss: 0.6925, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:16:24[0m] (Generator) rec_loss: 0.0545, perceptual_loss: 0.3145, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3003, d_vqkd: 129442.0078, d_vqgan: 144722.3906
	[[34m2025-04-30 22:16:25[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3125
	[[34m2025-04-30 22:16:25[0m] (step=0013200) Train Loss: 0.6955, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:17:52[0m] (Generator) rec_loss: 0.0550, perceptual_loss: 0.3066, vq_loss: 0.0236, commit_loss: 0.0059, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2856, d_vqkd: 127044.1328, d_vqgan: 143932.8125
	[[34m2025-04-30 22:17:52[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3516
	[[34m2025-04-30 22:17:52[0m] (step=0013300) Train Loss: 0.6996, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:19:19[0m] (Generator) rec_loss: 0.0557, perceptual_loss: 0.3066, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9187, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2696, d_vqkd: 128245.1406, d_vqgan: 145414.4219
	[[34m2025-04-30 22:19:20[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3438
	[[34m2025-04-30 22:19:20[0m] (step=0013400) Train Loss: 0.6875, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:20:47[0m] (Generator) rec_loss: 0.0575, perceptual_loss: 0.2969, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9207, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3083, d_vqkd: 128954.3594, d_vqgan: 144894.3594
	[[34m2025-04-30 22:20:47[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3828, logits_fake: -1.3828
	[[34m2025-04-30 22:20:47[0m] (step=0013500) Train Loss: 0.6874, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:22:14[0m] (Generator) rec_loss: 0.0619, perceptual_loss: 0.3008, vq_loss: 0.0254, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9139, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2782, d_vqkd: 128686.8906, d_vqgan: 145065.5156
	[[34m2025-04-30 22:22:15[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3359
	[[34m2025-04-30 22:22:15[0m] (step=0013600) Train Loss: 0.6918, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:23:42[0m] (Generator) rec_loss: 0.0583, perceptual_loss: 0.3184, vq_loss: 0.0257, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9176, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2892, d_vqkd: 129701.8281, d_vqgan: 145036.3906
	[[34m2025-04-30 22:23:42[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3594
	[[34m2025-04-30 22:23:42[0m] (step=0013700) Train Loss: 0.6859, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:25:09[0m] (Generator) rec_loss: 0.0540, perceptual_loss: 0.3223, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9184, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2837, d_vqkd: 128148.9609, d_vqgan: 144704.5156
	[[34m2025-04-30 22:25:09[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3203
	[[34m2025-04-30 22:25:09[0m] (step=0013800) Train Loss: 0.6891, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:26:36[0m] (Generator) rec_loss: 0.0470, perceptual_loss: 0.2988, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3006, d_vqkd: 128381.3750, d_vqgan: 144508.8281
	[[34m2025-04-30 22:26:37[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3281
	[[34m2025-04-30 22:26:37[0m] (step=0013900) Train Loss: 0.6844, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:28:04[0m] (Generator) rec_loss: 0.0701, perceptual_loss: 0.2852, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9168, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3061, d_vqkd: 128594.0312, d_vqgan: 145577.8438
	[[34m2025-04-30 22:28:04[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3359
	[[34m2025-04-30 22:28:04[0m] (step=0014000) Train Loss: 0.6934, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:29:31[0m] (Generator) rec_loss: 0.0443, perceptual_loss: 0.2891, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9184, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3016, d_vqkd: 128316.1406, d_vqgan: 145168.8906
	[[34m2025-04-30 22:29:32[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3594
	[[34m2025-04-30 22:29:32[0m] (step=0014100) Train Loss: 0.6913, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:30:59[0m] (Generator) rec_loss: 0.0418, perceptual_loss: 0.2910, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9179, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2730, d_vqkd: 129286.6641, d_vqgan: 144511.3125
	[[34m2025-04-30 22:30:59[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3125, logits_fake: -1.3047
	[[34m2025-04-30 22:30:59[0m] (step=0014200) Train Loss: 0.6789, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:32:26[0m] (Generator) rec_loss: 0.0573, perceptual_loss: 0.3027, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9176, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2839, d_vqkd: 128263.0234, d_vqgan: 146150.7188
	[[34m2025-04-30 22:32:26[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3594
	[[34m2025-04-30 22:32:26[0m] (step=0014300) Train Loss: 0.6860, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:33:53[0m] (Generator) rec_loss: 0.0420, perceptual_loss: 0.3047, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3050, d_vqkd: 128899.1406, d_vqgan: 144566.5938
	[[34m2025-04-30 22:33:54[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3438
	[[34m2025-04-30 22:33:54[0m] (step=0014400) Train Loss: 0.6841, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:35:21[0m] (Generator) rec_loss: 0.0663, perceptual_loss: 0.2891, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2829, d_vqkd: 128963.0938, d_vqgan: 144774.6250
	[[34m2025-04-30 22:35:21[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3672
	[[34m2025-04-30 22:35:21[0m] (step=0014500) Train Loss: 0.6785, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:36:44[0m] Beginning epoch 1...
	[[34m2025-04-30 22:36:49[0m] (Generator) rec_loss: 0.0666, perceptual_loss: 0.2910, vq_loss: 0.0228, commit_loss: 0.0057, entropy_loss: 0.0000, codebook_usage: 0.9168, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2902, d_vqkd: 127069.3984, d_vqgan: 144670.5156
	[[34m2025-04-30 22:36:49[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3281
	[[34m2025-04-30 22:36:49[0m] (step=0014600) Train Loss: 0.6792, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:38:16[0m] (Generator) rec_loss: 0.0677, perceptual_loss: 0.3125, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9200, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2934, d_vqkd: 128297.2031, d_vqgan: 145556.2500
	[[34m2025-04-30 22:38:16[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3359
	[[34m2025-04-30 22:38:16[0m] (step=0014700) Train Loss: 0.6767, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:39:43[0m] (Generator) rec_loss: 0.0455, perceptual_loss: 0.2852, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2926, d_vqkd: 128865.7500, d_vqgan: 144834.1875
	[[34m2025-04-30 22:39:44[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3125, logits_fake: -1.2969
	[[34m2025-04-30 22:39:44[0m] (step=0014800) Train Loss: 0.6796, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:41:11[0m] (Generator) rec_loss: 0.0401, perceptual_loss: 0.2930, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3156, d_vqkd: 128269.4375, d_vqgan: 144530.5469
	[[34m2025-04-30 22:41:11[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3203
	[[34m2025-04-30 22:41:11[0m] (step=0014900) Train Loss: 0.6776, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:42:38[0m] (Generator) rec_loss: 0.0483, perceptual_loss: 0.2949, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3066, d_vqkd: 128017.9219, d_vqgan: 144812.4375
	[[34m2025-04-30 22:42:39[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3594
	[[34m2025-04-30 22:42:39[0m] (step=0015000) Train Loss: 0.6763, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:44:05[0m] (Generator) rec_loss: 0.0682, perceptual_loss: 0.2891, vq_loss: 0.0242, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9178, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2883, d_vqkd: 126941.8281, d_vqgan: 145182.8125
	[[34m2025-04-30 22:44:06[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3594
	[[34m2025-04-30 22:44:06[0m] (step=0015100) Train Loss: 0.6737, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:45:33[0m] (Generator) rec_loss: 0.0558, perceptual_loss: 0.3105, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9150, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2834, d_vqkd: 128962.8516, d_vqgan: 145066.0781
	[[34m2025-04-30 22:45:33[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3516
	[[34m2025-04-30 22:45:33[0m] (step=0015200) Train Loss: 0.6695, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:47:00[0m] (Generator) rec_loss: 0.0439, perceptual_loss: 0.2793, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9198, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2832, d_vqkd: 128675.5781, d_vqgan: 145743.9688
	[[34m2025-04-30 22:47:01[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3359
	[[34m2025-04-30 22:47:01[0m] (step=0015300) Train Loss: 0.6758, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:48:28[0m] (Generator) rec_loss: 0.0451, perceptual_loss: 0.3145, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3411, d_vqkd: 129311.7109, d_vqgan: 146066.3281
	[[34m2025-04-30 22:48:28[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3438
	[[34m2025-04-30 22:48:28[0m] (step=0015400) Train Loss: 0.6793, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:49:55[0m] (Generator) rec_loss: 0.0541, perceptual_loss: 0.2949, vq_loss: 0.0237, commit_loss: 0.0059, entropy_loss: 0.0000, codebook_usage: 0.9190, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3076, d_vqkd: 127595.9141, d_vqgan: 145534.5000
	[[34m2025-04-30 22:49:56[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3828, logits_fake: -1.3750
	[[34m2025-04-30 22:49:56[0m] (step=0015500) Train Loss: 0.6781, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:51:23[0m] (Generator) rec_loss: 0.0452, perceptual_loss: 0.3203, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9187, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2809, d_vqkd: 128687.9688, d_vqgan: 145006.6875
	[[34m2025-04-30 22:51:23[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3516
	[[34m2025-04-30 22:51:23[0m] (step=0015600) Train Loss: 0.6783, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:52:50[0m] (Generator) rec_loss: 0.0333, perceptual_loss: 0.2969, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9180, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3045, d_vqkd: 128870.7500, d_vqgan: 145157.1875
	[[34m2025-04-30 22:52:51[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3281
	[[34m2025-04-30 22:52:51[0m] (step=0015700) Train Loss: 0.6798, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:54:17[0m] (Generator) rec_loss: 0.0632, perceptual_loss: 0.3887, vq_loss: 0.0242, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9199, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3501, d_vqkd: 127173.9531, d_vqgan: 144551.5938
	[[34m2025-04-30 22:54:18[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3125, logits_fake: -1.3203
	[[34m2025-04-30 22:54:18[0m] (step=0015800) Train Loss: 0.6782, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:55:45[0m] (Generator) rec_loss: 0.0451, perceptual_loss: 0.2852, vq_loss: 0.0257, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9196, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3066, d_vqkd: 128937.3281, d_vqgan: 145117.3750
	[[34m2025-04-30 22:55:45[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3359
	[[34m2025-04-30 22:55:45[0m] (step=0015900) Train Loss: 0.6676, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:57:12[0m] (Generator) rec_loss: 0.0474, perceptual_loss: 0.3008, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9195, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3038, d_vqkd: 128966.8203, d_vqgan: 144347.6875
	[[34m2025-04-30 22:57:13[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3438
	[[34m2025-04-30 22:57:13[0m] (step=0016000) Train Loss: 0.6700, Train Steps/Sec: 1.14
	[[34m2025-04-30 22:57:15[0m] Saved checkpoint to ck_decoder_cnn/001-TokenFlow/checkpoints/0016000.pt
	[[34m2025-04-30 22:58:42[0m] (Generator) rec_loss: 0.0405, perceptual_loss: 0.2734, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9195, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2936, d_vqkd: 128070.8750, d_vqgan: 145269.5156
	[[34m2025-04-30 22:58:43[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3672
	[[34m2025-04-30 22:58:43[0m] (step=0016100) Train Loss: 0.6633, Train Steps/Sec: 1.11
	[[34m2025-04-30 23:00:10[0m] (Generator) rec_loss: 0.0572, perceptual_loss: 0.3008, vq_loss: 0.0254, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9186, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2966, d_vqkd: 128244.4844, d_vqgan: 145343.1875
	[[34m2025-04-30 23:00:10[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3281
	[[34m2025-04-30 23:00:10[0m] (step=0016200) Train Loss: 0.6716, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:01:37[0m] (Generator) rec_loss: 0.0477, perceptual_loss: 0.2793, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9193, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2705, d_vqkd: 128637.7422, d_vqgan: 144398.5312
	[[34m2025-04-30 23:01:38[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3359
	[[34m2025-04-30 23:01:38[0m] (step=0016300) Train Loss: 0.6758, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:03:05[0m] (Generator) rec_loss: 0.0387, perceptual_loss: 0.2578, vq_loss: 0.0240, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9169, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2422, d_vqkd: 127082.4766, d_vqgan: 144005.6562
	[[34m2025-04-30 23:03:05[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3750
	[[34m2025-04-30 23:03:05[0m] (step=0016400) Train Loss: 0.6690, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:04:32[0m] (Generator) rec_loss: 0.0383, perceptual_loss: 0.2734, vq_loss: 0.0254, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9184, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2906, d_vqkd: 128197.8906, d_vqgan: 145521.1094
	[[34m2025-04-30 23:04:32[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3438
	[[34m2025-04-30 23:04:32[0m] (step=0016500) Train Loss: 0.6668, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:05:59[0m] (Generator) rec_loss: 0.0693, perceptual_loss: 0.3105, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9217, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2975, d_vqkd: 129076.3438, d_vqgan: 145563.3281
	[[34m2025-04-30 23:06:00[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3750, logits_fake: -1.3672
	[[34m2025-04-30 23:06:00[0m] (step=0016600) Train Loss: 0.6753, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:07:27[0m] (Generator) rec_loss: 0.0526, perceptual_loss: 0.2832, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9180, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2664, d_vqkd: 128480.8906, d_vqgan: 144848.4219
	[[34m2025-04-30 23:07:27[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3594
	[[34m2025-04-30 23:07:27[0m] (step=0016700) Train Loss: 0.6713, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:08:54[0m] (Generator) rec_loss: 0.0409, perceptual_loss: 0.3262, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9192, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2936, d_vqkd: 128340.0859, d_vqgan: 145026.3438
	[[34m2025-04-30 23:08:55[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3359
	[[34m2025-04-30 23:08:55[0m] (step=0016800) Train Loss: 0.6728, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:10:22[0m] (Generator) rec_loss: 0.0537, perceptual_loss: 0.3086, vq_loss: 0.0234, commit_loss: 0.0059, entropy_loss: 0.0000, codebook_usage: 0.9191, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3128, d_vqkd: 127420.6875, d_vqgan: 143886.0938
	[[34m2025-04-30 23:10:22[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3359
	[[34m2025-04-30 23:10:22[0m] (step=0016900) Train Loss: 0.6714, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:11:49[0m] (Generator) rec_loss: 0.0530, perceptual_loss: 0.2949, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3265, d_vqkd: 128904.2344, d_vqgan: 145662.5000
	[[34m2025-04-30 23:11:50[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3828, logits_fake: -1.3750
	[[34m2025-04-30 23:11:50[0m] (step=0017000) Train Loss: 0.6751, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:13:16[0m] (Generator) rec_loss: 0.0582, perceptual_loss: 0.2949, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9175, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2850, d_vqkd: 128670.9375, d_vqgan: 144544.3125
	[[34m2025-04-30 23:13:17[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3438
	[[34m2025-04-30 23:13:17[0m] (step=0017100) Train Loss: 0.6684, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:14:44[0m] (Generator) rec_loss: 0.0576, perceptual_loss: 0.3301, vq_loss: 0.0254, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9179, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2704, d_vqkd: 128563.7188, d_vqgan: 146146.2344
	[[34m2025-04-30 23:14:44[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3594
	[[34m2025-04-30 23:14:44[0m] (step=0017200) Train Loss: 0.6659, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:16:11[0m] (Generator) rec_loss: 0.0664, perceptual_loss: 0.3496, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9184, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3348, d_vqkd: 128185.3594, d_vqgan: 145090.4844
	[[34m2025-04-30 23:16:12[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3203
	[[34m2025-04-30 23:16:12[0m] (step=0017300) Train Loss: 0.6655, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:17:39[0m] (Generator) rec_loss: 0.0597, perceptual_loss: 0.3027, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9200, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3045, d_vqkd: 128851.7812, d_vqgan: 145616.8906
	[[34m2025-04-30 23:17:39[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3438
	[[34m2025-04-30 23:17:39[0m] (step=0017400) Train Loss: 0.6692, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:19:06[0m] (Generator) rec_loss: 0.0645, perceptual_loss: 0.2754, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9191, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2670, d_vqkd: 128604.0938, d_vqgan: 145061.8125
	[[34m2025-04-30 23:19:07[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3047, logits_fake: -1.3359
	[[34m2025-04-30 23:19:07[0m] (step=0017500) Train Loss: 0.6612, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:20:34[0m] (Generator) rec_loss: 0.0497, perceptual_loss: 0.2832, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9202, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2799, d_vqkd: 128455.8906, d_vqgan: 145514.4375
	[[34m2025-04-30 23:20:34[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3516
	[[34m2025-04-30 23:20:34[0m] (step=0017600) Train Loss: 0.6647, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:22:01[0m] (Generator) rec_loss: 0.0421, perceptual_loss: 0.2695, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9161, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2956, d_vqkd: 128534.7891, d_vqgan: 144391.4062
	[[34m2025-04-30 23:22:02[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.2891, logits_fake: -1.2734
	[[34m2025-04-30 23:22:02[0m] (step=0017700) Train Loss: 0.6671, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:23:28[0m] (Generator) rec_loss: 0.0573, perceptual_loss: 0.3047, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9197, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3185, d_vqkd: 129183.7969, d_vqgan: 145156.3281
	[[34m2025-04-30 23:23:29[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3438
	[[34m2025-04-30 23:23:29[0m] (step=0017800) Train Loss: 0.6676, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:24:56[0m] (Generator) rec_loss: 0.0514, perceptual_loss: 0.3164, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9170, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2925, d_vqkd: 128221.0234, d_vqgan: 145519.8281
	[[34m2025-04-30 23:24:56[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3125
	[[34m2025-04-30 23:24:56[0m] (step=0017900) Train Loss: 0.6567, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:26:23[0m] (Generator) rec_loss: 0.0387, perceptual_loss: 0.2617, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9175, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2410, d_vqkd: 128754.0625, d_vqgan: 145092.5625
	[[34m2025-04-30 23:26:24[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3750, logits_fake: -1.3906
	[[34m2025-04-30 23:26:24[0m] (step=0018000) Train Loss: 0.6603, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:27:51[0m] (Generator) rec_loss: 0.0365, perceptual_loss: 0.2676, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9186, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2911, d_vqkd: 128777.0469, d_vqgan: 144383.3438
	[[34m2025-04-30 23:27:51[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.2969, logits_fake: -1.3047
	[[34m2025-04-30 23:27:51[0m] (step=0018100) Train Loss: 0.6625, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:29:18[0m] (Generator) rec_loss: 0.0424, perceptual_loss: 0.3086, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9196, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2983, d_vqkd: 127821.3047, d_vqgan: 144761.7656
	[[34m2025-04-30 23:29:19[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3672
	[[34m2025-04-30 23:29:19[0m] (step=0018200) Train Loss: 0.6626, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:30:46[0m] (Generator) rec_loss: 0.0416, perceptual_loss: 0.2598, vq_loss: 0.0242, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9188, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2547, d_vqkd: 126993.5234, d_vqgan: 145016.5938
	[[34m2025-04-30 23:30:46[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3594
	[[34m2025-04-30 23:30:46[0m] (step=0018300) Train Loss: 0.6691, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:32:13[0m] (Generator) rec_loss: 0.0520, perceptual_loss: 0.3066, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3085, d_vqkd: 128866.0000, d_vqgan: 145560.4375
	[[34m2025-04-30 23:32:14[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3359
	[[34m2025-04-30 23:32:14[0m] (step=0018400) Train Loss: 0.6556, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:33:41[0m] (Generator) rec_loss: 0.0642, perceptual_loss: 0.3008, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9184, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2987, d_vqkd: 127539.7500, d_vqgan: 144897.2031
	[[34m2025-04-30 23:33:41[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3281
	[[34m2025-04-30 23:33:41[0m] (step=0018500) Train Loss: 0.6663, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:35:08[0m] (Generator) rec_loss: 0.0390, perceptual_loss: 0.2930, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9194, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2643, d_vqkd: 129123.7578, d_vqgan: 145154.5000
	[[34m2025-04-30 23:35:09[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3203
	[[34m2025-04-30 23:35:09[0m] (step=0018600) Train Loss: 0.6626, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:36:36[0m] (Generator) rec_loss: 0.0523, perceptual_loss: 0.3027, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9162, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2929, d_vqkd: 128482.9688, d_vqgan: 144994.7812
	[[34m2025-04-30 23:36:36[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3438
	[[34m2025-04-30 23:36:36[0m] (step=0018700) Train Loss: 0.6595, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:38:03[0m] (Generator) rec_loss: 0.0496, perceptual_loss: 0.2891, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9196, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3033, d_vqkd: 128104.2891, d_vqgan: 144587.9219
	[[34m2025-04-30 23:38:04[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3359
	[[34m2025-04-30 23:38:04[0m] (step=0018800) Train Loss: 0.6580, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:39:31[0m] (Generator) rec_loss: 0.0548, perceptual_loss: 0.2910, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9165, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3201, d_vqkd: 128780.5000, d_vqgan: 144889.0469
	[[34m2025-04-30 23:39:31[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3516
	[[34m2025-04-30 23:39:31[0m] (step=0018900) Train Loss: 0.6526, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:40:58[0m] (Generator) rec_loss: 0.0475, perceptual_loss: 0.2949, vq_loss: 0.0234, commit_loss: 0.0058, entropy_loss: 0.0000, codebook_usage: 0.9203, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3004, d_vqkd: 127516.0391, d_vqgan: 144565.3125
	[[34m2025-04-30 23:40:59[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3125
	[[34m2025-04-30 23:40:59[0m] (step=0019000) Train Loss: 0.6565, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:42:26[0m] (Generator) rec_loss: 0.0460, perceptual_loss: 0.2852, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9230, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2849, d_vqkd: 128582.3438, d_vqgan: 145364.3438
	[[34m2025-04-30 23:42:26[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3359
	[[34m2025-04-30 23:42:26[0m] (step=0019100) Train Loss: 0.6577, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:43:53[0m] (Generator) rec_loss: 0.0392, perceptual_loss: 0.2812, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9179, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3025, d_vqkd: 128301.5938, d_vqgan: 145735.3438
	[[34m2025-04-30 23:43:54[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3594, logits_fake: -1.3516
	[[34m2025-04-30 23:43:54[0m] (step=0019200) Train Loss: 0.6599, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:45:21[0m] (Generator) rec_loss: 0.0597, perceptual_loss: 0.2832, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9213, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2943, d_vqkd: 129033.9531, d_vqgan: 145614.5156
	[[34m2025-04-30 23:45:21[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3281, logits_fake: -1.3281
	[[34m2025-04-30 23:45:21[0m] (step=0019300) Train Loss: 0.6597, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:46:48[0m] (Generator) rec_loss: 0.0809, perceptual_loss: 0.3652, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9174, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3684, d_vqkd: 127718.2578, d_vqgan: 145265.9844
	[[34m2025-04-30 23:46:48[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3281
	[[34m2025-04-30 23:46:48[0m] (step=0019400) Train Loss: 0.6563, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:48:15[0m] (Generator) rec_loss: 0.0350, perceptual_loss: 0.2773, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2691, d_vqkd: 128624.6875, d_vqgan: 145030.2344
	[[34m2025-04-30 23:48:16[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3359, logits_fake: -1.3359
	[[34m2025-04-30 23:48:16[0m] (step=0019500) Train Loss: 0.6457, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:49:43[0m] (Generator) rec_loss: 0.0489, perceptual_loss: 0.3066, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2769, d_vqkd: 128660.7812, d_vqgan: 144541.2656
	[[34m2025-04-30 23:49:43[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3516
	[[34m2025-04-30 23:49:43[0m] (step=0019600) Train Loss: 0.6545, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:51:10[0m] (Generator) rec_loss: 0.0493, perceptual_loss: 0.2617, vq_loss: 0.0244, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2745, d_vqkd: 128652.2812, d_vqgan: 145220.3438
	[[34m2025-04-30 23:51:11[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3672
	[[34m2025-04-30 23:51:11[0m] (step=0019700) Train Loss: 0.6496, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:52:38[0m] (Generator) rec_loss: 0.0513, perceptual_loss: 0.3066, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9193, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.2901, d_vqkd: 128789.5000, d_vqgan: 145446.4688
	[[34m2025-04-30 23:52:38[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3516, logits_fake: -1.3516
	[[34m2025-04-30 23:52:38[0m] (step=0019800) Train Loss: 0.6564, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:54:05[0m] (Generator) rec_loss: 0.0526, perceptual_loss: 0.3203, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.3112, d_vqkd: 129179.6875, d_vqgan: 144899.0625
	[[34m2025-04-30 23:54:06[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3750, logits_fake: -1.3594
	[[34m2025-04-30 23:54:06[0m] (step=0019900) Train Loss: 0.6494, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:55:33[0m] (Generator) rec_loss: 0.0442, perceptual_loss: 0.3145, vq_loss: 0.0254, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9145, generator_adv_loss: 0.6602, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2790, d_vqkd: 129049.9766, d_vqgan: 144924.7969
	[[34m2025-04-30 23:55:33[0m] (Discriminator) discriminator_adv_loss: 0.6523, disc_weight: 0.5000, logits_real: -1.3359, logits_fake: -1.3203
	[[34m2025-04-30 23:55:33[0m] (step=0020000) Train Loss: 0.6688, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:57:00[0m] (Generator) rec_loss: 0.0682, perceptual_loss: 0.3086, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9178, generator_adv_loss: 0.0486, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3127, d_vqkd: 128610.3516, d_vqgan: 145101.6875
	[[34m2025-04-30 23:57:01[0m] (Discriminator) discriminator_adv_loss: 0.5195, disc_weight: 0.5000, logits_real: -0.1650, logits_fake: -0.0972
	[[34m2025-04-30 23:57:01[0m] (step=0020100) Train Loss: 1.2188, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:58:28[0m] (Generator) rec_loss: 0.0670, perceptual_loss: 0.2910, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: -0.1426, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2862, d_vqkd: 128796.7812, d_vqgan: 144950.9844
	[[34m2025-04-30 23:58:28[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: 0.2910, logits_fake: 0.2852
	[[34m2025-04-30 23:58:28[0m] (step=0020200) Train Loss: 1.2206, Train Steps/Sec: 1.14
	[[34m2025-04-30 23:59:55[0m] (Generator) rec_loss: 0.0660, perceptual_loss: 0.3086, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9170, generator_adv_loss: 0.0320, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2967, d_vqkd: 128886.5000, d_vqgan: 144832.9062
	[[34m2025-04-30 23:59:56[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: -0.0554, logits_fake: -0.0640
	[[34m2025-04-30 23:59:56[0m] (step=0020300) Train Loss: 1.2031, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:01:23[0m] (Generator) rec_loss: 0.0486, perceptual_loss: 0.2969, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9153, generator_adv_loss: -0.0630, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2937, d_vqkd: 128761.9766, d_vqgan: 144677.2188
	[[34m2025-05-01 00:01:23[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: 0.1484, logits_fake: 0.1260
	[[34m2025-05-01 00:01:23[0m] (step=0020400) Train Loss: 1.2428, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:02:50[0m] (Generator) rec_loss: 0.0640, perceptual_loss: 0.3164, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9163, generator_adv_loss: 0.2383, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3212, d_vqkd: 128877.7188, d_vqgan: 144977.3750
	[[34m2025-05-01 00:02:50[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.4531, logits_fake: -0.4766
	[[34m2025-05-01 00:02:50[0m] (step=0020500) Train Loss: 1.2514, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:04:17[0m] (Generator) rec_loss: 0.0518, perceptual_loss: 0.3047, vq_loss: 0.0257, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: -0.0069, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3065, d_vqkd: 129296.2266, d_vqgan: 145533.0781
	[[34m2025-05-01 00:04:18[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.0186, logits_fake: 0.0137
	[[34m2025-05-01 00:04:18[0m] (step=0020600) Train Loss: 1.2635, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:05:45[0m] (Generator) rec_loss: 0.0740, perceptual_loss: 0.2715, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9157, generator_adv_loss: -0.1729, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2602, d_vqkd: 129045.3750, d_vqgan: 144336.4062
	[[34m2025-05-01 00:05:45[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.3457, logits_fake: 0.3457
	[[34m2025-05-01 00:05:45[0m] (step=0020700) Train Loss: 1.2179, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:07:12[0m] (Generator) rec_loss: 0.0599, perceptual_loss: 0.2852, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9191, generator_adv_loss: 0.2012, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2967, d_vqkd: 128908.2266, d_vqgan: 145013.6250
	[[34m2025-05-01 00:07:13[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.4219, logits_fake: -0.4023
	[[34m2025-05-01 00:07:13[0m] (step=0020800) Train Loss: 1.2349, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:08:40[0m] (Generator) rec_loss: 0.0527, perceptual_loss: 0.2832, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: 0.2480, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2964, d_vqkd: 128713.0938, d_vqgan: 145565.2656
	[[34m2025-05-01 00:08:40[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.5000, logits_fake: -0.4961
	[[34m2025-05-01 00:08:40[0m] (step=0020900) Train Loss: 1.1802, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:10:07[0m] (Generator) rec_loss: 0.0700, perceptual_loss: 0.3125, vq_loss: 0.0233, commit_loss: 0.0058, entropy_loss: 0.0000, codebook_usage: 0.9184, generator_adv_loss: 0.2461, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2954, d_vqkd: 127319.5469, d_vqgan: 145392.2812
	[[34m2025-05-01 00:10:08[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: -0.4707, logits_fake: -0.4922
	[[34m2025-05-01 00:10:08[0m] (step=0021000) Train Loss: 1.2338, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:11:35[0m] (Generator) rec_loss: 0.0701, perceptual_loss: 0.2988, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9168, generator_adv_loss: 0.1914, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3304, d_vqkd: 129060.8984, d_vqgan: 145299.1250
	[[34m2025-05-01 00:11:35[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.4121, logits_fake: -0.3828
	[[34m2025-05-01 00:11:35[0m] (step=0021100) Train Loss: 1.2363, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:13:02[0m] (Generator) rec_loss: 0.0657, perceptual_loss: 0.3203, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9198, generator_adv_loss: 0.0204, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2800, d_vqkd: 128459.6875, d_vqgan: 145030.7344
	[[34m2025-05-01 00:13:03[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.0417, logits_fake: -0.0408
	[[34m2025-05-01 00:13:03[0m] (step=0021200) Train Loss: 1.1762, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:14:30[0m] (Generator) rec_loss: 0.0703, perceptual_loss: 0.2930, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9205, generator_adv_loss: -0.0048, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2753, d_vqkd: 128713.6719, d_vqgan: 145012.8906
	[[34m2025-05-01 00:14:30[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.0219, logits_fake: 0.0096
	[[34m2025-05-01 00:14:30[0m] (step=0021300) Train Loss: 1.1851, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:15:57[0m] (Generator) rec_loss: 0.0608, perceptual_loss: 0.2871, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9192, generator_adv_loss: -0.1348, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3022, d_vqkd: 127898.3750, d_vqgan: 145395.5312
	[[34m2025-05-01 00:15:58[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.2930, logits_fake: 0.2695
	[[34m2025-05-01 00:15:58[0m] (step=0021400) Train Loss: 1.1720, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:17:25[0m] (Generator) rec_loss: 0.0460, perceptual_loss: 0.2617, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9178, generator_adv_loss: -0.0635, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2459, d_vqkd: 128380.8281, d_vqgan: 144616.4375
	[[34m2025-05-01 00:17:25[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.1108, logits_fake: 0.1270
	[[34m2025-05-01 00:17:25[0m] (step=0021500) Train Loss: 1.2091, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:18:52[0m] (Generator) rec_loss: 0.0725, perceptual_loss: 0.3145, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9196, generator_adv_loss: -0.0757, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3048, d_vqkd: 128741.6094, d_vqgan: 145042.6562
	[[34m2025-05-01 00:18:53[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.1445, logits_fake: 0.1514
	[[34m2025-05-01 00:18:53[0m] (step=0021600) Train Loss: 1.1835, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:20:20[0m] (Generator) rec_loss: 0.0519, perceptual_loss: 0.2754, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9161, generator_adv_loss: -0.1729, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2864, d_vqkd: 129130.4766, d_vqgan: 144349.3594
	[[34m2025-05-01 00:20:20[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.3574, logits_fake: 0.3457
	[[34m2025-05-01 00:20:20[0m] (step=0021700) Train Loss: 1.2067, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:21:47[0m] (Generator) rec_loss: 0.0788, perceptual_loss: 0.3125, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9187, generator_adv_loss: -0.1289, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2994, d_vqkd: 128637.9688, d_vqgan: 144825.8906
	[[34m2025-05-01 00:21:48[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.2559, logits_fake: 0.2578
	[[34m2025-05-01 00:21:48[0m] (step=0021800) Train Loss: 1.2260, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:23:15[0m] (Generator) rec_loss: 0.0823, perceptual_loss: 0.3789, vq_loss: 0.0235, commit_loss: 0.0059, entropy_loss: 0.0000, codebook_usage: 0.9199, generator_adv_loss: 0.0135, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3529, d_vqkd: 127551.6328, d_vqgan: 144952.5938
	[[34m2025-05-01 00:23:15[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.0092, logits_fake: -0.0271
	[[34m2025-05-01 00:23:15[0m] (step=0021900) Train Loss: 1.2028, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:24:42[0m] (Generator) rec_loss: 0.0600, perceptual_loss: 0.3066, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9186, generator_adv_loss: -0.1523, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3234, d_vqkd: 128372.4688, d_vqgan: 145931.7812
	[[34m2025-05-01 00:24:42[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.2930, logits_fake: 0.3047
	[[34m2025-05-01 00:24:42[0m] (step=0022000) Train Loss: 1.2245, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:26:09[0m] (Generator) rec_loss: 0.0581, perceptual_loss: 0.3164, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9192, generator_adv_loss: -0.2461, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2742, d_vqkd: 128466.5547, d_vqgan: 145100.6562
	[[34m2025-05-01 00:26:10[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.4688, logits_fake: 0.4922
	[[34m2025-05-01 00:26:10[0m] (step=0022100) Train Loss: 1.1884, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:27:37[0m] (Generator) rec_loss: 0.1172, perceptual_loss: 0.3105, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9184, generator_adv_loss: 0.0552, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3004, d_vqkd: 128374.7344, d_vqgan: 145382.6719
	[[34m2025-05-01 00:27:37[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: -0.0869, logits_fake: -0.1104
	[[34m2025-05-01 00:27:37[0m] (step=0022200) Train Loss: 1.1934, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:29:04[0m] (Generator) rec_loss: 0.0628, perceptual_loss: 0.3047, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9212, generator_adv_loss: -0.2412, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2844, d_vqkd: 128724.4297, d_vqgan: 145162.9375
	[[34m2025-05-01 00:29:05[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.4668, logits_fake: 0.4824
	[[34m2025-05-01 00:29:05[0m] (step=0022300) Train Loss: 1.2356, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:30:32[0m] (Generator) rec_loss: 0.0653, perceptual_loss: 0.3301, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9180, generator_adv_loss: -0.2080, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2798, d_vqkd: 128878.9844, d_vqgan: 145071.7344
	[[34m2025-05-01 00:30:32[0m] (Discriminator) discriminator_adv_loss: 0.4883, disc_weight: 0.5000, logits_real: 0.4570, logits_fake: 0.4160
	[[34m2025-05-01 00:30:33[0m] (step=0022400) Train Loss: 1.2462, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:31:59[0m] (Generator) rec_loss: 0.0710, perceptual_loss: 0.3008, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9193, generator_adv_loss: -0.0913, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2944, d_vqkd: 128553.1094, d_vqgan: 144816.3438
	[[34m2025-05-01 00:32:00[0m] (Discriminator) discriminator_adv_loss: 0.4883, disc_weight: 0.5000, logits_real: 0.2266, logits_fake: 0.1826
	[[34m2025-05-01 00:32:00[0m] (step=0022500) Train Loss: 1.1978, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:33:27[0m] (Generator) rec_loss: 0.0610, perceptual_loss: 0.3242, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: 0.1245, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2925, d_vqkd: 128582.4219, d_vqgan: 145191.2500
	[[34m2025-05-01 00:33:28[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.2773, logits_fake: -0.2490
	[[34m2025-05-01 00:33:28[0m] (step=0022600) Train Loss: 1.1906, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:34:55[0m] (Generator) rec_loss: 0.0744, perceptual_loss: 0.3047, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9190, generator_adv_loss: 0.2891, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3217, d_vqkd: 128803.5781, d_vqgan: 145177.4688
	[[34m2025-05-01 00:34:55[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: -0.5547, logits_fake: -0.5781
	[[34m2025-05-01 00:34:55[0m] (step=0022700) Train Loss: 1.1746, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:36:22[0m] (Generator) rec_loss: 0.0484, perceptual_loss: 0.2812, vq_loss: 0.0244, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: 0.1108, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2743, d_vqkd: 128694.5469, d_vqgan: 144987.8750
	[[34m2025-05-01 00:36:23[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.2305, logits_fake: -0.2217
	[[34m2025-05-01 00:36:23[0m] (step=0022800) Train Loss: 1.2060, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:37:50[0m] (Generator) rec_loss: 0.0665, perceptual_loss: 0.3223, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: 0.2676, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3443, d_vqkd: 128878.6641, d_vqgan: 145558.9531
	[[34m2025-05-01 00:37:50[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.5312, logits_fake: -0.5352
	[[34m2025-05-01 00:37:50[0m] (step=0022900) Train Loss: 1.2227, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:39:17[0m] (Generator) rec_loss: 0.0566, perceptual_loss: 0.2891, vq_loss: 0.0242, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9148, generator_adv_loss: 0.1426, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2943, d_vqkd: 128925.9844, d_vqgan: 143802.6719
	[[34m2025-05-01 00:39:18[0m] (Discriminator) discriminator_adv_loss: 0.5117, disc_weight: 0.5000, logits_real: -0.3262, logits_fake: -0.2852
	[[34m2025-05-01 00:39:18[0m] (step=0023000) Train Loss: 1.2004, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:40:45[0m] (Generator) rec_loss: 0.0605, perceptual_loss: 0.2637, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9197, generator_adv_loss: 0.3047, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2576, d_vqkd: 128347.5156, d_vqgan: 145163.7969
	[[34m2025-05-01 00:40:45[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.6055, logits_fake: -0.6094
	[[34m2025-05-01 00:40:45[0m] (step=0023100) Train Loss: 1.2199, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:42:12[0m] (Generator) rec_loss: 0.0923, perceptual_loss: 0.3262, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9195, generator_adv_loss: 0.1396, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3082, d_vqkd: 128518.2891, d_vqgan: 145881.6250
	[[34m2025-05-01 00:42:13[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: -0.2598, logits_fake: -0.2793
	[[34m2025-05-01 00:42:13[0m] (step=0023200) Train Loss: 1.2170, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:43:40[0m] (Generator) rec_loss: 0.0687, perceptual_loss: 0.2812, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9158, generator_adv_loss: 0.2168, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2967, d_vqkd: 129154.4688, d_vqgan: 144529.2969
	[[34m2025-05-01 00:43:40[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.4277, logits_fake: -0.4336
	[[34m2025-05-01 00:43:40[0m] (step=0023300) Train Loss: 1.2113, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:45:07[0m] (Generator) rec_loss: 0.0542, perceptual_loss: 0.3027, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9155, generator_adv_loss: 0.0300, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2806, d_vqkd: 129204.1094, d_vqgan: 144693.6562
	[[34m2025-05-01 00:45:08[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.0542, logits_fake: -0.0601
	[[34m2025-05-01 00:45:08[0m] (step=0023400) Train Loss: 1.1663, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:46:35[0m] (Generator) rec_loss: 0.0542, perceptual_loss: 0.3145, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9150, generator_adv_loss: 0.0586, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3240, d_vqkd: 128614.3984, d_vqgan: 144976.3438
	[[34m2025-05-01 00:46:35[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.1289, logits_fake: -0.1172
	[[34m2025-05-01 00:46:35[0m] (step=0023500) Train Loss: 1.2042, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:48:02[0m] (Generator) rec_loss: 0.0716, perceptual_loss: 0.3008, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9187, generator_adv_loss: -0.1562, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2946, d_vqkd: 128622.4375, d_vqgan: 145990.2500
	[[34m2025-05-01 00:48:03[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: 0.3438, logits_fake: 0.3125
	[[34m2025-05-01 00:48:03[0m] (step=0023600) Train Loss: 1.2381, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:49:30[0m] (Generator) rec_loss: 0.0581, perceptual_loss: 0.2812, vq_loss: 0.0241, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9167, generator_adv_loss: -0.1504, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2958, d_vqkd: 128390.8828, d_vqgan: 145462.5312
	[[34m2025-05-01 00:49:30[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.3164, logits_fake: 0.3008
	[[34m2025-05-01 00:49:30[0m] (step=0023700) Train Loss: 1.1750, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:50:57[0m] (Generator) rec_loss: 0.0568, perceptual_loss: 0.3125, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9224, generator_adv_loss: -0.0776, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3041, d_vqkd: 128045.8359, d_vqgan: 144765.5000
	[[34m2025-05-01 00:50:58[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: 0.1631, logits_fake: 0.1553
	[[34m2025-05-01 00:50:58[0m] (step=0023800) Train Loss: 1.1831, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:52:25[0m] (Generator) rec_loss: 0.0784, perceptual_loss: 0.3672, vq_loss: 0.0237, commit_loss: 0.0059, entropy_loss: 0.0000, codebook_usage: 0.9187, generator_adv_loss: 0.0962, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3887, d_vqkd: 127450.7734, d_vqgan: 145305.7812
	[[34m2025-05-01 00:52:25[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.1680, logits_fake: -0.1924
	[[34m2025-05-01 00:52:25[0m] (step=0023900) Train Loss: 1.1869, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:53:52[0m] (Generator) rec_loss: 0.0591, perceptual_loss: 0.2910, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9167, generator_adv_loss: 0.2871, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3147, d_vqkd: 128532.9844, d_vqgan: 146021.9062
	[[34m2025-05-01 00:53:53[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.5820, logits_fake: -0.5742
	[[34m2025-05-01 00:53:53[0m] (step=0024000) Train Loss: 1.1398, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:53:55[0m] Saved checkpoint to ck_decoder_cnn/001-TokenFlow/checkpoints/0024000.pt
	[[34m2025-05-01 00:55:22[0m] (Generator) rec_loss: 0.0783, perceptual_loss: 0.3008, vq_loss: 0.0254, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: -0.0645, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2999, d_vqkd: 128765.8828, d_vqgan: 145313.8750
	[[34m2025-05-01 00:55:23[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.1221, logits_fake: 0.1289
	[[34m2025-05-01 00:55:23[0m] (step=0024100) Train Loss: 1.1580, Train Steps/Sec: 1.11
	[[34m2025-05-01 00:56:50[0m] (Generator) rec_loss: 0.0486, perceptual_loss: 0.2832, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: -0.1836, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2871, d_vqkd: 128570.8047, d_vqgan: 144953.9219
	[[34m2025-05-01 00:56:50[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: 0.3906, logits_fake: 0.3672
	[[34m2025-05-01 00:56:50[0m] (step=0024200) Train Loss: 1.2423, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:58:17[0m] (Generator) rec_loss: 0.0453, perceptual_loss: 0.3047, vq_loss: 0.0254, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: 0.0854, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2872, d_vqkd: 129055.6172, d_vqgan: 145102.7188
	[[34m2025-05-01 00:58:18[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.1758, logits_fake: -0.1709
	[[34m2025-05-01 00:58:18[0m] (step=0024300) Train Loss: 1.2150, Train Steps/Sec: 1.14
	[[34m2025-05-01 00:59:45[0m] (Generator) rec_loss: 0.0567, perceptual_loss: 0.3125, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9187, generator_adv_loss: 0.2930, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2840, d_vqkd: 128459.1250, d_vqgan: 145776.0312
	[[34m2025-05-01 00:59:45[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.5898, logits_fake: -0.5859
	[[34m2025-05-01 00:59:45[0m] (step=0024400) Train Loss: 1.1807, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:01:12[0m] (Generator) rec_loss: 0.0587, perceptual_loss: 0.2910, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9205, generator_adv_loss: -0.1299, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2763, d_vqkd: 129107.7344, d_vqgan: 144600.3750
	[[34m2025-05-01 01:01:13[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.2617, logits_fake: 0.2598
	[[34m2025-05-01 01:01:13[0m] (step=0024500) Train Loss: 1.1475, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:02:40[0m] (Generator) rec_loss: 0.0631, perceptual_loss: 0.3008, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9199, generator_adv_loss: -0.1099, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2598, d_vqkd: 128640.3672, d_vqgan: 144884.1406
	[[34m2025-05-01 01:02:40[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.2295, logits_fake: 0.2197
	[[34m2025-05-01 01:02:40[0m] (step=0024600) Train Loss: 1.2434, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:04:07[0m] (Generator) rec_loss: 0.0755, perceptual_loss: 0.3125, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9169, generator_adv_loss: 0.1836, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3267, d_vqkd: 129268.3438, d_vqgan: 145791.2812
	[[34m2025-05-01 01:04:08[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.3496, logits_fake: -0.3672
	[[34m2025-05-01 01:04:08[0m] (step=0024700) Train Loss: 1.1377, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:05:35[0m] (Generator) rec_loss: 0.0610, perceptual_loss: 0.2852, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: -0.0598, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3143, d_vqkd: 129184.8047, d_vqgan: 144590.7188
	[[34m2025-05-01 01:05:35[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.1035, logits_fake: 0.1196
	[[34m2025-05-01 01:05:35[0m] (step=0024800) Train Loss: 1.2005, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:07:02[0m] (Generator) rec_loss: 0.0826, perceptual_loss: 0.2930, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9195, generator_adv_loss: -0.2158, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2609, d_vqkd: 128581.7969, d_vqgan: 145144.8438
	[[34m2025-05-01 01:07:03[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.4219, logits_fake: 0.4316
	[[34m2025-05-01 01:07:03[0m] (step=0024900) Train Loss: 1.2143, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:08:30[0m] (Generator) rec_loss: 0.0734, perceptual_loss: 0.3203, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9194, generator_adv_loss: 0.3359, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2798, d_vqkd: 128878.5859, d_vqgan: 145864.2812
	[[34m2025-05-01 01:08:30[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: -0.6445, logits_fake: -0.6719
	[[34m2025-05-01 01:08:30[0m] (step=0025000) Train Loss: 1.1603, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:09:57[0m] (Generator) rec_loss: 0.0641, perceptual_loss: 0.2988, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9192, generator_adv_loss: -0.1006, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2922, d_vqkd: 129396.2969, d_vqgan: 145393.1094
	[[34m2025-05-01 01:09:58[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.1914, logits_fake: 0.2012
	[[34m2025-05-01 01:09:58[0m] (step=0025100) Train Loss: 1.1694, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:11:25[0m] (Generator) rec_loss: 0.0834, perceptual_loss: 0.3145, vq_loss: 0.0239, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: -0.2246, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2878, d_vqkd: 127938.6641, d_vqgan: 144018.4688
	[[34m2025-05-01 01:11:25[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: 0.4824, logits_fake: 0.4492
	[[34m2025-05-01 01:11:25[0m] (step=0025200) Train Loss: 1.2282, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:12:52[0m] (Generator) rec_loss: 0.0568, perceptual_loss: 0.2832, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9202, generator_adv_loss: 0.1670, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2871, d_vqkd: 128452.5703, d_vqgan: 144991.4844
	[[34m2025-05-01 01:12:53[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.3555, logits_fake: -0.3340
	[[34m2025-05-01 01:12:53[0m] (step=0025300) Train Loss: 1.1913, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:14:20[0m] (Generator) rec_loss: 0.0776, perceptual_loss: 0.3008, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9178, generator_adv_loss: 0.0996, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2972, d_vqkd: 128369.1094, d_vqgan: 144571.1562
	[[34m2025-05-01 01:14:20[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.1816, logits_fake: -0.1992
	[[34m2025-05-01 01:14:20[0m] (step=0025400) Train Loss: 1.1261, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:15:47[0m] (Generator) rec_loss: 0.1086, perceptual_loss: 0.3066, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: -0.2402, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3050, d_vqkd: 128896.1797, d_vqgan: 145034.5938
	[[34m2025-05-01 01:15:48[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.4746, logits_fake: 0.4805
	[[34m2025-05-01 01:15:48[0m] (step=0025500) Train Loss: 1.2302, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:17:15[0m] (Generator) rec_loss: 0.0594, perceptual_loss: 0.3184, vq_loss: 0.0240, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9192, generator_adv_loss: 0.3770, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2778, d_vqkd: 127298.9609, d_vqgan: 143653.5625
	[[34m2025-05-01 01:17:15[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.7305, logits_fake: -0.7539
	[[34m2025-05-01 01:17:15[0m] (step=0025600) Train Loss: 1.1554, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:18:42[0m] (Generator) rec_loss: 0.0480, perceptual_loss: 0.2715, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: -0.3027, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2673, d_vqkd: 128607.9766, d_vqgan: 145395.4844
	[[34m2025-05-01 01:18:43[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.5781, logits_fake: 0.6055
	[[34m2025-05-01 01:18:43[0m] (step=0025700) Train Loss: 1.1822, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:20:10[0m] (Generator) rec_loss: 0.0712, perceptual_loss: 0.3066, vq_loss: 0.0240, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9165, generator_adv_loss: 0.0122, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2670, d_vqkd: 127904.9219, d_vqgan: 145028.7500
	[[34m2025-05-01 01:20:10[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.0244, logits_fake: -0.0244
	[[34m2025-05-01 01:20:10[0m] (step=0025800) Train Loss: 1.1947, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:21:37[0m] (Generator) rec_loss: 0.0618, perceptual_loss: 0.2852, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9157, generator_adv_loss: 0.0815, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2706, d_vqkd: 128905.4453, d_vqgan: 145526.5156
	[[34m2025-05-01 01:21:38[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: -0.1436, logits_fake: -0.1631
	[[34m2025-05-01 01:21:38[0m] (step=0025900) Train Loss: 1.1395, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:23:05[0m] (Generator) rec_loss: 0.0554, perceptual_loss: 0.2832, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: -0.2871, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2754, d_vqkd: 129465.3828, d_vqgan: 144606.9844
	[[34m2025-05-01 01:23:05[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: 0.5820, logits_fake: 0.5742
	[[34m2025-05-01 01:23:05[0m] (step=0026000) Train Loss: 1.1596, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:24:32[0m] (Generator) rec_loss: 0.0468, perceptual_loss: 0.2871, vq_loss: 0.0232, commit_loss: 0.0058, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: 0.3027, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2822, d_vqkd: 127065.6484, d_vqgan: 144577.2031
	[[34m2025-05-01 01:24:33[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.6094, logits_fake: -0.6055
	[[34m2025-05-01 01:24:33[0m] (step=0026100) Train Loss: 1.1653, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:26:00[0m] (Generator) rec_loss: 0.0495, perceptual_loss: 0.2969, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: -0.2275, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2955, d_vqkd: 129167.9062, d_vqgan: 144925.8125
	[[34m2025-05-01 01:26:00[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.4531, logits_fake: 0.4551
	[[34m2025-05-01 01:26:00[0m] (step=0026200) Train Loss: 1.1635, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:27:27[0m] (Generator) rec_loss: 0.0848, perceptual_loss: 0.2812, vq_loss: 0.0241, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9180, generator_adv_loss: 0.1177, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2827, d_vqkd: 128266.9375, d_vqgan: 145270.1250
	[[34m2025-05-01 01:27:28[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.2490, logits_fake: -0.2354
	[[34m2025-05-01 01:27:28[0m] (step=0026300) Train Loss: 1.2211, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:28:55[0m] (Generator) rec_loss: 0.0545, perceptual_loss: 0.2871, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: 0.2871, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2679, d_vqkd: 128663.5000, d_vqgan: 144632.6719
	[[34m2025-05-01 01:28:55[0m] (Discriminator) discriminator_adv_loss: 0.5234, disc_weight: 0.5000, logits_real: -0.6719, logits_fake: -0.5742
	[[34m2025-05-01 01:28:55[0m] (step=0026400) Train Loss: 1.2062, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:30:22[0m] (Generator) rec_loss: 0.0735, perceptual_loss: 0.3184, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9171, generator_adv_loss: 0.0762, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3004, d_vqkd: 128288.0312, d_vqgan: 145709.8750
	[[34m2025-05-01 01:30:23[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.1641, logits_fake: -0.1523
	[[34m2025-05-01 01:30:23[0m] (step=0026500) Train Loss: 1.1616, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:31:50[0m] (Generator) rec_loss: 0.0457, perceptual_loss: 0.3008, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9176, generator_adv_loss: -0.2930, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3096, d_vqkd: 128515.0156, d_vqgan: 146482.1875
	[[34m2025-05-01 01:31:50[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: 0.6211, logits_fake: 0.5859
	[[34m2025-05-01 01:31:50[0m] (step=0026600) Train Loss: 1.2452, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:33:17[0m] (Generator) rec_loss: 0.0629, perceptual_loss: 0.3086, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9167, generator_adv_loss: 0.1416, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3034, d_vqkd: 128601.8203, d_vqgan: 144869.2656
	[[34m2025-05-01 01:33:18[0m] (Discriminator) discriminator_adv_loss: 0.5352, disc_weight: 0.5000, logits_real: -0.4219, logits_fake: -0.2832
	[[34m2025-05-01 01:33:18[0m] (step=0026700) Train Loss: 1.1747, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:34:45[0m] (Generator) rec_loss: 0.0614, perceptual_loss: 0.2852, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9161, generator_adv_loss: 0.2676, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2799, d_vqkd: 128508.3984, d_vqgan: 145266.5156
	[[34m2025-05-01 01:34:45[0m] (Discriminator) discriminator_adv_loss: 0.5117, disc_weight: 0.5000, logits_real: -0.5820, logits_fake: -0.5352
	[[34m2025-05-01 01:34:45[0m] (step=0026800) Train Loss: 1.1737, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:36:12[0m] (Generator) rec_loss: 0.0534, perceptual_loss: 0.2969, vq_loss: 0.0241, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: -0.3086, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2960, d_vqkd: 128248.6094, d_vqgan: 145038.0312
	[[34m2025-05-01 01:36:13[0m] (Discriminator) discriminator_adv_loss: 0.5195, disc_weight: 0.5000, logits_real: 0.5430, logits_fake: 0.6172
	[[34m2025-05-01 01:36:13[0m] (step=0026900) Train Loss: 1.1612, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:37:40[0m] (Generator) rec_loss: 0.0650, perceptual_loss: 0.2891, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9204, generator_adv_loss: -0.1484, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2778, d_vqkd: 128834.0625, d_vqgan: 145260.6719
	[[34m2025-05-01 01:37:40[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.3086, logits_fake: 0.2969
	[[34m2025-05-01 01:37:40[0m] (step=0027000) Train Loss: 1.1690, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:39:07[0m] (Generator) rec_loss: 0.0690, perceptual_loss: 0.2793, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9188, generator_adv_loss: 0.2383, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2556, d_vqkd: 128426.6484, d_vqgan: 145307.5469
	[[34m2025-05-01 01:39:08[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.5000, logits_fake: -0.4766
	[[34m2025-05-01 01:39:08[0m] (step=0027100) Train Loss: 1.1787, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:40:35[0m] (Generator) rec_loss: 0.0652, perceptual_loss: 0.2852, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9186, generator_adv_loss: -0.1611, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2534, d_vqkd: 128251.0547, d_vqgan: 144240.8594
	[[34m2025-05-01 01:40:36[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.3281, logits_fake: 0.3223
	[[34m2025-05-01 01:40:36[0m] (step=0027200) Train Loss: 1.1939, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:42:03[0m] (Generator) rec_loss: 0.0601, perceptual_loss: 0.2656, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9175, generator_adv_loss: 0.2148, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2787, d_vqkd: 128522.7969, d_vqgan: 144948.0938
	[[34m2025-05-01 01:42:03[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.4414, logits_fake: -0.4297
	[[34m2025-05-01 01:42:03[0m] (step=0027300) Train Loss: 1.2109, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:43:30[0m] (Generator) rec_loss: 0.0623, perceptual_loss: 0.2871, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9212, generator_adv_loss: -0.2129, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2720, d_vqkd: 128867.2188, d_vqgan: 145394.7812
	[[34m2025-05-01 01:43:31[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.4336, logits_fake: 0.4258
	[[34m2025-05-01 01:43:31[0m] (step=0027400) Train Loss: 1.1887, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:44:58[0m] (Generator) rec_loss: 0.0869, perceptual_loss: 0.3027, vq_loss: 0.0235, commit_loss: 0.0059, entropy_loss: 0.0000, codebook_usage: 0.9178, generator_adv_loss: 0.1387, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3035, d_vqkd: 127303.8984, d_vqgan: 144989.9219
	[[34m2025-05-01 01:44:58[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.2578, logits_fake: -0.2773
	[[34m2025-05-01 01:44:58[0m] (step=0027500) Train Loss: 1.2016, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:46:25[0m] (Generator) rec_loss: 0.0604, perceptual_loss: 0.2812, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: -0.0500, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2816, d_vqkd: 128931.4297, d_vqgan: 144916.6875
	[[34m2025-05-01 01:46:26[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.0908, logits_fake: 0.1001
	[[34m2025-05-01 01:46:26[0m] (step=0027600) Train Loss: 1.1673, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:47:52[0m] (Generator) rec_loss: 0.0630, perceptual_loss: 0.3164, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9189, generator_adv_loss: -0.1777, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3193, d_vqkd: 128342.5938, d_vqgan: 145142.5312
	[[34m2025-05-01 01:47:53[0m] (Discriminator) discriminator_adv_loss: 0.5117, disc_weight: 0.5000, logits_real: 0.3164, logits_fake: 0.3555
	[[34m2025-05-01 01:47:53[0m] (step=0027700) Train Loss: 1.2128, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:49:20[0m] (Generator) rec_loss: 0.0650, perceptual_loss: 0.3242, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9208, generator_adv_loss: -0.0708, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3094, d_vqkd: 128052.0781, d_vqgan: 144748.5000
	[[34m2025-05-01 01:49:20[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: 0.1709, logits_fake: 0.1416
	[[34m2025-05-01 01:49:20[0m] (step=0027800) Train Loss: 1.1523, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:50:47[0m] (Generator) rec_loss: 0.0490, perceptual_loss: 0.2969, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9180, generator_adv_loss: 0.0272, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3049, d_vqkd: 127983.6250, d_vqgan: 145422.1094
	[[34m2025-05-01 01:50:48[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: -0.0474, logits_fake: -0.0544
	[[34m2025-05-01 01:50:48[0m] (step=0027900) Train Loss: 1.1865, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:52:15[0m] (Generator) rec_loss: 0.0615, perceptual_loss: 0.3145, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9171, generator_adv_loss: 0.0028, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2783, d_vqkd: 128361.4766, d_vqgan: 144428.0156
	[[34m2025-05-01 01:52:15[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.0070, logits_fake: -0.0056
	[[34m2025-05-01 01:52:15[0m] (step=0028000) Train Loss: 1.1310, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:53:42[0m] (Generator) rec_loss: 0.0591, perceptual_loss: 0.3008, vq_loss: 0.0258, commit_loss: 0.0065, entropy_loss: 0.0000, codebook_usage: 0.9165, generator_adv_loss: -0.1816, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3204, d_vqkd: 129377.9766, d_vqgan: 145540.5469
	[[34m2025-05-01 01:53:43[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.3809, logits_fake: 0.3633
	[[34m2025-05-01 01:53:43[0m] (step=0028100) Train Loss: 1.2256, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:55:10[0m] (Generator) rec_loss: 0.0879, perceptual_loss: 0.3027, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9171, generator_adv_loss: -0.1562, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2967, d_vqkd: 128531.8594, d_vqgan: 145573.1094
	[[34m2025-05-01 01:55:10[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.3145, logits_fake: 0.3125
	[[34m2025-05-01 01:55:10[0m] (step=0028200) Train Loss: 1.1810, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:56:37[0m] (Generator) rec_loss: 0.0529, perceptual_loss: 0.2812, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9167, generator_adv_loss: 0.1270, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2850, d_vqkd: 128745.7188, d_vqgan: 144346.2500
	[[34m2025-05-01 01:56:38[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.2539, logits_fake: -0.2539
	[[34m2025-05-01 01:56:38[0m] (step=0028300) Train Loss: 1.1752, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:58:05[0m] (Generator) rec_loss: 0.0649, perceptual_loss: 0.2734, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9189, generator_adv_loss: -0.0845, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2674, d_vqkd: 129016.9844, d_vqgan: 145106.7500
	[[34m2025-05-01 01:58:05[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.1641, logits_fake: 0.1689
	[[34m2025-05-01 01:58:05[0m] (step=0028400) Train Loss: 1.1792, Train Steps/Sec: 1.14
	[[34m2025-05-01 01:59:32[0m] (Generator) rec_loss: 0.0549, perceptual_loss: 0.2773, vq_loss: 0.0236, commit_loss: 0.0059, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: 0.0938, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2956, d_vqkd: 127677.3984, d_vqgan: 143850.6094
	[[34m2025-05-01 01:59:33[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.1885, logits_fake: -0.1875
	[[34m2025-05-01 01:59:33[0m] (step=0028500) Train Loss: 1.1760, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:01:00[0m] (Generator) rec_loss: 0.0771, perceptual_loss: 0.2754, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9179, generator_adv_loss: -0.1846, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2852, d_vqkd: 128916.6250, d_vqgan: 144559.2188
	[[34m2025-05-01 02:01:00[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.3281, logits_fake: 0.3691
	[[34m2025-05-01 02:01:00[0m] (step=0028600) Train Loss: 1.1169, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:02:27[0m] (Generator) rec_loss: 0.0348, perceptual_loss: 0.2598, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9165, generator_adv_loss: 0.0586, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2405, d_vqkd: 128863.4453, d_vqgan: 145110.8281
	[[34m2025-05-01 02:02:28[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.1191, logits_fake: -0.1172
	[[34m2025-05-01 02:02:28[0m] (step=0028700) Train Loss: 1.2183, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:03:54[0m] (Generator) rec_loss: 0.0581, perceptual_loss: 0.2773, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9169, generator_adv_loss: -0.2617, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2712, d_vqkd: 128823.3906, d_vqgan: 145036.8906
	[[34m2025-05-01 02:03:55[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.4961, logits_fake: 0.5234
	[[34m2025-05-01 02:03:55[0m] (step=0028800) Train Loss: 1.1358, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:05:22[0m] (Generator) rec_loss: 0.0718, perceptual_loss: 0.3086, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: 0.0442, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3083, d_vqkd: 128654.0859, d_vqgan: 145228.5625
	[[34m2025-05-01 02:05:22[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.0659, logits_fake: -0.0884
	[[34m2025-05-01 02:05:22[0m] (step=0028900) Train Loss: 1.1566, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:06:49[0m] (Generator) rec_loss: 0.0559, perceptual_loss: 0.2832, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9165, generator_adv_loss: -0.1289, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2585, d_vqkd: 129260.0469, d_vqgan: 144859.0938
	[[34m2025-05-01 02:06:50[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.2471, logits_fake: 0.2578
	[[34m2025-05-01 02:06:50[0m] (step=0029000) Train Loss: 1.1130, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:08:17[0m] (Generator) rec_loss: 0.0535, perceptual_loss: 0.2773, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9189, generator_adv_loss: 0.1719, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2627, d_vqkd: 128413.6953, d_vqgan: 145026.5156
	[[34m2025-05-01 02:08:17[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.3262, logits_fake: -0.3438
	[[34m2025-05-01 02:08:17[0m] (step=0029100) Train Loss: 1.2198, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:09:34[0m] Beginning epoch 2...
	[[34m2025-05-01 02:09:45[0m] (Generator) rec_loss: 0.0509, perceptual_loss: 0.2832, vq_loss: 0.0233, commit_loss: 0.0058, entropy_loss: 0.0000, codebook_usage: 0.9184, generator_adv_loss: -0.0674, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2579, d_vqkd: 126975.8516, d_vqgan: 144530.2188
	[[34m2025-05-01 02:09:45[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.1128, logits_fake: 0.1348
	[[34m2025-05-01 02:09:45[0m] (step=0029200) Train Loss: 1.1269, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:11:12[0m] (Generator) rec_loss: 0.0582, perceptual_loss: 0.2969, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9187, generator_adv_loss: 0.0923, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2939, d_vqkd: 127987.2891, d_vqgan: 145255.4688
	[[34m2025-05-01 02:11:13[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.2188, logits_fake: -0.1846
	[[34m2025-05-01 02:11:13[0m] (step=0029300) Train Loss: 1.1944, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:12:40[0m] (Generator) rec_loss: 0.0572, perceptual_loss: 0.2520, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9168, generator_adv_loss: -0.1445, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2499, d_vqkd: 128195.2031, d_vqgan: 144891.8281
	[[34m2025-05-01 02:12:40[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.3008, logits_fake: 0.2891
	[[34m2025-05-01 02:12:40[0m] (step=0029400) Train Loss: 1.1174, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:14:07[0m] (Generator) rec_loss: 0.0553, perceptual_loss: 0.2617, vq_loss: 0.0241, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9191, generator_adv_loss: -0.0123, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2786, d_vqkd: 127701.7031, d_vqgan: 144789.1562
	[[34m2025-05-01 02:14:08[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.0167, logits_fake: 0.0245
	[[34m2025-05-01 02:14:08[0m] (step=0029500) Train Loss: 1.1988, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:15:35[0m] (Generator) rec_loss: 0.0600, perceptual_loss: 0.2988, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: -0.0703, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2591, d_vqkd: 128036.5234, d_vqgan: 145421.3438
	[[34m2025-05-01 02:15:35[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.1396, logits_fake: 0.1406
	[[34m2025-05-01 02:15:35[0m] (step=0029600) Train Loss: 1.0859, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:17:02[0m] (Generator) rec_loss: 0.0413, perceptual_loss: 0.2598, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9186, generator_adv_loss: 0.1113, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2437, d_vqkd: 128598.9141, d_vqgan: 145528.5781
	[[34m2025-05-01 02:17:03[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.2598, logits_fake: -0.2227
	[[34m2025-05-01 02:17:03[0m] (step=0029700) Train Loss: 1.2409, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:18:30[0m] (Generator) rec_loss: 0.0911, perceptual_loss: 0.3184, vq_loss: 0.0254, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: -0.0796, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3161, d_vqkd: 129334.5859, d_vqgan: 145236.0938
	[[34m2025-05-01 02:18:30[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: 0.1797, logits_fake: 0.1592
	[[34m2025-05-01 02:18:30[0m] (step=0029800) Train Loss: 1.1343, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:19:57[0m] (Generator) rec_loss: 0.0523, perceptual_loss: 0.2754, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9189, generator_adv_loss: 0.0757, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2597, d_vqkd: 129255.2656, d_vqgan: 145250.5781
	[[34m2025-05-01 02:19:58[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.1631, logits_fake: -0.1514
	[[34m2025-05-01 02:19:58[0m] (step=0029900) Train Loss: 1.2172, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:21:25[0m] (Generator) rec_loss: 0.0582, perceptual_loss: 0.2715, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9167, generator_adv_loss: 0.0420, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2733, d_vqkd: 128691.6875, d_vqgan: 145679.9375
	[[34m2025-05-01 02:21:25[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.0688, logits_fake: -0.0840
	[[34m2025-05-01 02:21:25[0m] (step=0030000) Train Loss: 1.1182, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:22:52[0m] (Generator) rec_loss: 0.0575, perceptual_loss: 0.3125, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: 0.0064, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3174, d_vqkd: 128258.5938, d_vqgan: 145015.9219
	[[34m2025-05-01 02:22:53[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.0273, logits_fake: -0.0128
	[[34m2025-05-01 02:22:53[0m] (step=0030100) Train Loss: 1.1987, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:24:20[0m] (Generator) rec_loss: 0.0528, perceptual_loss: 0.2930, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9187, generator_adv_loss: -0.0128, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2878, d_vqkd: 128417.8594, d_vqgan: 145980.1250
	[[34m2025-05-01 02:24:20[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.0008, logits_fake: 0.0255
	[[34m2025-05-01 02:24:20[0m] (step=0030200) Train Loss: 1.0897, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:25:47[0m] (Generator) rec_loss: 0.0564, perceptual_loss: 0.2793, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9189, generator_adv_loss: -0.0262, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2753, d_vqkd: 128701.5469, d_vqgan: 144922.7031
	[[34m2025-05-01 02:25:47[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: 0.0806, logits_fake: 0.0525
	[[34m2025-05-01 02:25:47[0m] (step=0030300) Train Loss: 1.1982, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:27:14[0m] (Generator) rec_loss: 0.0653, perceptual_loss: 0.2910, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9163, generator_adv_loss: 0.0356, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2824, d_vqkd: 128570.8281, d_vqgan: 144698.9375
	[[34m2025-05-01 02:27:15[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.0586, logits_fake: -0.0713
	[[34m2025-05-01 02:27:15[0m] (step=0030400) Train Loss: 1.1124, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:28:42[0m] (Generator) rec_loss: 0.0593, perceptual_loss: 0.2734, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9145, generator_adv_loss: -0.0295, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2868, d_vqkd: 129089.9375, d_vqgan: 144834.5625
	[[34m2025-05-01 02:28:42[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.0479, logits_fake: 0.0591
	[[34m2025-05-01 02:28:42[0m] (step=0030500) Train Loss: 1.2344, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:30:09[0m] (Generator) rec_loss: 0.0588, perceptual_loss: 0.2871, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9176, generator_adv_loss: 0.2715, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2610, d_vqkd: 128964.1641, d_vqgan: 145271.0000
	[[34m2025-05-01 02:30:10[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.5273, logits_fake: -0.5430
	[[34m2025-05-01 02:30:10[0m] (step=0030600) Train Loss: 1.1417, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:31:37[0m] (Generator) rec_loss: 0.0602, perceptual_loss: 0.3086, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9191, generator_adv_loss: -0.1982, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2980, d_vqkd: 128839.5078, d_vqgan: 145555.8281
	[[34m2025-05-01 02:31:37[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: 0.4238, logits_fake: 0.3965
	[[34m2025-05-01 02:31:37[0m] (step=0030700) Train Loss: 1.1861, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:33:04[0m] (Generator) rec_loss: 0.0560, perceptual_loss: 0.2969, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9179, generator_adv_loss: 0.2637, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2768, d_vqkd: 128454.5000, d_vqgan: 144759.0625
	[[34m2025-05-01 02:33:05[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.5547, logits_fake: -0.5273
	[[34m2025-05-01 02:33:05[0m] (step=0030800) Train Loss: 1.1420, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:34:32[0m] (Generator) rec_loss: 0.0538, perceptual_loss: 0.3008, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9192, generator_adv_loss: -0.2812, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3111, d_vqkd: 128502.9766, d_vqgan: 144954.0938
	[[34m2025-05-01 02:34:32[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.5781, logits_fake: 0.5625
	[[34m2025-05-01 02:34:32[0m] (step=0030900) Train Loss: 1.1794, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:35:59[0m] (Generator) rec_loss: 0.0577, perceptual_loss: 0.2969, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9186, generator_adv_loss: 0.1230, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2601, d_vqkd: 128951.4453, d_vqgan: 144907.3750
	[[34m2025-05-01 02:36:00[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.2832, logits_fake: -0.2461
	[[34m2025-05-01 02:36:00[0m] (step=0031000) Train Loss: 1.1532, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:37:27[0m] (Generator) rec_loss: 0.0554, perceptual_loss: 0.2773, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9204, generator_adv_loss: -0.3320, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2703, d_vqkd: 128501.4453, d_vqgan: 145404.3750
	[[34m2025-05-01 02:37:27[0m] (Discriminator) discriminator_adv_loss: 0.5117, disc_weight: 0.5000, logits_real: 0.6211, logits_fake: 0.6641
	[[34m2025-05-01 02:37:27[0m] (step=0031100) Train Loss: 1.1460, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:38:54[0m] (Generator) rec_loss: 0.0656, perceptual_loss: 0.3086, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: 0.1553, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3097, d_vqkd: 129655.3438, d_vqgan: 144706.4375
	[[34m2025-05-01 02:38:55[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: -0.3066, logits_fake: -0.3105
	[[34m2025-05-01 02:38:55[0m] (step=0031200) Train Loss: 1.1695, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:40:22[0m] (Generator) rec_loss: 0.0617, perceptual_loss: 0.2812, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9161, generator_adv_loss: -0.1543, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2630, d_vqkd: 128333.1094, d_vqgan: 145654.9375
	[[34m2025-05-01 02:40:22[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.2754, logits_fake: 0.3086
	[[34m2025-05-01 02:40:22[0m] (step=0031300) Train Loss: 1.0942, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:41:49[0m] (Generator) rec_loss: 0.0484, perceptual_loss: 0.2500, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9189, generator_adv_loss: 0.1621, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2579, d_vqkd: 128520.7500, d_vqgan: 144951.3750
	[[34m2025-05-01 02:41:50[0m] (Discriminator) discriminator_adv_loss: 0.5117, disc_weight: 0.5000, logits_real: -0.3691, logits_fake: -0.3242
	[[34m2025-05-01 02:41:50[0m] (step=0031400) Train Loss: 1.2289, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:43:17[0m] (Generator) rec_loss: 0.0801, perceptual_loss: 0.2891, vq_loss: 0.0234, commit_loss: 0.0058, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: -0.2246, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2659, d_vqkd: 126831.2344, d_vqgan: 144526.7344
	[[34m2025-05-01 02:43:17[0m] (Discriminator) discriminator_adv_loss: 0.5117, disc_weight: 0.5000, logits_real: 0.4082, logits_fake: 0.4492
	[[34m2025-05-01 02:43:17[0m] (step=0031500) Train Loss: 1.1364, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:44:44[0m] (Generator) rec_loss: 0.0618, perceptual_loss: 0.3008, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: 0.3125, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2870, d_vqkd: 128585.8516, d_vqgan: 145988.3125
	[[34m2025-05-01 02:44:45[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.5938, logits_fake: -0.6250
	[[34m2025-05-01 02:44:45[0m] (step=0031600) Train Loss: 1.1709, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:46:12[0m] (Generator) rec_loss: 0.0444, perceptual_loss: 0.2520, vq_loss: 0.0233, commit_loss: 0.0058, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: -0.1377, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2669, d_vqkd: 126037.0234, d_vqgan: 144521.0625
	[[34m2025-05-01 02:46:12[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: 0.2832, logits_fake: 0.2754
	[[34m2025-05-01 02:46:12[0m] (step=0031700) Train Loss: 1.2151, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:47:39[0m] (Generator) rec_loss: 0.0652, perceptual_loss: 0.2988, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9174, generator_adv_loss: 0.1865, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2657, d_vqkd: 129054.4062, d_vqgan: 144984.9688
	[[34m2025-05-01 02:47:40[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.3574, logits_fake: -0.3730
	[[34m2025-05-01 02:47:40[0m] (step=0031800) Train Loss: 1.1051, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:49:06[0m] (Generator) rec_loss: 0.0478, perceptual_loss: 0.2773, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9204, generator_adv_loss: -0.1689, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2610, d_vqkd: 128664.1719, d_vqgan: 145021.3906
	[[34m2025-05-01 02:49:07[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.3574, logits_fake: 0.3379
	[[34m2025-05-01 02:49:07[0m] (step=0031900) Train Loss: 1.2016, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:50:34[0m] (Generator) rec_loss: 0.0631, perceptual_loss: 0.2832, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: -0.0310, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2885, d_vqkd: 128627.8750, d_vqgan: 145675.8750
	[[34m2025-05-01 02:50:34[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.0752, logits_fake: 0.0620
	[[34m2025-05-01 02:50:34[0m] (step=0032000) Train Loss: 1.1274, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:50:37[0m] Saved checkpoint to ck_decoder_cnn/001-TokenFlow/checkpoints/0032000.pt
	[[34m2025-05-01 02:52:04[0m] (Generator) rec_loss: 0.0824, perceptual_loss: 0.3086, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9213, generator_adv_loss: -0.0603, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2810, d_vqkd: 129394.5156, d_vqgan: 145263.1406
	[[34m2025-05-01 02:52:04[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.1084, logits_fake: 0.1206
	[[34m2025-05-01 02:52:04[0m] (step=0032100) Train Loss: 1.2091, Train Steps/Sec: 1.11
	[[34m2025-05-01 02:53:31[0m] (Generator) rec_loss: 0.0640, perceptual_loss: 0.2715, vq_loss: 0.0254, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9188, generator_adv_loss: -0.1289, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2591, d_vqkd: 128284.5391, d_vqgan: 145429.1875
	[[34m2025-05-01 02:53:32[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.2275, logits_fake: 0.2578
	[[34m2025-05-01 02:53:32[0m] (step=0032200) Train Loss: 1.1059, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:54:59[0m] (Generator) rec_loss: 0.0666, perceptual_loss: 0.3105, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: 0.3398, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3264, d_vqkd: 128395.4922, d_vqgan: 145786.2500
	[[34m2025-05-01 02:54:59[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.6680, logits_fake: -0.6797
	[[34m2025-05-01 02:54:59[0m] (step=0032300) Train Loss: 1.1818, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:56:26[0m] (Generator) rec_loss: 0.0578, perceptual_loss: 0.3008, vq_loss: 0.0254, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9204, generator_adv_loss: -0.2285, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2880, d_vqkd: 128640.3594, d_vqgan: 145468.5781
	[[34m2025-05-01 02:56:27[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.4512, logits_fake: 0.4570
	[[34m2025-05-01 02:56:27[0m] (step=0032400) Train Loss: 1.1739, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:57:54[0m] (Generator) rec_loss: 0.0545, perceptual_loss: 0.2852, vq_loss: 0.0231, commit_loss: 0.0058, entropy_loss: 0.0000, codebook_usage: 0.9165, generator_adv_loss: 0.1660, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3042, d_vqkd: 127372.4844, d_vqgan: 144818.8594
	[[34m2025-05-01 02:57:54[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.3262, logits_fake: -0.3320
	[[34m2025-05-01 02:57:54[0m] (step=0032500) Train Loss: 1.1406, Train Steps/Sec: 1.14
	[[34m2025-05-01 02:59:21[0m] (Generator) rec_loss: 0.0677, perceptual_loss: 0.2852, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.0654, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2624, d_vqkd: 128141.6719, d_vqgan: 144972.1406
	[[34m2025-05-01 02:59:22[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.1167, logits_fake: -0.1309
	[[34m2025-05-01 02:59:22[0m] (step=0032600) Train Loss: 1.2283, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:00:49[0m] (Generator) rec_loss: 0.0571, perceptual_loss: 0.2793, vq_loss: 0.0237, commit_loss: 0.0059, entropy_loss: 0.0000, codebook_usage: 0.9171, generator_adv_loss: -0.1216, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2562, d_vqkd: 127720.7188, d_vqgan: 144790.9531
	[[34m2025-05-01 03:00:49[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.2217, logits_fake: 0.2432
	[[34m2025-05-01 03:00:49[0m] (step=0032700) Train Loss: 1.1177, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:02:16[0m] (Generator) rec_loss: 0.0739, perceptual_loss: 0.2930, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9165, generator_adv_loss: 0.1768, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2599, d_vqkd: 128291.3984, d_vqgan: 144488.5625
	[[34m2025-05-01 03:02:17[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: -0.3398, logits_fake: -0.3535
	[[34m2025-05-01 03:02:17[0m] (step=0032800) Train Loss: 1.1616, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:03:43[0m] (Generator) rec_loss: 0.0684, perceptual_loss: 0.3184, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: -0.1143, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2827, d_vqkd: 128253.9531, d_vqgan: 144198.0312
	[[34m2025-05-01 03:03:44[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.2314, logits_fake: 0.2285
	[[34m2025-05-01 03:03:44[0m] (step=0032900) Train Loss: 1.1575, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:05:11[0m] (Generator) rec_loss: 0.0633, perceptual_loss: 0.2773, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.0248, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2934, d_vqkd: 129111.2891, d_vqgan: 145004.4688
	[[34m2025-05-01 03:05:11[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.0767, logits_fake: -0.0496
	[[34m2025-05-01 03:05:11[0m] (step=0033000) Train Loss: 1.1348, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:06:38[0m] (Generator) rec_loss: 0.1165, perceptual_loss: 0.3418, vq_loss: 0.0234, commit_loss: 0.0058, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.0615, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3026, d_vqkd: 126822.1484, d_vqgan: 145139.3906
	[[34m2025-05-01 03:06:39[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.1113, logits_fake: -0.1230
	[[34m2025-05-01 03:06:39[0m] (step=0033100) Train Loss: 1.2127, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:08:06[0m] (Generator) rec_loss: 0.0738, perceptual_loss: 0.2930, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: -0.1523, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3092, d_vqkd: 128489.5078, d_vqgan: 145347.6719
	[[34m2025-05-01 03:08:06[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.2852, logits_fake: 0.3047
	[[34m2025-05-01 03:08:06[0m] (step=0033200) Train Loss: 1.1095, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:09:33[0m] (Generator) rec_loss: 0.0667, perceptual_loss: 0.3145, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: 0.1602, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2753, d_vqkd: 129203.3594, d_vqgan: 145832.8281
	[[34m2025-05-01 03:09:34[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: -0.3145, logits_fake: -0.3203
	[[34m2025-05-01 03:09:34[0m] (step=0033300) Train Loss: 1.1911, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:11:01[0m] (Generator) rec_loss: 0.0663, perceptual_loss: 0.2891, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: -0.2021, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2758, d_vqkd: 128481.4062, d_vqgan: 144933.5000
	[[34m2025-05-01 03:11:01[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.3867, logits_fake: 0.4043
	[[34m2025-05-01 03:11:01[0m] (step=0033400) Train Loss: 1.1034, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:12:28[0m] (Generator) rec_loss: 0.0672, perceptual_loss: 0.2871, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9202, generator_adv_loss: 0.2500, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2814, d_vqkd: 128311.9297, d_vqgan: 145554.3125
	[[34m2025-05-01 03:12:29[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: -0.4922, logits_fake: -0.5000
	[[34m2025-05-01 03:12:29[0m] (step=0033500) Train Loss: 1.1975, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:13:56[0m] (Generator) rec_loss: 0.0547, perceptual_loss: 0.2715, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9197, generator_adv_loss: -0.1895, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2764, d_vqkd: 128384.3906, d_vqgan: 144992.4688
	[[34m2025-05-01 03:13:56[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.3535, logits_fake: 0.3789
	[[34m2025-05-01 03:13:56[0m] (step=0033600) Train Loss: 1.1622, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:15:23[0m] (Generator) rec_loss: 0.0596, perceptual_loss: 0.2832, vq_loss: 0.0254, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9200, generator_adv_loss: 0.0251, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2962, d_vqkd: 128567.7656, d_vqgan: 145361.7031
	[[34m2025-05-01 03:15:24[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.0420, logits_fake: -0.0503
	[[34m2025-05-01 03:15:24[0m] (step=0033700) Train Loss: 1.0923, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:16:51[0m] (Generator) rec_loss: 0.0484, perceptual_loss: 0.2910, vq_loss: 0.0254, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9157, generator_adv_loss: 0.0322, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2688, d_vqkd: 128669.7969, d_vqgan: 145440.6562
	[[34m2025-05-01 03:16:51[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.0728, logits_fake: -0.0645
	[[34m2025-05-01 03:16:51[0m] (step=0033800) Train Loss: 1.2372, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:18:18[0m] (Generator) rec_loss: 0.0812, perceptual_loss: 0.2734, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: -0.0491, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2599, d_vqkd: 128323.6719, d_vqgan: 145038.4531
	[[34m2025-05-01 03:18:18[0m] (Discriminator) discriminator_adv_loss: 0.5117, disc_weight: 0.5000, logits_real: 0.0586, logits_fake: 0.0981
	[[34m2025-05-01 03:18:18[0m] (step=0033900) Train Loss: 1.0948, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:19:45[0m] (Generator) rec_loss: 0.0687, perceptual_loss: 0.3281, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: 0.2598, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3139, d_vqkd: 128334.4297, d_vqgan: 145191.6562
	[[34m2025-05-01 03:19:46[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.4824, logits_fake: -0.5195
	[[34m2025-05-01 03:19:46[0m] (step=0034000) Train Loss: 1.1706, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:21:13[0m] (Generator) rec_loss: 0.0552, perceptual_loss: 0.3105, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9164, generator_adv_loss: -0.2480, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2821, d_vqkd: 128413.6406, d_vqgan: 145878.1562
	[[34m2025-05-01 03:21:13[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.5039, logits_fake: 0.4961
	[[34m2025-05-01 03:21:13[0m] (step=0034100) Train Loss: 1.1689, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:22:40[0m] (Generator) rec_loss: 0.0565, perceptual_loss: 0.3262, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: 0.0427, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2953, d_vqkd: 127344.2734, d_vqgan: 145429.9688
	[[34m2025-05-01 03:22:41[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: -0.0640, logits_fake: -0.0854
	[[34m2025-05-01 03:22:41[0m] (step=0034200) Train Loss: 1.1165, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:24:08[0m] (Generator) rec_loss: 0.0481, perceptual_loss: 0.2852, vq_loss: 0.0244, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9146, generator_adv_loss: 0.1216, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2610, d_vqkd: 127985.5156, d_vqgan: 145288.5312
	[[34m2025-05-01 03:24:08[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.2441, logits_fake: -0.2432
	[[34m2025-05-01 03:24:08[0m] (step=0034300) Train Loss: 1.2003, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:25:35[0m] (Generator) rec_loss: 0.0728, perceptual_loss: 0.2715, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9163, generator_adv_loss: -0.2676, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2666, d_vqkd: 128693.0703, d_vqgan: 145019.6250
	[[34m2025-05-01 03:25:36[0m] (Discriminator) discriminator_adv_loss: 0.4844, disc_weight: 0.5000, logits_real: 0.6016, logits_fake: 0.5352
	[[34m2025-05-01 03:25:36[0m] (step=0034400) Train Loss: 1.1509, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:27:03[0m] (Generator) rec_loss: 0.0759, perceptual_loss: 0.2812, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9132, generator_adv_loss: 0.0693, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2804, d_vqkd: 128872.0859, d_vqgan: 144579.1250
	[[34m2025-05-01 03:27:03[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.1128, logits_fake: -0.1387
	[[34m2025-05-01 03:27:03[0m] (step=0034500) Train Loss: 1.1353, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:28:30[0m] (Generator) rec_loss: 0.0604, perceptual_loss: 0.2793, vq_loss: 0.0234, commit_loss: 0.0059, entropy_loss: 0.0000, codebook_usage: 0.9196, generator_adv_loss: 0.1846, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2840, d_vqkd: 127898.9375, d_vqgan: 144761.9375
	[[34m2025-05-01 03:28:31[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.4004, logits_fake: -0.3691
	[[34m2025-05-01 03:28:31[0m] (step=0034600) Train Loss: 1.2076, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:29:58[0m] (Generator) rec_loss: 0.0794, perceptual_loss: 0.2773, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9141, generator_adv_loss: -0.2490, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2859, d_vqkd: 128977.2422, d_vqgan: 144989.6719
	[[34m2025-05-01 03:29:58[0m] (Discriminator) discriminator_adv_loss: 0.4883, disc_weight: 0.5000, logits_real: 0.5469, logits_fake: 0.4980
	[[34m2025-05-01 03:29:58[0m] (step=0034700) Train Loss: 1.1620, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:31:25[0m] (Generator) rec_loss: 0.0619, perceptual_loss: 0.2910, vq_loss: 0.0258, commit_loss: 0.0065, entropy_loss: 0.0000, codebook_usage: 0.9205, generator_adv_loss: 0.2422, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2703, d_vqkd: 128542.5547, d_vqgan: 145490.0156
	[[34m2025-05-01 03:31:26[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.4824, logits_fake: -0.4844
	[[34m2025-05-01 03:31:26[0m] (step=0034800) Train Loss: 1.1738, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:32:52[0m] (Generator) rec_loss: 0.0544, perceptual_loss: 0.2734, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9158, generator_adv_loss: -0.1064, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2596, d_vqkd: 128364.1250, d_vqgan: 145466.5938
	[[34m2025-05-01 03:32:53[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.2148, logits_fake: 0.2129
	[[34m2025-05-01 03:32:53[0m] (step=0034900) Train Loss: 1.1949, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:34:20[0m] (Generator) rec_loss: 0.0660, perceptual_loss: 0.2812, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: -0.0105, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2740, d_vqkd: 129568.0156, d_vqgan: 144420.6250
	[[34m2025-05-01 03:34:20[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.0039, logits_fake: 0.0210
	[[34m2025-05-01 03:34:20[0m] (step=0035000) Train Loss: 1.1037, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:35:47[0m] (Generator) rec_loss: 0.0623, perceptual_loss: 0.3398, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9190, generator_adv_loss: 0.0894, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3269, d_vqkd: 128410.1406, d_vqgan: 145873.7188
	[[34m2025-05-01 03:35:48[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.1807, logits_fake: -0.1787
	[[34m2025-05-01 03:35:48[0m] (step=0035100) Train Loss: 1.1960, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:37:15[0m] (Generator) rec_loss: 0.0617, perceptual_loss: 0.2617, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9174, generator_adv_loss: -0.2422, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2358, d_vqkd: 128795.7969, d_vqgan: 145693.8125
	[[34m2025-05-01 03:37:15[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.4766, logits_fake: 0.4844
	[[34m2025-05-01 03:37:15[0m] (step=0035200) Train Loss: 1.1327, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:38:42[0m] (Generator) rec_loss: 0.0447, perceptual_loss: 0.2578, vq_loss: 0.0244, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9186, generator_adv_loss: 0.1729, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2742, d_vqkd: 128746.5234, d_vqgan: 144805.3906
	[[34m2025-05-01 03:38:43[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.3516, logits_fake: -0.3457
	[[34m2025-05-01 03:38:43[0m] (step=0035300) Train Loss: 1.1153, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:40:10[0m] (Generator) rec_loss: 0.0548, perceptual_loss: 0.2793, vq_loss: 0.0244, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9195, generator_adv_loss: 0.0564, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2737, d_vqkd: 128518.9219, d_vqgan: 144822.0781
	[[34m2025-05-01 03:40:10[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.1133, logits_fake: -0.1128
	[[34m2025-05-01 03:40:10[0m] (step=0035400) Train Loss: 1.2119, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:41:37[0m] (Generator) rec_loss: 0.0820, perceptual_loss: 0.2969, vq_loss: 0.0235, commit_loss: 0.0059, entropy_loss: 0.0000, codebook_usage: 0.9180, generator_adv_loss: -0.1523, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2666, d_vqkd: 127834.9141, d_vqgan: 144467.0938
	[[34m2025-05-01 03:41:38[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: 0.3340, logits_fake: 0.3047
	[[34m2025-05-01 03:41:38[0m] (step=0035500) Train Loss: 1.1260, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:43:05[0m] (Generator) rec_loss: 0.0755, perceptual_loss: 0.2832, vq_loss: 0.0254, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9166, generator_adv_loss: -0.0898, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2769, d_vqkd: 128737.3594, d_vqgan: 145106.4219
	[[34m2025-05-01 03:43:05[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.1426, logits_fake: 0.1797
	[[34m2025-05-01 03:43:05[0m] (step=0035600) Train Loss: 1.0928, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:44:32[0m] (Generator) rec_loss: 0.0501, perceptual_loss: 0.2812, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9171, generator_adv_loss: 0.0918, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2631, d_vqkd: 128616.2812, d_vqgan: 144616.9062
	[[34m2025-05-01 03:44:33[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.1885, logits_fake: -0.1836
	[[34m2025-05-01 03:44:33[0m] (step=0035700) Train Loss: 1.2236, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:46:00[0m] (Generator) rec_loss: 0.0528, perceptual_loss: 0.2617, vq_loss: 0.0240, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9187, generator_adv_loss: -0.3535, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2410, d_vqkd: 127640.0469, d_vqgan: 145336.7188
	[[34m2025-05-01 03:46:00[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.6992, logits_fake: 0.7070
	[[34m2025-05-01 03:46:00[0m] (step=0035800) Train Loss: 1.1056, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:47:27[0m] (Generator) rec_loss: 0.0677, perceptual_loss: 0.2910, vq_loss: 0.0260, commit_loss: 0.0065, entropy_loss: 0.0000, codebook_usage: 0.9195, generator_adv_loss: -0.0903, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2819, d_vqkd: 129326.8594, d_vqgan: 145757.1094
	[[34m2025-05-01 03:47:27[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.1758, logits_fake: 0.1807
	[[34m2025-05-01 03:47:27[0m] (step=0035900) Train Loss: 1.1271, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:48:54[0m] (Generator) rec_loss: 0.0611, perceptual_loss: 0.2852, vq_loss: 0.0229, commit_loss: 0.0057, entropy_loss: 0.0000, codebook_usage: 0.9189, generator_adv_loss: 0.0967, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2871, d_vqkd: 127117.5078, d_vqgan: 145688.5781
	[[34m2025-05-01 03:48:55[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.1885, logits_fake: -0.1934
	[[34m2025-05-01 03:48:55[0m] (step=0036000) Train Loss: 1.1936, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:50:22[0m] (Generator) rec_loss: 0.0541, perceptual_loss: 0.2695, vq_loss: 0.0254, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: -0.2178, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2526, d_vqkd: 128944.5625, d_vqgan: 144278.2031
	[[34m2025-05-01 03:50:22[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.4336, logits_fake: 0.4355
	[[34m2025-05-01 03:50:22[0m] (step=0036100) Train Loss: 1.1389, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:51:49[0m] (Generator) rec_loss: 0.0594, perceptual_loss: 0.2734, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9176, generator_adv_loss: -0.0864, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2794, d_vqkd: 128407.3750, d_vqgan: 145007.6250
	[[34m2025-05-01 03:51:50[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.1553, logits_fake: 0.1729
	[[34m2025-05-01 03:51:50[0m] (step=0036200) Train Loss: 1.1252, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:53:17[0m] (Generator) rec_loss: 0.0522, perceptual_loss: 0.2773, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9199, generator_adv_loss: 0.2266, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2809, d_vqkd: 128487.9531, d_vqgan: 145720.1094
	[[34m2025-05-01 03:53:17[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: -0.4473, logits_fake: -0.4531
	[[34m2025-05-01 03:53:17[0m] (step=0036300) Train Loss: 1.1673, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:54:44[0m] (Generator) rec_loss: 0.0890, perceptual_loss: 0.3320, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9188, generator_adv_loss: -0.1621, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3354, d_vqkd: 128820.0938, d_vqgan: 145346.0781
	[[34m2025-05-01 03:54:45[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.3496, logits_fake: 0.3242
	[[34m2025-05-01 03:54:45[0m] (step=0036400) Train Loss: 1.1697, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:56:12[0m] (Generator) rec_loss: 0.0779, perceptual_loss: 0.2715, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9190, generator_adv_loss: 0.0474, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2907, d_vqkd: 129012.1172, d_vqgan: 145445.7031
	[[34m2025-05-01 03:56:12[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.0588, logits_fake: -0.0947
	[[34m2025-05-01 03:56:12[0m] (step=0036500) Train Loss: 1.1053, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:57:39[0m] (Generator) rec_loss: 0.0687, perceptual_loss: 0.2969, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: 0.1875, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3017, d_vqkd: 128618.8828, d_vqgan: 144881.5469
	[[34m2025-05-01 03:57:40[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.3770, logits_fake: -0.3750
	[[34m2025-05-01 03:57:40[0m] (step=0036600) Train Loss: 1.2263, Train Steps/Sec: 1.14
	[[34m2025-05-01 03:59:07[0m] (Generator) rec_loss: 0.0538, perceptual_loss: 0.2559, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9204, generator_adv_loss: -0.1709, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2275, d_vqkd: 128422.3203, d_vqgan: 145150.3438
	[[34m2025-05-01 03:59:07[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: 0.3516, logits_fake: 0.3418
	[[34m2025-05-01 03:59:07[0m] (step=0036700) Train Loss: 1.1472, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:00:34[0m] (Generator) rec_loss: 0.0744, perceptual_loss: 0.2891, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: 0.0918, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2945, d_vqkd: 128205.4141, d_vqgan: 144392.2500
	[[34m2025-05-01 04:00:35[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: -0.1543, logits_fake: -0.1836
	[[34m2025-05-01 04:00:35[0m] (step=0036800) Train Loss: 1.1065, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:02:02[0m] (Generator) rec_loss: 0.0548, perceptual_loss: 0.2910, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9198, generator_adv_loss: 0.2002, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2709, d_vqkd: 129263.7344, d_vqgan: 144981.0625
	[[34m2025-05-01 04:02:02[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.4043, logits_fake: -0.4004
	[[34m2025-05-01 04:02:02[0m] (step=0036900) Train Loss: 1.1896, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:03:29[0m] (Generator) rec_loss: 0.0719, perceptual_loss: 0.2793, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9188, generator_adv_loss: -0.2373, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2841, d_vqkd: 128331.4062, d_vqgan: 145780.0312
	[[34m2025-05-01 04:03:29[0m] (Discriminator) discriminator_adv_loss: 0.4902, disc_weight: 0.5000, logits_real: 0.5195, logits_fake: 0.4746
	[[34m2025-05-01 04:03:29[0m] (step=0037000) Train Loss: 1.1321, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:04:56[0m] (Generator) rec_loss: 0.0735, perceptual_loss: 0.3418, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9208, generator_adv_loss: -0.0544, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3022, d_vqkd: 128324.4531, d_vqgan: 144657.3750
	[[34m2025-05-01 04:04:57[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: 0.1426, logits_fake: 0.1089
	[[34m2025-05-01 04:04:57[0m] (step=0037100) Train Loss: 1.1022, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:06:24[0m] (Generator) rec_loss: 0.0611, perceptual_loss: 0.3008, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9206, generator_adv_loss: 0.2041, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2795, d_vqkd: 129112.7656, d_vqgan: 145493.9375
	[[34m2025-05-01 04:06:24[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.4199, logits_fake: -0.4082
	[[34m2025-05-01 04:06:24[0m] (step=0037200) Train Loss: 1.1750, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:07:51[0m] (Generator) rec_loss: 0.0626, perceptual_loss: 0.2930, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9226, generator_adv_loss: -0.0767, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2892, d_vqkd: 128904.8594, d_vqgan: 145187.2500
	[[34m2025-05-01 04:07:52[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.1719, logits_fake: 0.1533
	[[34m2025-05-01 04:07:52[0m] (step=0037300) Train Loss: 1.1701, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:09:19[0m] (Generator) rec_loss: 0.0648, perceptual_loss: 0.2637, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9187, generator_adv_loss: -0.0684, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2635, d_vqkd: 128500.8984, d_vqgan: 145147.2500
	[[34m2025-05-01 04:09:19[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.1250, logits_fake: 0.1367
	[[34m2025-05-01 04:09:19[0m] (step=0037400) Train Loss: 1.0836, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:10:46[0m] (Generator) rec_loss: 0.0417, perceptual_loss: 0.2695, vq_loss: 0.0235, commit_loss: 0.0059, entropy_loss: 0.0000, codebook_usage: 0.9153, generator_adv_loss: 0.1943, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2510, d_vqkd: 127402.4141, d_vqgan: 144639.9375
	[[34m2025-05-01 04:10:47[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.3965, logits_fake: -0.3887
	[[34m2025-05-01 04:10:47[0m] (step=0037500) Train Loss: 1.1510, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:12:14[0m] (Generator) rec_loss: 0.0574, perceptual_loss: 0.2871, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9193, generator_adv_loss: -0.2930, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2881, d_vqkd: 128612.7812, d_vqgan: 145199.4375
	[[34m2025-05-01 04:12:14[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: 0.5977, logits_fake: 0.5859
	[[34m2025-05-01 04:12:14[0m] (step=0037600) Train Loss: 1.1686, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:13:41[0m] (Generator) rec_loss: 0.0656, perceptual_loss: 0.2910, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9212, generator_adv_loss: -0.1069, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2955, d_vqkd: 128579.7188, d_vqgan: 145178.2188
	[[34m2025-05-01 04:13:42[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: 0.2207, logits_fake: 0.2139
	[[34m2025-05-01 04:13:42[0m] (step=0037700) Train Loss: 1.0877, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:15:09[0m] (Generator) rec_loss: 0.0497, perceptual_loss: 0.2695, vq_loss: 0.0261, commit_loss: 0.0065, entropy_loss: 0.0000, codebook_usage: 0.9170, generator_adv_loss: 0.2412, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2430, d_vqkd: 128128.8438, d_vqgan: 145805.3906
	[[34m2025-05-01 04:15:09[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.5039, logits_fake: -0.4824
	[[34m2025-05-01 04:15:09[0m] (step=0037800) Train Loss: 1.1906, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:16:36[0m] (Generator) rec_loss: 0.0466, perceptual_loss: 0.2656, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: -0.2715, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2683, d_vqkd: 128472.2500, d_vqgan: 146283.9375
	[[34m2025-05-01 04:16:37[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.5195, logits_fake: 0.5430
	[[34m2025-05-01 04:16:37[0m] (step=0037900) Train Loss: 1.1724, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:18:03[0m] (Generator) rec_loss: 0.0547, perceptual_loss: 0.2578, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9174, generator_adv_loss: 0.1777, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2475, d_vqkd: 128916.4219, d_vqgan: 144899.2656
	[[34m2025-05-01 04:18:04[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.3359, logits_fake: -0.3555
	[[34m2025-05-01 04:18:04[0m] (step=0038000) Train Loss: 1.1423, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:19:31[0m] (Generator) rec_loss: 0.0616, perceptual_loss: 0.2754, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9186, generator_adv_loss: 0.0408, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2616, d_vqkd: 128663.8750, d_vqgan: 145140.3750
	[[34m2025-05-01 04:19:31[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.0684, logits_fake: -0.0815
	[[34m2025-05-01 04:19:31[0m] (step=0038100) Train Loss: 1.2295, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:20:58[0m] (Generator) rec_loss: 0.0587, perceptual_loss: 0.2852, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: -0.0649, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2739, d_vqkd: 128460.8984, d_vqgan: 145422.4375
	[[34m2025-05-01 04:20:59[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.1445, logits_fake: 0.1299
	[[34m2025-05-01 04:20:59[0m] (step=0038200) Train Loss: 1.0999, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:22:26[0m] (Generator) rec_loss: 0.0589, perceptual_loss: 0.2676, vq_loss: 0.0241, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: 0.2031, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2396, d_vqkd: 127935.9453, d_vqgan: 144334.1250
	[[34m2025-05-01 04:22:26[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.4023, logits_fake: -0.4062
	[[34m2025-05-01 04:22:26[0m] (step=0038300) Train Loss: 1.1733, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:23:53[0m] (Generator) rec_loss: 0.0683, perceptual_loss: 0.2930, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9167, generator_adv_loss: 0.1084, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2801, d_vqkd: 128977.2344, d_vqgan: 145382.7188
	[[34m2025-05-01 04:23:54[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: -0.2119, logits_fake: -0.2168
	[[34m2025-05-01 04:23:54[0m] (step=0038400) Train Loss: 1.1725, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:25:21[0m] (Generator) rec_loss: 0.0553, perceptual_loss: 0.2793, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: -0.2139, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2771, d_vqkd: 129020.3516, d_vqgan: 144795.0938
	[[34m2025-05-01 04:25:21[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.4102, logits_fake: 0.4277
	[[34m2025-05-01 04:25:21[0m] (step=0038500) Train Loss: 1.1288, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:26:48[0m] (Generator) rec_loss: 0.0870, perceptual_loss: 0.2910, vq_loss: 0.0260, commit_loss: 0.0065, entropy_loss: 0.0000, codebook_usage: 0.9178, generator_adv_loss: -0.0008, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2690, d_vqkd: 129585.1172, d_vqgan: 145646.7031
	[[34m2025-05-01 04:26:49[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.0256, logits_fake: 0.0015
	[[34m2025-05-01 04:26:49[0m] (step=0038600) Train Loss: 1.1158, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:28:16[0m] (Generator) rec_loss: 0.0686, perceptual_loss: 0.3047, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9168, generator_adv_loss: 0.2617, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2957, d_vqkd: 129024.1875, d_vqgan: 144997.1094
	[[34m2025-05-01 04:28:16[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.4922, logits_fake: -0.5234
	[[34m2025-05-01 04:28:16[0m] (step=0038700) Train Loss: 1.1793, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:29:43[0m] (Generator) rec_loss: 0.0580, perceptual_loss: 0.2910, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9145, generator_adv_loss: -0.1914, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2763, d_vqkd: 128597.2500, d_vqgan: 145265.1562
	[[34m2025-05-01 04:29:44[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.3984, logits_fake: 0.3828
	[[34m2025-05-01 04:29:44[0m] (step=0038800) Train Loss: 1.1764, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:31:11[0m] (Generator) rec_loss: 0.0629, perceptual_loss: 0.2676, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9164, generator_adv_loss: 0.0107, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2764, d_vqkd: 128806.1094, d_vqgan: 145153.5156
	[[34m2025-05-01 04:31:11[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.0072, logits_fake: -0.0215
	[[34m2025-05-01 04:31:11[0m] (step=0038900) Train Loss: 1.1111, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:32:38[0m] (Generator) rec_loss: 0.0601, perceptual_loss: 0.2832, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: 0.2578, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2760, d_vqkd: 128963.4297, d_vqgan: 144965.0781
	[[34m2025-05-01 04:32:39[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.5195, logits_fake: -0.5156
	[[34m2025-05-01 04:32:39[0m] (step=0039000) Train Loss: 1.2003, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:34:05[0m] (Generator) rec_loss: 0.0771, perceptual_loss: 0.2812, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9202, generator_adv_loss: -0.1777, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2782, d_vqkd: 128656.0312, d_vqgan: 144867.3594
	[[34m2025-05-01 04:34:06[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: 0.3867, logits_fake: 0.3555
	[[34m2025-05-01 04:34:06[0m] (step=0039100) Train Loss: 1.1733, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:35:33[0m] (Generator) rec_loss: 0.0638, perceptual_loss: 0.3145, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9180, generator_adv_loss: -0.0923, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3231, d_vqkd: 128642.2344, d_vqgan: 145340.4531
	[[34m2025-05-01 04:35:33[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.1836, logits_fake: 0.1846
	[[34m2025-05-01 04:35:33[0m] (step=0039200) Train Loss: 1.0733, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:37:00[0m] (Generator) rec_loss: 0.0537, perceptual_loss: 0.2656, vq_loss: 0.0257, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9157, generator_adv_loss: 0.2773, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2602, d_vqkd: 129183.1328, d_vqgan: 145095.9844
	[[34m2025-05-01 04:37:01[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.5820, logits_fake: -0.5547
	[[34m2025-05-01 04:37:01[0m] (step=0039300) Train Loss: 1.2028, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:38:28[0m] (Generator) rec_loss: 0.0724, perceptual_loss: 0.3477, vq_loss: 0.0241, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9187, generator_adv_loss: -0.2090, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3094, d_vqkd: 127502.7109, d_vqgan: 144708.3438
	[[34m2025-05-01 04:38:28[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: 0.4297, logits_fake: 0.4180
	[[34m2025-05-01 04:38:28[0m] (step=0039400) Train Loss: 1.1777, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:39:55[0m] (Generator) rec_loss: 0.0789, perceptual_loss: 0.2637, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9164, generator_adv_loss: -0.1152, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2968, d_vqkd: 128415.2344, d_vqgan: 144553.7812
	[[34m2025-05-01 04:39:56[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.2148, logits_fake: 0.2305
	[[34m2025-05-01 04:39:56[0m] (step=0039500) Train Loss: 1.0932, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:41:23[0m] (Generator) rec_loss: 0.0716, perceptual_loss: 0.2949, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9179, generator_adv_loss: 0.2891, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2867, d_vqkd: 127824.8906, d_vqgan: 145237.0469
	[[34m2025-05-01 04:41:23[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: -0.5703, logits_fake: -0.5781
	[[34m2025-05-01 04:41:23[0m] (step=0039600) Train Loss: 1.1558, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:42:50[0m] (Generator) rec_loss: 0.0951, perceptual_loss: 0.3105, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9203, generator_adv_loss: -0.0034, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2636, d_vqkd: 128183.4141, d_vqgan: 144757.5156
	[[34m2025-05-01 04:42:51[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.0222, logits_fake: 0.0068
	[[34m2025-05-01 04:42:51[0m] (step=0039700) Train Loss: 1.1925, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:44:18[0m] (Generator) rec_loss: 0.0585, perceptual_loss: 0.2930, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9189, generator_adv_loss: -0.1797, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2658, d_vqkd: 128762.3516, d_vqgan: 144510.6562
	[[34m2025-05-01 04:44:18[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.3594, logits_fake: 0.3594
	[[34m2025-05-01 04:44:18[0m] (step=0039800) Train Loss: 1.1093, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:45:45[0m] (Generator) rec_loss: 0.0470, perceptual_loss: 0.2676, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9174, generator_adv_loss: -0.1011, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2631, d_vqkd: 128767.8594, d_vqgan: 144470.5625
	[[34m2025-05-01 04:45:46[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.1855, logits_fake: 0.2021
	[[34m2025-05-01 04:45:46[0m] (step=0039900) Train Loss: 1.1537, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:47:13[0m] (Generator) rec_loss: 0.0716, perceptual_loss: 0.3418, vq_loss: 0.0238, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9176, generator_adv_loss: 0.2383, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3500, d_vqkd: 127903.7578, d_vqgan: 145392.0938
	[[34m2025-05-01 04:47:13[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.4473, logits_fake: -0.4766
	[[34m2025-05-01 04:47:13[0m] (step=0040000) Train Loss: 1.1237, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:47:16[0m] Saved checkpoint to ck_decoder_cnn/001-TokenFlow/checkpoints/0040000.pt
	[[34m2025-05-01 04:48:43[0m] (Generator) rec_loss: 0.0576, perceptual_loss: 0.2383, vq_loss: 0.0241, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9191, generator_adv_loss: 0.1592, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2657, d_vqkd: 128000.1484, d_vqgan: 144697.5469
	[[34m2025-05-01 04:48:43[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.3184, logits_fake: -0.3184
	[[34m2025-05-01 04:48:43[0m] (step=0040100) Train Loss: 1.1910, Train Steps/Sec: 1.11
	[[34m2025-05-01 04:50:10[0m] (Generator) rec_loss: 0.0485, perceptual_loss: 0.2676, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9179, generator_adv_loss: 0.1553, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2709, d_vqkd: 128851.7969, d_vqgan: 144289.1562
	[[34m2025-05-01 04:50:11[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.3438, logits_fake: -0.3105
	[[34m2025-05-01 04:50:11[0m] (step=0040200) Train Loss: 1.1492, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:51:38[0m] (Generator) rec_loss: 0.0579, perceptual_loss: 0.3008, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: -0.1377, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2834, d_vqkd: 129181.3594, d_vqgan: 145270.0156
	[[34m2025-05-01 04:51:38[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.2500, logits_fake: 0.2754
	[[34m2025-05-01 04:51:38[0m] (step=0040300) Train Loss: 1.1533, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:53:05[0m] (Generator) rec_loss: 0.0469, perceptual_loss: 0.2637, vq_loss: 0.0244, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9193, generator_adv_loss: -0.0383, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2590, d_vqkd: 128620.3125, d_vqgan: 144945.3750
	[[34m2025-05-01 04:53:06[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.0742, logits_fake: 0.0767
	[[34m2025-05-01 04:53:06[0m] (step=0040400) Train Loss: 1.1732, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:54:32[0m] (Generator) rec_loss: 0.0673, perceptual_loss: 0.2988, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: -0.0747, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2932, d_vqkd: 129062.8438, d_vqgan: 145039.5000
	[[34m2025-05-01 04:54:33[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: 0.1543, logits_fake: 0.1494
	[[34m2025-05-01 04:54:33[0m] (step=0040500) Train Loss: 1.1415, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:56:00[0m] (Generator) rec_loss: 0.0521, perceptual_loss: 0.2832, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9214, generator_adv_loss: 0.0825, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2783, d_vqkd: 128217.1406, d_vqgan: 145147.5312
	[[34m2025-05-01 04:56:00[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.1943, logits_fake: -0.1650
	[[34m2025-05-01 04:56:00[0m] (step=0040600) Train Loss: 1.2030, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:57:27[0m] (Generator) rec_loss: 0.0486, perceptual_loss: 0.2832, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9186, generator_adv_loss: -0.1436, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2737, d_vqkd: 129218.3281, d_vqgan: 144661.7656
	[[34m2025-05-01 04:57:28[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: 0.2969, logits_fake: 0.2871
	[[34m2025-05-01 04:57:28[0m] (step=0040700) Train Loss: 1.1583, Train Steps/Sec: 1.14
	[[34m2025-05-01 04:58:55[0m] (Generator) rec_loss: 0.0531, perceptual_loss: 0.2539, vq_loss: 0.0241, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9157, generator_adv_loss: 0.0359, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2513, d_vqkd: 128799.0234, d_vqgan: 144629.8125
	[[34m2025-05-01 04:58:55[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.0703, logits_fake: -0.0718
	[[34m2025-05-01 04:58:55[0m] (step=0040800) Train Loss: 1.1553, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:00:22[0m] (Generator) rec_loss: 0.0599, perceptual_loss: 0.2871, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9195, generator_adv_loss: 0.1118, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2612, d_vqkd: 129184.4375, d_vqgan: 144726.7812
	[[34m2025-05-01 05:00:23[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.2129, logits_fake: -0.2236
	[[34m2025-05-01 05:00:23[0m] (step=0040900) Train Loss: 1.1569, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:01:50[0m] (Generator) rec_loss: 0.0646, perceptual_loss: 0.2812, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9192, generator_adv_loss: -0.0289, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2613, d_vqkd: 128295.3828, d_vqgan: 144820.7656
	[[34m2025-05-01 05:01:50[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.0413, logits_fake: 0.0579
	[[34m2025-05-01 05:01:50[0m] (step=0041000) Train Loss: 1.1790, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:03:17[0m] (Generator) rec_loss: 0.0497, perceptual_loss: 0.2598, vq_loss: 0.0242, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9203, generator_adv_loss: 0.1621, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2677, d_vqkd: 127975.6250, d_vqgan: 145095.2812
	[[34m2025-05-01 05:03:18[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.3242, logits_fake: -0.3242
	[[34m2025-05-01 05:03:18[0m] (step=0041100) Train Loss: 1.1467, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:04:45[0m] (Generator) rec_loss: 0.0612, perceptual_loss: 0.2812, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9213, generator_adv_loss: 0.0211, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2620, d_vqkd: 128555.1562, d_vqgan: 144798.5781
	[[34m2025-05-01 05:04:45[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.0361, logits_fake: -0.0422
	[[34m2025-05-01 05:04:45[0m] (step=0041200) Train Loss: 1.1500, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:06:12[0m] (Generator) rec_loss: 0.0511, perceptual_loss: 0.2598, vq_loss: 0.0254, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9193, generator_adv_loss: 0.0625, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2404, d_vqkd: 128218.5781, d_vqgan: 145624.4219
	[[34m2025-05-01 05:06:13[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: -0.1016, logits_fake: -0.1250
	[[34m2025-05-01 05:06:13[0m] (step=0041300) Train Loss: 1.2070, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:07:39[0m] (Generator) rec_loss: 0.0658, perceptual_loss: 0.2734, vq_loss: 0.0244, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9159, generator_adv_loss: -0.0334, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2921, d_vqkd: 128497.0312, d_vqgan: 144066.6406
	[[34m2025-05-01 05:07:40[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.0645, logits_fake: 0.0669
	[[34m2025-05-01 05:07:40[0m] (step=0041400) Train Loss: 1.1150, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:09:07[0m] (Generator) rec_loss: 0.0721, perceptual_loss: 0.3301, vq_loss: 0.0264, commit_loss: 0.0066, entropy_loss: 0.0000, codebook_usage: 0.9180, generator_adv_loss: -0.0515, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3290, d_vqkd: 128377.4375, d_vqgan: 145728.6719
	[[34m2025-05-01 05:09:07[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: 0.1250, logits_fake: 0.1030
	[[34m2025-05-01 05:09:07[0m] (step=0041500) Train Loss: 1.1563, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:10:34[0m] (Generator) rec_loss: 0.0928, perceptual_loss: 0.3105, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: -0.0178, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2775, d_vqkd: 129086.2422, d_vqgan: 145597.2812
	[[34m2025-05-01 05:10:35[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.0236, logits_fake: 0.0356
	[[34m2025-05-01 05:10:35[0m] (step=0041600) Train Loss: 1.1423, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:12:02[0m] (Generator) rec_loss: 0.0651, perceptual_loss: 0.2832, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9220, generator_adv_loss: -0.1582, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2748, d_vqkd: 128897.9219, d_vqgan: 145079.6094
	[[34m2025-05-01 05:12:02[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.3008, logits_fake: 0.3164
	[[34m2025-05-01 05:12:02[0m] (step=0041700) Train Loss: 1.1806, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:13:29[0m] (Generator) rec_loss: 0.0589, perceptual_loss: 0.3125, vq_loss: 0.0257, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9168, generator_adv_loss: -0.0781, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2769, d_vqkd: 129036.0312, d_vqgan: 145523.9219
	[[34m2025-05-01 05:13:30[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.1514, logits_fake: 0.1562
	[[34m2025-05-01 05:13:30[0m] (step=0041800) Train Loss: 1.1693, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:14:57[0m] (Generator) rec_loss: 0.0779, perceptual_loss: 0.3125, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.0635, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2980, d_vqkd: 128933.9375, d_vqgan: 145973.7344
	[[34m2025-05-01 05:14:57[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.0952, logits_fake: -0.1270
	[[34m2025-05-01 05:14:57[0m] (step=0041900) Train Loss: 1.1757, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:16:24[0m] (Generator) rec_loss: 0.0644, perceptual_loss: 0.2734, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: 0.1074, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2627, d_vqkd: 128263.2188, d_vqgan: 145506.7656
	[[34m2025-05-01 05:16:25[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.2061, logits_fake: -0.2148
	[[34m2025-05-01 05:16:25[0m] (step=0042000) Train Loss: 1.1618, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:17:52[0m] (Generator) rec_loss: 0.0637, perceptual_loss: 0.2637, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: -0.0903, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2553, d_vqkd: 128545.1094, d_vqgan: 145563.7031
	[[34m2025-05-01 05:17:52[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.1807, logits_fake: 0.1807
	[[34m2025-05-01 05:17:52[0m] (step=0042100) Train Loss: 1.1557, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:19:19[0m] (Generator) rec_loss: 0.0380, perceptual_loss: 0.2266, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: -0.0520, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2822, d_vqkd: 128327.6953, d_vqgan: 145194.2031
	[[34m2025-05-01 05:19:20[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.0757, logits_fake: 0.1040
	[[34m2025-05-01 05:19:20[0m] (step=0042200) Train Loss: 1.1455, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:20:47[0m] (Generator) rec_loss: 0.0471, perceptual_loss: 0.2598, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9166, generator_adv_loss: 0.1196, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2499, d_vqkd: 128612.0703, d_vqgan: 144894.7344
	[[34m2025-05-01 05:20:47[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.2324, logits_fake: -0.2393
	[[34m2025-05-01 05:20:47[0m] (step=0042300) Train Loss: 1.1418, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:22:14[0m] (Generator) rec_loss: 0.0484, perceptual_loss: 0.2656, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9189, generator_adv_loss: 0.0669, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2703, d_vqkd: 128614.6406, d_vqgan: 145140.4688
	[[34m2025-05-01 05:22:15[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.1318, logits_fake: -0.1338
	[[34m2025-05-01 05:22:15[0m] (step=0042400) Train Loss: 1.1733, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:23:42[0m] (Generator) rec_loss: 0.0608, perceptual_loss: 0.2832, vq_loss: 0.0240, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9193, generator_adv_loss: -0.0061, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2563, d_vqkd: 127392.9844, d_vqgan: 144915.6562
	[[34m2025-05-01 05:23:42[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.0352, logits_fake: 0.0123
	[[34m2025-05-01 05:23:42[0m] (step=0042500) Train Loss: 1.1349, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:25:09[0m] (Generator) rec_loss: 0.0632, perceptual_loss: 0.3008, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9164, generator_adv_loss: -0.0297, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2995, d_vqkd: 129345.1875, d_vqgan: 144959.9688
	[[34m2025-05-01 05:25:10[0m] (Discriminator) discriminator_adv_loss: 0.5117, disc_weight: 0.5000, logits_real: 0.0150, logits_fake: 0.0593
	[[34m2025-05-01 05:25:10[0m] (step=0042600) Train Loss: 1.1534, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:26:37[0m] (Generator) rec_loss: 0.0542, perceptual_loss: 0.2695, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9180, generator_adv_loss: -0.1055, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2480, d_vqkd: 128236.0547, d_vqgan: 143826.5625
	[[34m2025-05-01 05:26:37[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.2021, logits_fake: 0.2109
	[[34m2025-05-01 05:26:37[0m] (step=0042700) Train Loss: 1.1823, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:28:04[0m] (Generator) rec_loss: 0.0645, perceptual_loss: 0.2793, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9171, generator_adv_loss: 0.1143, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2779, d_vqkd: 129365.0703, d_vqgan: 145820.2500
	[[34m2025-05-01 05:28:04[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.2080, logits_fake: -0.2285
	[[34m2025-05-01 05:28:04[0m] (step=0042800) Train Loss: 1.1191, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:29:31[0m] (Generator) rec_loss: 0.0530, perceptual_loss: 0.2793, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9178, generator_adv_loss: -0.0008, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2760, d_vqkd: 128584.8438, d_vqgan: 144730.2188
	[[34m2025-05-01 05:29:32[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.0128, logits_fake: 0.0015
	[[34m2025-05-01 05:29:32[0m] (step=0042900) Train Loss: 1.1445, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:30:59[0m] (Generator) rec_loss: 0.0544, perceptual_loss: 0.2656, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9159, generator_adv_loss: 0.0559, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2571, d_vqkd: 128364.5000, d_vqgan: 145044.3438
	[[34m2025-05-01 05:30:59[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.1118, logits_fake: -0.1118
	[[34m2025-05-01 05:30:59[0m] (step=0043000) Train Loss: 1.1505, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:32:26[0m] (Generator) rec_loss: 0.0641, perceptual_loss: 0.2637, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9192, generator_adv_loss: 0.0275, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2551, d_vqkd: 129096.3984, d_vqgan: 145623.2656
	[[34m2025-05-01 05:32:27[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.0630, logits_fake: -0.0549
	[[34m2025-05-01 05:32:27[0m] (step=0043100) Train Loss: 1.1184, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:33:54[0m] (Generator) rec_loss: 0.0477, perceptual_loss: 0.2598, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9186, generator_adv_loss: -0.0011, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2507, d_vqkd: 128259.9141, d_vqgan: 145076.5156
	[[34m2025-05-01 05:33:54[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.0034, logits_fake: 0.0023
	[[34m2025-05-01 05:33:54[0m] (step=0043200) Train Loss: 1.1535, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:35:21[0m] (Generator) rec_loss: 0.0524, perceptual_loss: 0.2988, vq_loss: 0.0254, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9178, generator_adv_loss: 0.0476, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2695, d_vqkd: 129040.9375, d_vqgan: 145100.1562
	[[34m2025-05-01 05:35:22[0m] (Discriminator) discriminator_adv_loss: 0.4883, disc_weight: 0.5000, logits_real: -0.0493, logits_fake: -0.0952
	[[34m2025-05-01 05:35:22[0m] (step=0043300) Train Loss: 1.1443, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:36:49[0m] (Generator) rec_loss: 0.0624, perceptual_loss: 0.2891, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9184, generator_adv_loss: -0.0184, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2627, d_vqkd: 128516.8594, d_vqgan: 145945.5625
	[[34m2025-05-01 05:36:49[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: 0.0457, logits_fake: 0.0369
	[[34m2025-05-01 05:36:49[0m] (step=0043400) Train Loss: 1.1289, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:38:16[0m] (Generator) rec_loss: 0.0513, perceptual_loss: 0.2578, vq_loss: 0.0241, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: 0.1108, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2490, d_vqkd: 128643.1094, d_vqgan: 144543.6719
	[[34m2025-05-01 05:38:17[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.2441, logits_fake: -0.2217
	[[34m2025-05-01 05:38:17[0m] (step=0043500) Train Loss: 1.1613, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:39:44[0m] (Generator) rec_loss: 0.0526, perceptual_loss: 0.2617, vq_loss: 0.0238, commit_loss: 0.0059, entropy_loss: 0.0000, codebook_usage: 0.9198, generator_adv_loss: 0.0374, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2775, d_vqkd: 127903.4688, d_vqgan: 144272.3281
	[[34m2025-05-01 05:39:44[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.0708, logits_fake: -0.0747
	[[34m2025-05-01 05:39:44[0m] (step=0043600) Train Loss: 1.1361, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:41:11[0m] (Generator) rec_loss: 0.0550, perceptual_loss: 0.2793, vq_loss: 0.0254, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: -0.0410, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2742, d_vqkd: 128276.3984, d_vqgan: 145711.5000
	[[34m2025-05-01 05:41:12[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.0554, logits_fake: 0.0820
	[[34m2025-05-01 05:41:12[0m] (step=0043700) Train Loss: 1.1222, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:42:23[0m] Beginning epoch 3...
	[[34m2025-05-01 05:42:39[0m] (Generator) rec_loss: 0.0654, perceptual_loss: 0.2930, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9208, generator_adv_loss: -0.0757, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2904, d_vqkd: 129031.8203, d_vqgan: 144927.8750
	[[34m2025-05-01 05:42:39[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.1494, logits_fake: 0.1514
	[[34m2025-05-01 05:42:39[0m] (step=0043800) Train Loss: 1.1423, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:44:06[0m] (Generator) rec_loss: 0.0677, perceptual_loss: 0.2617, vq_loss: 0.0254, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9174, generator_adv_loss: 0.0271, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2443, d_vqkd: 127968.3750, d_vqgan: 145387.2656
	[[34m2025-05-01 05:44:07[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.0693, logits_fake: -0.0542
	[[34m2025-05-01 05:44:07[0m] (step=0043900) Train Loss: 1.1682, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:45:34[0m] (Generator) rec_loss: 0.0989, perceptual_loss: 0.2832, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9186, generator_adv_loss: 0.0413, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2673, d_vqkd: 128196.2188, d_vqgan: 144727.9375
	[[34m2025-05-01 05:45:34[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.0884, logits_fake: -0.0825
	[[34m2025-05-01 05:45:34[0m] (step=0044000) Train Loss: 1.1354, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:47:01[0m] (Generator) rec_loss: 0.0455, perceptual_loss: 0.2852, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9180, generator_adv_loss: -0.0337, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2745, d_vqkd: 129285.4766, d_vqgan: 144108.4844
	[[34m2025-05-01 05:47:02[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.0474, logits_fake: 0.0674
	[[34m2025-05-01 05:47:02[0m] (step=0044100) Train Loss: 1.1228, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:48:29[0m] (Generator) rec_loss: 0.0664, perceptual_loss: 0.2852, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9179, generator_adv_loss: -0.0566, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2605, d_vqkd: 128389.2422, d_vqgan: 145720.2344
	[[34m2025-05-01 05:48:29[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.1338, logits_fake: 0.1133
	[[34m2025-05-01 05:48:29[0m] (step=0044200) Train Loss: 1.1481, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:49:56[0m] (Generator) rec_loss: 0.0831, perceptual_loss: 0.2715, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9201, generator_adv_loss: 0.1016, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2811, d_vqkd: 128166.0938, d_vqgan: 144439.7031
	[[34m2025-05-01 05:49:57[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.2051, logits_fake: -0.2031
	[[34m2025-05-01 05:49:57[0m] (step=0044300) Train Loss: 1.1913, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:51:24[0m] (Generator) rec_loss: 0.0735, perceptual_loss: 0.2852, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9204, generator_adv_loss: -0.1367, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2671, d_vqkd: 128913.2734, d_vqgan: 144757.1406
	[[34m2025-05-01 05:51:24[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: 0.2812, logits_fake: 0.2734
	[[34m2025-05-01 05:51:24[0m] (step=0044400) Train Loss: 1.1487, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:52:51[0m] (Generator) rec_loss: 0.0693, perceptual_loss: 0.3398, vq_loss: 0.0239, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9193, generator_adv_loss: 0.0811, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3274, d_vqkd: 127343.2656, d_vqgan: 145116.0469
	[[34m2025-05-01 05:52:52[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.1338, logits_fake: -0.1621
	[[34m2025-05-01 05:52:52[0m] (step=0044500) Train Loss: 1.1419, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:54:19[0m] (Generator) rec_loss: 0.0590, perceptual_loss: 0.2637, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9204, generator_adv_loss: -0.0347, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2453, d_vqkd: 129114.3906, d_vqgan: 145682.0000
	[[34m2025-05-01 05:54:19[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.0615, logits_fake: 0.0693
	[[34m2025-05-01 05:54:19[0m] (step=0044600) Train Loss: 1.1054, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:55:46[0m] (Generator) rec_loss: 0.0595, perceptual_loss: 0.2520, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9163, generator_adv_loss: -0.0718, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2483, d_vqkd: 128746.6719, d_vqgan: 145274.4531
	[[34m2025-05-01 05:55:47[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: 0.1484, logits_fake: 0.1436
	[[34m2025-05-01 05:55:47[0m] (step=0044700) Train Loss: 1.1154, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:57:13[0m] (Generator) rec_loss: 0.0580, perceptual_loss: 0.2930, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9205, generator_adv_loss: 0.0337, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2734, d_vqkd: 128998.1875, d_vqgan: 145325.6094
	[[34m2025-05-01 05:57:14[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.0874, logits_fake: -0.0674
	[[34m2025-05-01 05:57:14[0m] (step=0044800) Train Loss: 1.1539, Train Steps/Sec: 1.14
	[[34m2025-05-01 05:58:41[0m] (Generator) rec_loss: 0.0522, perceptual_loss: 0.2773, vq_loss: 0.0231, commit_loss: 0.0058, entropy_loss: 0.0000, codebook_usage: 0.9168, generator_adv_loss: 0.0430, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2764, d_vqkd: 126637.8281, d_vqgan: 144805.5781
	[[34m2025-05-01 05:58:41[0m] (Discriminator) discriminator_adv_loss: 0.4902, disc_weight: 0.5000, logits_real: -0.0481, logits_fake: -0.0859
	[[34m2025-05-01 05:58:41[0m] (step=0044900) Train Loss: 1.1344, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:00:08[0m] (Generator) rec_loss: 0.0632, perceptual_loss: 0.2539, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9194, generator_adv_loss: 0.1030, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2654, d_vqkd: 128285.6719, d_vqgan: 145417.5156
	[[34m2025-05-01 06:00:09[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.2334, logits_fake: -0.2061
	[[34m2025-05-01 06:00:09[0m] (step=0045000) Train Loss: 1.1578, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:01:36[0m] (Generator) rec_loss: 0.0604, perceptual_loss: 0.2891, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9170, generator_adv_loss: -0.0059, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2885, d_vqkd: 128670.6953, d_vqgan: 144996.7500
	[[34m2025-05-01 06:01:36[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.0118, logits_fake: 0.0118
	[[34m2025-05-01 06:01:36[0m] (step=0045100) Train Loss: 1.1600, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:03:03[0m] (Generator) rec_loss: 0.0631, perceptual_loss: 0.3125, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9180, generator_adv_loss: 0.0491, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2971, d_vqkd: 128891.9531, d_vqgan: 145125.6875
	[[34m2025-05-01 06:03:04[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.0981, logits_fake: -0.0981
	[[34m2025-05-01 06:03:04[0m] (step=0045200) Train Loss: 1.1294, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:04:31[0m] (Generator) rec_loss: 0.0560, perceptual_loss: 0.2812, vq_loss: 0.0244, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9174, generator_adv_loss: 0.1143, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2696, d_vqkd: 128490.2500, d_vqgan: 145267.2344
	[[34m2025-05-01 06:04:31[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.2314, logits_fake: -0.2285
	[[34m2025-05-01 06:04:31[0m] (step=0045300) Train Loss: 1.1662, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:05:58[0m] (Generator) rec_loss: 0.0685, perceptual_loss: 0.2891, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: 0.1226, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2820, d_vqkd: 128277.0469, d_vqgan: 145330.1562
	[[34m2025-05-01 06:05:59[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.2285, logits_fake: -0.2451
	[[34m2025-05-01 06:05:59[0m] (step=0045400) Train Loss: 1.1648, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:07:26[0m] (Generator) rec_loss: 0.0484, perceptual_loss: 0.2559, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9197, generator_adv_loss: -0.0942, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2960, d_vqkd: 128892.3828, d_vqgan: 144901.6094
	[[34m2025-05-01 06:07:26[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.1719, logits_fake: 0.1885
	[[34m2025-05-01 06:07:26[0m] (step=0045500) Train Loss: 1.1373, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:08:53[0m] (Generator) rec_loss: 0.0597, perceptual_loss: 0.2891, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.0884, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2650, d_vqkd: 128701.7969, d_vqgan: 145617.3281
	[[34m2025-05-01 06:08:54[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.1680, logits_fake: -0.1768
	[[34m2025-05-01 06:08:54[0m] (step=0045600) Train Loss: 1.1250, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:10:20[0m] (Generator) rec_loss: 0.0652, perceptual_loss: 0.2695, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9149, generator_adv_loss: 0.0620, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2774, d_vqkd: 128886.6641, d_vqgan: 144925.3281
	[[34m2025-05-01 06:10:21[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.0962, logits_fake: -0.1240
	[[34m2025-05-01 06:10:21[0m] (step=0045700) Train Loss: 1.1663, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:11:48[0m] (Generator) rec_loss: 0.0532, perceptual_loss: 0.2754, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9174, generator_adv_loss: -0.0752, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2756, d_vqkd: 128548.5625, d_vqgan: 145326.4844
	[[34m2025-05-01 06:11:48[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.1465, logits_fake: 0.1504
	[[34m2025-05-01 06:11:48[0m] (step=0045800) Train Loss: 1.1286, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:13:15[0m] (Generator) rec_loss: 0.0714, perceptual_loss: 0.2637, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: -0.0513, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2616, d_vqkd: 129309.4141, d_vqgan: 144883.0469
	[[34m2025-05-01 06:13:16[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.0762, logits_fake: 0.1025
	[[34m2025-05-01 06:13:16[0m] (step=0045900) Train Loss: 1.1428, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:14:43[0m] (Generator) rec_loss: 0.0504, perceptual_loss: 0.2676, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: -0.0908, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2719, d_vqkd: 127862.2188, d_vqgan: 144142.1406
	[[34m2025-05-01 06:14:43[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.1680, logits_fake: 0.1816
	[[34m2025-05-01 06:14:43[0m] (step=0046000) Train Loss: 1.1405, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:16:10[0m] (Generator) rec_loss: 0.0738, perceptual_loss: 0.3066, vq_loss: 0.0240, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9147, generator_adv_loss: 0.1289, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2931, d_vqkd: 127971.1562, d_vqgan: 145712.3438
	[[34m2025-05-01 06:16:11[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: -0.2305, logits_fake: -0.2578
	[[34m2025-05-01 06:16:11[0m] (step=0046100) Train Loss: 1.1202, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:17:38[0m] (Generator) rec_loss: 0.0523, perceptual_loss: 0.2773, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.1152, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2707, d_vqkd: 128463.0938, d_vqgan: 145940.6719
	[[34m2025-05-01 06:17:38[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.2207, logits_fake: -0.2305
	[[34m2025-05-01 06:17:38[0m] (step=0046200) Train Loss: 1.1444, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:19:05[0m] (Generator) rec_loss: 0.0635, perceptual_loss: 0.2793, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9189, generator_adv_loss: -0.0125, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2709, d_vqkd: 129170.3594, d_vqgan: 145148.1094
	[[34m2025-05-01 06:19:06[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.0267, logits_fake: 0.0249
	[[34m2025-05-01 06:19:06[0m] (step=0046300) Train Loss: 1.1228, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:20:33[0m] (Generator) rec_loss: 0.0432, perceptual_loss: 0.2520, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: 0.0879, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2655, d_vqkd: 128815.8594, d_vqgan: 144135.7812
	[[34m2025-05-01 06:20:33[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.1768, logits_fake: -0.1758
	[[34m2025-05-01 06:20:33[0m] (step=0046400) Train Loss: 1.1340, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:22:00[0m] (Generator) rec_loss: 0.0704, perceptual_loss: 0.2734, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9164, generator_adv_loss: 0.1064, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2864, d_vqkd: 127797.9141, d_vqgan: 145142.7969
	[[34m2025-05-01 06:22:01[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.2441, logits_fake: -0.2129
	[[34m2025-05-01 06:22:01[0m] (step=0046500) Train Loss: 1.1796, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:23:28[0m] (Generator) rec_loss: 0.0553, perceptual_loss: 0.3008, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9188, generator_adv_loss: -0.0615, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2920, d_vqkd: 128487.2500, d_vqgan: 145106.6094
	[[34m2025-05-01 06:23:28[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.1387, logits_fake: 0.1230
	[[34m2025-05-01 06:23:28[0m] (step=0046600) Train Loss: 1.1474, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:24:55[0m] (Generator) rec_loss: 0.0460, perceptual_loss: 0.2715, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: -0.0253, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2370, d_vqkd: 127918.7656, d_vqgan: 145074.8438
	[[34m2025-05-01 06:24:56[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.0513, logits_fake: 0.0505
	[[34m2025-05-01 06:24:56[0m] (step=0046700) Train Loss: 1.1357, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:26:23[0m] (Generator) rec_loss: 0.0467, perceptual_loss: 0.2617, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9186, generator_adv_loss: 0.0574, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2676, d_vqkd: 128250.9531, d_vqgan: 145547.5312
	[[34m2025-05-01 06:26:23[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.0889, logits_fake: -0.1147
	[[34m2025-05-01 06:26:23[0m] (step=0046800) Train Loss: 1.1659, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:27:50[0m] (Generator) rec_loss: 0.0422, perceptual_loss: 0.2373, vq_loss: 0.0244, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9203, generator_adv_loss: 0.1650, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2365, d_vqkd: 128287.0312, d_vqgan: 144863.2500
	[[34m2025-05-01 06:27:51[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.3613, logits_fake: -0.3301
	[[34m2025-05-01 06:27:51[0m] (step=0046900) Train Loss: 1.1195, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:29:18[0m] (Generator) rec_loss: 0.0540, perceptual_loss: 0.2793, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: 0.0371, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2957, d_vqkd: 128851.3516, d_vqgan: 144957.6094
	[[34m2025-05-01 06:29:18[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.0728, logits_fake: -0.0742
	[[34m2025-05-01 06:29:18[0m] (step=0047000) Train Loss: 1.1588, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:30:45[0m] (Generator) rec_loss: 0.0470, perceptual_loss: 0.2598, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: 0.1367, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2609, d_vqkd: 128149.1250, d_vqgan: 144626.2031
	[[34m2025-05-01 06:30:46[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: -0.2471, logits_fake: -0.2734
	[[34m2025-05-01 06:30:46[0m] (step=0047100) Train Loss: 1.1191, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:32:13[0m] (Generator) rec_loss: 0.0416, perceptual_loss: 0.2559, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9207, generator_adv_loss: -0.0811, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2496, d_vqkd: 128744.0938, d_vqgan: 145115.8438
	[[34m2025-05-01 06:32:13[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.1592, logits_fake: 0.1621
	[[34m2025-05-01 06:32:13[0m] (step=0047200) Train Loss: 1.1261, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:33:40[0m] (Generator) rec_loss: 0.0517, perceptual_loss: 0.2598, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9184, generator_adv_loss: 0.0378, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2612, d_vqkd: 128499.1094, d_vqgan: 145449.0781
	[[34m2025-05-01 06:33:41[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.0767, logits_fake: -0.0757
	[[34m2025-05-01 06:33:41[0m] (step=0047300) Train Loss: 1.1232, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:35:08[0m] (Generator) rec_loss: 0.0620, perceptual_loss: 0.2773, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9199, generator_adv_loss: -0.1611, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2689, d_vqkd: 128190.1797, d_vqgan: 144790.4375
	[[34m2025-05-01 06:35:08[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.3086, logits_fake: 0.3223
	[[34m2025-05-01 06:35:08[0m] (step=0047400) Train Loss: 1.1556, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:36:35[0m] (Generator) rec_loss: 0.0525, perceptual_loss: 0.2832, vq_loss: 0.0254, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9198, generator_adv_loss: -0.1465, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2632, d_vqkd: 128593.5156, d_vqgan: 145077.4062
	[[34m2025-05-01 06:36:36[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.2871, logits_fake: 0.2930
	[[34m2025-05-01 06:36:36[0m] (step=0047500) Train Loss: 1.1514, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:38:03[0m] (Generator) rec_loss: 0.0566, perceptual_loss: 0.2969, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9146, generator_adv_loss: -0.1621, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2764, d_vqkd: 128273.7969, d_vqgan: 144377.2812
	[[34m2025-05-01 06:38:03[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.2871, logits_fake: 0.3242
	[[34m2025-05-01 06:38:03[0m] (step=0047600) Train Loss: 1.1688, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:39:30[0m] (Generator) rec_loss: 0.0547, perceptual_loss: 0.2715, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9198, generator_adv_loss: -0.0189, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2547, d_vqkd: 128126.2188, d_vqgan: 145092.7344
	[[34m2025-05-01 06:39:31[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: 0.0488, logits_fake: 0.0378
	[[34m2025-05-01 06:39:31[0m] (step=0047700) Train Loss: 1.1291, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:40:58[0m] (Generator) rec_loss: 0.0607, perceptual_loss: 0.2891, vq_loss: 0.0258, commit_loss: 0.0065, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: -0.1226, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2755, d_vqkd: 128694.0938, d_vqgan: 145885.0156
	[[34m2025-05-01 06:40:58[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: 0.2656, logits_fake: 0.2451
	[[34m2025-05-01 06:40:58[0m] (step=0047800) Train Loss: 1.1372, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:42:25[0m] (Generator) rec_loss: 0.0665, perceptual_loss: 0.2871, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9199, generator_adv_loss: 0.1035, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2653, d_vqkd: 129233.2969, d_vqgan: 144858.5625
	[[34m2025-05-01 06:42:26[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.2334, logits_fake: -0.2070
	[[34m2025-05-01 06:42:26[0m] (step=0047900) Train Loss: 1.1455, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:43:53[0m] (Generator) rec_loss: 0.0397, perceptual_loss: 0.2373, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: -0.0032, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2500, d_vqkd: 128314.7109, d_vqgan: 145258.1094
	[[34m2025-05-01 06:43:53[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.0099, logits_fake: 0.0063
	[[34m2025-05-01 06:43:53[0m] (step=0048000) Train Loss: 1.1619, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:43:55[0m] Saved checkpoint to ck_decoder_cnn/001-TokenFlow/checkpoints/0048000.pt
	[[34m2025-05-01 06:45:22[0m] (Generator) rec_loss: 0.1009, perceptual_loss: 0.3086, vq_loss: 0.0229, commit_loss: 0.0057, entropy_loss: 0.0000, codebook_usage: 0.9187, generator_adv_loss: -0.0311, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3197, d_vqkd: 127692.1719, d_vqgan: 145393.2500
	[[34m2025-05-01 06:45:23[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.0359, logits_fake: 0.0623
	[[34m2025-05-01 06:45:23[0m] (step=0048100) Train Loss: 1.1220, Train Steps/Sec: 1.11
	[[34m2025-05-01 06:46:50[0m] (Generator) rec_loss: 0.0509, perceptual_loss: 0.2637, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9171, generator_adv_loss: -0.2295, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2753, d_vqkd: 128233.0625, d_vqgan: 145633.3906
	[[34m2025-05-01 06:46:50[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.4492, logits_fake: 0.4590
	[[34m2025-05-01 06:46:50[0m] (step=0048200) Train Loss: 1.1372, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:48:17[0m] (Generator) rec_loss: 0.0625, perceptual_loss: 0.2734, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9154, generator_adv_loss: 0.1924, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2642, d_vqkd: 128662.3125, d_vqgan: 145524.5781
	[[34m2025-05-01 06:48:18[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.3555, logits_fake: -0.3848
	[[34m2025-05-01 06:48:18[0m] (step=0048300) Train Loss: 1.1453, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:49:45[0m] (Generator) rec_loss: 0.0628, perceptual_loss: 0.2715, vq_loss: 0.0258, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9199, generator_adv_loss: 0.0091, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2667, d_vqkd: 129354.3672, d_vqgan: 145646.1562
	[[34m2025-05-01 06:49:46[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.0017, logits_fake: -0.0182
	[[34m2025-05-01 06:49:46[0m] (step=0048400) Train Loss: 1.1441, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:51:13[0m] (Generator) rec_loss: 0.0750, perceptual_loss: 0.2480, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9179, generator_adv_loss: -0.0488, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2572, d_vqkd: 128057.7734, d_vqgan: 144806.3750
	[[34m2025-05-01 06:51:13[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: 0.1582, logits_fake: 0.0977
	[[34m2025-05-01 06:51:13[0m] (step=0048500) Train Loss: 1.1315, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:52:40[0m] (Generator) rec_loss: 0.0654, perceptual_loss: 0.2559, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9201, generator_adv_loss: -0.1885, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2702, d_vqkd: 128482.8906, d_vqgan: 145414.6094
	[[34m2025-05-01 06:52:41[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.3438, logits_fake: 0.3770
	[[34m2025-05-01 06:52:41[0m] (step=0048600) Train Loss: 1.1437, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:54:08[0m] (Generator) rec_loss: 0.0534, perceptual_loss: 0.2715, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9199, generator_adv_loss: 0.0369, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2771, d_vqkd: 129091.6016, d_vqgan: 145509.3125
	[[34m2025-05-01 06:54:08[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.0947, logits_fake: -0.0737
	[[34m2025-05-01 06:54:08[0m] (step=0048700) Train Loss: 1.1380, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:55:35[0m] (Generator) rec_loss: 0.0544, perceptual_loss: 0.2812, vq_loss: 0.0254, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9216, generator_adv_loss: 0.1689, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2677, d_vqkd: 127797.7031, d_vqgan: 144668.4062
	[[34m2025-05-01 06:55:36[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.3457, logits_fake: -0.3379
	[[34m2025-05-01 06:55:36[0m] (step=0048800) Train Loss: 1.1809, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:57:03[0m] (Generator) rec_loss: 0.0479, perceptual_loss: 0.2598, vq_loss: 0.0234, commit_loss: 0.0058, entropy_loss: 0.0000, codebook_usage: 0.9215, generator_adv_loss: -0.0339, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2499, d_vqkd: 128166.2578, d_vqgan: 144643.7812
	[[34m2025-05-01 06:57:03[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.0442, logits_fake: 0.0679
	[[34m2025-05-01 06:57:03[0m] (step=0048900) Train Loss: 1.1338, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:58:30[0m] (Generator) rec_loss: 0.0505, perceptual_loss: 0.2559, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9169, generator_adv_loss: 0.0908, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2432, d_vqkd: 128619.8594, d_vqgan: 144933.1875
	[[34m2025-05-01 06:58:31[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: -0.1729, logits_fake: -0.1816
	[[34m2025-05-01 06:58:31[0m] (step=0049000) Train Loss: 1.1237, Train Steps/Sec: 1.14
	[[34m2025-05-01 06:59:58[0m] (Generator) rec_loss: 0.0656, perceptual_loss: 0.3066, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.0540, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2934, d_vqkd: 128487.1562, d_vqgan: 145479.4375
	[[34m2025-05-01 06:59:58[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.0776, logits_fake: -0.1079
	[[34m2025-05-01 06:59:58[0m] (step=0049100) Train Loss: 1.1634, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:01:25[0m] (Generator) rec_loss: 0.0593, perceptual_loss: 0.3008, vq_loss: 0.0258, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9180, generator_adv_loss: -0.0291, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2995, d_vqkd: 128791.4766, d_vqgan: 145226.6719
	[[34m2025-05-01 07:01:26[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.0762, logits_fake: 0.0581
	[[34m2025-05-01 07:01:26[0m] (step=0049200) Train Loss: 1.1206, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:02:53[0m] (Generator) rec_loss: 0.0506, perceptual_loss: 0.2754, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9187, generator_adv_loss: 0.1748, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2629, d_vqkd: 128897.0938, d_vqgan: 144738.8125
	[[34m2025-05-01 07:02:53[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.3398, logits_fake: -0.3496
	[[34m2025-05-01 07:02:53[0m] (step=0049300) Train Loss: 1.1696, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:04:20[0m] (Generator) rec_loss: 0.0673, perceptual_loss: 0.2832, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9174, generator_adv_loss: -0.1162, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2679, d_vqkd: 128517.0469, d_vqgan: 144575.8906
	[[34m2025-05-01 07:04:21[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.2676, logits_fake: 0.2324
	[[34m2025-05-01 07:04:21[0m] (step=0049400) Train Loss: 1.1385, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:05:48[0m] (Generator) rec_loss: 0.0502, perceptual_loss: 0.2656, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: -0.0298, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2746, d_vqkd: 129580.3750, d_vqgan: 144814.4062
	[[34m2025-05-01 07:05:48[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.0549, logits_fake: 0.0596
	[[34m2025-05-01 07:05:48[0m] (step=0049500) Train Loss: 1.1691, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:07:15[0m] (Generator) rec_loss: 0.0623, perceptual_loss: 0.2871, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9179, generator_adv_loss: 0.0237, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2939, d_vqkd: 128590.7500, d_vqgan: 145402.6094
	[[34m2025-05-01 07:07:16[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: -0.0203, logits_fake: -0.0474
	[[34m2025-05-01 07:07:16[0m] (step=0049600) Train Loss: 1.1351, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:08:43[0m] (Generator) rec_loss: 0.0532, perceptual_loss: 0.2832, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9184, generator_adv_loss: 0.0410, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2565, d_vqkd: 129706.1484, d_vqgan: 144807.8125
	[[34m2025-05-01 07:08:43[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.0898, logits_fake: -0.0820
	[[34m2025-05-01 07:08:43[0m] (step=0049700) Train Loss: 1.1243, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:10:10[0m] (Generator) rec_loss: 0.0594, perceptual_loss: 0.2930, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9190, generator_adv_loss: -0.0245, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2784, d_vqkd: 128539.3672, d_vqgan: 145567.3125
	[[34m2025-05-01 07:10:11[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: 0.0728, logits_fake: 0.0491
	[[34m2025-05-01 07:10:11[0m] (step=0049800) Train Loss: 1.1520, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:11:38[0m] (Generator) rec_loss: 0.0585, perceptual_loss: 0.2656, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: 0.0977, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2809, d_vqkd: 128664.9062, d_vqgan: 145370.7500
	[[34m2025-05-01 07:11:38[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.2148, logits_fake: -0.1953
	[[34m2025-05-01 07:11:38[0m] (step=0049900) Train Loss: 1.1283, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:13:05[0m] (Generator) rec_loss: 0.0479, perceptual_loss: 0.2617, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: -0.0063, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2536, d_vqkd: 128507.7188, d_vqgan: 145139.2031
	[[34m2025-05-01 07:13:06[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.0337, logits_fake: 0.0126
	[[34m2025-05-01 07:13:06[0m] (step=0050000) Train Loss: 1.1252, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:14:33[0m] (Generator) rec_loss: 0.0454, perceptual_loss: 0.2812, vq_loss: 0.0259, commit_loss: 0.0065, entropy_loss: 0.0000, codebook_usage: 0.9170, generator_adv_loss: 0.0845, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2592, d_vqkd: 128963.3672, d_vqgan: 145530.2031
	[[34m2025-05-01 07:14:33[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.1680, logits_fake: -0.1689
	[[34m2025-05-01 07:14:33[0m] (step=0050100) Train Loss: 1.1463, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:16:00[0m] (Generator) rec_loss: 0.0849, perceptual_loss: 0.3516, vq_loss: 0.0244, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: 0.0796, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3367, d_vqkd: 127378.6562, d_vqgan: 145344.8750
	[[34m2025-05-01 07:16:01[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.1387, logits_fake: -0.1592
	[[34m2025-05-01 07:16:01[0m] (step=0050200) Train Loss: 1.1551, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:17:28[0m] (Generator) rec_loss: 0.0431, perceptual_loss: 0.2500, vq_loss: 0.0254, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9198, generator_adv_loss: -0.0500, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2599, d_vqkd: 128335.0078, d_vqgan: 144863.0938
	[[34m2025-05-01 07:17:28[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.0850, logits_fake: 0.1001
	[[34m2025-05-01 07:17:28[0m] (step=0050300) Train Loss: 1.1468, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:18:55[0m] (Generator) rec_loss: 0.0573, perceptual_loss: 0.2676, vq_loss: 0.0254, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: 0.1875, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2835, d_vqkd: 129012.0469, d_vqgan: 145075.2344
	[[34m2025-05-01 07:18:56[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.3730, logits_fake: -0.3750
	[[34m2025-05-01 07:18:56[0m] (step=0050400) Train Loss: 1.1264, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:20:23[0m] (Generator) rec_loss: 0.0535, perceptual_loss: 0.2451, vq_loss: 0.0244, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9196, generator_adv_loss: -0.1221, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2386, d_vqkd: 128222.8750, d_vqgan: 144906.7031
	[[34m2025-05-01 07:20:23[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.2236, logits_fake: 0.2441
	[[34m2025-05-01 07:20:23[0m] (step=0050500) Train Loss: 1.1094, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:21:50[0m] (Generator) rec_loss: 0.0585, perceptual_loss: 0.2695, vq_loss: 0.0259, commit_loss: 0.0065, entropy_loss: 0.0000, codebook_usage: 0.9153, generator_adv_loss: -0.0938, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2530, d_vqkd: 128642.2969, d_vqgan: 145766.5312
	[[34m2025-05-01 07:21:51[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.1924, logits_fake: 0.1875
	[[34m2025-05-01 07:21:51[0m] (step=0050600) Train Loss: 1.1293, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:23:18[0m] (Generator) rec_loss: 0.0424, perceptual_loss: 0.2715, vq_loss: 0.0244, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: -0.0437, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2857, d_vqkd: 128698.6797, d_vqgan: 145188.0000
	[[34m2025-05-01 07:23:18[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.1001, logits_fake: 0.0874
	[[34m2025-05-01 07:23:18[0m] (step=0050700) Train Loss: 1.1251, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:24:45[0m] (Generator) rec_loss: 0.0636, perceptual_loss: 0.3047, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9171, generator_adv_loss: 0.1055, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2971, d_vqkd: 128139.6641, d_vqgan: 145310.4688
	[[34m2025-05-01 07:24:46[0m] (Discriminator) discriminator_adv_loss: 0.4863, disc_weight: 0.5000, logits_real: -0.1602, logits_fake: -0.2109
	[[34m2025-05-01 07:24:46[0m] (step=0050800) Train Loss: 1.1578, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:26:13[0m] (Generator) rec_loss: 0.0503, perceptual_loss: 0.3008, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: 0.0613, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2677, d_vqkd: 129089.5859, d_vqgan: 144834.2500
	[[34m2025-05-01 07:26:13[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.1250, logits_fake: -0.1226
	[[34m2025-05-01 07:26:13[0m] (step=0050900) Train Loss: 1.1118, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:27:40[0m] (Generator) rec_loss: 0.0619, perceptual_loss: 0.2676, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9187, generator_adv_loss: -0.0119, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2624, d_vqkd: 128670.5312, d_vqgan: 145115.5156
	[[34m2025-05-01 07:27:41[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.0449, logits_fake: 0.0238
	[[34m2025-05-01 07:27:41[0m] (step=0051000) Train Loss: 1.1266, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:29:08[0m] (Generator) rec_loss: 0.0732, perceptual_loss: 0.2812, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9176, generator_adv_loss: -0.0118, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2777, d_vqkd: 128651.5312, d_vqgan: 144999.0938
	[[34m2025-05-01 07:29:09[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: 0.0330, logits_fake: 0.0237
	[[34m2025-05-01 07:29:09[0m] (step=0051100) Train Loss: 1.1447, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:30:36[0m] (Generator) rec_loss: 0.0463, perceptual_loss: 0.2559, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9191, generator_adv_loss: -0.0801, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2137, d_vqkd: 127852.0234, d_vqgan: 145549.6406
	[[34m2025-05-01 07:30:36[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.1260, logits_fake: 0.1602
	[[34m2025-05-01 07:30:36[0m] (step=0051200) Train Loss: 1.1294, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:32:03[0m] (Generator) rec_loss: 0.0389, perceptual_loss: 0.2598, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9193, generator_adv_loss: 0.0386, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2754, d_vqkd: 128938.5312, d_vqgan: 144157.5938
	[[34m2025-05-01 07:32:04[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.0654, logits_fake: -0.0771
	[[34m2025-05-01 07:32:04[0m] (step=0051300) Train Loss: 1.1566, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:33:31[0m] (Generator) rec_loss: 0.0535, perceptual_loss: 0.2812, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9179, generator_adv_loss: -0.1177, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2452, d_vqkd: 129329.2188, d_vqgan: 144976.6250
	[[34m2025-05-01 07:33:31[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.2500, logits_fake: 0.2354
	[[34m2025-05-01 07:33:31[0m] (step=0051400) Train Loss: 1.0922, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:34:58[0m] (Generator) rec_loss: 0.0449, perceptual_loss: 0.2432, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9168, generator_adv_loss: 0.1187, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2385, d_vqkd: 129036.3750, d_vqgan: 144530.8281
	[[34m2025-05-01 07:34:59[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.2422, logits_fake: -0.2373
	[[34m2025-05-01 07:34:59[0m] (step=0051500) Train Loss: 1.1322, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:36:26[0m] (Generator) rec_loss: 0.0690, perceptual_loss: 0.2734, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: 0.0444, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2852, d_vqkd: 127974.3594, d_vqgan: 144748.0469
	[[34m2025-05-01 07:36:26[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.0820, logits_fake: -0.0889
	[[34m2025-05-01 07:36:26[0m] (step=0051600) Train Loss: 1.1025, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:37:53[0m] (Generator) rec_loss: 0.0624, perceptual_loss: 0.3047, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9184, generator_adv_loss: 0.1514, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2796, d_vqkd: 128544.8750, d_vqgan: 145227.3281
	[[34m2025-05-01 07:37:54[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.2695, logits_fake: -0.3027
	[[34m2025-05-01 07:37:54[0m] (step=0051700) Train Loss: 1.1326, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:39:21[0m] (Generator) rec_loss: 0.0657, perceptual_loss: 0.2949, vq_loss: 0.0237, commit_loss: 0.0059, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.0659, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2682, d_vqkd: 126709.6328, d_vqgan: 144586.2969
	[[34m2025-05-01 07:39:21[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: -0.1079, logits_fake: -0.1318
	[[34m2025-05-01 07:39:21[0m] (step=0051800) Train Loss: 1.1563, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:40:48[0m] (Generator) rec_loss: 0.0596, perceptual_loss: 0.2910, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9192, generator_adv_loss: -0.0698, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2763, d_vqkd: 128228.6875, d_vqgan: 145064.9688
	[[34m2025-05-01 07:40:49[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.1514, logits_fake: 0.1396
	[[34m2025-05-01 07:40:49[0m] (step=0051900) Train Loss: 1.1629, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:42:16[0m] (Generator) rec_loss: 0.0677, perceptual_loss: 0.2930, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9186, generator_adv_loss: 0.0596, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2478, d_vqkd: 128801.9922, d_vqgan: 145109.6094
	[[34m2025-05-01 07:42:16[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: -0.0967, logits_fake: -0.1191
	[[34m2025-05-01 07:42:16[0m] (step=0052000) Train Loss: 1.1232, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:43:43[0m] (Generator) rec_loss: 0.0470, perceptual_loss: 0.2754, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: -0.0598, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2445, d_vqkd: 128454.3594, d_vqgan: 144864.3281
	[[34m2025-05-01 07:43:44[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.1289, logits_fake: 0.1196
	[[34m2025-05-01 07:43:44[0m] (step=0052100) Train Loss: 1.1298, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:45:11[0m] (Generator) rec_loss: 0.0993, perceptual_loss: 0.2832, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9224, generator_adv_loss: 0.0471, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2828, d_vqkd: 128243.7656, d_vqgan: 145447.2500
	[[34m2025-05-01 07:45:11[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.0596, logits_fake: -0.0942
	[[34m2025-05-01 07:45:11[0m] (step=0052200) Train Loss: 1.1470, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:46:39[0m] (Generator) rec_loss: 0.0532, perceptual_loss: 0.2656, vq_loss: 0.0232, commit_loss: 0.0058, entropy_loss: 0.0000, codebook_usage: 0.9167, generator_adv_loss: 0.0815, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2620, d_vqkd: 126902.6406, d_vqgan: 144549.9375
	[[34m2025-05-01 07:46:39[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: -0.1367, logits_fake: -0.1631
	[[34m2025-05-01 07:46:39[0m] (step=0052300) Train Loss: 1.1523, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:48:06[0m] (Generator) rec_loss: 0.0609, perceptual_loss: 0.2637, vq_loss: 0.0238, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9164, generator_adv_loss: -0.0986, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2434, d_vqkd: 127403.2891, d_vqgan: 144213.6875
	[[34m2025-05-01 07:48:07[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.1895, logits_fake: 0.1973
	[[34m2025-05-01 07:48:07[0m] (step=0052400) Train Loss: 1.1359, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:49:34[0m] (Generator) rec_loss: 0.0550, perceptual_loss: 0.2793, vq_loss: 0.0237, commit_loss: 0.0059, entropy_loss: 0.0000, codebook_usage: 0.9187, generator_adv_loss: -0.0586, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2759, d_vqkd: 127007.9141, d_vqgan: 144481.5938
	[[34m2025-05-01 07:49:34[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: 0.1465, logits_fake: 0.1172
	[[34m2025-05-01 07:49:34[0m] (step=0052500) Train Loss: 1.1312, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:51:01[0m] (Generator) rec_loss: 0.0624, perceptual_loss: 0.2656, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9176, generator_adv_loss: 0.0708, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2497, d_vqkd: 128825.9062, d_vqgan: 144716.9688
	[[34m2025-05-01 07:51:02[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.1514, logits_fake: -0.1416
	[[34m2025-05-01 07:51:02[0m] (step=0052600) Train Loss: 1.1276, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:52:29[0m] (Generator) rec_loss: 0.0700, perceptual_loss: 0.2734, vq_loss: 0.0254, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: -0.0552, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2632, d_vqkd: 129295.6328, d_vqgan: 145077.3281
	[[34m2025-05-01 07:52:29[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: 0.1387, logits_fake: 0.1104
	[[34m2025-05-01 07:52:29[0m] (step=0052700) Train Loss: 1.1207, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:53:56[0m] (Generator) rec_loss: 0.0553, perceptual_loss: 0.2451, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: 0.0371, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2783, d_vqkd: 128561.0156, d_vqgan: 145360.6562
	[[34m2025-05-01 07:53:57[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.0698, logits_fake: -0.0742
	[[34m2025-05-01 07:53:57[0m] (step=0052800) Train Loss: 1.1562, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:55:24[0m] (Generator) rec_loss: 0.0535, perceptual_loss: 0.2715, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.0079, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2630, d_vqkd: 128588.3750, d_vqgan: 145093.4375
	[[34m2025-05-01 07:55:24[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.0037, logits_fake: -0.0157
	[[34m2025-05-01 07:55:24[0m] (step=0052900) Train Loss: 1.1307, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:56:51[0m] (Generator) rec_loss: 0.1199, perceptual_loss: 0.3125, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9171, generator_adv_loss: -0.0289, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3117, d_vqkd: 128607.8438, d_vqgan: 144918.4844
	[[34m2025-05-01 07:56:52[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.0220, logits_fake: 0.0579
	[[34m2025-05-01 07:56:52[0m] (step=0053000) Train Loss: 1.1075, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:58:19[0m] (Generator) rec_loss: 0.0668, perceptual_loss: 0.2773, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9214, generator_adv_loss: 0.0258, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2489, d_vqkd: 128619.3125, d_vqgan: 145133.9531
	[[34m2025-05-01 07:58:19[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.0457, logits_fake: -0.0515
	[[34m2025-05-01 07:58:19[0m] (step=0053100) Train Loss: 1.1634, Train Steps/Sec: 1.14
	[[34m2025-05-01 07:59:46[0m] (Generator) rec_loss: 0.0818, perceptual_loss: 0.2715, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9190, generator_adv_loss: -0.0679, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2443, d_vqkd: 129107.9375, d_vqgan: 144336.1250
	[[34m2025-05-01 07:59:47[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.1299, logits_fake: 0.1357
	[[34m2025-05-01 07:59:47[0m] (step=0053200) Train Loss: 1.1352, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:01:14[0m] (Generator) rec_loss: 0.0777, perceptual_loss: 0.3555, vq_loss: 0.0238, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9176, generator_adv_loss: 0.1289, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3584, d_vqkd: 128175.3125, d_vqgan: 144375.3125
	[[34m2025-05-01 08:01:14[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.2275, logits_fake: -0.2578
	[[34m2025-05-01 08:01:14[0m] (step=0053300) Train Loss: 1.1343, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:02:41[0m] (Generator) rec_loss: 0.0549, perceptual_loss: 0.2734, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9166, generator_adv_loss: 0.1729, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2667, d_vqkd: 128917.8125, d_vqgan: 144644.4062
	[[34m2025-05-01 08:02:41[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: -0.3379, logits_fake: -0.3457
	[[34m2025-05-01 08:02:41[0m] (step=0053400) Train Loss: 1.1681, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:04:08[0m] (Generator) rec_loss: 0.0468, perceptual_loss: 0.2402, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9194, generator_adv_loss: 0.0894, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2307, d_vqkd: 128577.9688, d_vqgan: 145369.8906
	[[34m2025-05-01 08:04:09[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: -0.1729, logits_fake: -0.1787
	[[34m2025-05-01 08:04:09[0m] (step=0053500) Train Loss: 1.1475, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:05:36[0m] (Generator) rec_loss: 0.0478, perceptual_loss: 0.2734, vq_loss: 0.0244, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: -0.0129, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2605, d_vqkd: 128535.9922, d_vqgan: 144470.2031
	[[34m2025-05-01 08:05:36[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: 0.0513, logits_fake: 0.0259
	[[34m2025-05-01 08:05:36[0m] (step=0053600) Train Loss: 1.1269, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:07:03[0m] (Generator) rec_loss: 0.0620, perceptual_loss: 0.2734, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9184, generator_adv_loss: 0.0002, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2642, d_vqkd: 128597.6875, d_vqgan: 144804.5312
	[[34m2025-05-01 08:07:04[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.0106, logits_fake: -0.0004
	[[34m2025-05-01 08:07:04[0m] (step=0053700) Train Loss: 1.1228, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:08:31[0m] (Generator) rec_loss: 0.0590, perceptual_loss: 0.2695, vq_loss: 0.0226, commit_loss: 0.0056, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: -0.1211, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2513, d_vqkd: 127178.5781, d_vqgan: 144553.7969
	[[34m2025-05-01 08:08:31[0m] (Discriminator) discriminator_adv_loss: 0.4883, disc_weight: 0.5000, logits_real: 0.2871, logits_fake: 0.2422
	[[34m2025-05-01 08:08:31[0m] (step=0053800) Train Loss: 1.1490, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:09:58[0m] (Generator) rec_loss: 0.0460, perceptual_loss: 0.2500, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9192, generator_adv_loss: -0.0530, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2488, d_vqkd: 128891.8438, d_vqgan: 144134.9062
	[[34m2025-05-01 08:09:59[0m] (Discriminator) discriminator_adv_loss: 0.5117, disc_weight: 0.5000, logits_real: 0.0645, logits_fake: 0.1060
	[[34m2025-05-01 08:09:59[0m] (step=0053900) Train Loss: 1.1225, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:11:26[0m] (Generator) rec_loss: 0.0722, perceptual_loss: 0.2852, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9166, generator_adv_loss: 0.1338, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2738, d_vqkd: 128050.0938, d_vqgan: 144981.9219
	[[34m2025-05-01 08:11:26[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.2637, logits_fake: -0.2676
	[[34m2025-05-01 08:11:26[0m] (step=0054000) Train Loss: 1.1454, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:12:53[0m] (Generator) rec_loss: 0.0447, perceptual_loss: 0.2422, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9186, generator_adv_loss: 0.1206, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2435, d_vqkd: 128680.6719, d_vqgan: 145038.0000
	[[34m2025-05-01 08:12:54[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.2393, logits_fake: -0.2412
	[[34m2025-05-01 08:12:54[0m] (step=0054100) Train Loss: 1.1292, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:14:21[0m] (Generator) rec_loss: 0.0625, perceptual_loss: 0.2715, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9180, generator_adv_loss: 0.0403, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2736, d_vqkd: 128944.8906, d_vqgan: 145525.2031
	[[34m2025-05-01 08:14:21[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.0603, logits_fake: -0.0806
	[[34m2025-05-01 08:14:21[0m] (step=0054200) Train Loss: 1.1662, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:15:48[0m] (Generator) rec_loss: 0.0622, perceptual_loss: 0.2676, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9174, generator_adv_loss: -0.1201, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2299, d_vqkd: 128952.4375, d_vqgan: 144928.0000
	[[34m2025-05-01 08:15:49[0m] (Discriminator) discriminator_adv_loss: 0.5117, disc_weight: 0.5000, logits_real: 0.2002, logits_fake: 0.2402
	[[34m2025-05-01 08:15:49[0m] (step=0054300) Train Loss: 1.0804, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:17:15[0m] (Generator) rec_loss: 0.0568, perceptual_loss: 0.2617, vq_loss: 0.0246, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9204, generator_adv_loss: 0.1426, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2493, d_vqkd: 128940.5469, d_vqgan: 145038.2969
	[[34m2025-05-01 08:17:16[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.2715, logits_fake: -0.2852
	[[34m2025-05-01 08:17:16[0m] (step=0054400) Train Loss: 1.1181, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:18:43[0m] (Generator) rec_loss: 0.0504, perceptual_loss: 0.2754, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9165, generator_adv_loss: 0.1060, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2840, d_vqkd: 129069.3281, d_vqgan: 145197.8906
	[[34m2025-05-01 08:18:43[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.1855, logits_fake: -0.2119
	[[34m2025-05-01 08:18:43[0m] (step=0054500) Train Loss: 1.1278, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:20:10[0m] (Generator) rec_loss: 0.0645, perceptual_loss: 0.2656, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9166, generator_adv_loss: 0.0192, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2454, d_vqkd: 128404.4531, d_vqgan: 144986.4219
	[[34m2025-05-01 08:20:11[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.0591, logits_fake: -0.0383
	[[34m2025-05-01 08:20:11[0m] (step=0054600) Train Loss: 1.1101, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:21:38[0m] (Generator) rec_loss: 0.0527, perceptual_loss: 0.2754, vq_loss: 0.0254, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9203, generator_adv_loss: 0.0835, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2493, d_vqkd: 128314.8516, d_vqgan: 145179.8750
	[[34m2025-05-01 08:21:38[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.1865, logits_fake: -0.1670
	[[34m2025-05-01 08:21:38[0m] (step=0054700) Train Loss: 1.1400, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:23:05[0m] (Generator) rec_loss: 0.0609, perceptual_loss: 0.3027, vq_loss: 0.0244, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9202, generator_adv_loss: 0.1396, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2795, d_vqkd: 127727.2266, d_vqgan: 144972.4844
	[[34m2025-05-01 08:23:06[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.2422, logits_fake: -0.2793
	[[34m2025-05-01 08:23:06[0m] (step=0054800) Train Loss: 1.1323, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:24:32[0m] (Generator) rec_loss: 0.0624, perceptual_loss: 0.2676, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: -0.0023, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2678, d_vqkd: 128118.7656, d_vqgan: 145274.2969
	[[34m2025-05-01 08:24:33[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: 0.0312, logits_fake: 0.0046
	[[34m2025-05-01 08:24:33[0m] (step=0054900) Train Loss: 1.1387, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:26:00[0m] (Generator) rec_loss: 0.0476, perceptual_loss: 0.2617, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: 0.0635, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2525, d_vqkd: 128071.9766, d_vqgan: 144639.4844
	[[34m2025-05-01 08:26:00[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.1318, logits_fake: -0.1270
	[[34m2025-05-01 08:26:00[0m] (step=0055000) Train Loss: 1.1313, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:27:27[0m] (Generator) rec_loss: 0.0678, perceptual_loss: 0.2852, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9195, generator_adv_loss: 0.0703, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2820, d_vqkd: 128548.1016, d_vqgan: 145897.7031
	[[34m2025-05-01 08:27:28[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.1650, logits_fake: -0.1406
	[[34m2025-05-01 08:27:28[0m] (step=0055100) Train Loss: 1.1349, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:28:55[0m] (Generator) rec_loss: 0.0852, perceptual_loss: 0.2441, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9179, generator_adv_loss: -0.0201, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2265, d_vqkd: 128542.5859, d_vqgan: 144919.7188
	[[34m2025-05-01 08:28:55[0m] (Discriminator) discriminator_adv_loss: 0.5117, disc_weight: 0.5000, logits_real: -0.0065, logits_fake: 0.0403
	[[34m2025-05-01 08:28:55[0m] (step=0055200) Train Loss: 1.1631, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:30:22[0m] (Generator) rec_loss: 0.0583, perceptual_loss: 0.2637, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9190, generator_adv_loss: -0.0952, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2410, d_vqkd: 128280.9609, d_vqgan: 145071.0000
	[[34m2025-05-01 08:30:23[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.1914, logits_fake: 0.1904
	[[34m2025-05-01 08:30:23[0m] (step=0055300) Train Loss: 1.1251, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:31:50[0m] (Generator) rec_loss: 0.0820, perceptual_loss: 0.2734, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9200, generator_adv_loss: -0.0430, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2825, d_vqkd: 128227.8906, d_vqgan: 145553.6250
	[[34m2025-05-01 08:31:50[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.0503, logits_fake: 0.0859
	[[34m2025-05-01 08:31:50[0m] (step=0055400) Train Loss: 1.1177, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:33:17[0m] (Generator) rec_loss: 0.0563, perceptual_loss: 0.2773, vq_loss: 0.0258, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9171, generator_adv_loss: 0.0918, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2698, d_vqkd: 128992.1172, d_vqgan: 145324.3125
	[[34m2025-05-01 08:33:18[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.1650, logits_fake: -0.1836
	[[34m2025-05-01 08:33:18[0m] (step=0055500) Train Loss: 1.1133, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:34:44[0m] (Generator) rec_loss: 0.0849, perceptual_loss: 0.3027, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9153, generator_adv_loss: 0.0057, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2898, d_vqkd: 127577.4609, d_vqgan: 146176.0000
	[[34m2025-05-01 08:34:45[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.0039, logits_fake: -0.0114
	[[34m2025-05-01 08:34:45[0m] (step=0055600) Train Loss: 1.1184, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:36:12[0m] (Generator) rec_loss: 0.0817, perceptual_loss: 0.2559, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9218, generator_adv_loss: -0.0199, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2597, d_vqkd: 127814.5078, d_vqgan: 145748.8281
	[[34m2025-05-01 08:36:12[0m] (Discriminator) discriminator_adv_loss: 0.5156, disc_weight: 0.5000, logits_real: -0.0211, logits_fake: 0.0398
	[[34m2025-05-01 08:36:12[0m] (step=0055700) Train Loss: 1.1333, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:37:39[0m] (Generator) rec_loss: 0.0705, perceptual_loss: 0.2695, vq_loss: 0.0228, commit_loss: 0.0057, entropy_loss: 0.0000, codebook_usage: 0.9175, generator_adv_loss: 0.0461, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2612, d_vqkd: 127165.3125, d_vqgan: 144173.3906
	[[34m2025-05-01 08:37:40[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: -0.0854, logits_fake: -0.0923
	[[34m2025-05-01 08:37:40[0m] (step=0055800) Train Loss: 1.1156, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:39:07[0m] (Generator) rec_loss: 0.0700, perceptual_loss: 0.2656, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9165, generator_adv_loss: 0.0669, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2355, d_vqkd: 128463.8125, d_vqgan: 145298.1094
	[[34m2025-05-01 08:39:07[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.1748, logits_fake: -0.1338
	[[34m2025-05-01 08:39:07[0m] (step=0055900) Train Loss: 1.1406, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:40:34[0m] (Generator) rec_loss: 0.0626, perceptual_loss: 0.2715, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9178, generator_adv_loss: 0.1582, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2467, d_vqkd: 128980.7500, d_vqgan: 144551.2344
	[[34m2025-05-01 08:40:35[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.3027, logits_fake: -0.3164
	[[34m2025-05-01 08:40:35[0m] (step=0056000) Train Loss: 1.1596, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:40:37[0m] Saved checkpoint to ck_decoder_cnn/001-TokenFlow/checkpoints/0056000.pt
	[[34m2025-05-01 08:42:04[0m] (Generator) rec_loss: 0.0624, perceptual_loss: 0.2910, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: 0.0918, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2632, d_vqkd: 129070.4375, d_vqgan: 144463.4531
	[[34m2025-05-01 08:42:04[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.1523, logits_fake: -0.1836
	[[34m2025-05-01 08:42:04[0m] (step=0056100) Train Loss: 1.1414, Train Steps/Sec: 1.12
	[[34m2025-05-01 08:43:31[0m] (Generator) rec_loss: 0.0535, perceptual_loss: 0.2754, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9157, generator_adv_loss: 0.0276, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2692, d_vqkd: 129164.9609, d_vqgan: 144977.2344
	[[34m2025-05-01 08:43:32[0m] (Discriminator) discriminator_adv_loss: 0.4883, disc_weight: 0.5000, logits_real: -0.0105, logits_fake: -0.0552
	[[34m2025-05-01 08:43:32[0m] (step=0056200) Train Loss: 1.1135, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:44:59[0m] (Generator) rec_loss: 0.0591, perceptual_loss: 0.2637, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9161, generator_adv_loss: 0.0332, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2623, d_vqkd: 128599.3594, d_vqgan: 145121.2656
	[[34m2025-05-01 08:44:59[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.0461, logits_fake: -0.0664
	[[34m2025-05-01 08:44:59[0m] (step=0056300) Train Loss: 1.1472, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:46:26[0m] (Generator) rec_loss: 0.0516, perceptual_loss: 0.2383, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9191, generator_adv_loss: 0.0500, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2571, d_vqkd: 128080.8359, d_vqgan: 145116.3750
	[[34m2025-05-01 08:46:27[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.1094, logits_fake: -0.1001
	[[34m2025-05-01 08:46:27[0m] (step=0056400) Train Loss: 1.1154, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:47:54[0m] (Generator) rec_loss: 0.0493, perceptual_loss: 0.2344, vq_loss: 0.0238, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: 0.0427, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2291, d_vqkd: 128412.9062, d_vqgan: 144656.0156
	[[34m2025-05-01 08:47:54[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.1157, logits_fake: -0.0854
	[[34m2025-05-01 08:47:54[0m] (step=0056500) Train Loss: 1.1272, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:49:21[0m] (Generator) rec_loss: 0.0492, perceptual_loss: 0.2715, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9189, generator_adv_loss: 0.0781, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2555, d_vqkd: 128567.2656, d_vqgan: 145200.2188
	[[34m2025-05-01 08:49:21[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: -0.1309, logits_fake: -0.1562
	[[34m2025-05-01 08:49:21[0m] (step=0056600) Train Loss: 1.1202, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:50:48[0m] (Generator) rec_loss: 0.0543, perceptual_loss: 0.2949, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9203, generator_adv_loss: 0.1357, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2752, d_vqkd: 128881.1562, d_vqgan: 144852.2344
	[[34m2025-05-01 08:50:49[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.2451, logits_fake: -0.2715
	[[34m2025-05-01 08:50:49[0m] (step=0056700) Train Loss: 1.1430, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:52:16[0m] (Generator) rec_loss: 0.0703, perceptual_loss: 0.2949, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: 0.0442, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2698, d_vqkd: 129114.7266, d_vqgan: 145476.2656
	[[34m2025-05-01 08:52:16[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.0933, logits_fake: -0.0884
	[[34m2025-05-01 08:52:16[0m] (step=0056800) Train Loss: 1.1211, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:53:43[0m] (Generator) rec_loss: 0.0669, perceptual_loss: 0.2832, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: 0.0588, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2620, d_vqkd: 128749.9062, d_vqgan: 145786.9844
	[[34m2025-05-01 08:53:44[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.1260, logits_fake: -0.1177
	[[34m2025-05-01 08:53:44[0m] (step=0056900) Train Loss: 1.1206, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:55:11[0m] (Generator) rec_loss: 0.0614, perceptual_loss: 0.2734, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: 0.0396, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2785, d_vqkd: 128774.9375, d_vqgan: 145107.0156
	[[34m2025-05-01 08:55:11[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.0491, logits_fake: -0.0791
	[[34m2025-05-01 08:55:11[0m] (step=0057000) Train Loss: 1.1345, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:56:38[0m] (Generator) rec_loss: 0.0488, perceptual_loss: 0.2676, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9174, generator_adv_loss: 0.0366, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2556, d_vqkd: 128218.9531, d_vqgan: 145042.4375
	[[34m2025-05-01 08:56:39[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.0635, logits_fake: -0.0732
	[[34m2025-05-01 08:56:39[0m] (step=0057100) Train Loss: 1.1392, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:58:06[0m] (Generator) rec_loss: 0.0778, perceptual_loss: 0.2734, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9174, generator_adv_loss: 0.1187, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2669, d_vqkd: 128395.8125, d_vqgan: 145517.6406
	[[34m2025-05-01 08:58:06[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.2236, logits_fake: -0.2373
	[[34m2025-05-01 08:58:06[0m] (step=0057200) Train Loss: 1.1355, Train Steps/Sec: 1.14
	[[34m2025-05-01 08:59:33[0m] (Generator) rec_loss: 0.0825, perceptual_loss: 0.2871, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9171, generator_adv_loss: 0.1436, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2962, d_vqkd: 128388.4688, d_vqgan: 145355.2500
	[[34m2025-05-01 08:59:34[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: -0.2793, logits_fake: -0.2871
	[[34m2025-05-01 08:59:34[0m] (step=0057300) Train Loss: 1.1607, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:01:01[0m] (Generator) rec_loss: 0.0432, perceptual_loss: 0.2461, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9191, generator_adv_loss: 0.0454, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2349, d_vqkd: 128817.5469, d_vqgan: 144653.5312
	[[34m2025-05-01 09:01:01[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.0630, logits_fake: -0.0908
	[[34m2025-05-01 09:01:01[0m] (step=0057400) Train Loss: 1.0986, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:02:28[0m] (Generator) rec_loss: 0.0462, perceptual_loss: 0.2334, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9167, generator_adv_loss: 0.0142, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2439, d_vqkd: 127979.6719, d_vqgan: 145587.1406
	[[34m2025-05-01 09:02:28[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.0464, logits_fake: -0.0283
	[[34m2025-05-01 09:02:28[0m] (step=0057500) Train Loss: 1.1039, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:03:55[0m] (Generator) rec_loss: 0.0459, perceptual_loss: 0.2617, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9174, generator_adv_loss: -0.0579, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2602, d_vqkd: 128810.1094, d_vqgan: 145047.9375
	[[34m2025-05-01 09:03:56[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.1108, logits_fake: 0.1157
	[[34m2025-05-01 09:03:56[0m] (step=0057600) Train Loss: 1.1376, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:05:23[0m] (Generator) rec_loss: 0.0620, perceptual_loss: 0.2754, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: -0.0013, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2648, d_vqkd: 129089.2266, d_vqgan: 145633.5000
	[[34m2025-05-01 09:05:23[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.0065, logits_fake: 0.0027
	[[34m2025-05-01 09:05:23[0m] (step=0057700) Train Loss: 1.1482, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:06:50[0m] (Generator) rec_loss: 0.0738, perceptual_loss: 0.2812, vq_loss: 0.0244, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9169, generator_adv_loss: -0.0036, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2841, d_vqkd: 128486.7344, d_vqgan: 144968.9062
	[[34m2025-05-01 09:06:51[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: 0.0167, logits_fake: 0.0071
	[[34m2025-05-01 09:06:51[0m] (step=0057800) Train Loss: 1.1400, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:08:18[0m] (Generator) rec_loss: 0.0590, perceptual_loss: 0.2793, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9165, generator_adv_loss: 0.0503, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2629, d_vqkd: 129282.6797, d_vqgan: 144929.0469
	[[34m2025-05-01 09:08:18[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.0879, logits_fake: -0.1006
	[[34m2025-05-01 09:08:18[0m] (step=0057900) Train Loss: 1.1343, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:09:45[0m] (Generator) rec_loss: 0.0448, perceptual_loss: 0.2617, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9188, generator_adv_loss: 0.0530, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2632, d_vqkd: 128967.0781, d_vqgan: 145186.9375
	[[34m2025-05-01 09:09:46[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.1289, logits_fake: -0.1060
	[[34m2025-05-01 09:09:46[0m] (step=0058000) Train Loss: 1.1191, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:11:13[0m] (Generator) rec_loss: 0.0617, perceptual_loss: 0.2695, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.0210, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2712, d_vqkd: 128371.6406, d_vqgan: 145396.0312
	[[34m2025-05-01 09:11:13[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.0449, logits_fake: -0.0420
	[[34m2025-05-01 09:11:13[0m] (step=0058100) Train Loss: 1.1217, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:12:40[0m] (Generator) rec_loss: 0.0433, perceptual_loss: 0.2695, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9189, generator_adv_loss: -0.0703, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2534, d_vqkd: 128757.8594, d_vqgan: 145195.3594
	[[34m2025-05-01 09:12:41[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.1230, logits_fake: 0.1406
	[[34m2025-05-01 09:12:41[0m] (step=0058200) Train Loss: 1.1086, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:14:08[0m] (Generator) rec_loss: 0.0641, perceptual_loss: 0.2969, vq_loss: 0.0257, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: -0.0173, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2482, d_vqkd: 129102.7500, d_vqgan: 145534.0938
	[[34m2025-05-01 09:14:08[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.0347, logits_fake: 0.0347
	[[34m2025-05-01 09:14:08[0m] (step=0058300) Train Loss: 1.1282, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:15:15[0m] Beginning epoch 4...
	[[34m2025-05-01 09:15:36[0m] (Generator) rec_loss: 0.0738, perceptual_loss: 0.2676, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: -0.0293, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2639, d_vqkd: 129203.9453, d_vqgan: 144531.9219
	[[34m2025-05-01 09:15:36[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.0403, logits_fake: 0.0586
	[[34m2025-05-01 09:15:36[0m] (step=0058400) Train Loss: 1.1137, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:17:03[0m] (Generator) rec_loss: 0.0572, perceptual_loss: 0.2773, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9221, generator_adv_loss: -0.0444, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2737, d_vqkd: 129023.0156, d_vqgan: 145322.5000
	[[34m2025-05-01 09:17:04[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.0981, logits_fake: 0.0889
	[[34m2025-05-01 09:17:04[0m] (step=0058500) Train Loss: 1.1349, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:18:30[0m] (Generator) rec_loss: 0.0547, perceptual_loss: 0.2891, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: -0.0032, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2718, d_vqkd: 128589.1641, d_vqgan: 145599.6562
	[[34m2025-05-01 09:18:31[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.0038, logits_fake: 0.0064
	[[34m2025-05-01 09:18:31[0m] (step=0058600) Train Loss: 1.1341, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:19:58[0m] (Generator) rec_loss: 0.0566, perceptual_loss: 0.2773, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9166, generator_adv_loss: 0.1250, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2436, d_vqkd: 129051.5156, d_vqgan: 145084.8438
	[[34m2025-05-01 09:19:58[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.2520, logits_fake: -0.2500
	[[34m2025-05-01 09:19:58[0m] (step=0058700) Train Loss: 1.1167, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:21:25[0m] (Generator) rec_loss: 0.0451, perceptual_loss: 0.2793, vq_loss: 0.0254, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9189, generator_adv_loss: 0.0222, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2696, d_vqkd: 128124.9844, d_vqgan: 144621.1250
	[[34m2025-05-01 09:21:26[0m] (Discriminator) discriminator_adv_loss: 0.5117, disc_weight: 0.5000, logits_real: -0.0942, logits_fake: -0.0444
	[[34m2025-05-01 09:21:26[0m] (step=0058800) Train Loss: 1.1046, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:22:53[0m] (Generator) rec_loss: 0.0528, perceptual_loss: 0.2793, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9201, generator_adv_loss: 0.0212, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2616, d_vqkd: 128358.2812, d_vqgan: 144693.0625
	[[34m2025-05-01 09:22:53[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.0393, logits_fake: -0.0425
	[[34m2025-05-01 09:22:53[0m] (step=0058900) Train Loss: 1.1130, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:24:20[0m] (Generator) rec_loss: 0.0529, perceptual_loss: 0.2656, vq_loss: 0.0239, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9174, generator_adv_loss: 0.0265, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2392, d_vqkd: 127820.6719, d_vqgan: 143863.5625
	[[34m2025-05-01 09:24:21[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.0923, logits_fake: -0.0530
	[[34m2025-05-01 09:24:21[0m] (step=0059000) Train Loss: 1.1175, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:25:48[0m] (Generator) rec_loss: 0.0560, perceptual_loss: 0.2480, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9153, generator_adv_loss: -0.0228, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2615, d_vqkd: 128206.4375, d_vqgan: 145351.4531
	[[34m2025-05-01 09:25:48[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.0325, logits_fake: 0.0457
	[[34m2025-05-01 09:25:48[0m] (step=0059100) Train Loss: 1.1384, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:27:15[0m] (Generator) rec_loss: 0.0546, perceptual_loss: 0.2656, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9170, generator_adv_loss: -0.0747, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2863, d_vqkd: 128677.8750, d_vqgan: 145421.6562
	[[34m2025-05-01 09:27:16[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: 0.1543, logits_fake: 0.1494
	[[34m2025-05-01 09:27:16[0m] (step=0059200) Train Loss: 1.1458, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:28:43[0m] (Generator) rec_loss: 0.0524, perceptual_loss: 0.2637, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9177, generator_adv_loss: -0.0640, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2527, d_vqkd: 128754.9375, d_vqgan: 145463.0000
	[[34m2025-05-01 09:28:43[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.1245, logits_fake: 0.1279
	[[34m2025-05-01 09:28:43[0m] (step=0059300) Train Loss: 1.1289, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:30:10[0m] (Generator) rec_loss: 0.0632, perceptual_loss: 0.2793, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: -0.0273, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2670, d_vqkd: 128370.8516, d_vqgan: 144642.7031
	[[34m2025-05-01 09:30:11[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.0591, logits_fake: 0.0547
	[[34m2025-05-01 09:30:11[0m] (step=0059400) Train Loss: 1.1185, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:31:37[0m] (Generator) rec_loss: 0.0438, perceptual_loss: 0.2695, vq_loss: 0.0250, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9170, generator_adv_loss: 0.0452, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2621, d_vqkd: 128559.8281, d_vqgan: 144721.8906
	[[34m2025-05-01 09:31:38[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.1021, logits_fake: -0.0903
	[[34m2025-05-01 09:31:38[0m] (step=0059500) Train Loss: 1.1190, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:33:05[0m] (Generator) rec_loss: 0.0736, perceptual_loss: 0.3281, vq_loss: 0.0234, commit_loss: 0.0058, entropy_loss: 0.0000, codebook_usage: 0.9175, generator_adv_loss: 0.0752, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3186, d_vqkd: 127816.1875, d_vqgan: 144554.8125
	[[34m2025-05-01 09:33:05[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.1094, logits_fake: -0.1504
	[[34m2025-05-01 09:33:05[0m] (step=0059600) Train Loss: 1.1270, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:34:32[0m] (Generator) rec_loss: 0.0681, perceptual_loss: 0.2695, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9161, generator_adv_loss: 0.0564, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2605, d_vqkd: 128992.8750, d_vqgan: 145201.8125
	[[34m2025-05-01 09:34:33[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.1025, logits_fake: -0.1128
	[[34m2025-05-01 09:34:33[0m] (step=0059700) Train Loss: 1.0993, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:36:00[0m] (Generator) rec_loss: 0.0513, perceptual_loss: 0.2793, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9190, generator_adv_loss: -0.0835, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2487, d_vqkd: 128124.1875, d_vqgan: 145279.1406
	[[34m2025-05-01 09:36:00[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.1582, logits_fake: 0.1670
	[[34m2025-05-01 09:36:00[0m] (step=0059800) Train Loss: 1.1095, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:37:27[0m] (Generator) rec_loss: 0.0600, perceptual_loss: 0.2734, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9159, generator_adv_loss: -0.1021, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2736, d_vqkd: 128709.6562, d_vqgan: 145494.9844
	[[34m2025-05-01 09:37:28[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.2227, logits_fake: 0.2041
	[[34m2025-05-01 09:37:28[0m] (step=0059900) Train Loss: 1.1279, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:38:55[0m] (Generator) rec_loss: 0.0538, perceptual_loss: 0.2617, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9188, generator_adv_loss: -0.0447, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2210, d_vqkd: 128610.6953, d_vqgan: 144903.2500
	[[34m2025-05-01 09:38:55[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.0796, logits_fake: 0.0894
	[[34m2025-05-01 09:38:55[0m] (step=0060000) Train Loss: 1.1270, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:40:22[0m] (Generator) rec_loss: 0.0482, perceptual_loss: 0.2559, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9179, generator_adv_loss: -0.0322, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2493, d_vqkd: 128389.7656, d_vqgan: 144116.3750
	[[34m2025-05-01 09:40:23[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.0500, logits_fake: 0.0645
	[[34m2025-05-01 09:40:23[0m] (step=0060100) Train Loss: 1.0987, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:41:50[0m] (Generator) rec_loss: 0.0423, perceptual_loss: 0.2402, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: 0.0776, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2488, d_vqkd: 127899.8516, d_vqgan: 144497.5312
	[[34m2025-05-01 09:41:50[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.1396, logits_fake: -0.1553
	[[34m2025-05-01 09:41:50[0m] (step=0060200) Train Loss: 1.1161, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:43:17[0m] (Generator) rec_loss: 0.0771, perceptual_loss: 0.2988, vq_loss: 0.0265, commit_loss: 0.0066, entropy_loss: 0.0000, codebook_usage: 0.9141, generator_adv_loss: 0.0176, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2419, d_vqkd: 129068.1250, d_vqgan: 145559.9688
	[[34m2025-05-01 09:43:18[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.0161, logits_fake: -0.0352
	[[34m2025-05-01 09:43:18[0m] (step=0060300) Train Loss: 1.0998, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:44:45[0m] (Generator) rec_loss: 0.0554, perceptual_loss: 0.2598, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9205, generator_adv_loss: 0.0023, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2583, d_vqkd: 128386.3125, d_vqgan: 144679.5312
	[[34m2025-05-01 09:44:45[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.0391, logits_fake: -0.0045
	[[34m2025-05-01 09:44:45[0m] (step=0060400) Train Loss: 1.1182, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:46:12[0m] (Generator) rec_loss: 0.0562, perceptual_loss: 0.2969, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9184, generator_adv_loss: -0.0320, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2967, d_vqkd: 129060.5312, d_vqgan: 145879.5625
	[[34m2025-05-01 09:46:13[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.0275, logits_fake: 0.0640
	[[34m2025-05-01 09:46:13[0m] (step=0060500) Train Loss: 1.1371, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:47:40[0m] (Generator) rec_loss: 0.0439, perceptual_loss: 0.2715, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9203, generator_adv_loss: -0.0559, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2641, d_vqkd: 128612.2656, d_vqgan: 145473.7188
	[[34m2025-05-01 09:47:40[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: 0.1260, logits_fake: 0.1118
	[[34m2025-05-01 09:47:40[0m] (step=0060600) Train Loss: 1.1142, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:49:07[0m] (Generator) rec_loss: 0.0695, perceptual_loss: 0.2871, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9179, generator_adv_loss: -0.0081, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2842, d_vqkd: 128117.2891, d_vqgan: 144586.1719
	[[34m2025-05-01 09:49:08[0m] (Discriminator) discriminator_adv_loss: 0.4941, disc_weight: 0.5000, logits_real: 0.0388, logits_fake: 0.0161
	[[34m2025-05-01 09:49:08[0m] (step=0060700) Train Loss: 1.1308, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:50:35[0m] (Generator) rec_loss: 0.0385, perceptual_loss: 0.2275, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9173, generator_adv_loss: 0.0181, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2460, d_vqkd: 129077.5156, d_vqgan: 145117.9375
	[[34m2025-05-01 09:50:35[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.0520, logits_fake: -0.0361
	[[34m2025-05-01 09:50:35[0m] (step=0060800) Train Loss: 1.1512, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:52:03[0m] (Generator) rec_loss: 0.0485, perceptual_loss: 0.2598, vq_loss: 0.0247, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9151, generator_adv_loss: 0.0137, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2578, d_vqkd: 127776.2266, d_vqgan: 144736.9531
	[[34m2025-05-01 09:52:03[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.0439, logits_fake: -0.0275
	[[34m2025-05-01 09:52:03[0m] (step=0060900) Train Loss: 1.0928, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:53:30[0m] (Generator) rec_loss: 0.0665, perceptual_loss: 0.2891, vq_loss: 0.0250, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9153, generator_adv_loss: -0.0588, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3063, d_vqkd: 128708.0156, d_vqgan: 145627.4844
	[[34m2025-05-01 09:53:31[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.1328, logits_fake: 0.1177
	[[34m2025-05-01 09:53:31[0m] (step=0061000) Train Loss: 1.1259, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:54:57[0m] (Generator) rec_loss: 0.0497, perceptual_loss: 0.2734, vq_loss: 0.0256, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9184, generator_adv_loss: -0.0099, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2530, d_vqkd: 128353.8828, d_vqgan: 145529.4375
	[[34m2025-05-01 09:54:58[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.0359, logits_fake: 0.0198
	[[34m2025-05-01 09:54:58[0m] (step=0061100) Train Loss: 1.1403, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:56:25[0m] (Generator) rec_loss: 0.0703, perceptual_loss: 0.2656, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9169, generator_adv_loss: 0.0645, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2470, d_vqkd: 128803.0781, d_vqgan: 145303.9688
	[[34m2025-05-01 09:56:25[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.1099, logits_fake: -0.1289
	[[34m2025-05-01 09:56:25[0m] (step=0061200) Train Loss: 1.0922, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:57:52[0m] (Generator) rec_loss: 0.0663, perceptual_loss: 0.2637, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9205, generator_adv_loss: 0.0447, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2590, d_vqkd: 128863.0781, d_vqgan: 145114.1250
	[[34m2025-05-01 09:57:53[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.1289, logits_fake: -0.0894
	[[34m2025-05-01 09:57:53[0m] (step=0061300) Train Loss: 1.1085, Train Steps/Sec: 1.14
	[[34m2025-05-01 09:59:20[0m] (Generator) rec_loss: 0.0448, perceptual_loss: 0.2539, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9176, generator_adv_loss: -0.0128, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2498, d_vqkd: 128512.5156, d_vqgan: 146158.6406
	[[34m2025-05-01 09:59:20[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.0378, logits_fake: 0.0256
	[[34m2025-05-01 09:59:20[0m] (step=0061400) Train Loss: 1.1231, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:00:47[0m] (Generator) rec_loss: 0.0673, perceptual_loss: 0.2695, vq_loss: 0.0254, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9165, generator_adv_loss: -0.0388, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2541, d_vqkd: 128887.8750, d_vqgan: 145933.8906
	[[34m2025-05-01 10:00:48[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.0898, logits_fake: 0.0776
	[[34m2025-05-01 10:00:48[0m] (step=0061500) Train Loss: 1.1375, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:02:15[0m] (Generator) rec_loss: 0.0895, perceptual_loss: 0.2871, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9188, generator_adv_loss: 0.0537, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2611, d_vqkd: 128560.8594, d_vqgan: 145237.7188
	[[34m2025-05-01 10:02:15[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.1279, logits_fake: -0.1074
	[[34m2025-05-01 10:02:15[0m] (step=0061600) Train Loss: 1.1354, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:03:42[0m] (Generator) rec_loss: 0.0564, perceptual_loss: 0.2422, vq_loss: 0.0243, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: -0.0020, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2388, d_vqkd: 128402.2266, d_vqgan: 144756.0938
	[[34m2025-05-01 10:03:42[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: 0.0309, logits_fake: 0.0041
	[[34m2025-05-01 10:03:42[0m] (step=0061700) Train Loss: 1.1012, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:05:09[0m] (Generator) rec_loss: 0.0838, perceptual_loss: 0.2656, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9181, generator_adv_loss: -0.0045, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2728, d_vqkd: 128469.5312, d_vqgan: 144440.7656
	[[34m2025-05-01 10:05:10[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.0256, logits_fake: 0.0089
	[[34m2025-05-01 10:05:10[0m] (step=0061800) Train Loss: 1.1436, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:06:37[0m] (Generator) rec_loss: 0.0592, perceptual_loss: 0.2773, vq_loss: 0.0258, commit_loss: 0.0065, entropy_loss: 0.0000, codebook_usage: 0.9175, generator_adv_loss: -0.0223, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2459, d_vqkd: 129146.3047, d_vqgan: 145923.5781
	[[34m2025-05-01 10:06:37[0m] (Discriminator) discriminator_adv_loss: 0.4883, disc_weight: 0.5000, logits_real: 0.0898, logits_fake: 0.0447
	[[34m2025-05-01 10:06:37[0m] (step=0061900) Train Loss: 1.1351, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:08:04[0m] (Generator) rec_loss: 0.0535, perceptual_loss: 0.2285, vq_loss: 0.0240, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9208, generator_adv_loss: -0.0097, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2368, d_vqkd: 128416.3203, d_vqgan: 144638.5156
	[[34m2025-05-01 10:08:05[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.0093, logits_fake: 0.0194
	[[34m2025-05-01 10:08:05[0m] (step=0062000) Train Loss: 1.1581, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:09:32[0m] (Generator) rec_loss: 0.0645, perceptual_loss: 0.2891, vq_loss: 0.0234, commit_loss: 0.0058, entropy_loss: 0.0000, codebook_usage: 0.9199, generator_adv_loss: 0.0311, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2767, d_vqkd: 127452.7109, d_vqgan: 144210.5625
	[[34m2025-05-01 10:09:32[0m] (Discriminator) discriminator_adv_loss: 0.4980, disc_weight: 0.5000, logits_real: -0.0457, logits_fake: -0.0623
	[[34m2025-05-01 10:09:32[0m] (step=0062100) Train Loss: 1.0899, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:10:59[0m] (Generator) rec_loss: 0.0660, perceptual_loss: 0.2617, vq_loss: 0.0254, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.0140, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2419, d_vqkd: 128793.3750, d_vqgan: 145180.7812
	[[34m2025-05-01 10:11:00[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.0459, logits_fake: -0.0280
	[[34m2025-05-01 10:11:00[0m] (step=0062200) Train Loss: 1.1228, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:12:27[0m] (Generator) rec_loss: 0.0429, perceptual_loss: 0.2402, vq_loss: 0.0254, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9161, generator_adv_loss: -0.0081, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2511, d_vqkd: 128511.8516, d_vqgan: 145025.2500
	[[34m2025-05-01 10:12:27[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.0106, logits_fake: 0.0162
	[[34m2025-05-01 10:12:27[0m] (step=0062300) Train Loss: 1.1284, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:13:54[0m] (Generator) rec_loss: 0.0667, perceptual_loss: 0.2734, vq_loss: 0.0251, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9193, generator_adv_loss: -0.0193, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2643, d_vqkd: 128802.7266, d_vqgan: 145673.0781
	[[34m2025-05-01 10:13:55[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.0447, logits_fake: 0.0386
	[[34m2025-05-01 10:13:55[0m] (step=0062400) Train Loss: 1.1364, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:15:21[0m] (Generator) rec_loss: 0.0699, perceptual_loss: 0.2520, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9190, generator_adv_loss: 0.0413, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2850, d_vqkd: 128687.2422, d_vqgan: 145165.7188
	[[34m2025-05-01 10:15:22[0m] (Discriminator) discriminator_adv_loss: 0.4883, disc_weight: 0.5000, logits_real: -0.0334, logits_fake: -0.0825
	[[34m2025-05-01 10:15:22[0m] (step=0062500) Train Loss: 1.1424, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:16:49[0m] (Generator) rec_loss: 0.0728, perceptual_loss: 0.2793, vq_loss: 0.0258, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9175, generator_adv_loss: -0.0154, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2623, d_vqkd: 129354.0469, d_vqgan: 145445.1250
	[[34m2025-05-01 10:16:49[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.0227, logits_fake: 0.0309
	[[34m2025-05-01 10:16:49[0m] (step=0062600) Train Loss: 1.1153, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:18:16[0m] (Generator) rec_loss: 0.0522, perceptual_loss: 0.2754, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9160, generator_adv_loss: -0.0596, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2779, d_vqkd: 128342.3281, d_vqgan: 145020.5625
	[[34m2025-05-01 10:18:17[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.1025, logits_fake: 0.1191
	[[34m2025-05-01 10:18:17[0m] (step=0062700) Train Loss: 1.1286, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:19:44[0m] (Generator) rec_loss: 0.0682, perceptual_loss: 0.2949, vq_loss: 0.0233, commit_loss: 0.0058, entropy_loss: 0.0000, codebook_usage: 0.9148, generator_adv_loss: -0.0559, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2777, d_vqkd: 127325.5156, d_vqgan: 144722.4375
	[[34m2025-05-01 10:19:44[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.1436, logits_fake: 0.1118
	[[34m2025-05-01 10:19:44[0m] (step=0062800) Train Loss: 1.1317, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:21:11[0m] (Generator) rec_loss: 0.0570, perceptual_loss: 0.2695, vq_loss: 0.0249, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9169, generator_adv_loss: -0.0317, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2706, d_vqkd: 128879.1406, d_vqgan: 144561.4531
	[[34m2025-05-01 10:21:12[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.0374, logits_fake: 0.0635
	[[34m2025-05-01 10:21:12[0m] (step=0062900) Train Loss: 1.1310, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:22:39[0m] (Generator) rec_loss: 0.0502, perceptual_loss: 0.2412, vq_loss: 0.0244, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9222, generator_adv_loss: 0.0908, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2363, d_vqkd: 128459.4531, d_vqgan: 144853.6875
	[[34m2025-05-01 10:22:39[0m] (Discriminator) discriminator_adv_loss: 0.5117, disc_weight: 0.5000, logits_real: -0.2236, logits_fake: -0.1816
	[[34m2025-05-01 10:22:39[0m] (step=0063000) Train Loss: 1.1178, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:24:06[0m] (Generator) rec_loss: 0.0564, perceptual_loss: 0.2754, vq_loss: 0.0244, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9172, generator_adv_loss: 0.0270, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2573, d_vqkd: 128187.8281, d_vqgan: 145314.4062
	[[34m2025-05-01 10:24:07[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.0583, logits_fake: -0.0540
	[[34m2025-05-01 10:24:07[0m] (step=0063100) Train Loss: 1.1487, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:25:34[0m] (Generator) rec_loss: 0.0532, perceptual_loss: 0.2578, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9151, generator_adv_loss: -0.0659, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2346, d_vqkd: 127834.8750, d_vqgan: 144861.7031
	[[34m2025-05-01 10:25:34[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: 0.0996, logits_fake: 0.1318
	[[34m2025-05-01 10:25:34[0m] (step=0063200) Train Loss: 1.1184, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:27:01[0m] (Generator) rec_loss: 0.0445, perceptual_loss: 0.2539, vq_loss: 0.0252, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9189, generator_adv_loss: -0.0195, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2581, d_vqkd: 128715.3750, d_vqgan: 145562.8906
	[[34m2025-05-01 10:27:02[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: 0.0287, logits_fake: 0.0391
	[[34m2025-05-01 10:27:02[0m] (step=0063300) Train Loss: 1.1398, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:28:28[0m] (Generator) rec_loss: 0.0707, perceptual_loss: 0.3223, vq_loss: 0.0238, commit_loss: 0.0060, entropy_loss: 0.0000, codebook_usage: 0.9189, generator_adv_loss: 0.0226, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.3110, d_vqkd: 127119.1250, d_vqgan: 144884.0625
	[[34m2025-05-01 10:28:29[0m] (Discriminator) discriminator_adv_loss: 0.5078, disc_weight: 0.5000, logits_real: -0.0850, logits_fake: -0.0452
	[[34m2025-05-01 10:28:29[0m] (step=0063400) Train Loss: 1.1324, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:29:56[0m] (Generator) rec_loss: 0.0541, perceptual_loss: 0.2695, vq_loss: 0.0254, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9193, generator_adv_loss: 0.0879, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2279, d_vqkd: 128119.9141, d_vqgan: 144998.2500
	[[34m2025-05-01 10:29:56[0m] (Discriminator) discriminator_adv_loss: 0.4922, disc_weight: 0.5000, logits_real: -0.1465, logits_fake: -0.1758
	[[34m2025-05-01 10:29:56[0m] (step=0063500) Train Loss: 1.1109, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:31:23[0m] (Generator) rec_loss: 0.0722, perceptual_loss: 0.2676, vq_loss: 0.0242, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9171, generator_adv_loss: -0.0164, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2761, d_vqkd: 128848.0078, d_vqgan: 144431.0469
	[[34m2025-05-01 10:31:24[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.0476, logits_fake: 0.0327
	[[34m2025-05-01 10:31:24[0m] (step=0063600) Train Loss: 1.1428, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:32:51[0m] (Generator) rec_loss: 0.0717, perceptual_loss: 0.2812, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9200, generator_adv_loss: -0.0155, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2935, d_vqkd: 128578.4609, d_vqgan: 144553.3438
	[[34m2025-05-01 10:32:51[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: 0.0520, logits_fake: 0.0310
	[[34m2025-05-01 10:32:51[0m] (step=0063700) Train Loss: 1.1270, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:34:18[0m] (Generator) rec_loss: 0.0598, perceptual_loss: 0.2656, vq_loss: 0.0255, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9195, generator_adv_loss: 0.0415, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2212, d_vqkd: 129056.4766, d_vqgan: 145566.1250
	[[34m2025-05-01 10:34:19[0m] (Discriminator) discriminator_adv_loss: 0.5039, disc_weight: 0.5000, logits_real: -0.1040, logits_fake: -0.0830
	[[34m2025-05-01 10:34:19[0m] (step=0063800) Train Loss: 1.1135, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:35:46[0m] (Generator) rec_loss: 0.0634, perceptual_loss: 0.2910, vq_loss: 0.0257, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9187, generator_adv_loss: 0.0168, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2802, d_vqkd: 129787.8906, d_vqgan: 144195.2031
	[[34m2025-05-01 10:35:46[0m] (Discriminator) discriminator_adv_loss: 0.4961, disc_weight: 0.5000, logits_real: -0.0148, logits_fake: -0.0337
	[[34m2025-05-01 10:35:46[0m] (step=0063900) Train Loss: 1.1150, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:37:13[0m] (Generator) rec_loss: 0.0889, perceptual_loss: 0.3066, vq_loss: 0.0254, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9182, generator_adv_loss: -0.1572, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2913, d_vqkd: 128621.1484, d_vqgan: 145919.7656
	[[34m2025-05-01 10:37:14[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: 0.3223, logits_fake: 0.3145
	[[34m2025-05-01 10:37:14[0m] (step=0064000) Train Loss: 1.1528, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:37:16[0m] Saved checkpoint to ck_decoder_cnn/001-TokenFlow/checkpoints/0064000.pt
	[[34m2025-05-01 10:38:43[0m] (Generator) rec_loss: 0.0467, perceptual_loss: 0.2461, vq_loss: 0.0248, commit_loss: 0.0062, entropy_loss: 0.0000, codebook_usage: 0.9195, generator_adv_loss: 0.0464, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2451, d_vqkd: 128071.2422, d_vqgan: 144751.0000
	[[34m2025-05-01 10:38:43[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.1006, logits_fake: -0.0928
	[[34m2025-05-01 10:38:43[0m] (step=0064100) Train Loss: 1.1310, Train Steps/Sec: 1.12
	[[34m2025-05-01 10:40:10[0m] (Generator) rec_loss: 0.0501, perceptual_loss: 0.2871, vq_loss: 0.0254, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9165, generator_adv_loss: 0.0212, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2783, d_vqkd: 128444.3203, d_vqgan: 145628.6094
	[[34m2025-05-01 10:40:11[0m] (Discriminator) discriminator_adv_loss: 0.5000, disc_weight: 0.5000, logits_real: -0.0422, logits_fake: -0.0425
	[[34m2025-05-01 10:40:11[0m] (step=0064200) Train Loss: 1.1362, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:41:37[0m] (Generator) rec_loss: 0.0830, perceptual_loss: 0.2676, vq_loss: 0.0244, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9183, generator_adv_loss: -0.0796, disc_adaptive_weight: 1.0000, disc_weight: 0.5000, vqkd_loss: 0.2680, d_vqkd: 128885.2969, d_vqgan: 144793.2969
	[[34m2025-05-01 10:44:47[0m] Experiment directory created at ck_decoder_cnn/001-TokenFlow
	[[34m2025-05-01 10:44:47[0m] Namespace(data_path='/root/autodl-tmp/TokenFlow/train2017', data_face_path=None, cloud_save_path='./logs/tokenflow/', no_local_save=False, vq_model='TokenFlow', teacher='clipb_224', vq_ckpt='/root/autodl-tmp/TokenFlow/TokenFlow_checkpoint/tokenflow_clipb_32k_enhanced.pt', finetune=False, ema=False, codebook_size=32768, codebook_embed_dim=8, semantic_code_dim=32, codebook_l2_norm=True, codebook_weight=1.0, entropy_loss_ratio=0.0, commit_loss_beta=0.25, reconstruction_weight=1.0, reconstruction_loss='l2', perceptual_weight=1.0, disc_weight=0.5, disc_start=20000, disc_type='patchgan', disc_loss='hinge', gen_loss='hinge', compile=False, dropout_p=0.0, results_dir='ck_decoder_cnn', dataset='coco', image_size=224, epochs=10, lr=0.0001, weight_decay=0.05, beta1=0.9, beta2=0.95, max_grad_norm=1.0, global_batch_size=8, global_seed=0, num_workers=1, log_every=100, ckpt_every=8000, gradient_accumulation_steps=1, mixed_precision='bf16', infer_interpolate=False, enhanced_decoder=False, kmeans=False, finetune_decoder=False, rank=0, world_size=1, gpu=0, dist_url='env://', distributed=True, dist_backend='nccl')
	[[34m2025-05-01 10:44:47[0m] Starting rank=0, seed=0, world_size=1.
	[[34m2025-05-01 10:44:51[0m] VQ Model Parameters: 376,710,957
	[[34m2025-05-01 10:44:55[0m] Discriminator Parameters: 2,765,633
	[[34m2025-05-01 10:44:55[0m] Optimizing part parameters.
	[[34m2025-05-01 10:44:55[0m] no kmeans, args.lr = 0.0001
	[[34m2025-05-01 10:44:55[0m] Dataset contains 116,756 images (/root/autodl-tmp/TokenFlow/train2017)
	[[34m2025-05-01 10:44:56[0m] Loaded model from checkpoint.
	[[34m2025-05-01 10:44:56[0m] Optimizer starting from scratch.
	[[34m2025-05-01 10:44:56[0m] Discriminator starting from scratch.
	[[34m2025-05-01 10:44:56[0m] Discriminator optimizer starting from scratch.
	[[34m2025-05-01 10:44:56[0m] Resume training from checkpoint: /root/autodl-tmp/TokenFlow/TokenFlow_checkpoint/tokenflow_clipb_32k_enhanced.pt
	[[34m2025-05-01 10:44:56[0m] Initial state: steps=0, epochs=0
	[[34m2025-05-01 10:44:56[0m] Training for 10 epochs...
	[[34m2025-05-01 10:45:15[0m] Beginning epoch 0...
	[[34m2025-05-01 10:46:42[0m] (Generator) rec_loss: 0.1836, perceptual_loss: 0.7305, vq_loss: 0.0234, commit_loss: 0.0059, entropy_loss: 0.0000, codebook_usage: 0.9208, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5058, d_vqkd: 127188.8984, d_vqgan: 145138.2344
	[[34m2025-05-01 10:46:43[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3047
	[[34m2025-05-01 10:46:43[0m] (step=0000100) Train Loss: 1.6187, Train Steps/Sec: 0.94
	[[34m2025-05-01 10:48:10[0m] (Generator) rec_loss: 0.1364, perceptual_loss: 0.6797, vq_loss: 0.0245, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9199, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5172, d_vqkd: 128174.8438, d_vqgan: 144185.8438
	[[34m2025-05-01 10:48:10[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3047, logits_fake: -1.3594
	[[34m2025-05-01 10:48:10[0m] (step=0000200) Train Loss: 1.4384, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:49:37[0m] (Generator) rec_loss: 0.1320, perceptual_loss: 0.7031, vq_loss: 0.0257, commit_loss: 0.0064, entropy_loss: 0.0000, codebook_usage: 0.9199, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5297, d_vqkd: 128616.2188, d_vqgan: 146205.1562
	[[34m2025-05-01 10:49:38[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3438, logits_fake: -1.3516
	[[34m2025-05-01 10:49:38[0m] (step=0000300) Train Loss: 1.3802, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:51:05[0m] (Generator) rec_loss: 0.1170, perceptual_loss: 0.6602, vq_loss: 0.0253, commit_loss: 0.0063, entropy_loss: 0.0000, codebook_usage: 0.9200, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5213, d_vqkd: 129389.1953, d_vqgan: 145608.9219
	[[34m2025-05-01 10:51:05[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3672, logits_fake: -1.3594
	[[34m2025-05-01 10:51:05[0m] (step=0000400) Train Loss: 1.3412, Train Steps/Sec: 1.14
	[[34m2025-05-01 10:52:32[0m] (Generator) rec_loss: 0.1081, perceptual_loss: 0.6211, vq_loss: 0.0246, commit_loss: 0.0061, entropy_loss: 0.0000, codebook_usage: 0.9185, generator_adv_loss: 0.0000, disc_adaptive_weight: 1.0000, disc_weight: 0.0000, vqkd_loss: 0.5014, d_vqkd: 128340.0547, d_vqgan: 144212.1719
	[[34m2025-05-01 10:52:33[0m] (Discriminator) discriminator_adv_loss: 0.0000, disc_weight: 0.0000, logits_real: -1.3203, logits_fake: -1.3594
	[[34m2025-05-01 10:52:33[0m] (step=0000500) Train Loss: 1.3092, Train Steps/Sec: 1.14