import torch
import torch.optim as optim
import torchvision
from torchvision import datasets, transforms
from torch.utils.data import DataLoader
import os
import numpy as np
import random
import torch.nn.functional as F
from attacks.UnivIntruder.dataloader import GetDatasetMeta, TransformedDataset, InMemoryDataset
from attacks.UnivIntruder.loss import TrainableAffineTransform, UniversalPerturbation, BackdoorEval, \
    NoTargetDataset
from attacks.UnivIntruder.loss_function.clip_loss import CLIPLoss
from tqdm import tqdm


# Fix random seeds for reproducibility
def fix_random_seeds(seed=42):
    torch.manual_seed(seed)
    torch.cuda.manual_seed(seed)
    torch.cuda.manual_seed_all(seed)  # if you are using multi-GPU.
    np.random.seed(seed)
    random.seed(seed)
    torch.backends.cudnn.benchmark = False
    torch.backends.cudnn.deterministic = True

def save_images(x, x_hat, render_num=64, output_dir='rendered_images', step=0, test=False):
    os.makedirs(output_dir, exist_ok=True)

    num_rows = int(render_num ** 0.5 / 2) * 2

    img_lst = []
    for i in range(int(render_num / 2)):
        img_lst.append(x[i])
        img_lst.append(x_hat[i])

    grid = torchvision.utils.make_grid(img_lst, nrow=num_rows, padding=2)
    if test:
        torchvision.utils.save_image(grid, os.path.join(output_dir, str(step) + '.png'), nrow=num_rows)
    else:
        torchvision.utils.save_image(grid * 0.5 + 0.5, os.path.join(output_dir, str(step) + '.png'), nrow=num_rows)


def train(args_cl):
    # fix_random_seeds(1)

    # Parameters
    device = 'cuda:0'  # args.device
    class_map = args_cl['target_class_dict']
    target_class = list(class_map.keys())[list(class_map.values()).index(args_cl['target_class'])]
    eps = 32  # args.eps
    epsilon = eps / 255
    batch_size = args_cl['batch_size']  # args.batch_sizes

    data_path = 'datasets'  # args.data_path
    if args_cl['dataset'] == 'cifar100':
        src_dataset = 'TinyImageNet'
        tgt_dataset = 'CIFAR100'
    elif args_cl['dataset'] == 'imagenet100':
        src_dataset = 'ImageNet'
        tgt_dataset = 'ImageNet100'
    image_size = 32 if tgt_dataset == 'CIFAR100' else 224  # args.image_size

    max_step = 1  # args.max_step
    out_path = f'{args_cl["logs_eval_name"]}/adv_eps{eps}_tc{class_map[target_class]}'
    os.makedirs(out_path, exist_ok=True)
    pretrain = None
    flip = True
    download = True
    simple_out = False
    top5 = True
    split = 1  # args.split

    transform = transforms.Compose([
        transforms.Resize((image_size, image_size)),
        transforms.ToTensor(),
        transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
    ])

    src_data_meta = GetDatasetMeta(data_path, src_dataset)
    tgt_data_meta = GetDatasetMeta(data_path, tgt_dataset)

    train_set = src_data_meta.get_dataset(transform=transform, train=True if src_dataset != 'ImageNet' else False,
                                          download=download)
    test_set = tgt_data_meta.get_dataset(transform=transform, train=True if tgt_dataset != 'ImageNet100' else False,
                                         download=download)
    test_set = NoTargetDataset(test_set, target_class)
    test_set, _ = torch.utils.data.random_split(test_set,
                                                [len(test_set) // split, len(test_set) - len(test_set) // split])
    src_label_text_dict = src_data_meta.get_dataset_label_names()
    tgt_label_text_dict = tgt_data_meta.get_dataset_label_names()

    tgt_transform = tgt_data_meta.get_transformation()
    y_negative = set(tgt_label_text_dict.values())
    y_negative.discard(tgt_label_text_dict[target_class])

    train_set = NoTargetDataset(train_set, target=next(
        (k for k, v in src_label_text_dict.items() if v == tgt_label_text_dict[target_class]), None))
    train_set = InMemoryDataset([i for i in train_set])

    train_loader = DataLoader(train_set, batch_size=batch_size, shuffle=True, drop_last=True, num_workers=0)

    if pretrain:
        input_tensor = torch.load(pretrain)
        output_tensor = F.interpolate(input_tensor.unsqueeze(0), size=(image_size, image_size), mode='bilinear',
                                      align_corners=False).squeeze(0)
        trigger_model = UniversalPerturbation((3, image_size, image_size), epsilon, initialization=output_tensor,
                                              device=device)
    else:
        trigger_model = UniversalPerturbation((3, int(image_size), int(image_size)), epsilon, initialization=None,
                                              device=device)

    visual_model = tgt_data_meta.get_clean_model()
    evaluator = BackdoorEval(visual_model, len(list(tgt_label_text_dict.keys())), device, target_class, simple_out,
                             top5)

    # Optimizer
    optimizer = optim.Adam(trigger_model.parameters(), lr=0.01, weight_decay=1e-5)

    # Loss function
    clip_loss_func = CLIPLoss(device, lambda_direction=1, clip_model='ViT-B-32', pretrained='laion2b_s34b_b79k'
    )

    clip_loss_func.precompute_text_features(list(src_label_text_dict.values()), templates=src_data_meta.get_template())
    clip_loss_func.precompute_text_features(list(tgt_label_text_dict.values()), templates=tgt_data_meta.get_template())

    # Training loop
    global_step = 0
    while global_step <= max_step:
        average_epoch_loss = []
        univ_loss = 0
        cl_loss = 0
        total_loss = 0
        for i, (x, y) in enumerate(tqdm(train_loader, total=len(train_loader),
                                        desc=f'Training Trigger: ')):
            if global_step > max_step:
                break
            bs = x.size(0)
            x = x.to(device).to(torch.float32)
            x_hat = trigger_model(x)  # Apply the perturbation

            grad_transform = TrainableAffineTransform(bs, 0.25, flip=flip)

            x_hat_trans = grad_transform(x_hat)

            if src_label_text_dict:
                y_source = [src_label_text_dict[int(y_i)] for y_i in y]
            else:
                y_source = None
            y_target = [tgt_label_text_dict[int(target_class)] for _ in y]

            # Compute the loss
            loss = clip_loss_func(x, y_source, x_hat_trans, y_target, y_negative)

            # Backward and optimize
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()

            with torch.no_grad():
                trigger_model.trigger.clamp_(-1, 1)

            average_epoch_loss.append(loss.item())
            global_step += 1
            univ_loss += loss.item()

            os.makedirs(os.path.join(out_path, 'ckpts'), exist_ok=True)
            torch.save(trigger_model.trigger.detach().cpu(), os.path.join(out_path, f'ckpts/trigger_{global_step}.pth'))
            trigger_model = trigger_model.to(device)
            trigger_model.train()