File size: 7,282 Bytes

d39b279

import models
import time
import torch
import math
from tqdm import tqdm
import numpy as np
import pandas as pd
from sklearn.metrics import f1_score, accuracy_score, recall_score, precision_score, average_precision_score, roc_auc_score

def build_model(model_name):
    if model_name == 'F3Net':
        model = models.Det_F3_Net()
    if model_name == 'NPR':
        model = models.resnet50_npr()
    if model_name == 'STIL':
        model = models.Det_STIL()
    if model_name == 'XCLIP_DeMamba':
        model = models.XCLIP_DeMamba()
    if model_name == 'CLIP_DeMamba':
        model = models.CLIP_DeMamba()
    if model_name == 'XCLIP':
        model = models.XCLIP()
    if model_name == 'CLIP':
        model = models.CLIP_Base()
    if model_name == 'ViT_B_MINTIME':
        model = models.ViT_B_MINTIME()
    return model

def eval_model(cfg, model, val_loader, loss_ce, val_batch_size):
    model.eval()
    outpred_list = []
    gt_label_list = []
    video_list = []
    valLoss = 0
    lossTrainNorm = 0
    print("******** Start Testing. ********")

    with torch.no_grad():  # No need to track gradients during validation
        for i, (_, input, target, binary_label, video_id) in enumerate(tqdm(val_loader, desc="Validation", total=len(val_loader))):
            if i == 0:
                ss_time = time.time()
            
            input = input[:,0]
            varInput = torch.autograd.Variable(input.float().cuda())
            varTarget = torch.autograd.Variable(target.contiguous().cuda())
            var_Binary_Target = torch.autograd.Variable(binary_label.contiguous().cuda())

            logit = model(varInput)
            lossvalue = loss_ce(logit, var_Binary_Target)

            valLoss += lossvalue.item()
            lossTrainNorm += 1
            outpred_list.append(logit[:,0].sigmoid().cpu().detach().numpy())
            gt_label_list.append(varTarget.cpu().detach().numpy())
            video_list.append(video_id)
    
    valLoss = valLoss / lossTrainNorm

    outpred = np.concatenate(outpred_list, 0)
    gt_label = np.concatenate(gt_label_list, 0)
    video_list = np.concatenate(video_list, 0)
    pred_labels = [1 if item > 0.5 else 0 for item in outpred]
    true_labels = np.argmax(gt_label, axis=1)

    pred_accuracy = accuracy_score(true_labels, pred_labels)

    return pred_accuracy, video_list, pred_labels, true_labels, outpred

def train_one_epoch(cfg, model, loss_ce, scheduler, optimizer, epochID, max_epoch, max_acc, train_loader, val_loader, snapshot_path):
    model.train()
    trainLoss = 0
    lossTrainNorm = 0

    scheduler.step()
    pbar = tqdm(total=cfg['bath_per_epoch'])
    for batchID, (index, input, target, binary_label) in enumerate(train_loader):
        if batchID > cfg['bath_per_epoch']:
            break
        if batchID == 0:
            ss_time = time.time()
        input = input[:,0].float()
        varInput = torch.autograd.Variable(input).cuda()
        varTarget = torch.autograd.Variable(target.contiguous().cuda())
        var_Binary_Target = torch.autograd.Variable(binary_label.contiguous().cuda())
        optimizer.zero_grad()

        logit = model(varInput)
        lossvalue = loss_ce(logit, var_Binary_Target)
        
        lossvalue.backward()
        optimizer.step()

        trainLoss += lossvalue.item()
        lossTrainNorm += 1
        pbar.set_postfix(loss=trainLoss / lossTrainNorm)
        pbar.update(1)
        del lossvalue

    trainLoss = trainLoss / lossTrainNorm
    
    if (epochID+1) % 1 == 0:
        pred_accuracy, video_id, pred_labels, true_labels, outpred = eval_model(cfg, model, val_loader, loss_ce, cfg['val_batch_size'])    

        torch.save(
            {"epoch": epochID + 1, "model_state_dict": model.state_dict()},
            snapshot_path + "/last"+ ".pth",
            )

        if pred_accuracy > max_acc:
            max_epoch, max_acc = epochID, pred_accuracy
            torch.save(
            {"epoch": epochID + 1, "model_state_dict": model.state_dict()},
            snapshot_path + "/best_acc"+ ".pth",
            )

        df_result = pd.DataFrame({
            'data_path': video_id,
            'predicted_label': pred_labels,
            'actual_label': true_labels,
            'predicted_prob':outpred
        })

        temp_result_txt = snapshot_path+'/Epoch_'+str(epochID)+'_accuracy.txt'
        with open(temp_result_txt, 'w') as file:
            true_labels = df_result['actual_label']
            pred_probs = df_result['predicted_prob'] 
            auc = roc_auc_score(true_labels, pred_probs)
            ap = average_precision_score(true_labels, pred_probs)
            file.write(f"总正确率: {pred_accuracy:.2%}\n")
            file.write(f"AUC是: {auc:.2%}\n")
            file.write(f"AP是: {ap:.2%}\n")
            
        # my code to save pred probs and true labels in csv
        temp_result_csv = snapshot_path + '/Epoch_' + str(epochID) + '_labels_probs.csv'
        df_result[['actual_label', 'predicted_prob']].to_csv(temp_result_csv, index=False)

        # prefixes = ["fake/ModelScope", "fake/Morph", "fake/MoonValley", 
        #             "fake/HotShot", "fake/EvalCrafter_T2V_Dataset/show_1", 
        #             "fake/Sora", "fake/Wild", "fake/VideoCrafter",
        #            "fake/Lavies", "fake/Gen2"]

        # video_nums = [700, 700, 626, 700, 700, 56, 926, 1400, 1400, 1380]

        # # real 
        # condition = df_result['data_path'].apply(lambda x: x.startswith("real"))
        # temp_df_val = df_result[condition]
        # temp_df_val['correct'] = temp_df_val['predicted_label'] == temp_df_val['actual_label']
        # accuracy = temp_df_val['correct'].mean()

        # FP = int((1-accuracy) * 10000)

        # for index, temp_prefixes in enumerate(prefixes):
        #     condition = df_result['data_path'].apply(lambda x: x.startswith(temp_prefixes))
        #     temp_df_val = df_result[condition]
        #     temp_df_val['correct'] = temp_df_val['predicted_label'] == temp_df_val['actual_label']
        #     accuracy = temp_df_val['correct'].mean()

        #     TP = int(accuracy * video_nums[index])
        #     FN = int((1-accuracy) * video_nums[index])
        #     P, R = TP / (TP + FP), TP / (TP + FN)
        #     F1 = 2 * P * R / (P + R)

        #     condition |= df_result['data_path'].str.startswith('real')
        #     temp_df_val = df_result[condition]
        #     true_labels = temp_df_val['actual_label']
        #     pred_probs = temp_df_val['predicted_prob']  # 假设这是模型预测的概率
        #     ap = average_precision_score(true_labels, pred_probs)
        #     with open(temp_result_txt, 'a') as file:
        #         name = temp_prefixes.split('/')[-1]
        #         file.write(f"文件名: {name}, Recall是: {accuracy}\n")
        #         file.write(f"文件名: {name}, F1是: {F1}\n")
        #         file.write(f"文件名: {name}, AP是: {ap}\n")

        print("*****Average Training loss",str(trainLoss),"*****\n")
        print("*****Epoch", str(epochID), "*****Acc ", str(pred_accuracy), '*****',
            '\n', "*****Max acc epoch", str(max_epoch), "*****Acc ", str(max_acc), '*****\n')
    end_time = time.time()

    return max_epoch, max_acc, end_time - ss_time