Spaces:

lord-reso
/

host

Sleeping

App Files Files Community

lord-reso commited on Feb 1, 2024

Commit

7071ffd

verified ·

1 Parent(s): cac86d7

Removed unused functions

Browse files

Files changed (1) hide show

train.py +1 -201

train.py CHANGED Viewed

@@ -1,212 +1,12 @@
-import os
-import time
-import argparse
-import math
-from numpy import finfo
 import torch
-from torch.utils.data import DataLoader
 from model import Tacotron2
-from data_utils import TextMelLoader, TextMelCollate
-from loss_function import Tacotron2Loss
-from logger import Tacotron2Logger
 from hparams import create_hparams
-def prepare_dataloaders(hparams):
-    # Get data, data loaders, and collate function ready
-    trainset = TextMelLoader(hparams.training_files, hparams)
-    valset = TextMelLoader(hparams.validation_files, hparams)
-    collate_fn = TextMelCollate(hparams.n_frames_per_step)
-    train_loader = DataLoader(trainset, num_workers=1, shuffle=True,
-                              batch_size=hparams.batch_size, collate_fn=collate_fn)
-    return train_loader, valset, collate_fn
-def prepare_directories_and_logger(output_directory, log_directory):
-    if not os.path.isdir(output_directory):
-        os.makedirs(output_directory)
-        os.chmod(output_directory, 0o775)
-    logger = Tacotron2Logger(os.path.join(output_directory, log_directory))
-    return logger
 def load_model(hparams):
     model = Tacotron2(hparams).float()
     if hparams.fp16_run:
         model.decoder.attention_layer.score_mask_value = finfo('float16').min
     return model
-def warm_start_model(checkpoint_path, model, ignore_layers):
-    assert os.path.isfile(checkpoint_path)
-    print("Warm starting model from checkpoint '{}'".format(checkpoint_path))
-    checkpoint_dict = torch.load(checkpoint_path, map_location='cpu')
-    model_dict = checkpoint_dict['state_dict']
-    if len(ignore_layers) > 0:
-        model_dict = {k: v for k, v in model_dict.items()
-                      if k not in ignore_layers}
-        dummy_dict = model.state_dict()
-        dummy_dict.update(model_dict)
-        model_dict = dummy_dict
-    model.load_state_dict(model_dict)
-    return model
-def load_checkpoint(checkpoint_path, model, optimizer):
-    assert os.path.isfile(checkpoint_path)
-    print("Loading checkpoint '{}'".format(checkpoint_path))
-    checkpoint_dict = torch.load(checkpoint_path, map_location='cpu')
-    model.load_state_dict(checkpoint_dict['state_dict'])
-    optimizer.load_state_dict(checkpoint_dict['optimizer'])
-    learning_rate = checkpoint_dict['learning_rate']
-    iteration = checkpoint_dict['iteration']
-    print("Loaded checkpoint '{}' from iteration {}".format(
-        checkpoint_path, iteration))
-    return model, optimizer, learning_rate, iteration
-def save_checkpoint(model, optimizer, learning_rate, iteration, filepath):
-    print("Saving model and optimizer state at iteration {} to {}".format(
-        iteration, filepath))
-    torch.save({'iteration': iteration,
-                'state_dict': model.state_dict(),
-                'optimizer': optimizer.state_dict(),
-                'learning_rate': learning_rate}, filepath)
-def validate(model, criterion, valset, iteration, batch_size,
-             collate_fn, logger):
-    """Handles all the validation scoring and printing"""
-    model.eval()
-    with torch.no_grad():
-        val_loader = DataLoader(valset, num_workers=1, shuffle=False,
-                                batch_size=batch_size, collate_fn=collate_fn)
-        val_loss = 0.0
-        for i, batch in enumerate(val_loader):
-            x, y = model.parse_batch(batch)
-            y_pred = model(x)
-            loss = criterion(y_pred, y)
-            reduced_val_loss = loss.item()
-            val_loss += reduced_val_loss
-        val_loss = val_loss / (i + 1)
-    model.train()
-    print("Validation loss {}: {:9f}  ".format(iteration, val_loss))
-    logger.log_validation(val_loss, model, y, y_pred, iteration)
-def train(output_directory, log_directory, checkpoint_path, warm_start,
-          hparams):
-    """Training and validation logging results to tensorboard and stdout
-    Params
-    ------
-    output_directory (string): directory to save checkpoints
-    log_directory (string) directory to save tensorboard logs
-    checkpoint_path(string): checkpoint path
-    hparams (object): comma-separated list of "name=value" pairs.
-    """
-    torch.manual_seed(hparams.seed)
-    model = load_model(hparams)
-    learning_rate = hparams.learning_rate
-    optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate,
-                                 weight_decay=hparams.weight_decay)
-    if hparams.fp16_run:
-        from apex import amp
-        model, optimizer = amp.initialize(model, optimizer, opt_level='O2')
-    criterion = Tacotron2Loss()
-    logger = prepare_directories_and_logger(
-        output_directory, log_directory)
-    train_loader, valset, collate_fn = prepare_dataloaders(hparams)
-    # Load checkpoint if one exists
-    iteration = 0
-    if checkpoint_path is not None:
-        if warm_start:
-            model = warm_start_model(checkpoint_path, model, hparams.ignore_layers)
-        else:
-            model, optimizer, _learning_rate, iteration = load_checkpoint(
-                checkpoint_path, model, optimizer)
-            if hparams.use_saved_learning_rate:
-                learning_rate = _learning_rate
-            iteration += 1  # next iteration is iteration + 1
-    model.train()
-    is_overflow = False
-    # ================ MAIN TRAINING LOOP! ===================
-    for epoch in range(hparams.epochs):
-        print("Epoch: {}".format(epoch))
-        for i, batch in enumerate(train_loader):
-            start = time.perf_counter()
-            for param_group in optimizer.param_groups:
-                param_group['lr'] = learning_rate
-            model.zero_grad()
-            x, y = model.parse_batch(batch)
-            y_pred = model(x)
-            loss = criterion(y_pred, y)
-            reduced_loss = loss.item()
-            if hparams.fp16_run:
-                with amp.scale_loss(loss, optimizer) as scaled_loss:
-                    scaled_loss.backward()
-            else:
-                loss.backward()
-            grad_norm = torch.nn.utils.clip_grad_norm_(
-                model.parameters(), hparams.grad_clip_thresh)
-            optimizer.step()
-            if not is_overflow:
-                duration = time.perf_counter() - start
-                print("Train loss {} {:.6f} Grad Norm {:.6f} {:.2f}s/it".format(
-                    iteration, reduced_loss, grad_norm, duration))
-                logger.log_training(
-                    reduced_loss, grad_norm, learning_rate, duration, iteration)
-            if not is_overflow and (iteration % hparams.iters_per_checkpoint == 0):
-                validate(model, criterion, valset, iteration,
-                         hparams.batch_size, collate_fn, logger)
-                checkpoint_path = os.path.join(
-                    output_directory, "checkpoint_{}".format(iteration))
-                save_checkpoint(model, optimizer, learning_rate, iteration,
-                                checkpoint_path)
-            iteration += 1
-if __name__ == '__main__':
-    parser = argparse.ArgumentParser()
-    parser.add_argument('-o', '--output_directory', type=str,
-                        help='directory to save checkpoints')
-    parser.add_argument('-l', '--log_directory', type=str,
-                        help='directory to save tensorboard logs')
-    parser.add_argument('-c', '--checkpoint_path', type=str, default=None,
-                        required=False, help='checkpoint path')
-    parser.add_argument('--warm_start', action='store_true',
-                        help='load model weights only, ignore specified layers')
-    parser.add_argument('--hparams', type=str,
-                        required=False, help='comma-separated name=value pairs')
-    args = parser.parse_args()
-    hparams = create_hparams(args.hparams)
-    torch.backends.cudnn.enabled = hparams.cudnn_enabled
-    torch.backends.cudnn.benchmark = hparams.cudnn_benchmark
-    print("FP16 Run:", hparams.fp16_run)
-    print("Dynamic Loss Scaling:", hparams.dynamic_loss_scaling)
-    train(args.output_directory, args.log_directory, args.checkpoint_path,
-          args.warm_start, hparams)

 import torch
+from numpy import finfo
 from model import Tacotron2
 from hparams import create_hparams
 def load_model(hparams):
     model = Tacotron2(hparams).float()
     if hparams.fp16_run:
         model.decoder.attention_layer.score_mask_value = finfo('float16').min
     return model