Check
/

vaw2tmp

nguyenvulebinh commited on Aug 18, 2021

Commit

18b4250

1 Parent(s): 58c3693

add random print sample when eval

Files changed (1) hide show

main.py CHANGED Viewed

@@ -150,7 +150,7 @@ if __name__ == "__main__":
                                               cache_file_name=os.path.join(cache_processing_dataset_folder, 'train',
                                                                            'cache-train-shard-{}.arrow'.format(
                                                                                train_dataset_shard_idx))
-                                              ) #.shard(1000, 0)  # Remove shard split when train
         # load test shard subset
         test_dataset = load_prepared_dataset(os.path.join(test_dataset_root_folder,
                                                           'shard_{}'.format(test_dataset_shard_idx)),
@@ -172,9 +172,6 @@ if __name__ == "__main__":
             callbacks=[BreakEachEpoch()]  # Manual break end of epoch because each epoch loop over a shard
         )
-        # training_args.num_train_epochs = epoch_idx + 1
-        logging.get_logger().info('Train epoch {}'.format(training_args.num_train_epochs))
         logging.get_logger().info('Train shard idx: {} / {}'.format(train_dataset_shard_idx + 1, num_train_shards))
         logging.get_logger().info(
             'Valid shard idx: {} / {} sub_shard: {}'.format(test_dataset_shard_idx + 1, num_test_shards, idx_sub_shard))

                                               cache_file_name=os.path.join(cache_processing_dataset_folder, 'train',
                                                                            'cache-train-shard-{}.arrow'.format(
                                                                                train_dataset_shard_idx))
+                                              )  # .shard(1000, 0)  # Remove shard split when train
         # load test shard subset
         test_dataset = load_prepared_dataset(os.path.join(test_dataset_root_folder,
                                                           'shard_{}'.format(test_dataset_shard_idx)),
             callbacks=[BreakEachEpoch()]  # Manual break end of epoch because each epoch loop over a shard
         )
         logging.get_logger().info('Train shard idx: {} / {}'.format(train_dataset_shard_idx + 1, num_train_shards))
         logging.get_logger().info(
             'Valid shard idx: {} / {} sub_shard: {}'.format(test_dataset_shard_idx + 1, num_test_shards, idx_sub_shard))