Spaces:

Kasamuday
/

object

Runtime error

App Files Files Community

object / models /official /projects /roformer /roformer_experiments.py

Kasamuday

Upload 4260 files

f3507ef verified almost 2 years ago

raw

history blame contribute delete

4.92 kB

	# Copyright 2023 The TensorFlow Authors. All Rights Reserved.
	#
	# Licensed under the Apache License, Version 2.0 (the "License");
	# you may not use this file except in compliance with the License.
	# You may obtain a copy of the License at
	#
	# http://www.apache.org/licenses/LICENSE-2.0
	#
	# Unless required by applicable law or agreed to in writing, software
	# distributed under the License is distributed on an "AS IS" BASIS,
	# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
	# See the License for the specific language governing permissions and
	# limitations under the License.

	"""Roformer experiment configurations."""
	# pylint: disable=g-doc-return-or-yield,line-too-long
	import dataclasses

	from official.core import config_definitions as cfg
	from official.core import exp_factory
	from official.modeling import optimization
	from official.nlp.configs import bert
	from official.nlp.configs import encoders
	from official.nlp.data import pretrain_dataloader
	from official.nlp.data import sentence_prediction_dataloader
	from official.nlp.tasks import masked_lm
	from official.nlp.tasks import sentence_prediction
	from official.projects.roformer import roformer

	AdamWeightDecay = optimization.AdamWeightDecayConfig
	PolynomialLr = optimization.PolynomialLrConfig
	PolynomialWarmupConfig = optimization.PolynomialWarmupConfig


	@dataclasses.dataclass
	class RoformerOptimizationConfig(optimization.OptimizationConfig):
	"""TEAMS optimization config."""
	optimizer: optimization.OptimizerConfig = optimization.OptimizerConfig(
	type='adamw',
	adamw=AdamWeightDecay(
	weight_decay_rate=0.01,
	exclude_from_weight_decay=['LayerNorm', 'layer_norm', 'bias'],
	epsilon=1e-6))
	learning_rate: optimization.LrConfig = optimization.LrConfig(
	type='polynomial',
	polynomial=PolynomialLr(
	initial_learning_rate=1e-4,
	decay_steps=1000000,
	end_learning_rate=0.0))
	warmup: optimization.WarmupConfig = optimization.WarmupConfig(
	type='polynomial', polynomial=PolynomialWarmupConfig(warmup_steps=10000))


	@exp_factory.register_config_factory('roformer/pretraining')
	def roformer_pretraining() -> cfg.ExperimentConfig:
	"""BERT pretraining experiment."""
	config = cfg.ExperimentConfig(
	runtime=cfg.RuntimeConfig(enable_xla=True),
	task=masked_lm.MaskedLMConfig(
	model=bert.PretrainerConfig(
	encoder=encoders.EncoderConfig(
	type='any', any=roformer.RoformerEncoderConfig()),
	cls_heads=[
	bert.ClsHeadConfig(
	inner_dim=768,
	num_classes=2,
	dropout_rate=0.1,
	name='next_sentence')
	]),
	train_data=pretrain_dataloader.BertPretrainDataConfig(
	use_v2_feature_names=True),
	validation_data=pretrain_dataloader.BertPretrainDataConfig(
	use_v2_feature_names=True, is_training=False)),
	trainer=cfg.TrainerConfig(
	optimizer_config=RoformerOptimizationConfig(), train_steps=1000000),
	restrictions=[
	'task.train_data.is_training != None',
	'task.validation_data.is_training != None'
	])
	return config


	@exp_factory.register_config_factory('roformer/glue')
	def roformer_glue() -> cfg.ExperimentConfig:
	r"""BigBird GLUE."""
	config = cfg.ExperimentConfig(
	task=sentence_prediction.SentencePredictionConfig(
	model=sentence_prediction.ModelConfig(
	encoder=encoders.EncoderConfig(
	type='any', any=roformer.RoformerEncoderConfig())),
	train_data=sentence_prediction_dataloader
	.SentencePredictionDataConfig(),
	validation_data=sentence_prediction_dataloader
	.SentencePredictionDataConfig(
	is_training=False, drop_remainder=False)),
	trainer=cfg.TrainerConfig(
	optimizer_config=optimization.OptimizationConfig({
	'optimizer': {
	'type': 'adamw',
	'adamw': {
	'weight_decay_rate':
	0.01,
	'exclude_from_weight_decay':
	['LayerNorm', 'layer_norm', 'bias'],
	}
	},
	'learning_rate': {
	'type': 'polynomial',
	'polynomial': {
	'initial_learning_rate': 3e-5,
	'end_learning_rate': 0.0,
	}
	},
	'warmup': {
	'type': 'polynomial'
	}
	})),
	restrictions=[
	'task.train_data.is_training != None',
	'task.validation_data.is_training != None'
	])
	return config