Buckets:

hf-doc-build
/

doc

Files

xet

hf-doc-build/doc / transformers /main /ko /main_classes /trainer.md

HuggingFaceDocBuilder

about 3 hours ago

preview code

download

raw

71.2 kB

Trainer [[trainer]]

Trainer 클래스는 PyTorch에서 완전한 기능(feature-complete)의 훈련을 위한 API를 제공하며, 다중 GPU/TPU에서의 분산 훈련, NVIDIA GPU, AMD GPU를 위한 혼합 정밀도, 그리고 PyTorch의 torch.amp를 지원합니다. Trainer는 모델의 훈련 방식을 커스터마이즈할 수 있는 다양한 옵션을 제공하는 TrainingArguments 클래스와 함께 사용됩니다. 이 두 클래스는 함께 완전한 훈련 API를 제공합니다.

Seq2SeqTrainer와 Seq2SeqTrainingArguments는 Trainer와 TrainingArguments 클래스를 상속하며, 요약이나 번역과 같은 시퀀스-투-시퀀스 작업을 위한 모델 훈련에 적합하게 조정되어 있습니다.

Trainer 클래스는 🤗 Transformers 모델에 최적화되어 있으며, 다른 모델과 함께 사용될 때 예상치 못한 동작을 하게 될 수 있습니다. 자신만의 모델을 사용할 때는 다음을 확인하세요:

모델은 항상 튜플이나 ModelOutput의 서브클래스를 반환해야 합니다.
모델은 labels 인자가 제공되면 손실을 계산할 수 있고, 모델이 튜플을 반환하는 경우 그 손실이 튜플의 첫 번째 요소로 반환되어야 합니다.
모델은 여러 개의 레이블 인자를 수용할 수 있어야 하며, Trainer에게 이름을 알리기 위해 TrainingArguments에서 label_names를 사용하지만, 그 중 어느 것도 "label"로 명명되어서는 안 됩니다.

Trainer [[trainer]]

Trainer [[transformers.Trainer]][[transformers.Trainer]]

transformers.Trainer[[transformers.Trainer]]

autocast_smart_context_manager[[transformers.Trainer.autocast_smart_context_manager]]

call_model_init[[transformers.Trainer.call_model_init]]

compute_loss[[transformers.Trainer.compute_loss]]

compute_loss_context_manager[[transformers.Trainer.compute_loss_context_manager]]

create_accelerator_and_postprocess[[transformers.Trainer.create_accelerator_and_postprocess]]

create_model_card[[transformers.Trainer.create_model_card]]

create_optimizer[[transformers.Trainer.create_optimizer]]

create_optimizer_and_scheduler[[transformers.Trainer.create_optimizer_and_scheduler]]

create_scheduler[[transformers.Trainer.create_scheduler]]

evaluate[[transformers.Trainer.evaluate]]

evaluation_loop[[transformers.Trainer.evaluation_loop]]

floating_point_ops[[transformers.Trainer.floating_point_ops]]

get_batch_samples[[transformers.Trainer.get_batch_samples]]

get_cp_size[[transformers.Trainer.get_cp_size]]

get_decay_parameter_names[[transformers.Trainer.get_decay_parameter_names]]

get_eval_dataloader[[transformers.Trainer.get_eval_dataloader]]

get_learning_rates[[transformers.Trainer.get_learning_rates]]

get_num_trainable_parameters[[transformers.Trainer.get_num_trainable_parameters]]

get_optimizer_cls_and_kwargs[[transformers.Trainer.get_optimizer_cls_and_kwargs]]

get_optimizer_group[[transformers.Trainer.get_optimizer_group]]

get_sp_size[[transformers.Trainer.get_sp_size]]

get_test_dataloader[[transformers.Trainer.get_test_dataloader]]

get_total_train_batch_size[[transformers.Trainer.get_total_train_batch_size]]

get_tp_size[[transformers.Trainer.get_tp_size]]

get_train_dataloader[[transformers.Trainer.get_train_dataloader]]

hyperparameter_search[[transformers.Trainer.hyperparameter_search]]

init_hf_repo[[transformers.Trainer.init_hf_repo]]

is_local_process_zero[[transformers.Trainer.is_local_process_zero]]

is_world_process_zero[[transformers.Trainer.is_world_process_zero]]

log[[transformers.Trainer.log]]

log_metrics[[transformers.Trainer.log_metrics]]

metrics_format[[transformers.Trainer.metrics_format]]

num_examples[[transformers.Trainer.num_examples]]

pop_callback[[transformers.Trainer.pop_callback]]

predict[[transformers.Trainer.predict]]

prediction_step[[transformers.Trainer.prediction_step]]

push_to_hub[[transformers.Trainer.push_to_hub]]

remove_callback[[transformers.Trainer.remove_callback]]

save_metrics[[transformers.Trainer.save_metrics]]

save_model[[transformers.Trainer.save_model]]

save_state[[transformers.Trainer.save_state]]

set_initial_training_values[[transformers.Trainer.set_initial_training_values]]

store_flos[[transformers.Trainer.store_flos]]

train[[transformers.Trainer.train]]

training_step[[transformers.Trainer.training_step]]

Seq2SeqTrainer [[transformers.Seq2SeqTrainer]][[transformers.Seq2SeqTrainer]]

transformers.Seq2SeqTrainer[[transformers.Seq2SeqTrainer]]

predict[[transformers.Seq2SeqTrainer.predict]]

TrainingArguments [[transformers.TrainingArguments]][[transformers.TrainingArguments]]

transformers.TrainingArguments[[transformers.TrainingArguments]]

get_warmup_steps[[transformers.TrainingArguments.get_warmup_steps]]

main_process_first[[transformers.TrainingArguments.main_process_first]]

set_dataloader[[transformers.TrainingArguments.set_dataloader]]

set_evaluate[[transformers.TrainingArguments.set_evaluate]]

set_logging[[transformers.TrainingArguments.set_logging]]

set_lr_scheduler[[transformers.TrainingArguments.set_lr_scheduler]]

set_optimizer[[transformers.TrainingArguments.set_optimizer]]

set_push_to_hub[[transformers.TrainingArguments.set_push_to_hub]]

set_save[[transformers.TrainingArguments.set_save]]

set_testing[[transformers.TrainingArguments.set_testing]]

set_training[[transformers.TrainingArguments.set_training]]

to_dict[[transformers.TrainingArguments.to_dict]]

to_json_string[[transformers.TrainingArguments.to_json_string]]

to_sanitized_dict[[transformers.TrainingArguments.to_sanitized_dict]]

Seq2SeqTrainingArguments [[transformers.Seq2SeqTrainingArguments]][[transformers.Seq2SeqTrainingArguments]]

transformers.Seq2SeqTrainingArguments[[transformers.Seq2SeqTrainingArguments]]

Xet Storage Details