Buckets:

hf-doc-build
/

doc

Files

xet

hf-doc-build/doc / transformers /main /en /main_classes /text_generation.md

HuggingFaceDocBuilder

about 17 hours ago

preview code

download

raw

49.1 kB

Generation

Each framework has a generate method for text generation implemented in their respective GenerationMixin class:

PyTorch generate() is implemented in GenerationMixin.

You can parameterize the generate method with a GenerationConfig class instance. Please refer to this class for the complete list of generation parameters, which control the behavior of the generation method.

To learn how to inspect a model's generation configuration, what are the defaults, how to change the parameters ad hoc, and how to create and save a customized generation configuration, refer to the text generation strategies guide. The guide also explains how to use related features, like token streaming.

Generation

GenerationConfig[[transformers.GenerationConfig]]

transformers.GenerationConfig[[transformers.GenerationConfig]]

from_model_config[[transformers.GenerationConfig.from_model_config]]

save_pretrained[[transformers.GenerationConfig.save_pretrained]]

update[[transformers.GenerationConfig.update]]

validate[[transformers.GenerationConfig.validate]]

get_generation_mode[[transformers.GenerationConfig.get_generation_mode]]

GenerationMixin[[transformers.GenerationMixin]]

transformers.GenerationMixin[[transformers.GenerationMixin]]

compute_transition_scores[[transformers.GenerationMixin.compute_transition_scores]]

ContinuousMixin[[transformers.ContinuousMixin]]

transformers.ContinuousMixin[[transformers.ContinuousMixin]]

destroy_cached_continuous_batching_manager[[transformers.ContinuousMixin.destroy_cached_continuous_batching_manager]]

generate_batch[[transformers.ContinuousMixin.generate_batch]]

init_continuous_batching[[transformers.ContinuousMixin.init_continuous_batching]]

ContinuousBatchingManager[[transformers.ContinuousBatchingManager]]

transformers.ContinuousBatchingManager[[transformers.ContinuousBatchingManager]]

cancel_request[[transformers.ContinuousBatchingManager.cancel_request]]

get_result[[transformers.ContinuousBatchingManager.get_result]]

is_running[[transformers.ContinuousBatchingManager.is_running]]

join[[transformers.ContinuousBatchingManager.join]]

register_result_handler[[transformers.ContinuousBatchingManager.register_result_handler]]

request_id_iter[[transformers.ContinuousBatchingManager.request_id_iter]]

start[[transformers.ContinuousBatchingManager.start]]

stop[[transformers.ContinuousBatchingManager.stop]]

switch_to_paged_attn[[transformers.ContinuousBatchingManager.switch_to_paged_attn]]

warmup[[transformers.ContinuousBatchingManager.warmup]]

Scheduler[[transformers.generation.Scheduler]]

transformers.generation.Scheduler[[transformers.generation.Scheduler]]

clear_cancelled_requests[[transformers.generation.Scheduler.clear_cancelled_requests]]

finish_request[[transformers.generation.Scheduler.finish_request]]

get_active_request_static_outputs[[transformers.generation.Scheduler.get_active_request_static_outputs]]

has_pending_requests[[transformers.generation.Scheduler.has_pending_requests]]

pop_request_to_evict[[transformers.generation.Scheduler.pop_request_to_evict]]

request_is_cancelled[[transformers.generation.Scheduler.request_is_cancelled]]

reset[[transformers.generation.Scheduler.reset]]

schedule_batch[[transformers.generation.Scheduler.schedule_batch]]

set_request_cancellation[[transformers.generation.Scheduler.set_request_cancellation]]

FIFOScheduler[[transformers.generation.FIFOScheduler]]

transformers.generation.FIFOScheduler[[transformers.generation.FIFOScheduler]]

PrefillFirstScheduler[[transformers.generation.PrefillFirstScheduler]]

transformers.generation.PrefillFirstScheduler[[transformers.generation.PrefillFirstScheduler]]

Xet Storage Details