๋ชจ๋ธ
๊ธฐ๋ณธ ํด๋์ค [PreTrainedModel], [TFPreTrainedModel], [FlaxPreTrainedModel]๋ ๋ก์ปฌ ํ์ผ๊ณผ ๋๋ ํ ๋ฆฌ๋ก๋ถํฐ ๋ชจ๋ธ์ ๋ก๋ํ๊ณ ์ ์ฅํ๊ฑฐ๋ ๋๋ (ํ๊น
ํ์ด์ค AWS S3 ๋ฆฌํฌ์งํ ๋ฆฌ๋ก๋ถํฐ ๋ค์ด๋ก๋๋) ๋ผ์ด๋ธ๋ฌ๋ฆฌ์์ ์ ๊ณตํ๋ ์ฌ์ ํ๋ จ๋ ๋ชจ๋ธ ์ค์ ์ ๋ก๋ํ๊ณ ์ ์ฅํ๋ ๊ฒ์ ์ง์ํ๋ ๊ธฐ๋ณธ ๋ฉ์๋๋ฅผ ๊ตฌํํ์์ต๋๋ค.
[PreTrainedModel]๊ณผ [TFPreTrainedModel]์ ๋ํ ๋ชจ๋ ๋ชจ๋ธ๋ค์ ๊ณตํต์ ์ผ๋ก ์ง์ํ๋ ๋ฉ์๋ ์ฌ๋ฌ๊ฐ๋ฅผ ๊ตฌํํ์์ต๋๋ค:
- ์ ํ ํฐ์ด ๋จ์ด์ฅ์ ์ถ๊ฐ๋ ๋, ์ ๋ ฅ ํ ํฐ ์๋ฒ ๋ฉ์ ํฌ๊ธฐ๋ฅผ ์กฐ์ ํฉ๋๋ค.
- ๋ชจ๋ธ์ ์ดํ ์ ํค๋๋ฅผ ๊ฐ์ง์น๊ธฐํฉ๋๋ค.
๊ฐ ๋ชจ๋ธ์ ๊ณตํต์ธ ๋ค๋ฅธ ๋ฉ์๋๋ค์ ๋ค์์ ํด๋์ค์์ ์ ์๋ฉ๋๋ค.
- [
~modeling_utils.ModuleUtilsMixin](ํ์ดํ ์น ๋ชจ๋ธ์ฉ) - ํ
์คํธ ์์ฑ์ ์ํ [
~modeling_tf_utils.TFModuleUtilsMixin](ํ ์ํ๋ก ๋ชจ๋ธ์ฉ) - [
~generation.GenerationMixin](ํ์ดํ ์น ๋ชจ๋ธ์ฉ) - [
~generation.FlaxGenerationMixin](Flax/JAX ๋ชจ๋ธ์ฉ)
PreTrainedModel
[[autodoc]] PreTrainedModel - push_to_hub - all
์ฌ์ฉ์ ์ ์ ๋ชจ๋ธ์ ์ด๊ณ ์ ์ด๊ธฐํ(superfast init)๊ฐ ํน์ ๋ชจ๋ธ์ ์ ์ฉ๋ ์ ์๋์ง ์ฌ๋ถ๋ฅผ ๊ฒฐ์ ํ๋ _supports_assign_param_buffer๋ ํฌํจํด์ผ ํฉ๋๋ค.
test_save_and_load_from_pretrained ์คํจ ์, ๋ชจ๋ธ์ด _supports_assign_param_buffer๋ฅผ ํ์๋ก ํ๋์ง ํ์ธํ์ธ์.
ํ์๋ก ํ๋ค๋ฉด False๋ก ์ค์ ํ์ธ์.
ModuleUtilsMixin
[[autodoc]] modeling_utils.ModuleUtilsMixin
TFPreTrainedModel
[[autodoc]] TFPreTrainedModel - push_to_hub - all
TFModelUtilsMixin
[[autodoc]] modeling_tf_utils.TFModelUtilsMixin
FlaxPreTrainedModel
[[autodoc]] FlaxPreTrainedModel - push_to_hub - all
ํ๋ธ์ ์ ์ฅํ๊ธฐ
[[autodoc]] utils.PushToHubMixin
๊ณต์ ๋ ์ฒดํฌํฌ์ธํธ
[[autodoc]] modeling_utils.load_sharded_checkpoint