PatchTSMixer[[patchtsmixer]]
๊ฐ์[[overview]]
PatchTSMixer ๋ชจ๋ธ์ Vijay Ekambaram, Arindam Jati, Nam Nguyen, Phanwadee Sinthong, Jayant Kalagnanam์ด ์ ์ํ TSMixer: ๋ค๋ณ๋ ์๊ณ์ด ์์ธก์ ์ํ ๊ฒฝ๋ MLP-Mixer ๋ชจ๋ธ์ด๋ผ๋ ๋ ผ๋ฌธ์์ ์๊ฐ๋์์ต๋๋ค.
PatchTSMixer๋ MLP-Mixer ์ํคํ ์ฒ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ ๊ฒฝ๋ ์๊ณ์ด ๋ชจ๋ธ๋ง ์ ๊ทผ๋ฒ์ ๋๋ค. ํ๊น ํ์ด์ค ๊ตฌํ์์๋ PatchTSMixer์ ๊ธฐ๋ฅ์ ์ ๊ณตํ์ฌ ํจ์น, ์ฑ๋, ์จ๊ฒจ์ง ํน์ฑ ๊ฐ์ ๊ฒฝ๋ ํผํฉ์ ์ฝ๊ฒ ์ํํ์ฌ ํจ๊ณผ์ ์ธ ๋ค๋ณ๋ ์๊ณ์ด ๋ชจ๋ธ๋ง์ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค. ๋ํ ๊ฐ๋จํ ๊ฒ์ดํธ ์ดํ ์ ๋ถํฐ ์ฌ์ฉ์ ์ ์๋ ๋ ๋ณต์กํ ์ ํ ์ดํ ์ ๋ธ๋ก๊น์ง ๋ค์ํ ์ดํ ์ ๋ฉ์ปค๋์ฆ์ ์ง์ํฉ๋๋ค. ์ด ๋ชจ๋ธ์ ์ฌ์ ํ๋ จ๋ ์ ์์ผ๋ฉฐ ์ดํ ์์ธก, ๋ถ๋ฅ, ํ๊ท์ ๊ฐ์ ๋ค์ํ ๋ค์ด์คํธ๋ฆผ ์์ ์ ์ฌ์ฉ๋ ์ ์์ต๋๋ค.
ํด๋น ๋ ผ๋ฌธ์ ์ด๋ก์ ๋๋ค:
TSMixer๋ ํจ์น ์ฒ๋ฆฌ๋ ์๊ณ์ด์ ๋ค๋ณ๋ ์์ธก ๋ฐ ํํ ํ์ต์ ์ํด ์ค๊ณ๋ ๋ค์ธต ํผ์ ํธ๋ก (MLP) ๋ชจ๋๋ก๋ง ๊ตฌ์ฑ๋ ๊ฒฝ๋ ์ ๊ฒฝ๋ง ์ํคํ ์ฒ์ ๋๋ค. ์ฐ๋ฆฌ์ ๋ชจ๋ธ์ ์ปดํจํฐ ๋น์ ๋ถ์ผ์์ MLP-Mixer ๋ชจ๋ธ์ ์ฑ๊ณต์์ ์๊ฐ์ ๋ฐ์์ต๋๋ค. ์ฐ๋ฆฌ๋ Vision MLP-Mixer๋ฅผ ์๊ณ์ด์ ์ ์ฉํ๋ ๋ฐ ๋ฐ๋ฅด๋ ๊ณผ์ ๋ฅผ ๋ณด์ฌ์ฃผ๊ณ , ์ ํ๋๋ฅผ ํฅ์์ํค๊ธฐ ์ํด ๊ฒฝํ์ ์ผ๋ก ๊ฒ์ฆ๋ ๊ตฌ์ฑ ์์๋ค์ ๋์ ํฉ๋๋ค. ์ฌ๊ธฐ์๋ ๊ณ์ธต ๊ตฌ์กฐ ๋ฐ ์ฑ๋ ์๊ด๊ด๊ณ์ ๊ฐ์ ์๊ณ์ด ํน์ฑ์ ๋ช ์์ ์ผ๋ก ๋ชจ๋ธ๋งํ๊ธฐ ์ํด MLP-Mixer ๋ฐฑ๋ณธ์ ์จ๋ผ์ธ ์กฐ์ ํค๋๋ฅผ ๋ถ์ฐฉํ๋ ์๋ก์ด ์ค๊ณ ํจ๋ฌ๋ค์์ด ํฌํจ๋ฉ๋๋ค. ๋ํ ๊ธฐ์กด ํจ์น ์ฑ๋ ํผํฉ ๋ฐฉ๋ฒ์ ์ผ๋ฐ์ ์ธ ๋ฌธ์ ์ธ ๋ ธ์ด์ฆ๊ฐ ์๋ ์ฑ๋ ์ํธ์์ฉ์ ํจ๊ณผ์ ์ผ๋ก ์ฒ๋ฆฌํ๊ณ ๋ค์ํ ๋ฐ์ดํฐ์ ์ ๊ฑธ์ณ ์ผ๋ฐํํ๊ธฐ ์ํ ํ์ด๋ธ๋ฆฌ๋ ์ฑ๋ ๋ชจ๋ธ๋ง ์ ๊ทผ๋ฒ์ ์ ์ํฉ๋๋ค. ์ถ๊ฐ๋ก, ์ค์ํ ํน์ฑ์ ์ฐ์ ์ํ๊ธฐ ์ํด ๋ฐฑ๋ณธ์ ๊ฐ๋จํ ๊ฒ์ดํธ ์ฃผ์ ๋ฉ์ปค๋์ฆ์ ๋์ ํฉ๋๋ค. ์ด๋ฌํ ๊ฒฝ๋ ๊ตฌ์ฑ ์์๋ค์ ํตํฉํจ์ผ๋ก์จ, ์ฐ๋ฆฌ๋ ๋จ์ํ MLP ๊ตฌ์กฐ์ ํ์ต ๋ฅ๋ ฅ์ ํฌ๊ฒ ํฅ์์์ผ ์ต์ํ์ ์ปดํจํ ์ฌ์ฉ์ผ๋ก ๋ณต์กํ ํธ๋์คํฌ๋จธ ๋ชจ๋ธ๋ค์ ๋ฅ๊ฐํ๋ ์ฑ๋ฅ์ ๋ฌ์ฑํฉ๋๋ค. ๋์ฑ์ด, TSMixer์ ๋ชจ๋์ ์ค๊ณ๋ ๊ฐ๋ ํ์ต๊ณผ ๋ง์คํฌ ์๊ธฐ ๊ฐ๋ ํ์ต ๋ฐฉ๋ฒ ๋ชจ๋์ ํธํ๋์ด ์๊ณ์ด ๊ธฐ์ด ๋ชจ๋ธ์ ์ ๋งํ ๊ตฌ์ฑ ์์๊ฐ ๋ฉ๋๋ค. TSMixer๋ ์์ธก ์์ ์์ ์ต์ฒจ๋จ MLP ๋ฐ ํธ๋์คํฌ๋จธ ๋ชจ๋ธ๋ค์ ์๋นํ ์ฐจ์ด(8-60%)๋ก ๋ฅ๊ฐํฉ๋๋ค. ๋ํ ์ต์ ์ ๊ฐ๋ ฅํ Patch-Transformer ๋ชจ๋ธ ๋ฒค์น๋งํฌ๋ค์ ๋ฉ๋ชจ๋ฆฌ์ ์คํ ์๊ฐ์ ํฌ๊ฒ ์ค์ด๋ฉด์(2-3๋ฐฐ) ์ฑ๋ฅ ๋ฉด์์๋ ์์ญ๋๋ค(1-2%).
์ด ๋ชจ๋ธ์ ajati, vijaye12, gsinthong, namctin, wmgifford, kashif๊ฐ ๊ธฐ์ฌํ์ต๋๋ค.
์ฌ์ฉ ์[[usage-example]]
์๋์ ์ฝ๋ ์ค๋ํซ์ PatchTSMixer ๋ชจ๋ธ์ ๋ฌด์์๋ก ์ด๊ธฐํํ๋ ๋ฐฉ๋ฒ์ ๋ณด์ฌ์ค๋๋ค. PatchTSMixer ๋ชจ๋ธ์ Trainer API์ ํธํ๋ฉ๋๋ค.
from transformers import PatchTSMixerConfig, PatchTSMixerForPrediction
from transformers import Trainer, TrainingArguments,
config = PatchTSMixerConfig(context_length = 512, prediction_length = 96)
model = PatchTSMixerForPrediction(config)
trainer = Trainer(model=model, args=training_args,
train_dataset=train_dataset,
eval_dataset=valid_dataset)
trainer.train()
results = trainer.evaluate(test_dataset)
์ฌ์ฉ ํ[[usage-tips]]
์ด ๋ชจ๋ธ์ ์๊ณ์ด ๋ถ๋ฅ์ ์๊ณ์ด ํ๊ท์๋ ์ฌ์ฉ๋ ์ ์์ต๋๋ค. ๊ฐ๊ฐ[PatchTSMixerForTimeSeriesClassification]์ [PatchTSMixerForRegression] ํด๋์ค๋ฅผ ์ฐธ์กฐํ์ธ์.
์๋ฃ[[resources]]
- PatchTSMixer๋ฅผ ์์ธํ ์ค๋ช ํ๋ ๋ธ๋ก๊ทธ ํฌ์คํธ๋ ์ฌ๊ธฐ์์ ์ฐพ์ ์ ์์ต๋๋ค ์ด๊ณณ. ์ด ๋ธ๋ก๊ทธ๋ Google Colab์์๋ ์ด์ด๋ณผ ์ ์์ต๋๋ค.
PatchTSMixerConfig[[transformers.PatchTSMixerConfig]]
[[autodoc]] PatchTSMixerConfig
PatchTSMixerModel[[transformers.PatchTSMixerModel]]
[[autodoc]] PatchTSMixerModel - forward
PatchTSMixerForPrediction[[transformers.PatchTSMixerForPrediction]]
[[autodoc]] PatchTSMixerForPrediction - forward
PatchTSMixerForTimeSeriesClassification[[transformers.PatchTSMixerForTimeSeriesClassification]]
[[autodoc]] PatchTSMixerForTimeSeriesClassification - forward
PatchTSMixerForPretraining[[transformers.PatchTSMixerForPretraining]]
[[autodoc]] PatchTSMixerForPretraining - forward
PatchTSMixerForRegression[[transformers.PatchTSMixerForRegression]]
[[autodoc]] PatchTSMixerForRegression - forward