Buckets:
| # 시퀀스-투-시퀀스 모델 | |
| <CourseFloatingBanner | |
| chapter={1} | |
| classNames="absolute z-10 right-0 top-0" | |
| /> | |
| <Youtube id="0_4KEb08xrE" /> | |
| 인코더-디코더 모델(Encoder-decoder models) (*시퀀스-투-시퀀스 모델(sequence-to-sequence models)*로 부르기도 합니다)은 트랜스포머 구조의 인코더, 디코더 둘을 모두 사용합니다. 각 단계마다, 인코더의 어텐션 레이어는 초기 문장의 모든 단어에 액세스 할 수 있는 반면, 디코더의 어텐션 레이어는 주어진 단어 앞에 위치한 단어들에만 액세스 할 수 있습니다. | |
| 이러한 모델의 사전 학습은 인코더 혹은 디코더 모델의 방식을 모두 사용할 수 있지만 조금 더 복잡합니다. 이를테면, [T5](https://huggingface.co/t5-base)는 (여러 단어를 포함하기도 하는) 임의의 텍스트 범위를 하나의 특수 마스크 토큰으로 바꾸고 마스크 단어를 대체할 텍스트를 예측하는 방식으로 사전 학습 되었습니다. | |
| 시퀀스-투-시퀀스 모델은 요약, 번역, 생성 질의 응답과 같이 주어진 입력을 기반으로 새로운 문장을 생성하는 작업에 가장 적합합니다. | |
| 이 계열을 대표하는 모델은 다음과 같습니다: | |
| - [BART](https://huggingface.co/transformers/model_doc/bart.html) | |
| - [mBART](https://huggingface.co/transformers/model_doc/mbart.html) | |
| - [Marian](https://huggingface.co/transformers/model_doc/marian.html) | |
| - [T5](https://huggingface.co/transformers/model_doc/t5.html) | |
| <EditOnGithub source="https://github.com/huggingface/course/blob/main/chapters/ko/chapter1/7.mdx" /> |
Xet Storage Details
- Size:
- 1.64 kB
- Xet hash:
- e97519492cceacdc571e32f302f218e4aa2d180a67a58c4e6fef6e0d9c47ac35
·
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.