Buckets:

rtrm's picture
|
download
raw
1.55 kB
# Các mô hình mã hóa
<CourseFloatingBanner
chapter={1}
classNames="absolute z-10 right-0 top-0"
/>
<Youtube id="MUqNwgPjJvQ" />
Các mô hình mã hóa chỉ sử dụng phần mã hóa của mô hình Transformer. Ở mỗi bước, các lớp attention có thể truy cập tất cả các từ trong câu ban đầu. Những mô hình này thường có đặc trưng là chú ý "hai chiều" và thường được gọi là mô hình _auto-encoding_ hay _mã hóa tự động_.
Việc huấn luyện trước các mô hình này thường xoay quanh việc phá vỡ một câu đã cho bằng cách nào đó (ví dụ: bằng cách che các từ ngẫu nhiên trong đó) và yêu cầu mô hình tìm hoặc tái tạo lại câu ban đầu.
Mô hình mã hóa phù hợp nhất cho các tác vụ yêu cầu hiểu toàn bộ câu, chẳng hạn như phân loại câu, nhận dạng thực thể được đặt tên (và nói chung là phân loại từ) và trả lời câu hỏi chiết xuất.
Một số mô hình tiêu biểu của nhóm này bao gồm:
- [ALBERT](https://huggingface.co/transformers/model_doc/albert.html)
- [BERT](https://huggingface.co/transformers/model_doc/bert.html)
- [DistilBERT](https://huggingface.co/transformers/model_doc/distilbert.html)
- [ELECTRA](https://huggingface.co/transformers/model_doc/electra.html)
- [RoBERTa](https://huggingface.co/transformers/model_doc/roberta.html)
<EditOnGithub source="https://github.com/huggingface/course/blob/main/chapters/vi/chapter1/5.mdx" />

Xet Storage Details

Size:
1.55 kB
·
Xet hash:
228a5cb8a9e83d9604ab366ee89e06832f7b316481e13b84c94d83672972c5b7

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.