Buckets:

rtrm's picture
|
download
raw
2.01 kB

โมเดล Encoder

โมเดล encoder ใช้เพียงส่วน encoder จากโมเดล Transformer เท่านั้น ในแต่ละชั้น attention layer สามารถเข้าถึงคำทุกคำในประโยคได้ โมเดลเหล่านี้ส่วนใหญ่จะใช้ attention แบบสองทาง (หรือเรียกว่า bi-directional attention) และถูกเรียกว่า โมเดล auto-encoding

โมเดล pretrain ในกลุ่มนี้จะเทรนโดยการให้ประโยคเริ่มต้นและประโยควิบัติ(เช่น เว้นว่างคำบางคำในประโยค) และเป้าหมายของโมเดลคือหาวิธีสร้างประโยคเริ่มต้นให้ดีดังเดิม

โมเดล encoder เหมาะกับงานแบบนี้ที่สุด เพราะงานเหล่านี้ต้องการความเข้าใจประโยคทั้งประโยค ตัวอย่างงานแบบนี้เช่น การแยกแยะประโยค, การระบุคำเฉพาะในประโยค (รวมถึงการแยกแยะประเภทคำ), และการสกัดคำถามคำตอบ

ตัวแทนโมเดลในกลุ่มนี้ได้แก่:

Xet Storage Details

Size:
2.01 kB
·
Xet hash:
a38e1deeb08571b39dd117c4cc2694586987c1c032d814f0d06a902eade3d2e7

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.