Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
Paper β’ 1908.10084 β’ Published β’ 13
How to use sept102/klue-roberta-small-cross-encoder with sentence-transformers:
from sentence_transformers import CrossEncoder
model = CrossEncoder("sept102/klue-roberta-small-cross-encoder")
query = "Which planet is known as the Red Planet?"
passages = [
"Venus is often called Earth's twin because of its similar size and proximity.",
"Mars, known for its reddish appearance, is often referred to as the Red Planet.",
"Jupiter, the largest planet in our solar system, has a prominent red spot.",
"Saturn, famous for its rings, is sometimes mistaken for the Red Planet."
]
scores = model.predict([(query, passage) for passage in passages])
print(scores)This is a Cross Encoder model finetuned from klue/roberta-small using the sentence-transformers library. It computes scores for pairs of texts, which can be used for text reranking and semantic search.
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import CrossEncoder
# Download from the π€ Hub
model = CrossEncoder("cross_encoder_model_id")
# Get scores for pairs of texts
pairs = [
['μ μ§κ΅μ΄ μΈκ΅ κΈ°μ
μ λμ°νκΈ° μν μ λλ?', 'νμ€μ λΆμ΄λ¦¬ κ²Έ κΈ°νμ¬μ λΆ μ₯κ΄μ΄ μ€μκΈ°μ
보νΈλ₯Ό μν΄ κ³΅κ³΅μ‘°λ¬ μμ₯μμ βκ΅λ΄μΈ λκΈ°μ
μ λν λλ± κ·μ β μμΉμ λ°νμ λ°λΌ μ λΆκ° μΈλΆ κ·μ λ°©μ λ§λ ¨μ λ€μ΄κ°λ€. μ λΆλ νΉν μ΄ κ°μ κ·μ λ μΈκ΅ κΈ°μ
λ§μ λμμΌλ‘ ν κ·μ μ λ¬λ¦¬ μΈκ³λ¬΄μ기ꡬ(WTO) 43κ° κ°μ
κ΅μ΄ λ§Ίκ³ μλ μ λΆμ‘°λ¬νμ (GPA)μ μλ°°λμ§ μλλ€λ μ
μ₯μ λΆλͺ
ν νλ€. βΆλ³Έμ§ 11μ11μΌμ A1, 3λ©΄ μ°Έκ³ βμ λΆ, β곡곡μμ₯ μμ°¨λ³ μμ βκΈ°μ¬λΆ κ΄κ³μλ 11μΌ βλ΄λΆ κ²ν κ²°κ³Ό κ΅λ΄ λκΈ°μ
κ³Ό μΈκ΅ λκΈ°μ
μ λλ±νκ² κ·μ νλ κ²μ κ΅μ μ μΌλ‘ λ¬Έμ κ° μ λλ€βλ©° βμ μ§κ΅λ μΈμ μ§μ, μ§μ
μ₯λ²½ μ€μΉ, μ¬μ μ§μ λ±μ ν΅ν΄ μκ΅ μ€μκΈ°μ
μ 100% 보νΈνκ³ μλ€βκ³ λ§νλ€. μΈκ΅ κΈ°μ
μ μ°¨λ³ λμ°νλ©΄ λ¬Έμ κ° λμ§λ§ κ·Έλ μ§ μμΌλ©΄ κ΅μ λ²μ λ¬Έμ κ° μλ€λ κ²μ΄λ€.μ΄ κ΄κ³μλ μ΄μ΄ βμ€μκΈ°μ
보νΈλ₯Ό μν΄ κ΅λ΄ λκΈ°μ
μ λ°°μ νλλ° (κ΅λ΄ λκΈ°μ
λ³΄λ€ λ©μΉκ° ν°) μΈκ΅κ³ λκΈ°μ
μ΄ λ€μ΄μ€λ 건 λ¬Έμ κ° μλ€λ μ μ΄ κ΅μ κ°μ¬μμλ μ¬λ¬ λ² μ§μ λλ€βλ©° βμ΄λ° νμμ λ°©μΉν μ μλ€λ κ² μ λΆ λ°©μΉ¨βμ΄λΌκ³ κ°μ‘°νλ€. μΌλΆμμ βμΈκ΅κ³ λκΈ°μ
κ·μ κ° κ΅λ΄ μμ₯μ μ§ν€λ €λ€ ν΄μΈ μμ₯μ μλ μ‘°μΉ μλλβλ μ§μ μ΄ λμ€λ λ° λν΄μλ βν΄μΈ μμ₯ ν¬κΈ°κ° μλλΌ κ΅λ΄ κΈ°μ
μ΄ λ°λ μμ°¨λ³ ν΄μ μ°¨μβμ΄λΌκ³ μ κ·Ή λ°λ°νλ€. μ€μκΈ°μ
μ μν΄ λ¨κ²¨λ μ리λ₯Ό μΈκ΅κ³ κΈ°μ
μ΄ μΉκ³ λ€μ΄μ€λ©΄ κ΅λ΄ λκΈ°μ
μ΄ μμ°¨λ³μ λ°λ κ²μ λ¬Όλ‘ μ€μκΈ°μ
μ¬μ΄μμλ βμΈκ΅κ³ κΈ°μ
κ³Ό μ ν΄λ₯Ό νλλ λͺ»νλλβμ λ°λΌ κ³΅κ³΅μ‘°λ¬ μμ₯μμ μ°¨λ³μ λ°μ μ μλ€λ μ΄μ μμλ€. κΈ°μ¬λΆλ μ΄μ λ°λΌ μ‘°λ§κ° μ°μ
ν΅μμμλΆ μ€μκΈ°μ
μ² μ‘°λ¬μ² λ± κ΄κ³λΆμ²μ νμν΄ ν λΆμ΄λ¦¬κ° λ°ν κ·μ λ°©μμ λ€λ¬λ μμ
μ λμκΈ°λ‘ νλ€. κΈ°μ¬λΆ λ΄λΆμ μΌλ‘λ μ΄λ―Έ μ§λμ£Όμ κ²ν μμ
μ ν μ°¨λ‘ νλ€. ν΅μ 주무λΆμ²μΈ μ°μ
λΆλ μ΄λ―Έ λ΄λΆμ μΌλ‘λ μ΄ κ°μ κ΅λ΄μΈ λλ± κ·μ λ WTO νμ μ μλ°°λμ§ μλλ€λ νλ¨μ λ΄λ Έλ€. μ°μ
λΆμ κ΄κ³μλ βμ€μκΈ°μ
보νΈλ₯Ό μν μμΈ μ μ©μ μ λΆμ‘°λ¬νμ λΏ μλλΌ μμ 무μνμ (FTA)μλ λͺ
λ¬ΈνλΌ μλ€βκ³ λ§νλ€. βκ·μ λ°©μμ βμ μ€βμ λΆλ ꡬ체μ μΈ κ·μ λ°©μμ΄ λμ€λ €λ©΄ μκ°μ΄ νμνλ€λ λ°μμ 보μλ€. μ€μκΈ°μ
보νΈλ₯Ό μν΄ κ΅λ΄ λκΈ°μ
λΏ μλλΌ μΈκ΅κ³ λκΈ°μ
λ κ·μ ν΄μΌ νλ€λ λ°©ν₯μ±μ μ μμ§λ§ ꡬ체μ μΌλ‘ μ΄λ»κ² ν΄μΌ μ κ΅ν λ°©μμ μ§λΌ μ μμμ§λ μ μ€ν κ²ν ν΄μΌ νλ€λ κ²μ΄λ€.κΈ°μ¬λΆ κ΄κ³μλ βμ°λ¦¬κ° 보νΈνλ €λ μ€μκΈ°μ
μ λ²μλ₯Ό μ΄λ»κ² μ ν μ§, ν΅μ λ§μ°° λ
Όλμ μ΄λ»κ² λμν μ§, μμ° μ΄μ‘ 5μ‘°μ μ΄μ λκΈ°μ
μ§λ¨μ κ·μ νλ μνΈμΆμμ ν κΈ°μ
μ§λ¨ κ·μ λ₯Ό μΈκ΅κ³ κΈ°μ
μ νλ μ μ©νλ€λ©΄ μ΄λ»κ² ν μ§ λ± λ€μν μ΄μκ° κ±Έλ € μλ€βλ©° βμ€μκΈ°μ
μ² μ°μ
λΆ κ³΅μ κ±°λμμν μ‘°λ¬μ² λ± λ€λ₯Έ λΆμ²μ μΆ©λΆν νμν΄ κ²°μ ν μ¬μβμ΄λΌκ³ λ§νλ€. μ£Όμ©μ/μ‘°λ―Έν κΈ°μ'],
['μλ μ΄ μ€μ€λ‘ μνλ₯Ό μ μν μ μμμ μ
μ¦νμ¬ μΉλΆμμ μ΄κΈ΄ μλλ λꡬμΈκ°?', 'βλ§λ
Έμ€: μ΄λͺ
μ μβμ μλ μ κ³ ν₯μΈ ν
μ¬μ€μ£Ό μ νμμ μλ μΉ΄ν리 κ·Ήμ₯μμ 1966λ
11μ 15μΌ μμ¬νλ₯Ό κ°μ‘λ€. μλ μ μμ¬νμ μ°λ €κ³ μμΉλΌμ΄νΈλ₯Ό ꡬνμΌλ©° ν리μ°λ λΆμκΈ°λ₯Ό λ΄κΈ° μν΄ μΊμ€νΈκ° ν 리무μ§μ λμ¬νλ€. νμ§λ§ λ¦¬λ¬΄μ§ ν λ λ°μ λμ¬κ° μ λμμΌλ―λ‘, μΊμ€νΈλ₯Ό λ°μΌλ‘ λλμ΄ ν κ·Έλ£Ήμ μμ¬νλ‘ νμ°κ³ , λ€μ 리무μ§μ λλ € κΈ°λ€λ¦¬κ³ μλ λλ¨Έμ§ κ·Έλ£Ήμ κ·Όμ² λͺ¨νμ΄μμ νμ°κ³ μμ¬νλ‘ λ°λ €μμΌνλ€. μμ¬νμλ μμ₯, μ§μ 보μκ΄ λ± μ§μμ μ£Όμ μΈμ¬λ€μ΄ λ€μ μ΄λλμλ€. μνκ° μμν μ§ μΌλ§ μ§λμ§ μμ, μμ¬νμ₯μ μμμΌλ‘ κ°λμ°Όλ€. μλ κ³Ό λλ¨Έμ§ μΆμ°μ§μ λ―Όλ§ν΄μ§ μ±λ‘ μ¬λΉ¨λ¦¬ μΆκ΅¬λ₯Ό ν΅ν΄ λΉ μ Έλκ°λ€. μμ¬ν ν, μλ μ μμ μ΄ λ³΄κΈ°μλ βλ§λ
Έμ€βκ° μ΅μ
μ μνλΌκ³ μκ°νμ§λ§ κ·Έλλ μλμ€λ½λ€κ³ λ°νλ€. λν, μλ§ λ€λ¬μΌλ©΄ μ¬λ°λ μ½λ―Έλ μνλ‘ λ§λ€ μ μμ κ² κ°λ€λ μκΈ°λ μΈν°λ·°μμ νμλ€\n\nμ΄ μνλ μλ¨Έμ¨ μ¬κ° λ°°ν¬λ₯Ό λ§‘μλ€. λν μΉ΄ν리 κ·Ήμ₯μμ μ μ λμ μμλμμΌλ©°, ν
μ¬μ€ μλΆμ λλΌμ΄λΈμΈ κ·Ήμ₯μμλ μμμ΄ λμλ€. μ΄λ€ λ³΄κ³ μ λ°λ₯΄λ©΄ μμ
μ λκ°λ₯Ό λ°μ μ€νμ μν€ λλ¨Ό μ‘΄μ€μ κ·Έλ
μ κ°μμ§ λΏμ΄μμΌλ©°, κ·Έ λκ°λ μμ κ±°μ λ€λμ κ°μμ§ μμμ΄μλ€κ³ νλλ°, μ΄λ μνκ° μ¬μ μ μΌλ‘ μΌλ§λ ν¬κ² μ€ν¨νλμ§λ₯Ό 보μ¬μ€λ€ 곡μ λ°μ€μ€νΌμ€ μ§κ³λ μλ €μ Έμμ§ μλ€. μνμ λν λ°μμ μ’μ§ μμμΌλ, μλ μ μμ μ΄ νΌμ μνλ₯Ό λ§λ€ μ μμμ μ¦λͺ
νμ¬, μ€νΈλ§ μ€λ¦¬ννΈμμ λ΄κΈ°μμ μΉλ¦¬νμλ€'],
['μ₯νΈμμ€ λΆμΌμ μ§μν λ, μν μΈμ λ³λλ‘ μ¨μΌ νλ κΈμ λͺ μ₯μΈκ°?', 'λΆμ°λ μ² νκ³Όμ λ€λλ νμ€μ± μ¨(24)λ μ§λν΄ κ°μ νμ μ λΆμΌλ‘ μ 3ν νκ²½ μ²λ
μ μΆλ¬Έμμ λ¬Έμ λλλ Έλ€. νμ¨λ μ² νκ³Ό μ±
μ μ’μνλ νλ²ν νμμ΄μλ€. μ μΆλ¬Έμ μ₯νΈμμ€ λΆλ¬Έμ λΉμ λλ©° κ·Έμ μΆμ λ³νλ€. μκΈμ μ¬λΉ μΌμ μ κ΅μ μ¬ννλ©° μ΄μΌκΈ°λ₯Ό μμ§νλ€. κ°μ νΈλ¨ μλ¨ λ± μμ¬μ λΉκ·Ήμ μ§λ κ³³μ μ°Ύμλ€λλ©° μ΄μΌκΈ°λ₯Ό λ€μλ€. λΉμ μ κΉμ§λ§ ν΄λ λ§νκΈ°λ₯Ό μ’μνλ μ μ μ²λ
μ μ΄λμ νμΈμ λ§μ κ· κΈ°μΈμ¬ λ£λ μ μ μκ°λ‘ λ³μ νλ€. νμ¨λ μ¬ν΄ λ¬Ένλλ€ μκ°μ λ³Έμ¬μ μ΄λ¦μ μ¬λ¦¬λ λ± μ μΆλ¬Έμ λΉμ μ΄ μ°μ°μ΄ μλμμμ μ¦λͺ
ν΄ λκ°κ³ μλ€. κ·Έμ μ²λ
μ μΆλ¬Έμ λΉμ μ μ΄λ±μ κ³λ³΄(μνλ무)λ ν΄κ³ λ₯Ό κ±°λν΄ μ΄λ¬ μ μ μΆκ°λλ€.μ’μ μνμ κ·Έκ²μ μ½λ μ¬λμ μΈμμ λ¬Όλ‘ λ§λ μ¬λμ μΈμλ λ°κΎΌλ€. κ°μ₯ μ’μ μ¬λ‘κ° μ μΆλ¬Έμλ€. λ¬Έν μ§λ§μμΌλ‘μ λμλ μ΅μμ λλ μ 보λ΄λ μ΄λ€μ μ μΆλ¬ΈμλΌλ κ΄λ¬Έμ κ±°μ³ μκ°λ‘ λ³μ νλ€.μ 2ν μ₯νΈμμ€ λΉμ μμΈ κΉμκ²½ μ¨(36)μ λΉμ μ μ²μΆνμ°(λ―Όμμ¬)μ μ μ μΈλκ° κ²ͺλ μ΄λ €μμ μμ§νκ² ννν΄ νΈνλ°μ μνμ΄λ€. μ΄ μμ€μλ κΉμ¨κ° κ²ͺμ μΌλ€μ΄ μλΉ λΆλΆ λ
Ήμ μλ€. κΉμ¨λ μ§μμ΄ μ΄λ €μμ§λ λ°λμ μ΄λ¦° μμ ν΄ λ³΄μ§ μμ μλ₯΄λ°μ΄νΈκ° μμ μ λμλ€.κΉμ¨λ μ§λ 2μ νκ΅λ¬Ένμμ μμνμ μμΈ νλ¦°μ€νΈν
μ΄ νμνλ μ°½μμ§νμ€ μ
μ£Όμκ° νλ‘κ·Έλ¨μ μ μ λΌ ν λ¬ λμ νΈν
μμ μ§νμ μ λ
νλ€. νΈν
μμ νμ μ‘μ λνμ μμ νΈν
μ£Όλ°©μμ μ€κ±°μ§νλ κΈ°μ΅μ΄ λ μ¬λλ€. βνΈν
μμ κΈμ μ°λ μλ μκ°μ΄ λμ κΈ°λΆμ΄ λ¬νμ΄μ. νΈν
μμ μΌν λλ μ λ¬ΈμΌλ‘ λ€μ΄κ° μλ μλ μ μΈμλλ° λ§μ΄μ£ .β μ μ μκ°κ° λ λ€ λ ν° μ±
μκ°μ λλΌκ³ μλ€λ κ·Έλ μ΄λ¬ λ λ²μ§Έ μνμ νκ³ ν κ³νμ΄λ€.μ 3ν μ λΆλ¬Έ λΉμ μ κΉλ―Όμ¨ μ¨(37)λ λ±λ¨ μ΄μ κ³Ό λ³λ€λ₯Ό κ² μμ΄ λ³΄μ΄λ μΌμμ 보λ΄κ³ μλ€. νμ§λ§ κ·Έμκ²λ λΆλͺ
ν λ³νκ° μκ²Όλ€. βλ±λ¨ μ μλ μ’ νΈμνκ² μλ₯Ό μΌλλ° λ±λ¨ν λ€λ‘λ μ±
μκ° μκ² μλ₯Ό μ°λ €κ³ νλ€βκ³ κΉμ¨λ λ§νλ€. βκ·Έλμ λ μλ―Όν μνλ₯Ό μ μ§νλ €κ³ λ
Έλ ₯ν©λλ€. μλ₯Ό μΌλ€λ λ° λ§μ‘±νμ§ μκ³ μ΄ μλ₯Ό ν΅ν΄ 무μμ ν μ μμκΉ κ³ λ―Όνκ³ μμ΄μ.βμ 2ν μ λΆλ¬Έ λΉμ μ μ΄μμ° μ¨(32)λ βμνμ μ΄ μ¬λμ μ½λ μ¬λλ³΄λ€ μ£Όμ μ λν΄ λ κΉμ΄ μκ°ν μλ°μ μλ€βλ©° βμνμ μ°λ©΄μ λ΄ μμ μ΄ λ°λμ΄κ°λ κ²μ λλλ€βκ³ λ§νλ€.μ μΈ μκ°λ₯Ό λ°κ΅΄Β·μ‘μ±νκ³ λ¬Ένμ½ν
μΈ λ₯Ό λ°κ΅΄νκΈ° μν νκ²½ μ²λ
μ μΆλ¬Έμκ° 4νλ₯Ό λ§μλ€. μ 3νλΆν° λ§ 39μΈ μ΄νκΉμ§ μ°Έμ¬ν μ μλλ‘ νμ λνλ€. 20λ λνμλΆν° μκ°μ κΏμ λμ§ μμ 30λ μ§λ§μμκ²κΉμ§ λ¬Έμ΄ μ΄λ € μλ€.μ¬ν΄λ μ, μ₯νΈμμ€, μλλ¦¬μ€ λ± μΈ κ° λΆλ¬Έμμ μλ‘μ΄ μκ°λ₯Ό μ°Ύμ λμ λ€. μ₯νΈμμ€ λΆλ¬Έμ 3000λ§μμ μκΈμ μ€λ€. μκ³ λμ 200μ μκ³ μ§ κΈ°μ€ 1000μ₯ μνμ΄λ©° 10μ₯ λΆλμ μ€κ±°λ¦¬ μ€λͺ
μ λ°λ‘ μ μΆν΄μΌ νλ€. μλ 5νΈ μ΄μ μ μΆν΄μΌ νλ©°, μλλ¦¬μ€ μκ³ λ 400μ₯ μν(μλμμ€ 10μ₯ λ³λ)μ΄λ€. μμ μλλ¦¬μ€ μκΈμ 500λ§μμ©μ΄λ€.μκ³ λ A4 μ©μ§μ μΆλ ₯ν΄μ 보λ΄μΌ νλ€. μλͺ¨μμ κ³Όκ±°μ λ°ννκ±°λ μ
μν μ μ΄ μλ μμ μ°½μλ¬Όμ΄μ΄μΌ νλ€. λ€λ₯Έ 곡λͺ¨μ μ μ€λ³΅ ν¬κ³ ν΄ μ΄λ―Έ μ
μν μνμ΄κ±°λ νμ ν μ¬μ€μ΄ λ°νμ§λ©΄ λΉμ μ μ·¨μνλ€. λ΄ν¬μ βνκ²½ μ²λ
μ μΆλ¬Έμ μλͺ¨μνβμ΄λΌ μ κ³ μν 첫 μ₯κ³Ό λ§μ§λ§ μ₯μ μλͺ¨ λΆλ¬Έ, μ΄λ¦(νλͺ
μΌ κ²½μ° λ³Έλͺ
λ³κΈ°), μ£Όμ, μ νλ²νΈ, μκ³ λ(200μ μκ³ μ§ κΈ°μ€), μ£Όλ―Όλ±λ‘μ μλ
μμΌμ λͺ
μν΄μΌ μ μ μλͺ¨μμΌλ‘ μ μνλ€. λͺ¨λ μκ³ λ λ°ννμ§ μλλ€.'],
['ν©κ΄ν¬κ° λ°°μ΄ λ°©μΈμ μ¬μ©νλ λμλ?', 'μ λΆκ° λ°νν β9Β·1 λΆλμ° λμ±
β κ°μ΄λ° κ΅νλ₯Ό κ±°μ³μΌ ν μ
λ² μ¬νμ λκ³ κ°λ±μ΄ λΆκ±°μ§κ³ μλ€. 9Β·1 λμ±
λλΆλΆμ μ λΆ μ°¨μμμ μνλ Ήμ΄λ κ·μΉμ κ³ μΉλ©΄ μνν μ μλ λ΄μ©μ΄μ§λ§, μ¬μΌ ν©μλ₯Ό ν΅ν΄ κ΅ν ν΅κ³Όκ° νμν νμ§κ°λ°μ΄μ§λ²(νμ΄λ²) νμ§, μ²μ½μ λ κ°νΈ λ±μ λκ³ μΌλΉμ΄ λ°λ°νκ³ λμ°λ€. μμΈμλ μ¬κ±΄μΆΒ·μ¬κ°λ° λ± μ λΉμ¬μ
λ°©μ κ°νΈμ λ°λν΄ μΆμ§μ μ΄λ €μμ κ²ͺμ κ²μ΄λΌλ μ λ§μ΄ λμ¨λ€.μ§λ 1μΌ μ λΆκ° λ°νν κ·μ μνμ 42κ° κ°μ΄λ° λ² κ°μ μ΄ νμν μ
λ² μ¬νμ λͺ¨λ 11κ°λ€. μμ μΉλ―Όμ£Όμ°ν©μ μ΄ κ°μ΄λ° β³νμ΄λ² νμ§ β³κ³΅κ³΅κ΄λ¦¬μ κ°μ (λμ λ° μ£Όκ±°νκ²½μ λΉλ²) β³μ²μ½μ λ κ°νΈ(μ£Όνλ²) λ±μ λ°λνκ³ μλ€. βμλ―Όμ£Όκ±°μμ λ°©μμ΄ μλλΌ μμΈ κ°λ¨κΆ μ€μ¬μ λΆλμ° κ²½κΈ° λΆμ μ μ±
βμ΄λΌλ μ£Όμ₯μ΄λ€.μ°μ νμ΄λ²μ νμ§νλ©΄ λ μ΄μ μ λμκΈμ λκ·λͺ¨ μ£Όν 곡κΈμ ν μ μμ΄ μ§κ° μμΉ μ°λ €κ° μλ€λ κ² μΌλΉ μΈ‘ μ§μ μ΄λ€. λ°±μ¬ν μμ μΉμ°ν© μ μ±
μ μμλΆμμ₯μ βμλμ μΌλ‘ μ§κ°μ΄ μΌ νμ§μ§κ΅¬κ° μ¬λΌμ§λ©΄ 무주ν μλ―Όμ΄ μ§μ μ₯λ§νκΈ°λ λ μ΄λ €μμ§ κ²βμ΄λΌκ³ λ§νλ€. κ΅ν κ΅ν΅λΆ κ΄κ³μλ μ΄μ λν΄ βμ£Όν 보κΈλ₯ μ΄ 100%λ₯Ό λμ λ°λ€ μ΅κ·Ό μ£Όν 곡κΈκ³ΌμμΌλ‘ μ΄λ―Έ μ§μ λ λν νμ§μ§κ΅¬ μλΉμλ₯Ό ν΄μ νκ³ μλ μ€μ βμ΄λΌλ©° βμ λμκΈ λμ μ€μν κ·λͺ¨μ λμκ°λ°μ κ³μ μΆμ§ν κ²βμ΄λΌκ³ μ€λͺ
νλ€.μ²μ½ κ°μ μ λ₯Ό μ§λ°©μμΉλ¨μ²΄μ₯μ΄ μμ¨ μ΄μνλλ‘ ν κ²λ 무주νμ ννμ μ€μ΄λ λ°©μμ΄λΌλ μ£Όμ₯μ΄ λμ¨λ€. νμ¬ μ²μ½μ λλ 무주ν κΈ°κ°μ΄ μ€λλκ³ λΆμκ°μ‘±μ΄ λ§μ μΈλμ£Όμκ² κ°μ μ μ£Όκ³ μλ€. μ΄λ₯Ό μ§μ체μ₯ μμ¨μ λ§‘κΈΈ κ²½μ° λ¬΄μ£Όν ννμ΄ μ¬λΌμ§ κ°λ₯μ±μ΄ λλ€λ μ§μ μ΄λ€. κ΅ν λΆ κ΄κ³μλ βμ²μ½ κ³Όμ΄μ΄ μ°λ €λλ ν¬κΈ°κ³Όμ΄μ§κ΅¬μ 곡곡주νμ§κ΅¬μ λν΄μλ κ°μ μ λ₯Ό μ무 μ μ©ν΄ 무주ν μλ―Όμκ² μ°μ 곡κΈν κ³νβμ΄λΌκ³ ν΄λͺ
νλ€.곡곡κ΄λ¦¬μ λ₯Ό κ°μ νλ λμ λ²μ μμΈμκ° λ°λνκ³ μλ€. κ°μ μμ ν μ§ λ± μμ μ κ³Όλ°μκ° μν κ²½μ° μ¬μ
μνμΈκ° μ΄μ μ μ곡μ¬λ₯Ό μ μ ν μ μλλ‘ νλ€. μμΈμ μ‘°λ‘λ³΄λ€ μμλ²μΈ λμ λ²μ΄ κ°μ λλ©΄ μ§μ체λ μ΄λ₯Ό λ°λΌμΌ νλ€. μμΈμ κ΄κ³μλ βμκ³΅μ¬ μ μ μ μλΉκΈΈ κ²½μ° μ¬μ
λΉκ° λμμ§κ³ μ‘°ν©μ κ° κ°λ±μ΄ λμ΄λ κ°λ₯μ±λ μλ€βκ³ μ£Όμ₯νλ€. μ΄νμ§/μ΄νΈκΈ°/κΉλ³κ·Ό κΈ°μ'],
['νλ₯΄λΌμ΄ν 첫 μμλΆν° λ±μ₯νλ μΊλ¦ν°λ?', 'λμ μ μλ μ λ³μμ μλ£μ
κ³μμ βνλ₯μ€νβλ‘ ν΅νλ€. μ§λ 4λ
κ° μ΄κ³³μ μ°Ύμ μΈκ΅μΈ νμλ 1λ§2000λͺ
μ΄ λλλ€. 2011λ
854λͺ
μ λΆκ³ΌνμΌλ μ§λν΄μλ 5431λͺ
μΌλ‘ κΈμ¦νλ€. μ΄ κΈ°κ° μΈκ΅μΈ νμ μ¦κ°μ¨μ 536%μ μ΄λ₯Έλ€.μ λ³μμ κ΅λ΄μΈ λ³μλ€μ βλ²€μΉλ§νΉβ λμμ΄λ€. μ§κΈκΉμ§ μ΄κ³³μ νλ°©νκ³ λμκ° κ΅λ΄ μ’
ν©λ³μλ§ 100κ³³μ μ΄λ₯Έλ€. μμΈλλ³μκ³Ό μΌμ±μμΈλ³μ λ± λ΄λ‘λΌνλ μ’
ν©λ³μλ€λ βμμ‘΄μ¬βμ λ΄λ €λκ³ μ λ³μμ μ₯μ μ λ°°μ°κΈ° μν΄ μ°Ύκ³ μλ€.μλ
ν ν΄μλ§ μΌλ³ΈΒ·μ€κ΅Β·λ¬μμΒ·λ² νΈλ¨Β·νκ΅Β·μΈλ λ± ν΄μΈ 20μ¬κ°κ΅ μλ£κΈ°κ΄λ€μ΄ λ³μ κ²½μμ λ°°μ°λ¬ μλ€. μ λ³μμ λμΉλ λ°©λ¬Έκ°λ€λ‘ μΈν΄ μ
무μ μ§μ₯μ λ°μ λ°©λ¬Έ κ°λ₯ν λ μ μ 1ν, λ§μ§λ§μ£Ό κΈμμΌλ‘ μ ννκΈ°λ νλ€.μ λ³μμ λμ μλ΄μ μ μ±μ ν©μ΄μ Έ μλ λ³μμ λͺ¨λ ν©μ³μΌ 900κ° μ λλ€. κ·λͺ¨λ‘ 보면 νλ²ν μ§λ°© μ’
ν©λ³μμ΄μ§λ§ κ°μ’
μ§νλ‘ λ³΄λ©΄ μ±μ₯μΈκ° κ°νλ₯΄λ€. μλ
λ§ κΈ°μ€μΌλ‘ ν루 μΈλ νμ μλ 3500λͺ
μ μ΄λ€. μΈκ΅μΈ νμ μ μΉλ₯Ό κ³κΈ°λ‘ 본격μ μΈ λ³μ μ μλν 4λ
μ κ³Ό λΉκ΅νλ©΄ 34.6% μ¦κ°ν κ²μ΄λ€.μμΈμ μλ μ’
ν©λ³μλ€μ λΉν΄ μ§λ¦¬μ μΌλ‘ λΆλ¦¬ν μ§λ°© λ³μμ΄ βνμ μ μμ΄μ½βμΌλ‘ λΆλ¦¬λ λΉκ²°μ 무μμΌκΉ. μ μΉν μλ£μμ₯μ βλ°°μΈ μ μλ λͺ¨λ κ²μ λ§€λ΄μΌνν κ²°κ³ΌβλΌκ³ μ€λͺ
νλ€. μ λ³μμ΄ κ°μ₯ μ¬νμ κΈ°μΈμ΄λ κ²μ μ΅κ³ κΈ μλΉμ€λ₯Ό λ²€μΉλ§νΉνλ μΌμ΄λ€. μ μμ₯μ β1λ
μ μ§κ΅¬ λ€ λ°ν΄ λ°μ λλ©΄μ μΈκ³ κ°κ΅μ νμ μ¬λ‘λ₯Ό λͺ¨μ μ¨λ€βκ³ νλ€. κ·Έλ λ§€λ
νλ μ°¨λ‘ μ§μ 15~20λͺ
μ ν΄μΈμ λ΄λ³΄λΈλ€. κ·Έμ μ£Όλ¬Έμ λ¨ νλ, βμ무κ²λ μκ°νμ§ λ§κ³ μ΅κ³ κΈ μλΉμ€λ₯Ό μ¦κ²¨λΌβ.νμ μ κ³³κ³³μμ μ΄λ€μ‘λ€. κ°νΈμ¬λ€μ νμμ μ 보λ₯Ό μΌμΌμ΄ μ첩μ μ κ³ μ΄λ₯Ό μ μ°μΌλ‘ κ΄λ¦¬ν΄ νΈνμ λ°κ³ μλ€. 4λ
μ μ μμ₯κ³Ό μ§μ 20μ¬λͺ
μ΄ λ°©λ¬Έν μ±κ°ν¬λ₯΄ 6μ±κΈ νΈν
μΈ μΉ΄ν λΌνΈν
μ μλΉμ€μμ κ°μ Έμ¨ μμ΄λμ΄λ€. μλ΄μ§μλ€μ βλ°λ± μλβλ νκ΅ λ°©μ½μ μ¬λ―Έν°λ²³ λ³μ κ°νΈμ¬λ€μ΄ μμμ μμ μλ νμ κ°μ‘± λ±κ³Ό λλμ΄λ₯Ό λ§μΆκΈ° μν΄ λ¬΄λ¦μ κΏλ κ²μμ λ°°μμλ€.μ±κ°ν¬λ₯΄ μ°½μ΄κ΅μ 곡ν, ν콩κ΅μ 곡ν λ±λ βλ°°μν°βμλ€. λ³μμ 리λͺ¨λΈλ§ν λ μ΄μ©κ° νΈμλ₯Ό κ·Ήλνν κ΅μ 곡νμ λμ μ μ μ©νλ€.μ λ³μμ μ§λλ¬ μ€νμμ€μ 5μ±κΈ νΈν
νμΌλ‘ μλ‘ κΎΈλͺλ€. μ€νμμ€ κ°νΈμ¬λ€μ μ¬λ¬΄κ³΅κ°μ βννκ³€νβμΌλ‘ μ μ€μμ λ°°μΉ, νμλ€μ μꡬμ¬νκ³Ό νλμ μ¦μ λμν μ μλλ‘ λ°κΏ¨λ€. λ³λ λΉμ© μμ΄ λ³΄νΈμκ° νμ κ³μμ λ¨Έλ¬Ό μ μλλ‘ κ°λ³ μΉ¨λμ μμ€λ λ§λ ¨νλ€. μ΄κ·μ κ²½μμ΄κ΄μμ₯μ βνΈν
μ μ₯μ μ μ λͺ©ν μ€νμμ€μ κ°μΆκΈ° μν΄ μ λΌνΈν
κ³Ό λ‘―λ°νΈν
λ± κ΅λ΄ νΉκΈνΈν
μ λ¬Όλ‘ μΌλ³Έ λ²³νΈ μΈμ΄μΉ΄μ΄νΈν
, ν콩 λμ νλ μ΄μ€ λ± μμμ μ£Όμ νΈν
μ κ±°μ λΉ μ§μμ΄ νμλ€βκ³ μ νλ€.'],
]
scores = model.predict(pairs)
print(scores.shape)
# (5,)
# Or rank different texts based on similarity to a single text
ranks = model.rank(
'μ μ§κ΅μ΄ μΈκ΅ κΈ°μ
μ λμ°νκΈ° μν μ λλ?',
[
'νμ€μ λΆμ΄λ¦¬ κ²Έ κΈ°νμ¬μ λΆ μ₯κ΄μ΄ μ€μκΈ°μ
보νΈλ₯Ό μν΄ κ³΅κ³΅μ‘°λ¬ μμ₯μμ βκ΅λ΄μΈ λκΈ°μ
μ λν λλ± κ·μ β μμΉμ λ°νμ λ°λΌ μ λΆκ° μΈλΆ κ·μ λ°©μ λ§λ ¨μ λ€μ΄κ°λ€. μ λΆλ νΉν μ΄ κ°μ κ·μ λ μΈκ΅ κΈ°μ
λ§μ λμμΌλ‘ ν κ·μ μ λ¬λ¦¬ μΈκ³λ¬΄μ기ꡬ(WTO) 43κ° κ°μ
κ΅μ΄ λ§Ίκ³ μλ μ λΆμ‘°λ¬νμ (GPA)μ μλ°°λμ§ μλλ€λ μ
μ₯μ λΆλͺ
ν νλ€. βΆλ³Έμ§ 11μ11μΌμ A1, 3λ©΄ μ°Έκ³ βμ λΆ, β곡곡μμ₯ μμ°¨λ³ μμ βκΈ°μ¬λΆ κ΄κ³μλ 11μΌ βλ΄λΆ κ²ν κ²°κ³Ό κ΅λ΄ λκΈ°μ
κ³Ό μΈκ΅ λκΈ°μ
μ λλ±νκ² κ·μ νλ κ²μ κ΅μ μ μΌλ‘ λ¬Έμ κ° μ λλ€βλ©° βμ μ§κ΅λ μΈμ μ§μ, μ§μ
μ₯λ²½ μ€μΉ, μ¬μ μ§μ λ±μ ν΅ν΄ μκ΅ μ€μκΈ°μ
μ 100% 보νΈνκ³ μλ€βκ³ λ§νλ€. μΈκ΅ κΈ°μ
μ μ°¨λ³ λμ°νλ©΄ λ¬Έμ κ° λμ§λ§ κ·Έλ μ§ μμΌλ©΄ κ΅μ λ²μ λ¬Έμ κ° μλ€λ κ²μ΄λ€.μ΄ κ΄κ³μλ μ΄μ΄ βμ€μκΈ°μ
보νΈλ₯Ό μν΄ κ΅λ΄ λκΈ°μ
μ λ°°μ νλλ° (κ΅λ΄ λκΈ°μ
λ³΄λ€ λ©μΉκ° ν°) μΈκ΅κ³ λκΈ°μ
μ΄ λ€μ΄μ€λ 건 λ¬Έμ κ° μλ€λ μ μ΄ κ΅μ κ°μ¬μμλ μ¬λ¬ λ² μ§μ λλ€βλ©° βμ΄λ° νμμ λ°©μΉν μ μλ€λ κ² μ λΆ λ°©μΉ¨βμ΄λΌκ³ κ°μ‘°νλ€. μΌλΆμμ βμΈκ΅κ³ λκΈ°μ
κ·μ κ° κ΅λ΄ μμ₯μ μ§ν€λ €λ€ ν΄μΈ μμ₯μ μλ μ‘°μΉ μλλβλ μ§μ μ΄ λμ€λ λ° λν΄μλ βν΄μΈ μμ₯ ν¬κΈ°κ° μλλΌ κ΅λ΄ κΈ°μ
μ΄ λ°λ μμ°¨λ³ ν΄μ μ°¨μβμ΄λΌκ³ μ κ·Ή λ°λ°νλ€. μ€μκΈ°μ
μ μν΄ λ¨κ²¨λ μ리λ₯Ό μΈκ΅κ³ κΈ°μ
μ΄ μΉκ³ λ€μ΄μ€λ©΄ κ΅λ΄ λκΈ°μ
μ΄ μμ°¨λ³μ λ°λ κ²μ λ¬Όλ‘ μ€μκΈ°μ
μ¬μ΄μμλ βμΈκ΅κ³ κΈ°μ
κ³Ό μ ν΄λ₯Ό νλλ λͺ»νλλβμ λ°λΌ κ³΅κ³΅μ‘°λ¬ μμ₯μμ μ°¨λ³μ λ°μ μ μλ€λ μ΄μ μμλ€. κΈ°μ¬λΆλ μ΄μ λ°λΌ μ‘°λ§κ° μ°μ
ν΅μμμλΆ μ€μκΈ°μ
μ² μ‘°λ¬μ² λ± κ΄κ³λΆμ²μ νμν΄ ν λΆμ΄λ¦¬κ° λ°ν κ·μ λ°©μμ λ€λ¬λ μμ
μ λμκΈ°λ‘ νλ€. κΈ°μ¬λΆ λ΄λΆμ μΌλ‘λ μ΄λ―Έ μ§λμ£Όμ κ²ν μμ
μ ν μ°¨λ‘ νλ€. ν΅μ 주무λΆμ²μΈ μ°μ
λΆλ μ΄λ―Έ λ΄λΆμ μΌλ‘λ μ΄ κ°μ κ΅λ΄μΈ λλ± κ·μ λ WTO νμ μ μλ°°λμ§ μλλ€λ νλ¨μ λ΄λ Έλ€. μ°μ
λΆμ κ΄κ³μλ βμ€μκΈ°μ
보νΈλ₯Ό μν μμΈ μ μ©μ μ λΆμ‘°λ¬νμ λΏ μλλΌ μμ 무μνμ (FTA)μλ λͺ
λ¬ΈνλΌ μλ€βκ³ λ§νλ€. βκ·μ λ°©μμ βμ μ€βμ λΆλ ꡬ체μ μΈ κ·μ λ°©μμ΄ λμ€λ €λ©΄ μκ°μ΄ νμνλ€λ λ°μμ 보μλ€. μ€μκΈ°μ
보νΈλ₯Ό μν΄ κ΅λ΄ λκΈ°μ
λΏ μλλΌ μΈκ΅κ³ λκΈ°μ
λ κ·μ ν΄μΌ νλ€λ λ°©ν₯μ±μ μ μμ§λ§ ꡬ체μ μΌλ‘ μ΄λ»κ² ν΄μΌ μ κ΅ν λ°©μμ μ§λΌ μ μμμ§λ μ μ€ν κ²ν ν΄μΌ νλ€λ κ²μ΄λ€.κΈ°μ¬λΆ κ΄κ³μλ βμ°λ¦¬κ° 보νΈνλ €λ μ€μκΈ°μ
μ λ²μλ₯Ό μ΄λ»κ² μ ν μ§, ν΅μ λ§μ°° λ
Όλμ μ΄λ»κ² λμν μ§, μμ° μ΄μ‘ 5μ‘°μ μ΄μ λκΈ°μ
μ§λ¨μ κ·μ νλ μνΈμΆμμ ν κΈ°μ
μ§λ¨ κ·μ λ₯Ό μΈκ΅κ³ κΈ°μ
μ νλ μ μ©νλ€λ©΄ μ΄λ»κ² ν μ§ λ± λ€μν μ΄μκ° κ±Έλ € μλ€βλ©° βμ€μκΈ°μ
μ² μ°μ
λΆ κ³΅μ κ±°λμμν μ‘°λ¬μ² λ± λ€λ₯Έ λΆμ²μ μΆ©λΆν νμν΄ κ²°μ ν μ¬μβμ΄λΌκ³ λ§νλ€. μ£Όμ©μ/μ‘°λ―Έν κΈ°μ',
'βλ§λ
Έμ€: μ΄λͺ
μ μβμ μλ μ κ³ ν₯μΈ ν
μ¬μ€μ£Ό μ νμμ μλ μΉ΄ν리 κ·Ήμ₯μμ 1966λ
11μ 15μΌ μμ¬νλ₯Ό κ°μ‘λ€. μλ μ μμ¬νμ μ°λ €κ³ μμΉλΌμ΄νΈλ₯Ό ꡬνμΌλ©° ν리μ°λ λΆμκΈ°λ₯Ό λ΄κΈ° μν΄ μΊμ€νΈκ° ν 리무μ§μ λμ¬νλ€. νμ§λ§ λ¦¬λ¬΄μ§ ν λ λ°μ λμ¬κ° μ λμμΌλ―λ‘, μΊμ€νΈλ₯Ό λ°μΌλ‘ λλμ΄ ν κ·Έλ£Ήμ μμ¬νλ‘ νμ°κ³ , λ€μ 리무μ§μ λλ € κΈ°λ€λ¦¬κ³ μλ λλ¨Έμ§ κ·Έλ£Ήμ κ·Όμ² λͺ¨νμ΄μμ νμ°κ³ μμ¬νλ‘ λ°λ €μμΌνλ€. μμ¬νμλ μμ₯, μ§μ 보μκ΄ λ± μ§μμ μ£Όμ μΈμ¬λ€μ΄ λ€μ μ΄λλμλ€. μνκ° μμν μ§ μΌλ§ μ§λμ§ μμ, μμ¬νμ₯μ μμμΌλ‘ κ°λμ°Όλ€. μλ κ³Ό λλ¨Έμ§ μΆμ°μ§μ λ―Όλ§ν΄μ§ μ±λ‘ μ¬λΉ¨λ¦¬ μΆκ΅¬λ₯Ό ν΅ν΄ λΉ μ Έλκ°λ€. μμ¬ν ν, μλ μ μμ μ΄ λ³΄κΈ°μλ βλ§λ
Έμ€βκ° μ΅μ
μ μνλΌκ³ μκ°νμ§λ§ κ·Έλλ μλμ€λ½λ€κ³ λ°νλ€. λν, μλ§ λ€λ¬μΌλ©΄ μ¬λ°λ μ½λ―Έλ μνλ‘ λ§λ€ μ μμ κ² κ°λ€λ μκΈ°λ μΈν°λ·°μμ νμλ€\n\nμ΄ μνλ μλ¨Έμ¨ μ¬κ° λ°°ν¬λ₯Ό λ§‘μλ€. λν μΉ΄ν리 κ·Ήμ₯μμ μ μ λμ μμλμμΌλ©°, ν
μ¬μ€ μλΆμ λλΌμ΄λΈμΈ κ·Ήμ₯μμλ μμμ΄ λμλ€. μ΄λ€ λ³΄κ³ μ λ°λ₯΄λ©΄ μμ
μ λκ°λ₯Ό λ°μ μ€νμ μν€ λλ¨Ό μ‘΄μ€μ κ·Έλ
μ κ°μμ§ λΏμ΄μμΌλ©°, κ·Έ λκ°λ μμ κ±°μ λ€λμ κ°μμ§ μμμ΄μλ€κ³ νλλ°, μ΄λ μνκ° μ¬μ μ μΌλ‘ μΌλ§λ ν¬κ² μ€ν¨νλμ§λ₯Ό 보μ¬μ€λ€ 곡μ λ°μ€μ€νΌμ€ μ§κ³λ μλ €μ Έμμ§ μλ€. μνμ λν λ°μμ μ’μ§ μμμΌλ, μλ μ μμ μ΄ νΌμ μνλ₯Ό λ§λ€ μ μμμ μ¦λͺ
νμ¬, μ€νΈλ§ μ€λ¦¬ννΈμμ λ΄κΈ°μμ μΉλ¦¬νμλ€',
'λΆμ°λ μ² νκ³Όμ λ€λλ νμ€μ± μ¨(24)λ μ§λν΄ κ°μ νμ μ λΆμΌλ‘ μ 3ν νκ²½ μ²λ
μ μΆλ¬Έμμ λ¬Έμ λλλ Έλ€. νμ¨λ μ² νκ³Ό μ±
μ μ’μνλ νλ²ν νμμ΄μλ€. μ μΆλ¬Έμ μ₯νΈμμ€ λΆλ¬Έμ λΉμ λλ©° κ·Έμ μΆμ λ³νλ€. μκΈμ μ¬λΉ μΌμ μ κ΅μ μ¬ννλ©° μ΄μΌκΈ°λ₯Ό μμ§νλ€. κ°μ νΈλ¨ μλ¨ λ± μμ¬μ λΉκ·Ήμ μ§λ κ³³μ μ°Ύμλ€λλ©° μ΄μΌκΈ°λ₯Ό λ€μλ€. λΉμ μ κΉμ§λ§ ν΄λ λ§νκΈ°λ₯Ό μ’μνλ μ μ μ²λ
μ μ΄λμ νμΈμ λ§μ κ· κΈ°μΈμ¬ λ£λ μ μ μκ°λ‘ λ³μ νλ€. νμ¨λ μ¬ν΄ λ¬Ένλλ€ μκ°μ λ³Έμ¬μ μ΄λ¦μ μ¬λ¦¬λ λ± μ μΆλ¬Έμ λΉμ μ΄ μ°μ°μ΄ μλμμμ μ¦λͺ
ν΄ λκ°κ³ μλ€. κ·Έμ μ²λ
μ μΆλ¬Έμ λΉμ μ μ΄λ±μ κ³λ³΄(μνλ무)λ ν΄κ³ λ₯Ό κ±°λν΄ μ΄λ¬ μ μ μΆκ°λλ€.μ’μ μνμ κ·Έκ²μ μ½λ μ¬λμ μΈμμ λ¬Όλ‘ λ§λ μ¬λμ μΈμλ λ°κΎΌλ€. κ°μ₯ μ’μ μ¬λ‘κ° μ μΆλ¬Έμλ€. λ¬Έν μ§λ§μμΌλ‘μ λμλ μ΅μμ λλ μ 보λ΄λ μ΄λ€μ μ μΆλ¬ΈμλΌλ κ΄λ¬Έμ κ±°μ³ μκ°λ‘ λ³μ νλ€.μ 2ν μ₯νΈμμ€ λΉμ μμΈ κΉμκ²½ μ¨(36)μ λΉμ μ μ²μΆνμ°(λ―Όμμ¬)μ μ μ μΈλκ° κ²ͺλ μ΄λ €μμ μμ§νκ² ννν΄ νΈνλ°μ μνμ΄λ€. μ΄ μμ€μλ κΉμ¨κ° κ²ͺμ μΌλ€μ΄ μλΉ λΆλΆ λ
Ήμ μλ€. κΉμ¨λ μ§μμ΄ μ΄λ €μμ§λ λ°λμ μ΄λ¦° μμ ν΄ λ³΄μ§ μμ μλ₯΄λ°μ΄νΈκ° μμ μ λμλ€.κΉμ¨λ μ§λ 2μ νκ΅λ¬Ένμμ μμνμ μμΈ νλ¦°μ€νΈν
μ΄ νμνλ μ°½μμ§νμ€ μ
μ£Όμκ° νλ‘κ·Έλ¨μ μ μ λΌ ν λ¬ λμ νΈν
μμ μ§νμ μ λ
νλ€. νΈν
μμ νμ μ‘μ λνμ μμ νΈν
μ£Όλ°©μμ μ€κ±°μ§νλ κΈ°μ΅μ΄ λ μ¬λλ€. βνΈν
μμ κΈμ μ°λ μλ μκ°μ΄ λμ κΈ°λΆμ΄ λ¬νμ΄μ. νΈν
μμ μΌν λλ μ λ¬ΈμΌλ‘ λ€μ΄κ° μλ μλ μ μΈμλλ° λ§μ΄μ£ .β μ μ μκ°κ° λ λ€ λ ν° μ±
μκ°μ λλΌκ³ μλ€λ κ·Έλ μ΄λ¬ λ λ²μ§Έ μνμ νκ³ ν κ³νμ΄λ€.μ 3ν μ λΆλ¬Έ λΉμ μ κΉλ―Όμ¨ μ¨(37)λ λ±λ¨ μ΄μ κ³Ό λ³λ€λ₯Ό κ² μμ΄ λ³΄μ΄λ μΌμμ 보λ΄κ³ μλ€. νμ§λ§ κ·Έμκ²λ λΆλͺ
ν λ³νκ° μκ²Όλ€. βλ±λ¨ μ μλ μ’ νΈμνκ² μλ₯Ό μΌλλ° λ±λ¨ν λ€λ‘λ μ±
μκ° μκ² μλ₯Ό μ°λ €κ³ νλ€βκ³ κΉμ¨λ λ§νλ€. βκ·Έλμ λ μλ―Όν μνλ₯Ό μ μ§νλ €κ³ λ
Έλ ₯ν©λλ€. μλ₯Ό μΌλ€λ λ° λ§μ‘±νμ§ μκ³ μ΄ μλ₯Ό ν΅ν΄ 무μμ ν μ μμκΉ κ³ λ―Όνκ³ μμ΄μ.βμ 2ν μ λΆλ¬Έ λΉμ μ μ΄μμ° μ¨(32)λ βμνμ μ΄ μ¬λμ μ½λ μ¬λλ³΄λ€ μ£Όμ μ λν΄ λ κΉμ΄ μκ°ν μλ°μ μλ€βλ©° βμνμ μ°λ©΄μ λ΄ μμ μ΄ λ°λμ΄κ°λ κ²μ λλλ€βκ³ λ§νλ€.μ μΈ μκ°λ₯Ό λ°κ΅΄Β·μ‘μ±νκ³ λ¬Ένμ½ν
μΈ λ₯Ό λ°κ΅΄νκΈ° μν νκ²½ μ²λ
μ μΆλ¬Έμκ° 4νλ₯Ό λ§μλ€. μ 3νλΆν° λ§ 39μΈ μ΄νκΉμ§ μ°Έμ¬ν μ μλλ‘ νμ λνλ€. 20λ λνμλΆν° μκ°μ κΏμ λμ§ μμ 30λ μ§λ§μμκ²κΉμ§ λ¬Έμ΄ μ΄λ € μλ€.μ¬ν΄λ μ, μ₯νΈμμ€, μλλ¦¬μ€ λ± μΈ κ° λΆλ¬Έμμ μλ‘μ΄ μκ°λ₯Ό μ°Ύμ λμ λ€. μ₯νΈμμ€ λΆλ¬Έμ 3000λ§μμ μκΈμ μ€λ€. μκ³ λμ 200μ μκ³ μ§ κΈ°μ€ 1000μ₯ μνμ΄λ©° 10μ₯ λΆλμ μ€κ±°λ¦¬ μ€λͺ
μ λ°λ‘ μ μΆν΄μΌ νλ€. μλ 5νΈ μ΄μ μ μΆν΄μΌ νλ©°, μλλ¦¬μ€ μκ³ λ 400μ₯ μν(μλμμ€ 10μ₯ λ³λ)μ΄λ€. μμ μλλ¦¬μ€ μκΈμ 500λ§μμ©μ΄λ€.μκ³ λ A4 μ©μ§μ μΆλ ₯ν΄μ 보λ΄μΌ νλ€. μλͺ¨μμ κ³Όκ±°μ λ°ννκ±°λ μ
μν μ μ΄ μλ μμ μ°½μλ¬Όμ΄μ΄μΌ νλ€. λ€λ₯Έ 곡λͺ¨μ μ μ€λ³΅ ν¬κ³ ν΄ μ΄λ―Έ μ
μν μνμ΄κ±°λ νμ ν μ¬μ€μ΄ λ°νμ§λ©΄ λΉμ μ μ·¨μνλ€. λ΄ν¬μ βνκ²½ μ²λ
μ μΆλ¬Έμ μλͺ¨μνβμ΄λΌ μ κ³ μν 첫 μ₯κ³Ό λ§μ§λ§ μ₯μ μλͺ¨ λΆλ¬Έ, μ΄λ¦(νλͺ
μΌ κ²½μ° λ³Έλͺ
λ³κΈ°), μ£Όμ, μ νλ²νΈ, μκ³ λ(200μ μκ³ μ§ κΈ°μ€), μ£Όλ―Όλ±λ‘μ μλ
μμΌμ λͺ
μν΄μΌ μ μ μλͺ¨μμΌλ‘ μ μνλ€. λͺ¨λ μκ³ λ λ°ννμ§ μλλ€.',
'μ λΆκ° λ°νν β9Β·1 λΆλμ° λμ±
β κ°μ΄λ° κ΅νλ₯Ό κ±°μ³μΌ ν μ
λ² μ¬νμ λκ³ κ°λ±μ΄ λΆκ±°μ§κ³ μλ€. 9Β·1 λμ±
λλΆλΆμ μ λΆ μ°¨μμμ μνλ Ήμ΄λ κ·μΉμ κ³ μΉλ©΄ μνν μ μλ λ΄μ©μ΄μ§λ§, μ¬μΌ ν©μλ₯Ό ν΅ν΄ κ΅ν ν΅κ³Όκ° νμν νμ§κ°λ°μ΄μ§λ²(νμ΄λ²) νμ§, μ²μ½μ λ κ°νΈ λ±μ λκ³ μΌλΉμ΄ λ°λ°νκ³ λμ°λ€. μμΈμλ μ¬κ±΄μΆΒ·μ¬κ°λ° λ± μ λΉμ¬μ
λ°©μ κ°νΈμ λ°λν΄ μΆμ§μ μ΄λ €μμ κ²ͺμ κ²μ΄λΌλ μ λ§μ΄ λμ¨λ€.μ§λ 1μΌ μ λΆκ° λ°νν κ·μ μνμ 42κ° κ°μ΄λ° λ² κ°μ μ΄ νμν μ
λ² μ¬νμ λͺ¨λ 11κ°λ€. μμ μΉλ―Όμ£Όμ°ν©μ μ΄ κ°μ΄λ° β³νμ΄λ² νμ§ β³κ³΅κ³΅κ΄λ¦¬μ κ°μ (λμ λ° μ£Όκ±°νκ²½μ λΉλ²) β³μ²μ½μ λ κ°νΈ(μ£Όνλ²) λ±μ λ°λνκ³ μλ€. βμλ―Όμ£Όκ±°μμ λ°©μμ΄ μλλΌ μμΈ κ°λ¨κΆ μ€μ¬μ λΆλμ° κ²½κΈ° λΆμ μ μ±
βμ΄λΌλ μ£Όμ₯μ΄λ€.μ°μ νμ΄λ²μ νμ§νλ©΄ λ μ΄μ μ λμκΈμ λκ·λͺ¨ μ£Όν 곡κΈμ ν μ μμ΄ μ§κ° μμΉ μ°λ €κ° μλ€λ κ² μΌλΉ μΈ‘ μ§μ μ΄λ€. λ°±μ¬ν μμ μΉμ°ν© μ μ±
μ μμλΆμμ₯μ βμλμ μΌλ‘ μ§κ°μ΄ μΌ νμ§μ§κ΅¬κ° μ¬λΌμ§λ©΄ 무주ν μλ―Όμ΄ μ§μ μ₯λ§νκΈ°λ λ μ΄λ €μμ§ κ²βμ΄λΌκ³ λ§νλ€. κ΅ν κ΅ν΅λΆ κ΄κ³μλ μ΄μ λν΄ βμ£Όν 보κΈλ₯ μ΄ 100%λ₯Ό λμ λ°λ€ μ΅κ·Ό μ£Όν 곡κΈκ³ΌμμΌλ‘ μ΄λ―Έ μ§μ λ λν νμ§μ§κ΅¬ μλΉμλ₯Ό ν΄μ νκ³ μλ μ€μ βμ΄λΌλ©° βμ λμκΈ λμ μ€μν κ·λͺ¨μ λμκ°λ°μ κ³μ μΆμ§ν κ²βμ΄λΌκ³ μ€λͺ
νλ€.μ²μ½ κ°μ μ λ₯Ό μ§λ°©μμΉλ¨μ²΄μ₯μ΄ μμ¨ μ΄μνλλ‘ ν κ²λ 무주νμ ννμ μ€μ΄λ λ°©μμ΄λΌλ μ£Όμ₯μ΄ λμ¨λ€. νμ¬ μ²μ½μ λλ 무주ν κΈ°κ°μ΄ μ€λλκ³ λΆμκ°μ‘±μ΄ λ§μ μΈλμ£Όμκ² κ°μ μ μ£Όκ³ μλ€. μ΄λ₯Ό μ§μ체μ₯ μμ¨μ λ§‘κΈΈ κ²½μ° λ¬΄μ£Όν ννμ΄ μ¬λΌμ§ κ°λ₯μ±μ΄ λλ€λ μ§μ μ΄λ€. κ΅ν λΆ κ΄κ³μλ βμ²μ½ κ³Όμ΄μ΄ μ°λ €λλ ν¬κΈ°κ³Όμ΄μ§κ΅¬μ 곡곡주νμ§κ΅¬μ λν΄μλ κ°μ μ λ₯Ό μ무 μ μ©ν΄ 무주ν μλ―Όμκ² μ°μ 곡κΈν κ³νβμ΄λΌκ³ ν΄λͺ
νλ€.곡곡κ΄λ¦¬μ λ₯Ό κ°μ νλ λμ λ²μ μμΈμκ° λ°λνκ³ μλ€. κ°μ μμ ν μ§ λ± μμ μ κ³Όλ°μκ° μν κ²½μ° μ¬μ
μνμΈκ° μ΄μ μ μ곡μ¬λ₯Ό μ μ ν μ μλλ‘ νλ€. μμΈμ μ‘°λ‘λ³΄λ€ μμλ²μΈ λμ λ²μ΄ κ°μ λλ©΄ μ§μ체λ μ΄λ₯Ό λ°λΌμΌ νλ€. μμΈμ κ΄κ³μλ βμκ³΅μ¬ μ μ μ μλΉκΈΈ κ²½μ° μ¬μ
λΉκ° λμμ§κ³ μ‘°ν©μ κ° κ°λ±μ΄ λμ΄λ κ°λ₯μ±λ μλ€βκ³ μ£Όμ₯νλ€. μ΄νμ§/μ΄νΈκΈ°/κΉλ³κ·Ό κΈ°μ',
'λμ μ μλ μ λ³μμ μλ£μ
κ³μμ βνλ₯μ€νβλ‘ ν΅νλ€. μ§λ 4λ
κ° μ΄κ³³μ μ°Ύμ μΈκ΅μΈ νμλ 1λ§2000λͺ
μ΄ λλλ€. 2011λ
854λͺ
μ λΆκ³ΌνμΌλ μ§λν΄μλ 5431λͺ
μΌλ‘ κΈμ¦νλ€. μ΄ κΈ°κ° μΈκ΅μΈ νμ μ¦κ°μ¨μ 536%μ μ΄λ₯Έλ€.μ λ³μμ κ΅λ΄μΈ λ³μλ€μ βλ²€μΉλ§νΉβ λμμ΄λ€. μ§κΈκΉμ§ μ΄κ³³μ νλ°©νκ³ λμκ° κ΅λ΄ μ’
ν©λ³μλ§ 100κ³³μ μ΄λ₯Έλ€. μμΈλλ³μκ³Ό μΌμ±μμΈλ³μ λ± λ΄λ‘λΌνλ μ’
ν©λ³μλ€λ βμμ‘΄μ¬βμ λ΄λ €λκ³ μ λ³μμ μ₯μ μ λ°°μ°κΈ° μν΄ μ°Ύκ³ μλ€.μλ
ν ν΄μλ§ μΌλ³ΈΒ·μ€κ΅Β·λ¬μμΒ·λ² νΈλ¨Β·νκ΅Β·μΈλ λ± ν΄μΈ 20μ¬κ°κ΅ μλ£κΈ°κ΄λ€μ΄ λ³μ κ²½μμ λ°°μ°λ¬ μλ€. μ λ³μμ λμΉλ λ°©λ¬Έκ°λ€λ‘ μΈν΄ μ
무μ μ§μ₯μ λ°μ λ°©λ¬Έ κ°λ₯ν λ μ μ 1ν, λ§μ§λ§μ£Ό κΈμμΌλ‘ μ ννκΈ°λ νλ€.μ λ³μμ λμ μλ΄μ μ μ±μ ν©μ΄μ Έ μλ λ³μμ λͺ¨λ ν©μ³μΌ 900κ° μ λλ€. κ·λͺ¨λ‘ 보면 νλ²ν μ§λ°© μ’
ν©λ³μμ΄μ§λ§ κ°μ’
μ§νλ‘ λ³΄λ©΄ μ±μ₯μΈκ° κ°νλ₯΄λ€. μλ
λ§ κΈ°μ€μΌλ‘ ν루 μΈλ νμ μλ 3500λͺ
μ μ΄λ€. μΈκ΅μΈ νμ μ μΉλ₯Ό κ³κΈ°λ‘ 본격μ μΈ λ³μ μ μλν 4λ
μ κ³Ό λΉκ΅νλ©΄ 34.6% μ¦κ°ν κ²μ΄λ€.μμΈμ μλ μ’
ν©λ³μλ€μ λΉν΄ μ§λ¦¬μ μΌλ‘ λΆλ¦¬ν μ§λ°© λ³μμ΄ βνμ μ μμ΄μ½βμΌλ‘ λΆλ¦¬λ λΉκ²°μ 무μμΌκΉ. μ μΉν μλ£μμ₯μ βλ°°μΈ μ μλ λͺ¨λ κ²μ λ§€λ΄μΌνν κ²°κ³ΌβλΌκ³ μ€λͺ
νλ€. μ λ³μμ΄ κ°μ₯ μ¬νμ κΈ°μΈμ΄λ κ²μ μ΅κ³ κΈ μλΉμ€λ₯Ό λ²€μΉλ§νΉνλ μΌμ΄λ€. μ μμ₯μ β1λ
μ μ§κ΅¬ λ€ λ°ν΄ λ°μ λλ©΄μ μΈκ³ κ°κ΅μ νμ μ¬λ‘λ₯Ό λͺ¨μ μ¨λ€βκ³ νλ€. κ·Έλ λ§€λ
νλ μ°¨λ‘ μ§μ 15~20λͺ
μ ν΄μΈμ λ΄λ³΄λΈλ€. κ·Έμ μ£Όλ¬Έμ λ¨ νλ, βμ무κ²λ μκ°νμ§ λ§κ³ μ΅κ³ κΈ μλΉμ€λ₯Ό μ¦κ²¨λΌβ.νμ μ κ³³κ³³μμ μ΄λ€μ‘λ€. κ°νΈμ¬λ€μ νμμ μ 보λ₯Ό μΌμΌμ΄ μ첩μ μ κ³ μ΄λ₯Ό μ μ°μΌλ‘ κ΄λ¦¬ν΄ νΈνμ λ°κ³ μλ€. 4λ
μ μ μμ₯κ³Ό μ§μ 20μ¬λͺ
μ΄ λ°©λ¬Έν μ±κ°ν¬λ₯΄ 6μ±κΈ νΈν
μΈ μΉ΄ν λΌνΈν
μ μλΉμ€μμ κ°μ Έμ¨ μμ΄λμ΄λ€. μλ΄μ§μλ€μ βλ°λ± μλβλ νκ΅ λ°©μ½μ μ¬λ―Έν°λ²³ λ³μ κ°νΈμ¬λ€μ΄ μμμ μμ μλ νμ κ°μ‘± λ±κ³Ό λλμ΄λ₯Ό λ§μΆκΈ° μν΄ λ¬΄λ¦μ κΏλ κ²μμ λ°°μμλ€.μ±κ°ν¬λ₯΄ μ°½μ΄κ΅μ 곡ν, ν콩κ΅μ 곡ν λ±λ βλ°°μν°βμλ€. λ³μμ 리λͺ¨λΈλ§ν λ μ΄μ©κ° νΈμλ₯Ό κ·Ήλνν κ΅μ 곡νμ λμ μ μ μ©νλ€.μ λ³μμ μ§λλ¬ μ€νμμ€μ 5μ±κΈ νΈν
νμΌλ‘ μλ‘ κΎΈλͺλ€. μ€νμμ€ κ°νΈμ¬λ€μ μ¬λ¬΄κ³΅κ°μ βννκ³€νβμΌλ‘ μ μ€μμ λ°°μΉ, νμλ€μ μꡬμ¬νκ³Ό νλμ μ¦μ λμν μ μλλ‘ λ°κΏ¨λ€. λ³λ λΉμ© μμ΄ λ³΄νΈμκ° νμ κ³μμ λ¨Έλ¬Ό μ μλλ‘ κ°λ³ μΉ¨λμ μμ€λ λ§λ ¨νλ€. μ΄κ·μ κ²½μμ΄κ΄μμ₯μ βνΈν
μ μ₯μ μ μ λͺ©ν μ€νμμ€μ κ°μΆκΈ° μν΄ μ λΌνΈν
κ³Ό λ‘―λ°νΈν
λ± κ΅λ΄ νΉκΈνΈν
μ λ¬Όλ‘ μΌλ³Έ λ²³νΈ μΈμ΄μΉ΄μ΄νΈν
, ν콩 λμ νλ μ΄μ€ λ± μμμ μ£Όμ νΈν
μ κ±°μ λΉ μ§μμ΄ νμλ€βκ³ μ νλ€.',
]
)
# [{'corpus_id': ..., 'score': ...}, {'corpus_id': ..., 'score': ...}, ...]
sentence_0, sentence_1, and label| sentence_0 | sentence_1 | label | |
|---|---|---|---|
| type | string | string | int |
| details |
|
|
|
| sentence_0 | sentence_1 | label |
|---|---|---|
μ μ§κ΅μ΄ μΈκ΅ κΈ°μ
μ λμ°νκΈ° μν μ λλ? |
νμ€μ λΆμ΄λ¦¬ κ²Έ κΈ°νμ¬μ λΆ μ₯κ΄μ΄ μ€μκΈ°μ
보νΈλ₯Ό μν΄ κ³΅κ³΅μ‘°λ¬ μμ₯μμ βκ΅λ΄μΈ λκΈ°μ
μ λν λλ± κ·μ β μμΉμ λ°νμ λ°λΌ μ λΆκ° μΈλΆ κ·μ λ°©μ λ§λ ¨μ λ€μ΄κ°λ€. μ λΆλ νΉν μ΄ κ°μ κ·μ λ μΈκ΅ κΈ°μ
λ§μ λμμΌλ‘ ν κ·μ μ λ¬λ¦¬ μΈκ³λ¬΄μ기ꡬ(WTO) 43κ° κ°μ
κ΅μ΄ λ§Ίκ³ μλ μ λΆμ‘°λ¬νμ (GPA)μ μλ°°λμ§ μλλ€λ μ
μ₯μ λΆλͺ
ν νλ€. βΆλ³Έμ§ 11μ11μΌμ A1, 3λ©΄ μ°Έκ³ βμ λΆ, β곡곡μμ₯ μμ°¨λ³ μμ βκΈ°μ¬λΆ κ΄κ³μλ 11μΌ βλ΄λΆ κ²ν κ²°κ³Ό κ΅λ΄ λκΈ°μ
κ³Ό μΈκ΅ λκΈ°μ
μ λλ±νκ² κ·μ νλ κ²μ κ΅μ μ μΌλ‘ λ¬Έμ κ° μ λλ€βλ©° βμ μ§κ΅λ μΈμ μ§μ, μ§μ
μ₯λ²½ μ€μΉ, μ¬μ μ§μ λ±μ ν΅ν΄ μκ΅ μ€μκΈ°μ
μ 100% 보νΈνκ³ μλ€βκ³ λ§νλ€. μΈκ΅ κΈ°μ
μ μ°¨λ³ λμ°νλ©΄ λ¬Έμ κ° λμ§λ§ κ·Έλ μ§ μμΌλ©΄ κ΅μ λ²μ λ¬Έμ κ° μλ€λ κ²μ΄λ€.μ΄ κ΄κ³μλ μ΄μ΄ βμ€μκΈ°μ
보νΈλ₯Ό μν΄ κ΅λ΄ λκΈ°μ
μ λ°°μ νλλ° (κ΅λ΄ λκΈ°μ
λ³΄λ€ λ©μΉκ° ν°) μΈκ΅κ³ λκΈ°μ
μ΄ λ€μ΄μ€λ 건 λ¬Έμ κ° μλ€λ μ μ΄ κ΅μ κ°μ¬μμλ μ¬λ¬ λ² μ§μ λλ€βλ©° βμ΄λ° νμμ λ°©μΉν μ μλ€λ κ² μ λΆ λ°©μΉ¨βμ΄λΌκ³ κ°μ‘°νλ€. μΌλΆμμ βμΈκ΅κ³ λκΈ°μ
κ·μ κ° κ΅λ΄ μμ₯μ μ§ν€λ €λ€ ν΄μΈ μμ₯μ μλ μ‘°μΉ μλλβλ μ§μ μ΄ λμ€λ λ° λν΄μλ βν΄μΈ μμ₯ ν¬κΈ°κ° μλλΌ κ΅λ΄ κΈ°μ
μ΄ λ°λ μμ°¨λ³ ν΄μ μ°¨μβμ΄λΌκ³ μ κ·Ή λ°λ°νλ€. μ€μκΈ°μ
μ μν΄ λ¨κ²¨λ μ리λ₯Ό μΈκ΅κ³ κΈ°μ
μ΄ μΉκ³ λ€μ΄μ€λ©΄ κ΅λ΄ λκΈ°μ
μ΄ μμ°¨λ³μ λ°λ κ²μ λ¬Όλ‘ μ€μκΈ°μ
μ¬μ΄μμλ βμΈκ΅κ³ κΈ°μ
κ³Ό μ ν΄λ₯Ό νλλ λͺ»νλλβμ λ°λΌ κ³΅κ³΅μ‘°λ¬ μμ₯μμ μ°¨λ³μ λ°μ μ μλ€λ μ΄μ μμλ€. κΈ°μ¬λΆλ μ΄μ λ°λΌ μ‘°λ§κ° μ°μ
ν΅μμμλΆ μ€μκΈ°μ
μ² μ‘°λ¬μ² λ± κ΄κ³λΆμ²μ νμν΄ ν λΆμ΄λ¦¬κ° λ°ν κ·μ λ°©μμ λ€λ¬λ μμ
μ λμκΈ°λ‘ νλ€. κΈ°μ¬λΆ λ΄λΆμ μΌλ‘λ μ΄λ―Έ μ§λμ£Όμ κ²ν μμ
μ ν μ°¨λ‘ νλ€. ν΅μ 주무λΆμ²μΈ μ°μ
λΆλ μ΄λ―Έ λ΄λΆμ μΌλ‘λ μ΄ κ°μ κ΅λ΄μΈ λλ± κ·μ λ WTO νμ μ μλ°°λμ§ μλλ€λ νλ¨μ λ΄λ Έλ€. μ°μ
λΆμ κ΄κ³μλ βμ€μκΈ°μ
보νΈλ₯Ό μν μμΈ μ μ©μ μ ... |
1 |
μλ μ΄ μ€μ€λ‘ μνλ₯Ό μ μν μ μμμ μ
μ¦νμ¬ μΉλΆμμ μ΄κΈ΄ μλλ λꡬμΈκ°? |
βλ§λ
Έμ€: μ΄λͺ
μ μβμ μλ μ κ³ ν₯μΈ ν
μ¬μ€μ£Ό μ νμμ μλ μΉ΄ν리 κ·Ήμ₯μμ 1966λ
11μ 15μΌ μμ¬νλ₯Ό κ°μ‘λ€. μλ μ μμ¬νμ μ°λ €κ³ μμΉλΌμ΄νΈλ₯Ό ꡬνμΌλ©° ν리μ°λ λΆμκΈ°λ₯Ό λ΄κΈ° μν΄ μΊμ€νΈκ° ν 리무μ§μ λμ¬νλ€. νμ§λ§ λ¦¬λ¬΄μ§ ν λ λ°μ λμ¬κ° μ λμμΌλ―λ‘, μΊμ€νΈλ₯Ό λ°μΌλ‘ λλμ΄ ν κ·Έλ£Ήμ μμ¬νλ‘ νμ°κ³ , λ€μ 리무μ§μ λλ € κΈ°λ€λ¦¬κ³ μλ λλ¨Έμ§ κ·Έλ£Ήμ κ·Όμ² λͺ¨νμ΄μμ νμ°κ³ μμ¬νλ‘ λ°λ €μμΌνλ€. μμ¬νμλ μμ₯, μ§μ 보μκ΄ λ± μ§μμ μ£Όμ μΈμ¬λ€μ΄ λ€μ μ΄λλμλ€. μνκ° μμν μ§ μΌλ§ μ§λμ§ μμ, μμ¬νμ₯μ μμμΌλ‘ κ°λμ°Όλ€. μλ κ³Ό λλ¨Έμ§ μΆμ°μ§μ λ―Όλ§ν΄μ§ μ±λ‘ μ¬λΉ¨λ¦¬ μΆκ΅¬λ₯Ό ν΅ν΄ λΉ μ Έλκ°λ€. μμ¬ν ν, μλ μ μμ μ΄ λ³΄κΈ°μλ βλ§λ
Έμ€βκ° μ΅μ
μ μνλΌκ³ μκ°νμ§λ§ κ·Έλλ μλμ€λ½λ€κ³ λ°νλ€. λν, μλ§ λ€λ¬μΌλ©΄ μ¬λ°λ μ½λ―Έλ μνλ‘ λ§λ€ μ μμ κ² κ°λ€λ μκΈ°λ μΈν°λ·°μμ νμλ€ |
1 |
μ₯νΈμμ€ λΆμΌμ μ§μν λ, μν μΈμ λ³λλ‘ μ¨μΌ νλ κΈμ λͺ μ₯μΈκ°? |
λΆμ°λ μ² νκ³Όμ λ€λλ νμ€μ± μ¨(24)λ μ§λν΄ κ°μ νμ μ λΆμΌλ‘ μ 3ν νκ²½ μ²λ
μ μΆλ¬Έμμ λ¬Έμ λλλ Έλ€. νμ¨λ μ² νκ³Ό μ±
μ μ’μνλ νλ²ν νμμ΄μλ€. μ μΆλ¬Έμ μ₯νΈμμ€ λΆλ¬Έμ λΉμ λλ©° κ·Έμ μΆμ λ³νλ€. μκΈμ μ¬λΉ μΌμ μ κ΅μ μ¬ννλ©° μ΄μΌκΈ°λ₯Ό μμ§νλ€. κ°μ νΈλ¨ μλ¨ λ± μμ¬μ λΉκ·Ήμ μ§λ κ³³μ μ°Ύμλ€λλ©° μ΄μΌκΈ°λ₯Ό λ€μλ€. λΉμ μ κΉμ§λ§ ν΄λ λ§νκΈ°λ₯Ό μ’μνλ μ μ μ²λ
μ μ΄λμ νμΈμ λ§μ κ· κΈ°μΈμ¬ λ£λ μ μ μκ°λ‘ λ³μ νλ€. νμ¨λ μ¬ν΄ λ¬Ένλλ€ μκ°μ λ³Έμ¬μ μ΄λ¦μ μ¬λ¦¬λ λ± μ μΆλ¬Έμ λΉμ μ΄ μ°μ°μ΄ μλμμμ μ¦λͺ
ν΄ λκ°κ³ μλ€. κ·Έμ μ²λ
μ μΆλ¬Έμ λΉμ μ μ΄λ±μ κ³λ³΄(μνλ무)λ ν΄κ³ λ₯Ό κ±°λν΄ μ΄λ¬ μ μ μΆκ°λλ€.μ’μ μνμ κ·Έκ²μ μ½λ μ¬λμ μΈμμ λ¬Όλ‘ λ§λ μ¬λμ μΈμλ λ°κΎΌλ€. κ°μ₯ μ’μ μ¬λ‘κ° μ μΆλ¬Έμλ€. λ¬Έν μ§λ§μμΌλ‘μ λμλ μ΅μμ λλ μ 보λ΄λ μ΄λ€μ μ μΆλ¬ΈμλΌλ κ΄λ¬Έμ κ±°μ³ μκ°λ‘ λ³μ νλ€.μ 2ν μ₯νΈμμ€ λΉμ μμΈ κΉμκ²½ μ¨(36)μ λΉμ μ μ²μΆνμ°(λ―Όμμ¬)μ μ μ μΈλκ° κ²ͺλ μ΄λ €μμ μμ§νκ² ννν΄ νΈνλ°μ μνμ΄λ€. μ΄ μμ€μλ κΉμ¨κ° κ²ͺμ μΌλ€μ΄ μλΉ λΆλΆ λ
Ήμ μλ€. κΉμ¨λ μ§μμ΄ μ΄λ €μμ§λ λ°λμ μ΄λ¦° μμ ν΄ λ³΄μ§ μμ μλ₯΄λ°μ΄νΈκ° μμ μ λμλ€.κΉμ¨λ μ§λ 2μ νκ΅λ¬Ένμμ μμνμ μμΈ νλ¦°μ€νΈν
μ΄ νμνλ μ°½μμ§νμ€ μ
μ£Όμκ° νλ‘κ·Έλ¨μ μ μ λΌ ν λ¬ λμ νΈν
μμ μ§νμ μ λ
νλ€. νΈν
μμ νμ μ‘μ λνμ μμ νΈν
μ£Όλ°©μμ μ€κ±°μ§νλ κΈ°μ΅μ΄ λ μ¬λλ€. βνΈν
μμ κΈμ μ°λ μλ μκ°μ΄ λμ κΈ°λΆμ΄ λ¬νμ΄μ. νΈν
μμ μΌν λλ μ λ¬ΈμΌλ‘ λ€μ΄κ° μλ μλ μ μΈμλλ° λ§μ΄μ£ .β μ μ μκ°κ° λ λ€ λ ν° μ±
μκ°μ λλΌκ³ μλ€λ κ·Έλ μ΄λ¬ λ λ²μ§Έ μνμ νκ³ ν κ³νμ΄λ€.μ 3ν μ λΆλ¬Έ λΉμ μ κΉλ―Όμ¨ μ¨(37)λ λ±λ¨ μ΄μ κ³Ό λ³λ€λ₯Ό κ² μμ΄ λ³΄μ΄λ μΌμμ 보λ΄κ³ μλ€. νμ§λ§ κ·Έμκ²λ λΆλͺ
ν λ³νκ° μκ²Όλ€. βλ±λ¨ μ μλ μ’ νΈμνκ² μλ₯Ό μΌλλ° λ±λ¨ν λ€λ‘λ μ±
μκ° μκ² μλ₯Ό μ°λ €κ³ νλ€βκ³ κΉμ¨λ λ§ν... |
1 |
BinaryCrossEntropyLoss with these parameters:{
"activation_fn": "torch.nn.modules.linear.Identity",
"pos_weight": null
}
per_device_train_batch_size: 16per_device_eval_batch_size: 16num_train_epochs: 1overwrite_output_dir: Falsedo_predict: Falseeval_strategy: noprediction_loss_only: Trueper_device_train_batch_size: 16per_device_eval_batch_size: 16per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 5e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1num_train_epochs: 1max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.0warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falseuse_ipex: Falsebf16: Falsefp16: Falsefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}parallelism_config: Nonedeepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torch_fusedoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsehub_revision: Nonegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters: auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: Falseneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseliger_kernel_config: Noneeval_use_gather_object: Falseaverage_tokens_across_devices: Falseprompts: Nonebatch_sampler: batch_samplermulti_dataset_batch_sampler: proportionalrouter_mapping: {}learning_rate_mapping: {}| Epoch | Step | Training Loss |
|---|---|---|
| 0.2278 | 500 | 0.2381 |
| 0.4556 | 1000 | 0.072 |
| 0.6834 | 1500 | 0.0639 |
| 0.9112 | 2000 | 0.0494 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
Base model
klue/roberta-small