Matryoshka Representation Learning
Paper • 2205.13147 • Published • 27
How to use Desalegnn/Desu1-roberta-amharic-embed-medium-45k with sentence-transformers:
from sentence_transformers import SentenceTransformer
model = SentenceTransformer("Desalegnn/Desu1-roberta-amharic-embed-medium-45k")
sentences = [
"የአሜሪካ ኤምባሲ ለጠቅላይ ሚኒስትር ዐብይ አህመድ የደስታ መግለጫ አወጣ፡፡",
"ባሕር ዳር፡ መስከረም 30/2012 ዓ/ም (አብመድ) በኢትዮጵያ የአሜሪካ ኤምባሲ ጠቅላይ ሚኒስትር ዐብይ አህመድ (ዶክተር) 100ኛው የኖቤል ሽልማት አሸናፊ መሆናቸውን በመስማቱ መደሰቱን ገልጿል፤ ለጠቅላይ ሚኒስትሩና ለኢትዮጵያ ሕዝብም ‹የእንኳን ደስ አላችሁ› መልዕክት አስተላልፏል፡፡ኤምባሲው ‹‹ለሠላምና ዓለማቀፋዊ ጥምረት ባረከቱት ጉልህ አስተዋጽኦ እና ከኤርትራ ጋር የነበረውን የድንበር ቅራኔ ለመፍታት በሄዱት ርቀት›› አሸናፊ መሆናቸው እንዳስደሰተው ነው የገለጸው፡፡ሽልማቱ ጠቅላይ ሚኒስትሩ በመሪነት ዘመናቸው እያስመዘገቡ ላለው ስኬት ማሳያ መሆኑንም ኤምባሲው አመልክቷል፡፡የዴሞክራሲ መርሆዎችን ለመተግበር፣ አካታች ልማት ለማምጣት፣ የፖለቲካ ምኅዳሩን ለማስፋት፣ የመገናኛ ብዙኃን ነፃነትን ለማረጋገጥና እስረኞችን ለመፍታትና የምጣኔ ሀብት ሽግግር ለማምጣት ዶክተር ዐብይ ያሳዩትን ቁርጠኝነትም አድንቋል፡፡አሜሪካ የኢትዮጵያን ሕዝብና መንግሥት በመደገፍ ዴሞክራሲያዊ ሥርዓትና ብልጽግና እንዲኖር እንደምትደግፍም ኤምባሲው አስታውቋል፡፡",
"አዲስ አበባ፣ ነሐሴ 20፣2012 (ኤፍ ቢ ሲ) ዋጋቸው 28 ነጥብ 2 ሚሊየን ብር የሚገመት ልዩ ልዩ የኮንትሮባንድ ዕቃዎች እና የንግድ ማጭበርበሮች ባለፉት ስድስት ቀናት በተለያዩ የሀገሪቱ ክፍሎች መያዛቸውን የገቢዎች ሚኒስቴር አስታወቀ፡፡ከዚህ ውስጥ 4 ሚሊየን ብር የሚገመተው የኮንትሮባንድ እቃ በህገ-ወጥ መንገድ ከሶማሌላንድ ወደ ጅግጅጋ በጭነት መኪና ሲጓጓዝ የተያዘ ሲሆን፤ ሊሰወር የነበረ 15 ነጥብ 7 ሚሊየን ብር ቀረጥና ታክስ በኮምቦልቻ፣ በሞጆ እና በቃሊቲ የጉምሩክ ቅርንጫፍ ጽህፈት ቤቶች ክትትል ተደርሶባቸው ለመንግስት ገቢ ተደርጓል፡፡ ከ3 ሚሊየን ብር በላይ ግምታዊ ዋጋ ያለው የውጭ ምርት የሆነ ማሽላ የእርዳታ እህል በማስመሰል የጉምሩክ ስነ-ስርዓት ሳይፈጸምበት ሲጓጓዝ ተይዟል፡፡ከተያዙት የኮንትሮባንድ ዕቃዎች ውስጥ የተለያዩ አልባሳት እና የግንባታ ዕቃዎች እንደሚገኙበት ያስታወቀው ሚኒስቴሩ ፤ 2 ነጥብ 7 ሚሊየን ብር የሚገመት በጎብኚ ስም የገባ የኮንትሮባንድ እቃ በድሬዳዋ የጉምሩክ ቅርንጫፍ መያዙን ገልጿል፡፡ ሌሎች ግምታዊ ዋጋ ያልወጣላቸው የኮንትሮባንድ ዕቃዎችም በተጠቀሰው ጊዜ መያዛቸው ነው የተነገረው፡፡ህጋዊ ንግድን ሽፋን በማድረግ የሚፈፀሙ የንግድ ማጭበርበሮች ለመከላከል በኮምቦልቻ፣ በሞጆ እና ቃሊቲ የተጀመሩ ስራዎች አበረታች በመሆናቸው በሌሎችም ቅርንጫፎች መጠናከር እንዳለባቸው ተጠቁሟል።",
"አዲስ አበባ ፣ ሐምሌ 22 ፣ 2012 (ኤፍ ቢ ሲ) ምክትል ጠቅላይ ሚኒስትር ደመቀ መኮንን ከብሪታንያ የአፍሪካ ጉዳዮች ሚኒስትር ጀምስ ደድሪጅ ጋር በሁለትዮሽ የሃገራቱ ግንኙነት መጠናከር እና ሌሎች የጋራ ጉዳዮች ላይ ተወያይተዋል።ምክትል ጠቅላይ ሚኒስትሩ ለሶስት ቀናት ይፋዊ የስራ ጉብኝት አዲስ አበባ የሚገኙትን የብሪታንያ የአፍሪካ ጉዳዮች ሚኒስትር ጀምስ ደድሪጅን በጽህፈት ቤታቸው ተቀብለው አነጋግረዋል።በዚህ ወቅትም በሁለትዮሽ የሃገራቱ ግንኙነት እና በሌሎች የጋራ ጉዳዮች ላይ ምክክር አድርገዋል፡፡ከዚህ ባለፈም የኮሮና ቫይረስ ወረሽኝን ለመዋጋት በሚደረግ ትብብርና ቀጠናዊ ጉዳዮች ላይ መወያየታቸውን ኢዜአ ዘግቧል።ምክትል ጠቅላይ ሚኒስትሩ በኢትዮጵያ ወረርሽኙን ለመከላከል በርካታ ጠንካራ እርምጃዎች መወሰዳቸውን ገልጸዋል።"
]
embeddings = model.encode(sentences)
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [4, 4]This is a sentence-transformers model finetuned from rasyosef/roberta-medium-amharic. It maps sentences & paragraphs to a 512-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
SentenceTransformer(
(0): Transformer({'max_seq_length': 510, 'do_lower_case': False, 'architecture': 'XLMRobertaModel'})
(1): Pooling({'word_embedding_dimension': 512, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("Desalegnn/Desu1-roberta-amharic-embed-medium-45k")
# Run inference
sentences = [
'24 ሰዓት በተደረገው 3 ሺህ 271 የላብራቶሪ ምርመራ በ14 ሰዎች ላይ የኮሮና ቫይረስ ተገኘ',
'አዲስ አበባ፣ ግንቦት 11፣ 2012 (ኤፍ.ቢ.ሲ) ባለፉት 24 ሰዓት ውስጥ በተደረገው 3 ሺህ 271 የላብራቶሪ ምርመራ በ14 ሰዎች የኮሮና ቫይረስ እንደተገኘባቸው የጤና ሚኒስቴር ገለፀ።በአጠቃላይ በኢትዮጵያ ቫይረሱ በምርመራ የተገኘባቸው ሰዎች ቁጥር 365 መድረሱን የጤና ሚኒስትሯ ዶክተር ሊያ ታደሰ አስታውቅዋል።ባለፉት 24 ሰዓት ውስጥ ቫይረሱ በምርመራ የተገኘባቸው ሁሉም ኢትዮጵያውያን ሲሆኑ፥ እድሜያቸው ከ9 እስከ 68 ዓመት የሆኑ 11 ወንዶችና 3 ሴቶች ናቸው።ቫይረሱ ከተገኘባቸው ሰዎች መካከል 9 ሰዎች ከአዲስ አበባ ሲሆኑ፥ ከእነዚህም መካከል 1 ሰው የውጭ ሀገር የጉዞ ታሪክ ያለው ድንበር ተሻጋሪ አሽከርካሪ፣ 7 ሰዎች በበሽታው ከተያዘ ሰው ጋር ግንኙነት ያላቸው እንዲሁም 1 ሰው ደግሞ የውጭ ሀገር የጉዞ ታሪክ እና በቫይረሱ ከተያዘ ሰው ጋር ግንኙነት የሌለው መሆኑን አስታውቀዋል።ቀሪዎቹ አምስት ሰዎች ደግሞ 1 ሰው በትግራይ ክልል (የውጭ ሀገር የጉዞ ታሪክ ያለው ድንበር ተሻጋሪ አሽከርካሪ፤ በመቐለ ለይቶ ማቆያ ያለ) 1 ሰው በኦሮሚያ ክልል (የውጭ ሀገር የጉዞ ታሪክ ያለው ድንበር ተሻጋሪ አሽከርካሪ) እንዲሁም 3 ሰዎች በሶማሌ ክልል (ጅግጅጋ ልይቶ ማቆያ) ውስጥ የሚገኙ መሆናቸውንም ገልፀዋል።በትናንትናው እለት በወጣው ሪፖርት ላይ ከአማራ ክልል (ሰሜን ሸዋ ዞን አጣየ ከተማ ለይቶ ማቆያ) ተብሎ የተገለፀው ግንቦት 9 በወጣው ሪፖርት ላይ ተገልፆ የነበረ እና ትናንት በድጋሚ ሪፖርት መደረጉን በመግለፅ፤ በትናንትናው እለት ቫይረሱ በምርመራ የተገኘባቸው ሰዎች ቁጥር 34 መሆኑን ሚኒስቴሩ ከይቅርታ ጋር ገልጿል።በሌላ በኩል በትናንትናው እለት 3 ሰዎች ከሶማሌ ክልል፣ 1 ሰው ደግሞ ከአፋር ክልል በድምሩ 4 ተጨማሪ ሰዎች ከቫይረሱ ማገገማቸውንና በአጠቃላይ ከቫይረሱ ያገገሙ ሰዎች ቁጥር 120 መድረሱንም አስታውቀዋል።ከቫይረሱ ጋር በተያያዘ እስካሁን ለ62 ሺህ 300 ሰዎች ምርመራ የተደረገ ሲሆን፥ በአጠቃላይ በኢትዮጵያ ቫይረሱ በምርመራ የተገኘባቸው ሰዎች ቁጥር 365 ደርሷል።አሁን ላይ 238 ሰዎች በህክምና ላይ ሲሆኑ፥ እስካሁንም 120 ሰዎች ከቫይረሱ አገግመዋል፤ የ5 ሰዎች ህይወት ሲያልፍ፤ 2 ሰዎች ወደ ሀገራቸው ጃፓን መመለሳቸው ይታወሳል።የዜና ሰዓት ሳይጠብቁ የፋና ብሮድካስቲንግ ኮርፖሬትን ትኩስ እና ሰበር ዜናዎችን በፍጥነት በአጭር የፅሁፍ መልዕክት መልክ በስልክዎ ላይ እንዲደርስዎ ወደ 8111 OK ብለው ይላኩ።',
'ሁለቱ አዲስ አዳጊ ክለቦች በወራጅ ቀጠናው ውስጥ ሆነው የሚገናኙበት ጨዋታ 09፡00 ላይ በሽረ ስታድየም ይጀምራል። 14ኛ ደረጃ ላይ የተቀመጡት ሽረዎች አዲስ አበባ ላይ በኢትዮጵያ ቡና ከተሸነፉ በኋላ ነው ይህን ጨዋታ የሚያደርጉት። ምንም እንኳን አንድ ተስተካካይ ጨዋታ ቢቀራቸውም እስካሁን ድል ሳይቀናቸው በሊጉ በርካታ ግብ ያስተናገደ ክለብ ሆነው ነው በአደጋው ዞን ውስጥ የተቀመጡት። ሁሉንም ጨዋታዎች ያከናወነው ደቡብ ፖሊስም ከተጋጣሚው በአንድ ድረጃ ዝቅ ብሎ ይገኛል። ሣምንት በሜዳው ቅዱስ ጊዮርጊስን ገጥሞ 1-0 የተሸነፈው ደቡብ ፖሊስ ደደቢትን ከረታበት ጨዋታ ውጪ ከድሬዳዋ አቻ ሲለያይ በሌሎቹ ሽንፈት ሲያስተናግድ ቆይቷል። ደካማ አቋም እያሳዩ የሚገኙት ሁለቱ ቡድኖች እርስ በርስ በመገናኘታቸው ጨዋታውን በመሸናነፍ ካጠናቀቁ ከወራጅ ቀጠናው የመውጣት ዕድል ይኖራቸዋል።ስሑል ሽረ አሁንም ጉዳት ላይ የሚገኙት ተጫዋቾቹ ወደ ሜዳ አይመለሱም። ሸዊት የውሃንስ ፣ ሰለሞን ገብረመድህን ፣ መብራህቶም ፍስሃ ፣ ንስሃ ታፈሰ እና ሰዒድ ሁሴን በዚህ ዝርዝር ውስጥ ተካተዋል። በደቡብ ፖሊስ በኩል ደግሞ በረከት ይስሀቅ ፣ ቢኒያም አድማሱ እንዲሁም ረዘም ያለ ጉዳት የገጠመው የቀኝ መስመር ተከላካዩ ብርሀኑ በቀለ ወደ ሽረ ያልተጎዙ ተጫዋቾች ሲሆኑ ሙሉዓለም ረጋሳም በተመሳሳይ ከነገው ጨዋታ ውጪ ሆኗል።– ጨዋታው ለሁለቱ ቡድኖች የመጀመሪያ የፕሪምየር ሊግ ግንኙነታቸው ነው።– ስሑል ሽረ እስካሁን በሜዳው ያደረጋቸውን ጨዋታዎች በሙሉ በአቻ ውጤት አጠናቋል። ከነዚህ ጨዋታዎች ውስጥ ግብ ማስቆጠር የቻለውም ሲዳማን ባስተናገደበት ወቅት ብቻ ነው።– ደቡብ ፖሊስ ከሀዋሳ ውጪ ካደረጋቸው አራት ጨዋታዎች አንድ ነጥብ እና አንድ ጎል ይዞ የተመለሰው ከድሬዳዋው ጨዋታ ብቻ ነበር። በቀሪዎቹን ሦስት ጨዋታዎች ግን በተመሳሳይ የ1-0 ውጤት ተሸንፏል።– እስካሁን በተደረጉ ጨዋታዎች ከፍተኛ ቁጥር ያለው የቢጫ ካርድ (21) የመዘዘው ተፈሪ አለባቸው ይህንን ጨዋታ ይመረዋል። አርቢትሩ ሦስት የፍፁም ቅጣት ምት የሰጠበትን የሲዳማ ቡና እና ባህር ዳር ከተማ ጨዋታ ጨምሮ እስካሁን ሦስት ጨዋታዎችን ዳኝቷል።ሰንደይ ሮቲሚአብዱሰላም አማን – ዘላለም በረከት – ዲሜጥሮስ ወልደስላሴ – ክብሮም ብርሀነሳሙኤል ተስፋዬ – ኄኖክ ካሳሁንኢብራሒማ ፎፋና – ጅላሎ ሻፊ – ልደቱ ለማሚድ ፎፋናዳዊት አሰፋአናጋው ባደግ – ደስታ ጊቻሞ – አዳሙ መሀመድ – አበባው ቡታቆአዲስአለም ደበበ – ኤርሚያስ በላይ – ዘላለም ኢሳያስመስፍን ኪዳኔ – በኃይሉ ወገኔ – ብሩክ ኤልያስ',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 512]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[ 1.0000, 0.8042, -0.0227],
# [ 0.8042, 1.0000, 0.0781],
# [-0.0227, 0.0781, 1.0000]])
dim_512InformationRetrievalEvaluator with these parameters:{
"truncate_dim": 512
}
| Metric | Value |
|---|---|
| cosine_accuracy@1 | 0.6331 |
| cosine_accuracy@3 | 0.768 |
| cosine_accuracy@5 | 0.8134 |
| cosine_accuracy@10 | 0.8679 |
| cosine_precision@1 | 0.6331 |
| cosine_precision@3 | 0.256 |
| cosine_precision@5 | 0.1627 |
| cosine_precision@10 | 0.0868 |
| cosine_recall@1 | 0.6331 |
| cosine_recall@3 | 0.768 |
| cosine_recall@5 | 0.8134 |
| cosine_recall@10 | 0.8679 |
| cosine_ndcg@10 | 0.7493 |
| cosine_mrr@10 | 0.7116 |
| cosine_map@100 | 0.7161 |
dim_256InformationRetrievalEvaluator with these parameters:{
"truncate_dim": 256
}
| Metric | Value |
|---|---|
| cosine_accuracy@1 | 0.6293 |
| cosine_accuracy@3 | 0.7646 |
| cosine_accuracy@5 | 0.8098 |
| cosine_accuracy@10 | 0.8658 |
| cosine_precision@1 | 0.6293 |
| cosine_precision@3 | 0.2549 |
| cosine_precision@5 | 0.162 |
| cosine_precision@10 | 0.0866 |
| cosine_recall@1 | 0.6293 |
| cosine_recall@3 | 0.7646 |
| cosine_recall@5 | 0.8098 |
| cosine_recall@10 | 0.8658 |
| cosine_ndcg@10 | 0.7459 |
| cosine_mrr@10 | 0.7077 |
| cosine_map@100 | 0.7122 |
anchor and positive| anchor | positive | |
|---|---|---|
| type | string | string |
| details |
|
|
| anchor | positive |
|---|---|
በትራንስፖርት ሚ/ር ወ/ሮ ዳግማዊት የተመራው ልዑክ በሱዳን የነበረውን የስራ ጉብኝት አጠናቀቀ |
አዲስ አበባ፣ ታህሳስ 23፣ 2012 (ኤፍ ቢ ሲ) በትራንስፖርት ሚኒስትር ወይዘሮ ዳግማዊት ሞገስ የተመራው የልዑካን ቡድን በሱዳን ካርቱም የነበረውን የስራ ጉብኝት በስኬት አጠናቋል።ልዑኩ በካርቱም ቆይታውም ከሀገሪቱ የመሠረተ ልማትና ትራንስፖርት ሚኒስትር ኡመር አህመድ መሃመድ፣ የፖርት ሱዳን ኮርፕሬሽን ዋና ዳይሬክተር ካፕቴን አንዋር ሙሳ እንዲሁም ከንግድና፣ ከፋይናንስ ሚንስትርና ከጉሙሩክ ከፍተኛ የስራ ሃላፊዎች ጋር ተወያይቷል።በውይይታቸው ሀገራቱን በትራንስፖርት ለማስተሳሰር፣ በወደብ አጠቃቀም እና በዘርፉ የተደረጉ ስምምነቶችን መተግበር በሚቻልባቸው ሁኔታዎች ዙሪያ መክረዋል ። |
ብሩክታዊት ጌታሁን (ቤቲ ጂ) የተባበሩት መንግስታት የስደተኞች ጉዳይ የበጎ ፈቃድ አምባሳደር ሆና ተመረጠች |
አዲስ አበባ ፣ የካቲት 27፣ 2012 (ኤፍ ቢ ሲ) ድምጻዊት እና የሙዚቃ ፀሃፊ ብሩክታዊት ጌታሁን (ቤቲ ጂ) ዛሬ የተባበሩት መንግስታት የስደተኞች ጉዳይ የበጎ ፈቃድ አምባሳደር ሆና ተመርጣለች፡፡በዓለም አቀፍ እና በሃገር አቀፍ ደረጃ እየተከበረ የሚገኘውን የሴቶችን ቀን ምከንያት በማድረግ በተካሄደ የሹመት ስነ ስርዓት ላይ ድምጻዊት ብሩክታዊት የተባበሩት መንግስታት የስደተኞች ጉዳይ የበጎ ፈቃድ አምባሳደር ሆና መመረጧ ይፋ ሆኗል፡፡በዚህ ወቅትም ድምጻዊቷ “የስደተኞች ጉዳይ በጎ ፈቃድ አምባሳደር ሆኜ በመመረጤ ኩራት እና ክብር ይሰማኛል፥ ለዚህ ጥሩ ዓላማም ሙሉ በሙሉ ቁርጠኛ ነኝ” ብላለች፡፡ብሩክታዊት ጌታሁን በሙዚቃው ዘርፍ ጉልህ ሚና ያላት ወጣት ስትሆን አፍሪማን ጨምሮ ሌሎች ሽልማቶችን ማሸነፍ ችላለች።፡እንዲሁም በቅርቡ በኦስሎ በተካሄደው 2019 የኖቤል ሽልማት ስነ ስርዓት ላይ ሃገሬ እና ሲንጃለዳ የተሰኙ ሙዚቃዎችን በመጫወት አድናቆትን አግኝታለች፡፡በተጨማሪም በተለያዩ የበጎ ፍቃድ ስራዎች ላይም በመሳተፍ ትታወቃለች፡፡ትኩስ መረጃዎችን በፍጥነት ለማግኘት የቴሌግራም ገፃችንን ሰብስክራይብ ያድርጉ! |
ሞት የናፈቃቸው የ99 ዓመት አዛውንት! |
ለአገራቸው ነፃነት ከጣልያን ጋር የተዋጉ አርበኛ ታሪክሁለት ልጆቻቸው በቀይ ሽብር ተገደሉ፡፡ ልጆቼን ልቅበር ሲሉ እስር ቤት ተወረወሩ፡፡ ሚስታቸው በሃዘን ብዛት ህይወታቸው አለፈ፡፡ አንድ የቀረቻቸው ልጅ የት እንደገባች አያውቁም፡፡ ስድስት ዓመት ታስረው ሲወጡ ቤታቸው ፈርሷል! እንዴታ! አምስት አመት ሙሉ ተዋግቻለሁ፡፡እንዴት ነው የዘመቱት?አባቴ ቀኝአማች ብሩ ሀይለኛ አርበኛ ነበሩ፡፡ በጦርነቱ ጣሊያኖች አባቴን ሲገድሉብኝ እጅግ ተቆጣሁ፣ ደሜ ፈላ፡፡ በወቅቱ የ20 ዓመት ወጣት ነበርኩ፡፡ ማቄን ጨርቄን የምለው አልነበረኝም፡፡ ጫካ ገባሁና መዋጋት ጀመርኩኝ፡፡ ከየት አካባቢ ነው ወደ ጦርነቱ የሄዱት?የተወለድኩት ወሎ ውስጥ አማራ ሳይንት ነው፡፡ ጦርነቱን የተቀላቀልኩትም ከዚያ ሄጄ ነው፡፡ በላይ ዘለቀን ያውቁታል ይባላል፡፡ እውነት ነው?አሳምሬ አውቀዋለሁ እንጂ እንዴት አላውቀውም! አብራችሁ ዘምታችኋል እንዴ?አብረን አልዘመትንም፡፡ እኔ እራያ አዘቦ፣ መሆኒ፣ ሸዋ፣ መንዝ፣ መራ ቤቴ፣ አህያ ፈጅ ዶባ እየተዘዋወርኩ ራያው ከፈለ ከተባለ የጦር መሪ ጋር ነው የተዋጋሁት፡፡ ጐበዝ የጦር መሪ ነበር፡፡ በላይ ዘለቀ ግን አባይ በረሃ ላይ ነበር፡፡ ግን ተገናኝተን እናውቃለን፡፡ በደንብ ነው የማውቀው! ድል ካደረጋችሁ በኋላ ስለነበረው ሁኔታ ያጫውቱኝ-----ጃንሆይ “አገርህን ለመጠበቅ በጫካ ያለህ ወደ እኔ ተሰብሰብ” ብለው ሲጣሩ፣ ከነበርኩበት ተነስቼ ከጓደኞቼ ጋር መጣሁ፡፡ እርሳቸው ውጭ አገር ከርመው መምጣታቸው ነበር፡፡ እናም አርበኛው ሁሉ በጠቅላላ አዲስ አበባ ገባና ተሰበሰበ፡፡ ጃንሆይ ጃን ሜዳ መጡ፣ በሬው ሁሉ ታረደ፣ ተደገሰ፡፡ ድግሱ ሲያልቅ እዚሁ ለትንሽ ጊዜ ቆዩ ተባልን፡፡ ግን ማንም የሰማቸው የለም፣ ሁሉም በየሀገሩ ሲበታተን እኔም አማራ ሳይንት ገባሁ፡፡ በወቅቱ ጡ... |
MatryoshkaLoss with these parameters:{
"loss": "MultipleNegativesRankingLoss",
"matryoshka_dims": [
512,
256
],
"matryoshka_weights": [
1,
1
],
"n_dims_per_step": -1
}
eval_strategy: epochper_device_train_batch_size: 128per_device_eval_batch_size: 128num_train_epochs: 5lr_scheduler_type: cosinewarmup_ratio: 0.1fp16: Trueload_best_model_at_end: Truebatch_sampler: no_duplicatesoverwrite_output_dir: Falsedo_predict: Falseeval_strategy: epochprediction_loss_only: Trueper_device_train_batch_size: 128per_device_eval_batch_size: 128per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 5e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1.0num_train_epochs: 5max_steps: -1lr_scheduler_type: cosinelr_scheduler_kwargs: {}warmup_ratio: 0.1warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falsebf16: Falsefp16: Truefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Trueignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}parallelism_config: Nonedeepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torch_fusedoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthproject: huggingfacetrackio_space_id: trackioddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsehub_revision: Nonegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters: auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: noneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseliger_kernel_config: Noneeval_use_gather_object: Falseaverage_tokens_across_devices: Trueprompts: Nonebatch_sampler: no_duplicatesmulti_dataset_batch_sampler: proportionalrouter_mapping: {}learning_rate_mapping: {}| Epoch | Step | Training Loss | dim_512_cosine_ndcg@10 | dim_256_cosine_ndcg@10 |
|---|---|---|---|---|
| -1 | -1 | - | 0.0809 | 0.0661 |
| 1.0 | 333 | 0.9276 | 0.6918 | 0.6825 |
| 2.0 | 666 | 0.2268 | 0.7186 | 0.7113 |
| 3.0 | 999 | 0.1082 | 0.7403 | 0.7342 |
| 4.0 | 1332 | 0.0683 | 0.7474 | 0.7426 |
| 5.0 | 1665 | 0.0554 | 0.7493 | 0.7459 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
@misc{kusupati2024matryoshka,
title={Matryoshka Representation Learning},
author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
year={2024},
eprint={2205.13147},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}