Add evaluation results for model mteb/bm25s revision 0_1_10

by Samoed - opened Feb 20

base: refs/heads/main

←

from: refs/pr/4

Discussion Files changed

+1152

-0

This view is limited to 50 files because it contains too many changes. See the raw diff here.

Files changed (50) hide show

.eval_results/AILACasedocs.yaml +12 -0
.eval_results/AILAStatutes.yaml +12 -0
.eval_results/AppsRetrieval.yaml +12 -0
.eval_results/ArguAna.yaml +12 -0
.eval_results/CQADupstackAndroidRetrieval.yaml +12 -0
.eval_results/CQADupstackEnglishRetrieval.yaml +12 -0
.eval_results/CQADupstackGamingRetrieval.yaml +12 -0
.eval_results/CQADupstackGisRetrieval.yaml +12 -0
.eval_results/CQADupstackMathematicaRetrieval.yaml +12 -0
.eval_results/CQADupstackPhysicsRetrieval.yaml +12 -0
.eval_results/CQADupstackProgrammersRetrieval.yaml +12 -0
.eval_results/CQADupstackRetrieval.yaml +12 -0
.eval_results/CQADupstackStatsRetrieval.yaml +12 -0
.eval_results/CQADupstackTexRetrieval.yaml +12 -0
.eval_results/CQADupstackUnixRetrieval.yaml +12 -0
.eval_results/CQADupstackWebmastersRetrieval.yaml +12 -0
.eval_results/CQADupstackWordpressRetrieval.yaml +12 -0
.eval_results/CUREv1.yaml +204 -0
.eval_results/ChatDoctorRetrieval.yaml +12 -0
.eval_results/ClimateFEVER.yaml +12 -0
.eval_results/CmedqaRetrieval.yaml +12 -0
.eval_results/Code1Retrieval.yaml +12 -0
.eval_results/DBPedia.yaml +12 -0
.eval_results/DS1000Retrieval.yaml +12 -0
.eval_results/EnglishFinance1Retrieval.yaml +12 -0
.eval_results/EnglishFinance2Retrieval.yaml +12 -0
.eval_results/EnglishFinance3Retrieval.yaml +12 -0
.eval_results/EnglishFinance4Retrieval.yaml +12 -0
.eval_results/EnglishHealthcare1Retrieval.yaml +12 -0
.eval_results/FEVER.yaml +18 -0
.eval_results/FiQA2018.yaml +18 -0
.eval_results/FinQARetrieval.yaml +12 -0
.eval_results/FinanceBenchRetrieval.yaml +12 -0
.eval_results/French1Retrieval.yaml +12 -0
.eval_results/FrenchLegal1Retrieval.yaml +12 -0
.eval_results/FreshStackRetrieval.yaml +12 -0
.eval_results/German1Retrieval.yaml +12 -0
.eval_results/GermanHealthcare1Retrieval.yaml +12 -0
.eval_results/GermanLegal1Retrieval.yaml +12 -0
.eval_results/HC3FinanceRetrieval.yaml +12 -0
.eval_results/HotpotQA.yaml +18 -0
.eval_results/HumanEvalRetrieval.yaml +12 -0
.eval_results/JaCWIRRetrieval.yaml +12 -0
.eval_results/JaGovFaqsRetrieval.yaml +12 -0
.eval_results/JapaneseCode1Retrieval.yaml +12 -0
.eval_results/JapaneseLegal1Retrieval.yaml +12 -0
.eval_results/JaqketRetrieval.yaml +12 -0
.eval_results/LegalQuAD.yaml +12 -0
.eval_results/LegalSummarization.yaml +12 -0
.eval_results/MBPPRetrieval.yaml +12 -0

.eval_results/AILACasedocs.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/AILA_casedocs
+    revision: 4106e6bcc72e0698d714ea8b101355e3e238431a
+    task_id: AILACasedocs_default_test
+  notes: Created by mteb
+  value: 0.27837
+- dataset:
+    id: mteb/AILA_casedocs
+    revision: 4106e6bcc72e0698d714ea8b101355e3e238431a
+    task_id: AILACasedocs
+  notes: Created by mteb
+  value: 0.27837

.eval_results/AILAStatutes.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/AILA_statutes
+    revision: ebfcd844eadd3d667efa3c57fc5c8c87f5c2867e
+    task_id: AILAStatutes_default_test
+  notes: Created by mteb
+  value: 0.21618
+- dataset:
+    id: mteb/AILA_statutes
+    revision: ebfcd844eadd3d667efa3c57fc5c8c87f5c2867e
+    task_id: AILAStatutes
+  notes: Created by mteb
+  value: 0.21618

.eval_results/AppsRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: CoIR-Retrieval/apps
+    revision: f22508f96b7a36c2415181ed8bb76f76e04ae2d5
+    task_id: AppsRetrieval_default_test
+  notes: Created by mteb
+  value: 0.04764
+- dataset:
+    id: CoIR-Retrieval/apps
+    revision: f22508f96b7a36c2415181ed8bb76f76e04ae2d5
+    task_id: AppsRetrieval
+  notes: Created by mteb
+  value: 0.04764

.eval_results/ArguAna.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/arguana
+    revision: c22ab2a51041ffd869aaddef7af8d8215647e41a
+    task_id: ArguAna_default_test
+  notes: Created by mteb
+  value: 0.49276
+- dataset:
+    id: mteb/arguana
+    revision: c22ab2a51041ffd869aaddef7af8d8215647e41a
+    task_id: ArguAna
+  notes: Created by mteb
+  value: 0.49276

.eval_results/CQADupstackAndroidRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/CQADupstackAndroidRetrieval
+    revision: 9be4c0e46342e8e3aff577a89b9a1ec9bc6b4af3
+    task_id: CQADupstackAndroidRetrieval_default_test
+  notes: Created by mteb
+  value: 0.39693
+- dataset:
+    id: mteb/CQADupstackAndroidRetrieval
+    revision: 9be4c0e46342e8e3aff577a89b9a1ec9bc6b4af3
+    task_id: CQADupstackAndroidRetrieval
+  notes: Created by mteb
+  value: 0.39693

.eval_results/CQADupstackEnglishRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/cqadupstack-english
+    revision: ad9991cb51e31e31e430383c75ffb2885547b5f0
+    task_id: CQADupstackEnglishRetrieval_default_test
+  notes: Created by mteb
+  value: 0.34746
+- dataset:
+    id: mteb/cqadupstack-english
+    revision: ad9991cb51e31e31e430383c75ffb2885547b5f0
+    task_id: CQADupstackEnglishRetrieval
+  notes: Created by mteb
+  value: 0.34746

.eval_results/CQADupstackGamingRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/cqadupstack-gaming
+    revision: 4885aa143210c98657558c04aaf3dc47cfb54340
+    task_id: CQADupstackGamingRetrieval_default_test
+  notes: Created by mteb
+  value: 0.48471
+- dataset:
+    id: mteb/cqadupstack-gaming
+    revision: 4885aa143210c98657558c04aaf3dc47cfb54340
+    task_id: CQADupstackGamingRetrieval
+  notes: Created by mteb
+  value: 0.48471

.eval_results/CQADupstackGisRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/cqadupstack-gis
+    revision: 5003b3064772da1887988e05400cf3806fe491f2
+    task_id: CQADupstackGisRetrieval_default_test
+  notes: Created by mteb
+  value: 0.3083
+- dataset:
+    id: mteb/cqadupstack-gis
+    revision: 5003b3064772da1887988e05400cf3806fe491f2
+    task_id: CQADupstackGisRetrieval
+  notes: Created by mteb
+  value: 0.3083

.eval_results/CQADupstackMathematicaRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/cqadupstack-mathematica
+    revision: 90fceea13679c63fe563ded68f3b6f06e50061de
+    task_id: CQADupstackMathematicaRetrieval_default_test
+  notes: Created by mteb
+  value: 0.22017
+- dataset:
+    id: mteb/cqadupstack-mathematica
+    revision: 90fceea13679c63fe563ded68f3b6f06e50061de
+    task_id: CQADupstackMathematicaRetrieval
+  notes: Created by mteb
+  value: 0.22017

.eval_results/CQADupstackPhysicsRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/cqadupstack-physics
+    revision: 79531abbd1fb92d06c6d6315a0cbbbf5bb247ea4
+    task_id: CQADupstackPhysicsRetrieval_default_test
+  notes: Created by mteb
+  value: 0.34926
+- dataset:
+    id: mteb/cqadupstack-physics
+    revision: 79531abbd1fb92d06c6d6315a0cbbbf5bb247ea4
+    task_id: CQADupstackPhysicsRetrieval
+  notes: Created by mteb
+  value: 0.34926

.eval_results/CQADupstackProgrammersRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/cqadupstack-programmers
+    revision: 6184bc1440d2dbc7612be22b50686b8826d22b32
+    task_id: CQADupstackProgrammersRetrieval_default_test
+  notes: Created by mteb
+  value: 0.298
+- dataset:
+    id: mteb/cqadupstack-programmers
+    revision: 6184bc1440d2dbc7612be22b50686b8826d22b32
+    task_id: CQADupstackProgrammersRetrieval
+  notes: Created by mteb
+  value: 0.298

.eval_results/CQADupstackRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: aggregate tasks do not have a path
+    revision: '1'
+    task_id: CQADupstackRetrieval_default_test
+  notes: Created by mteb
+  value: 0.318642
+- dataset:
+    id: aggregate tasks do not have a path
+    revision: '1'
+    task_id: CQADupstackRetrieval
+  notes: Created by mteb
+  value: 0.318642

.eval_results/CQADupstackStatsRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/cqadupstack-stats
+    revision: 65ac3a16b8e91f9cee4c9828cc7c335575432a2a
+    task_id: CQADupstackStatsRetrieval_default_test
+  notes: Created by mteb
+  value: 0.29019
+- dataset:
+    id: mteb/cqadupstack-stats
+    revision: 65ac3a16b8e91f9cee4c9828cc7c335575432a2a
+    task_id: CQADupstackStatsRetrieval
+  notes: Created by mteb
+  value: 0.29019

.eval_results/CQADupstackTexRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/cqadupstack-tex
+    revision: 46989137a86843e03a6195de44b09deda022eec7
+    task_id: CQADupstackTexRetrieval_default_test
+  notes: Created by mteb
+  value: 0.24397
+- dataset:
+    id: mteb/cqadupstack-tex
+    revision: 46989137a86843e03a6195de44b09deda022eec7
+    task_id: CQADupstackTexRetrieval
+  notes: Created by mteb
+  value: 0.24397

.eval_results/CQADupstackUnixRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/cqadupstack-unix
+    revision: 6c6430d3a6d36f8d2a829195bc5dc94d7e063e53
+    task_id: CQADupstackUnixRetrieval_default_test
+  notes: Created by mteb
+  value: 0.29165
+- dataset:
+    id: mteb/cqadupstack-unix
+    revision: 6c6430d3a6d36f8d2a829195bc5dc94d7e063e53
+    task_id: CQADupstackUnixRetrieval
+  notes: Created by mteb
+  value: 0.29165

.eval_results/CQADupstackWebmastersRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/cqadupstack-webmasters
+    revision: 160c094312a0e1facb97e55eeddb698c0abe3571
+    task_id: CQADupstackWebmastersRetrieval_default_test
+  notes: Created by mteb
+  value: 0.31381
+- dataset:
+    id: mteb/cqadupstack-webmasters
+    revision: 160c094312a0e1facb97e55eeddb698c0abe3571
+    task_id: CQADupstackWebmastersRetrieval
+  notes: Created by mteb
+  value: 0.31381

.eval_results/CQADupstackWordpressRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/cqadupstack-wordpress
+    revision: 4ffe81d471b1924886b33c7567bfb200e9eec5c4
+    task_id: CQADupstackWordpressRetrieval_default_test
+  notes: Created by mteb
+  value: 0.27925
+- dataset:
+    id: mteb/cqadupstack-wordpress
+    revision: 4ffe81d471b1924886b33c7567bfb200e9eec5c4
+    task_id: CQADupstackWordpressRetrieval
+  notes: Created by mteb
+  value: 0.27925

.eval_results/CUREv1.yaml ADDED Viewed

	@@ -0,0 +1,204 @@

+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_en_all
+  notes: Created by mteb
+  value: 0.35481
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_es_all
+  notes: Created by mteb
+  value: 0.01157
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_fr_all
+  notes: Created by mteb
+  value: 0.01796
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_en_dentistry_and_oral_health
+  notes: Created by mteb
+  value: 0.38853
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_es_dentistry_and_oral_health
+  notes: Created by mteb
+  value: 0.00791
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_fr_dentistry_and_oral_health
+  notes: Created by mteb
+  value: 0.0137
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_en_dermatology
+  notes: Created by mteb
+  value: 0.40305
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_es_dermatology
+  notes: Created by mteb
+  value: 0.04687
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_fr_dermatology
+  notes: Created by mteb
+  value: 0.07281
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_en_gastroenterology
+  notes: Created by mteb
+  value: 0.30019
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_es_gastroenterology
+  notes: Created by mteb
+  value: 0.01412
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_fr_gastroenterology
+  notes: Created by mteb
+  value: 0.02969
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_en_genetics
+  notes: Created by mteb
+  value: 0.41022
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_es_genetics
+  notes: Created by mteb
+  value: 0.03798
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_fr_genetics
+  notes: Created by mteb
+  value: 0.08926
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_en_neuroscience_and_neurology
+  notes: Created by mteb
+  value: 0.31575
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_es_neuroscience_and_neurology
+  notes: Created by mteb
+  value: 0.00768
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_fr_neuroscience_and_neurology
+  notes: Created by mteb
+  value: 0.02533
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_en_orthopedic_surgery
+  notes: Created by mteb
+  value: 0.39297
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_es_orthopedic_surgery
+  notes: Created by mteb
+  value: 0.02131
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_fr_orthopedic_surgery
+  notes: Created by mteb
+  value: 0.04247
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_en_otorhinolaryngology
+  notes: Created by mteb
+  value: 0.33081
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_es_otorhinolaryngology
+  notes: Created by mteb
+  value: 0.00483
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_fr_otorhinolaryngology
+  notes: Created by mteb
+  value: 0.02196
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_en_plastic_surgery
+  notes: Created by mteb
+  value: 0.34636
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_es_plastic_surgery
+  notes: Created by mteb
+  value: 0.01692
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_fr_plastic_surgery
+  notes: Created by mteb
+  value: 0.02923
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_en_psychiatry_and_psychology
+  notes: Created by mteb
+  value: 0.34984
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_es_psychiatry_and_psychology
+  notes: Created by mteb
+  value: 0.01113
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_fr_psychiatry_and_psychology
+  notes: Created by mteb
+  value: 0.02743
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_en_pulmonology
+  notes: Created by mteb
+  value: 0.34924
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_es_pulmonology
+  notes: Created by mteb
+  value: 0.01324
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1_fr_pulmonology
+  notes: Created by mteb
+  value: 0.01515
+- dataset:
+    id: clinia/CUREv1
+    revision: 3bcf51c91e04d04a8a3329dfbe988b964c5cbe83
+    task_id: CUREv1
+  notes: Created by mteb
+  value: 0.13697939393939393

.eval_results/ChatDoctorRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: embedding-benchmark/ChatDoctor_HealthCareMagic
+    revision: 50c2986fedffa33b38afd5c1752026f8e9e5ed1d
+    task_id: ChatDoctorRetrieval_default_test
+  notes: Created by mteb
+  value: 0.31764
+- dataset:
+    id: embedding-benchmark/ChatDoctor_HealthCareMagic
+    revision: 50c2986fedffa33b38afd5c1752026f8e9e5ed1d
+    task_id: ChatDoctorRetrieval
+  notes: Created by mteb
+  value: 0.31764

.eval_results/ClimateFEVER.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/climate-fever
+    revision: 47f2ac6acb640fc46020b02a5b59fdda04d39380
+    task_id: ClimateFEVER_default_test
+  notes: Created by mteb
+  value: 0.13621
+- dataset:
+    id: mteb/climate-fever
+    revision: 47f2ac6acb640fc46020b02a5b59fdda04d39380
+    task_id: ClimateFEVER
+  notes: Created by mteb
+  value: 0.13621

.eval_results/CmedqaRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/CmedqaRetrieval
+    revision: c476f85bf03d6642ec66bf54b9a551c88108bbb4
+    task_id: CmedqaRetrieval_default_dev
+  notes: Created by mteb
+  value: 0.01337
+- dataset:
+    id: mteb/CmedqaRetrieval
+    revision: c476f85bf03d6642ec66bf54b9a551c88108bbb4
+    task_id: CmedqaRetrieval
+  notes: Created by mteb
+  value: 0.01337

.eval_results/Code1Retrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb-private/Code1Retrieval
+    revision: 94d25599a7e0221484f31749448e5ea217484e41
+    task_id: Code1Retrieval_default_test
+  notes: Created by mteb
+  value: 0.44744
+- dataset:
+    id: mteb-private/Code1Retrieval
+    revision: 94d25599a7e0221484f31749448e5ea217484e41
+    task_id: Code1Retrieval
+  notes: Created by mteb
+  value: 0.44744

.eval_results/DBPedia.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/dbpedia
+    revision: c0f706b76e590d620bd6618b3ca8efdd34e2d659
+    task_id: DBPedia_default_dev
+  notes: Created by mteb
+  value: 0.34447
+- dataset:
+    id: mteb/dbpedia
+    revision: c0f706b76e590d620bd6618b3ca8efdd34e2d659
+    task_id: DBPedia_default_test
+  notes: Created by mteb
+  value: 0.29907

.eval_results/DS1000Retrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: embedding-benchmark/DS1000
+    revision: 25cd4dc8172e799235d83c66439b6b7b8e6583ec
+    task_id: DS1000Retrieval_default_test
+  notes: Created by mteb
+  value: 0.41454
+- dataset:
+    id: embedding-benchmark/DS1000
+    revision: 25cd4dc8172e799235d83c66439b6b7b8e6583ec
+    task_id: DS1000Retrieval
+  notes: Created by mteb
+  value: 0.41454

.eval_results/EnglishFinance1Retrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb-private/EnglishFinance1Retrieval
+    revision: b2816ead5389ee383019bb2e50df9f1aac8229d8
+    task_id: EnglishFinance1Retrieval_default_test
+  notes: Created by mteb
+  value: 0.75345
+- dataset:
+    id: mteb-private/EnglishFinance1Retrieval
+    revision: b2816ead5389ee383019bb2e50df9f1aac8229d8
+    task_id: EnglishFinance1Retrieval
+  notes: Created by mteb
+  value: 0.75345

.eval_results/EnglishFinance2Retrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb-private/EnglishFinance2Retrieval
+    revision: 346d5039b9ec75a7b80f8ff008d5ca3df126f5aa
+    task_id: EnglishFinance2Retrieval_default_test
+  notes: Created by mteb
+  value: 0.76472
+- dataset:
+    id: mteb-private/EnglishFinance2Retrieval
+    revision: 346d5039b9ec75a7b80f8ff008d5ca3df126f5aa
+    task_id: EnglishFinance2Retrieval
+  notes: Created by mteb
+  value: 0.76472

.eval_results/EnglishFinance3Retrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb-private/EnglishFinance3Retrieval
+    revision: 5ed0bc0fffa309e99400ea800397931749d12cd2
+    task_id: EnglishFinance3Retrieval_default_test
+  notes: Created by mteb
+  value: 0.45123
+- dataset:
+    id: mteb-private/EnglishFinance3Retrieval
+    revision: 5ed0bc0fffa309e99400ea800397931749d12cd2
+    task_id: EnglishFinance3Retrieval
+  notes: Created by mteb
+  value: 0.45123

.eval_results/EnglishFinance4Retrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb-private/EnglishFinance4Retrieval
+    revision: 2fdb7001309f897d50d38d196a3fd0f03c913810
+    task_id: EnglishFinance4Retrieval_default_test
+  notes: Created by mteb
+  value: 0.3173
+- dataset:
+    id: mteb-private/EnglishFinance4Retrieval
+    revision: 2fdb7001309f897d50d38d196a3fd0f03c913810
+    task_id: EnglishFinance4Retrieval
+  notes: Created by mteb
+  value: 0.3173

.eval_results/EnglishHealthcare1Retrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb-private/EnglishHealthcare1Retrieval
+    revision: 393c24e85114d44c43259fb2d1c5639c5d09809d
+    task_id: EnglishHealthcare1Retrieval_default_test
+  notes: Created by mteb
+  value: 0.68748
+- dataset:
+    id: mteb-private/EnglishHealthcare1Retrieval
+    revision: 393c24e85114d44c43259fb2d1c5639c5d09809d
+    task_id: EnglishHealthcare1Retrieval
+  notes: Created by mteb
+  value: 0.68748

.eval_results/FEVER.yaml ADDED Viewed

	@@ -0,0 +1,18 @@

+- dataset:
+    id: mteb/fever
+    revision: bea83ef9e8fb933d90a2f1d5515737465d613e12
+    task_id: FEVER_default_dev
+  notes: Created by mteb
+  value: 0.49778
+- dataset:
+    id: mteb/fever
+    revision: bea83ef9e8fb933d90a2f1d5515737465d613e12
+    task_id: FEVER_default_test
+  notes: Created by mteb
+  value: 0.4809
+- dataset:
+    id: mteb/fever
+    revision: bea83ef9e8fb933d90a2f1d5515737465d613e12
+    task_id: FEVER_default_train
+  notes: Created by mteb
+  value: 0.38431

.eval_results/FiQA2018.yaml ADDED Viewed

	@@ -0,0 +1,18 @@

+- dataset:
+    id: mteb/fiqa
+    revision: 27a168819829fe9bcd655c2df245fb19452e8e06
+    task_id: FiQA2018_default_dev
+  notes: Created by mteb
+  value: 0.2592
+- dataset:
+    id: mteb/fiqa
+    revision: 27a168819829fe9bcd655c2df245fb19452e8e06
+    task_id: FiQA2018_default_test
+  notes: Created by mteb
+  value: 0.25139
+- dataset:
+    id: mteb/fiqa
+    revision: 27a168819829fe9bcd655c2df245fb19452e8e06
+    task_id: FiQA2018_default_train
+  notes: Created by mteb
+  value: 0.24794

.eval_results/FinQARetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: embedding-benchmark/FinQA
+    revision: bdd1903ce03153129480bfc14b710e3d612c1efd
+    task_id: FinQARetrieval_default_test
+  notes: Created by mteb
+  value: 0.73872
+- dataset:
+    id: embedding-benchmark/FinQA
+    revision: bdd1903ce03153129480bfc14b710e3d612c1efd
+    task_id: FinQARetrieval
+  notes: Created by mteb
+  value: 0.73872

.eval_results/FinanceBenchRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: embedding-benchmark/FinanceBench
+    revision: e68478442112cae36b70a216f52cc2777acf0a7e
+    task_id: FinanceBenchRetrieval_default_test
+  notes: Created by mteb
+  value: 0.46676
+- dataset:
+    id: embedding-benchmark/FinanceBench
+    revision: e68478442112cae36b70a216f52cc2777acf0a7e
+    task_id: FinanceBenchRetrieval
+  notes: Created by mteb
+  value: 0.46676

.eval_results/French1Retrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb-private/French1Retrieval
+    revision: c5c5a44f75dff57be44e5623e817239b050bf0f2
+    task_id: French1Retrieval_default_test
+  notes: Created by mteb
+  value: 0.78323
+- dataset:
+    id: mteb-private/French1Retrieval
+    revision: c5c5a44f75dff57be44e5623e817239b050bf0f2
+    task_id: French1Retrieval
+  notes: Created by mteb
+  value: 0.78323

.eval_results/FrenchLegal1Retrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb-private/FrenchLegal1Retrieval
+    revision: 6d7308571a1572e22d5c0c1cb87385a7bb6b2c6d
+    task_id: FrenchLegal1Retrieval_default_test
+  notes: Created by mteb
+  value: 0.94897
+- dataset:
+    id: mteb-private/FrenchLegal1Retrieval
+    revision: 6d7308571a1572e22d5c0c1cb87385a7bb6b2c6d
+    task_id: FrenchLegal1Retrieval
+  notes: Created by mteb
+  value: 0.94897

.eval_results/FreshStackRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: embedding-benchmark/FreshStack_mteb
+    revision: 7a20df1abe4dafc46f93f9a7965bf9c6968bdf04
+    task_id: FreshStackRetrieval_default_test
+  notes: Created by mteb
+  value: 0.27888
+- dataset:
+    id: embedding-benchmark/FreshStack_mteb
+    revision: 7a20df1abe4dafc46f93f9a7965bf9c6968bdf04
+    task_id: FreshStackRetrieval
+  notes: Created by mteb
+  value: 0.27888

.eval_results/German1Retrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb-private/German1Retrieval
+    revision: d83dd140fc8fdf96372a6e9193cd4fd2d5cb72bd
+    task_id: German1Retrieval_default_test
+  notes: Created by mteb
+  value: 0.86465
+- dataset:
+    id: mteb-private/German1Retrieval
+    revision: d83dd140fc8fdf96372a6e9193cd4fd2d5cb72bd
+    task_id: German1Retrieval
+  notes: Created by mteb
+  value: 0.86465

.eval_results/GermanHealthcare1Retrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb-private/GermanHealthcare1Retrieval
+    revision: 53e9a6fb88b48b7513e9d2cc2218e3415f4e45f8
+    task_id: GermanHealthcare1Retrieval_default_test
+  notes: Created by mteb
+  value: 0.37248
+- dataset:
+    id: mteb-private/GermanHealthcare1Retrieval
+    revision: 53e9a6fb88b48b7513e9d2cc2218e3415f4e45f8
+    task_id: GermanHealthcare1Retrieval
+  notes: Created by mteb
+  value: 0.37248

.eval_results/GermanLegal1Retrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb-private/GermanLegal1Retrieval
+    revision: 65ea369daff680b77f90b560e7e97d2ab4ec5072
+    task_id: GermanLegal1Retrieval_default_test
+  notes: Created by mteb
+  value: 0.66876
+- dataset:
+    id: mteb-private/GermanLegal1Retrieval
+    revision: 65ea369daff680b77f90b560e7e97d2ab4ec5072
+    task_id: GermanLegal1Retrieval
+  notes: Created by mteb
+  value: 0.66876

.eval_results/HC3FinanceRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: embedding-benchmark/HC3Finance
+    revision: fda6fad068f2ed814d99f29dc95dbb28ac586943
+    task_id: HC3FinanceRetrieval_default_test
+  notes: Created by mteb
+  value: 0.28977
+- dataset:
+    id: embedding-benchmark/HC3Finance
+    revision: fda6fad068f2ed814d99f29dc95dbb28ac586943
+    task_id: HC3FinanceRetrieval
+  notes: Created by mteb
+  value: 0.28977

.eval_results/HotpotQA.yaml ADDED Viewed

	@@ -0,0 +1,18 @@

+- dataset:
+    id: mteb/hotpotqa
+    revision: ab518f4d6fcca38d87c25209f94beba119d02014
+    task_id: HotpotQA_default_dev
+  notes: Created by mteb
+  value: 0.59451
+- dataset:
+    id: mteb/hotpotqa
+    revision: ab518f4d6fcca38d87c25209f94beba119d02014
+    task_id: HotpotQA_default_test
+  notes: Created by mteb
+  value: 0.56907
+- dataset:
+    id: mteb/hotpotqa
+    revision: ab518f4d6fcca38d87c25209f94beba119d02014
+    task_id: HotpotQA_default_train
+  notes: Created by mteb
+  value: 0.58909

.eval_results/HumanEvalRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: embedding-benchmark/HumanEval
+    revision: ed1f48aca747f10bac146795328e2f03326e7625
+    task_id: HumanEvalRetrieval_default_test
+  notes: Created by mteb
+  value: 0.38472
+- dataset:
+    id: embedding-benchmark/HumanEval
+    revision: ed1f48aca747f10bac146795328e2f03326e7625
+    task_id: HumanEvalRetrieval
+  notes: Created by mteb
+  value: 0.38472

.eval_results/JaCWIRRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/JaCWIRRetrieval
+    revision: abf6d5fb6759ad516f998bd887b75420d595672e
+    task_id: JaCWIRRetrieval_default_test
+  notes: Created by mteb
+  value: 0.19066
+- dataset:
+    id: mteb/JaCWIRRetrieval
+    revision: abf6d5fb6759ad516f998bd887b75420d595672e
+    task_id: JaCWIRRetrieval
+  notes: Created by mteb
+  value: 0.19066

.eval_results/JaGovFaqsRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/JaGovFaqsRetrieval
+    revision: 0726b2af53c907628067871e2e7c84e0d8e099c2
+    task_id: JaGovFaqsRetrieval_default_test
+  notes: Created by mteb
+  value: 0.12557
+- dataset:
+    id: mteb/JaGovFaqsRetrieval
+    revision: 0726b2af53c907628067871e2e7c84e0d8e099c2
+    task_id: JaGovFaqsRetrieval
+  notes: Created by mteb
+  value: 0.12557

.eval_results/JapaneseCode1Retrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb-private/JapaneseCode1Retrieval
+    revision: fc4cb6390055e65490dfc42526e1d6a379e8cd86
+    task_id: JapaneseCode1Retrieval_default_test
+  notes: Created by mteb
+  value: 0.33855
+- dataset:
+    id: mteb-private/JapaneseCode1Retrieval
+    revision: fc4cb6390055e65490dfc42526e1d6a379e8cd86
+    task_id: JapaneseCode1Retrieval
+  notes: Created by mteb
+  value: 0.33855

.eval_results/JapaneseLegal1Retrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb-private/JapaneseLegal1Retrieval
+    revision: d653557fe66bb6af2b0e2adfc371a24554cf11ce
+    task_id: JapaneseLegal1Retrieval_default_test
+  notes: Created by mteb
+  value: 0.11133
+- dataset:
+    id: mteb-private/JapaneseLegal1Retrieval
+    revision: d653557fe66bb6af2b0e2adfc371a24554cf11ce
+    task_id: JapaneseLegal1Retrieval
+  notes: Created by mteb
+  value: 0.11133

.eval_results/JaqketRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/jaqket
+    revision: 3a5b92dad489a61e664c05ed2175bc9220230199
+    task_id: JaqketRetrieval_default_test
+  notes: Created by mteb
+  value: 0.13284
+- dataset:
+    id: mteb/jaqket
+    revision: 3a5b92dad489a61e664c05ed2175bc9220230199
+    task_id: JaqketRetrieval
+  notes: Created by mteb
+  value: 0.13284

.eval_results/LegalQuAD.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/LegalQuAD
+    revision: 37aa6cfb01d48960b0f8e3f17d6e3d99bf1ebc3e
+    task_id: LegalQuAD_default_test
+  notes: Created by mteb
+  value: 0.76755
+- dataset:
+    id: mteb/LegalQuAD
+    revision: 37aa6cfb01d48960b0f8e3f17d6e3d99bf1ebc3e
+    task_id: LegalQuAD
+  notes: Created by mteb
+  value: 0.76755

.eval_results/LegalSummarization.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: mteb/legal_summarization
+    revision: 3bb1a05c66872889662af04c5691c14489cebd72
+    task_id: LegalSummarization_default_test
+  notes: Created by mteb
+  value: 0.60983
+- dataset:
+    id: mteb/legal_summarization
+    revision: 3bb1a05c66872889662af04c5691c14489cebd72
+    task_id: LegalSummarization
+  notes: Created by mteb
+  value: 0.60983

.eval_results/MBPPRetrieval.yaml ADDED Viewed

	@@ -0,0 +1,12 @@

+- dataset:
+    id: embedding-benchmark/MBPP
+    revision: 586a1fd6a0c63fdeda3b49c0293559a81c79cdec
+    task_id: MBPPRetrieval_default_test
+  notes: Created by mteb
+  value: 0.11637
+- dataset:
+    id: embedding-benchmark/MBPP
+    revision: 586a1fd6a0c63fdeda3b49c0293559a81c79cdec
+    task_id: MBPPRetrieval
+  notes: Created by mteb
+  value: 0.11637