language:-eslicense:apache-2.0tags:-sentence-transformers-sentence-similarity-feature-extraction-generated_from_trainer-dataset_size:14907-loss:MatryoshkaLoss-loss:MultipleNegativesRankingLossbase_model:jinaai/jina-embeddings-v3widget:-source_sentence:>- ¿Qué característica especial tenía la escultura del 'Torico' creada por Pedro Blesa?sentences:-> Después de dorar el conejo en la receta de Conejo escabechado, en la misma sartén se rehogan los ajos, con el laurel y la pimienta.->- Rafael Barcelón se encargaba del servicio de electricidad en Valdeconejos en 1951.->- La escultura del 'Torico' creada por Pedro Blesa era un anaglifo, visible en 3D con gafas especiales.-source_sentence:>- ¿Por qué cantidad adquirió Francisco Santacruz la mina Escuadra en la subasta pública?sentences:->- Después de la temporada 1986-87, el equipo descendió, lo que provocó su desaparición del campeonato en la temporada 1987-88.-'''Al bies'' significa en diagonal.'->- Francisco Santacruz adquirió la mina Escuadra por la cantidad de 931 pesetas.-source_sentence:>- ¿Quién se desempeñaba como fiscal en el ayuntamiento de Escucha en el año 1916?sentences:-ElautormencionadoparalarecetaSopasdeajoesTeoMartinLafuente.->- En Escucha en 1916, D. Joaquín Latorre del Río se desempeñaba como fiscal.-FelipeMalléneraelfarmacéuticoenValdeconejosen1928.-source_sentence:>- ¿Qué información transmiten los 'toques' en la caña de un pozo durante las operaciones mineras?sentences:->- Juan Pedro Martín encontró fragmentos de carbón de piedra en el paraje de El Horcajo.-Sepublicóen1970 porEdicionesCulturayAcción.CNT.->- Los 'toques' son señales que se hacen en la caña del pozo para las distintas operaciones 1: alto 2: arriba 3: abajo 1+2: despacio arriba 1+3: despacio abajo 4+2: personal arriba 4+3: personal abajo 4+1+2: señalista en jaula arriba 4+1+3: señalista en jaula abajo 5: jaula libre 6: maniobra-source_sentence:¿Enquéañosedemarcóyreconociólamina'El Pilar'?sentences:->- Según la quinta demanda del SOMM, todas compañías mineras debían entregar a todos sus obreros un libramiento de liquidación mensual-'''Tontiar'' significa cuando dos jóvenes empiezan con un noviazgo.'-Lamina'El Pilar'sedemarcóyreconocióen1857.pipeline_tag:sentence-similaritylibrary_name:sentence-transformersmetrics:-cosine_accuracy@1-cosine_accuracy@3-cosine_accuracy@5-cosine_accuracy@10-cosine_precision@1-cosine_precision@3-cosine_precision@5-cosine_precision@10-cosine_recall@1-cosine_recall@3-cosine_recall@5-cosine_recall@10-cosine_ndcg@10-cosine_mrr@10-cosine_map@100model-index:-name:Lampisteroresults:-task:type:information-retrievalname:InformationRetrievaldataset:name:dim1024type:dim_1024metrics:-type:cosine_accuracy@1value:0.7700663850331925name:CosineAccuracy@1-type:cosine_accuracy@3value:0.8925769462884732name:CosineAccuracy@3-type:cosine_accuracy@5value:0.9155099577549789name:CosineAccuracy@5-type:cosine_accuracy@10value:0.9330114665057333name:CosineAccuracy@10-type:cosine_precision@1value:0.7700663850331925name:CosinePrecision@1-type:cosine_precision@3value:0.2975256487628244name:CosinePrecision@3-type:cosine_precision@5value:0.18310199155099577name:CosinePrecision@5-type:cosine_precision@10value:0.09330114665057333name:CosinePrecision@10-type:cosine_recall@1value:0.7700663850331925name:CosineRecall@1-type:cosine_recall@3value:0.8925769462884732name:CosineRecall@3-type:cosine_recall@5value:0.9155099577549789name:CosineRecall@5-type:cosine_recall@10value:0.9330114665057333name:CosineRecall@10-type:cosine_ndcg@10value:0.8578914781807897name:CosineNdcg@10-type:cosine_mrr@10value:0.8330619976817926name:CosineMrr@10-type:cosine_map@100value:0.8343424106284848name:CosineMap@100-task:type:information-retrievalname:InformationRetrievaldataset:name:dim768type:dim_768metrics:-type:cosine_accuracy@1value:0.7694628847314424name:CosineAccuracy@1-type:cosine_accuracy@3value:0.8889559444779722name:CosineAccuracy@3-type:cosine_accuracy@5value:0.9124924562462281name:CosineAccuracy@5-type:cosine_accuracy@10value:0.9330114665057333name:CosineAccuracy@10-type:cosine_precision@1value:0.7694628847314424name:CosinePrecision@1-type:cosine_precision@3value:0.29631864815932407name:CosinePrecision@3-type:cosine_precision@5value:0.1824984912492456name:CosinePrecision@5-type:cosine_precision@10value:0.09330114665057332name:CosinePrecision@10-type:cosine_recall@1value:0.7694628847314424name:CosineRecall@1-type:cosine_recall@3value:0.8889559444779722name:CosineRecall@3-type:cosine_recall@5value:0.9124924562462281name:CosineRecall@5-type:cosine_recall@10value:0.9330114665057333name:CosineRecall@10-type:cosine_ndcg@10value:0.8571049923900239name:CosineNdcg@10-type:cosine_mrr@10value:0.8320899311243306name:CosineMrr@10-type:cosine_map@100value:0.8333457816447034name:CosineMap@100-task:type:information-retrievalname:InformationRetrievaldataset:name:dim512type:dim_512metrics:-type:cosine_accuracy@1value:0.7682558841279421name:CosineAccuracy@1-type:cosine_accuracy@3value:0.8865419432709717name:CosineAccuracy@3-type:cosine_accuracy@5value:0.9112854556427278name:CosineAccuracy@5-type:cosine_accuracy@10value:0.9305974652987327name:CosineAccuracy@10-type:cosine_precision@1value:0.7682558841279421name:CosinePrecision@1-type:cosine_precision@3value:0.2955139810903239name:CosinePrecision@3-type:cosine_precision@5value:0.18225709112854557name:CosinePrecision@5-type:cosine_precision@10value:0.09305974652987326name:CosinePrecision@10-type:cosine_recall@1value:0.7682558841279421name:CosineRecall@1-type:cosine_recall@3value:0.8865419432709717name:CosineRecall@3-type:cosine_recall@5value:0.9112854556427278name:CosineRecall@5-type:cosine_recall@10value:0.9305974652987327name:CosineRecall@10-type:cosine_ndcg@10value:0.8555277012951626name:CosineNdcg@10-type:cosine_mrr@10value:0.8307227155597702name:CosineMrr@10-type:cosine_map@100value:0.8321030396467847name:CosineMap@100-task:type:information-retrievalname:InformationRetrievaldataset:name:dim256type:dim_256metrics:-type:cosine_accuracy@1value:0.764031382015691name:CosineAccuracy@1-type:cosine_accuracy@3value:0.8901629450814725name:CosineAccuracy@3-type:cosine_accuracy@5value:0.9082679541339771name:CosineAccuracy@5-type:cosine_accuracy@10value:0.9299939649969825name:CosineAccuracy@10-type:cosine_precision@1value:0.764031382015691name:CosinePrecision@1-type:cosine_precision@3value:0.2967209816938242name:CosinePrecision@3-type:cosine_precision@5value:0.1816535908267954name:CosinePrecision@5-type:cosine_precision@10value:0.09299939649969825name:CosinePrecision@10-type:cosine_recall@1value:0.764031382015691name:CosineRecall@1-type:cosine_recall@3value:0.8901629450814725name:CosineRecall@3-type:cosine_recall@5value:0.9082679541339771name:CosineRecall@5-type:cosine_recall@10value:0.9299939649969825name:CosineRecall@10-type:cosine_ndcg@10value:0.8535167149096011name:CosineNdcg@10-type:cosine_mrr@10value:0.8282907530342651name:CosineMrr@10-type:cosine_map@100value:0.8296119986031772name:CosineMap@100-task:type:information-retrievalname:InformationRetrievaldataset:name:dim128type:dim_128metrics:-type:cosine_accuracy@1value:0.7447193723596862name:CosineAccuracy@1-type:cosine_accuracy@3value:0.8768859384429692name:CosineAccuracy@3-type:cosine_accuracy@5value:0.9028364514182257name:CosineAccuracy@5-type:cosine_accuracy@10value:0.9215449607724804name:CosineAccuracy@10-type:cosine_precision@1value:0.7447193723596862name:CosinePrecision@1-type:cosine_precision@3value:0.2922953128143231name:CosinePrecision@3-type:cosine_precision@5value:0.1805672902836451name:CosinePrecision@5-type:cosine_precision@10value:0.09215449607724803name:CosinePrecision@10-type:cosine_recall@1value:0.7447193723596862name:CosineRecall@1-type:cosine_recall@3value:0.8768859384429692name:CosineRecall@3-type:cosine_recall@5value:0.9028364514182257name:CosineRecall@5-type:cosine_recall@10value:0.9215449607724804name:CosineRecall@10-type:cosine_ndcg@10value:0.8402664516336745name:CosineNdcg@10-type:cosine_mrr@10value:0.8133905221714518name:CosineMrr@10-type:cosine_map@100value:0.8148588407289652name:CosineMap@100-task:type:information-retrievalname:InformationRetrievaldataset:name:dim64type:dim_64metrics:-type:cosine_accuracy@1value:0.7103198551599276name:CosineAccuracy@1-type:cosine_accuracy@3value:0.8491249245624622name:CosineAccuracy@3-type:cosine_accuracy@5value:0.8780929390464696name:CosineAccuracy@5-type:cosine_accuracy@10value:0.899818949909475name:CosineAccuracy@10-type:cosine_precision@1value:0.7103198551599276name:CosinePrecision@1-type:cosine_precision@3value:0.2830416415208208name:CosinePrecision@3-type:cosine_precision@5value:0.1756185878092939name:CosinePrecision@5-type:cosine_precision@10value:0.08998189499094747name:CosinePrecision@10-type:cosine_recall@1value:0.7103198551599276name:CosineRecall@1-type:cosine_recall@3value:0.8491249245624622name:CosineRecall@3-type:cosine_recall@5value:0.8780929390464696name:CosineRecall@5-type:cosine_recall@10value:0.899818949909475name:CosineRecall@10-type:cosine_ndcg@10value:0.8119294706592789name:CosineNdcg@10-type:cosine_mrr@10value:0.7829293234091058name:CosineMrr@10-type:cosine_map@100value:0.7850878407159746name:CosineMap@100
Lampistero
This is a sentence-transformers model finetuned from jinaai/jina-embeddings-v3 on the json dataset. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("csanz91/lampistero_rag_embeddings_2")
# Run inference
sentences = [
"¿En qué año se demarcó y reconoció la mina 'El Pilar'?",
"La mina 'El Pilar' se demarcó y reconoció en 1857.",
'Según la quinta demanda del SOMM, todas compañías mineras debían entregar a todos sus obreros un libramiento de liquidación mensual',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Approximate statistics based on the first 1000 samples:
query
answer
type
string
string
details
min: 9 tokens
mean: 26.09 tokens
max: 66 tokens
min: 4 tokens
mean: 34.02 tokens
max: 405 tokens
Samples:
query
answer
¿Qué tipos de palas se utilizan para cargar el carbón y el mineral?
Se utiliza una pala convencional y una pala hidráulica, esta última descarga sobre un páncer, puede hacerlo lateralmente y se desplaza sobre ruedas u oruga.
Tras el cierre de la tejería de Florencio Salvador, ¿de dónde procedieron finalmente los ladrillos para las doscientas diez viviendas construidas en Utrillas?
Los ladrillos y material para las doscientas diez viviendas construidas en Utrillas procedieron finalmente de Letux, Zaragoza .
¿Cuál es el formato de los juegos infantiles que se están preparando para el verano en Escucha en 2021?
Los juegos infantiles que se están preparando para el verano en Escucha en 2021 están en formato revista.
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
MatryoshkaLoss
@misc{kusupati2024matryoshka,
title={Matryoshka Representation Learning},
author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
year={2024},
eprint={2205.13147},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
MultipleNegativesRankingLoss
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}