metadata
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- dense
- generated_from_trainer
- dataset_size:3324
- loss:MultipleNegativesRankingLoss
base_model: sentence-transformers/distiluse-base-multilingual-cased-v2
widget:
- source_sentence: >-
Pizarra acústica de guitarra Dunlop T213C negra - Top plate de reemplazo
para guitarras acústicas, fabricada en madera maciza (arce), con
perforaciones para mejor resonancia y acabado negro mate
sentences:
- Accesorios para instrumentos musicales / Musical instrument accessories
- Personal Care / Aseo
- Sistema limpiaparabrisas / Windshield wiper system
- source_sentence: >-
Hisense 40" Clase FHD (1080P) Roku Smart LED TV (40H4030F1) - Hisense 40"
Clase 1080P FHD LED Roku Smart TV 40H4030F1
sentences:
- Olla arrocera / rice cooker
- Estufa / Stove/Cooktop
- TV (-) 32 ''
- source_sentence: >-
Reductor de Bushing de 3/4 in. x 1/2 in. PVC Schedule 40 - Las tuberías y
accesorios de presión de PVC Schedule 40 se utilizan en sistemas de riego,
aspersores subterráneos, piscinas, aplicaciones al aire libre y líneas de
suministro de agua fría. Estos accesorios son altamente resistentes, con
alta resistencia a la tracción y al impacto. Diseñados para uso bajo
presión donde los sistemas no superen los 140° F. Cumplen con las Normas:
ASTM D 1784, ASTM D 2466, NSF 14 y 61PVC Schedule 40. Tienen mejores
propiedades de reducción de sonido que el PVC Schedule 40 DWV Foam Core y
el ABS Foam Core. La instalación requiere el uso de imprimación y cemento
solvente. Todos los productos Charlotte Pipe se fabrican en los EE. UU.
sentences:
- Base de TV / TV base
- Manufacturas para la construcción/ Manufactures for construction use
- >-
Leather goods. (Briefcases, suitcases, portfolios.) / Artículos de
talabartería.(Maletines, maletas, portafolios. )
- source_sentence: >-
Liebherr WCE81769BX Motor de Compresión con Inversor para Nevera Combi,
Tensión Dual (220-240V/50Hz) - 100% Reutilizable y Garantía Vida - Motor
de alta eficiencia y durabilidad diseñado específicamente para neveras y
congeladores Liebherr de gama media-alta. Este motor de compresión
invertible con tensión dual (220-240V/50Hz) está optimizado para reducir
el consumo energético en hasta un 30% frente a modelos convencionales,
garantizando un funcionamiento silencioso (≤42dB) y una capacidad de
refrigeración constante. Compatible con unidades de neveras tipo 'Combi'
de gran tamaño, como los modelos WCS5791 o WCF6589. Incluye certificación
ecológica A+++ por eficiencia energética y viene empaquetado en caja
hermética para evitar daños durante el transporte o almacenaje prolongado.
Ideal para reemplazo en reparaciones profesionales, con garantía de vida
útil del equipo original (hasta 10 años según uso). Diseño modular que
permite instalación rápida sin necesidad de herramientas especializadas
sentences:
- Piezas de repuesto de motos / Motorcycle spare parts
- Alternador / Alternator
- Motores de equipos electrodomésticos / Motors for household appliances
- source_sentence: >-
Audífono Widex Moment A-RIC Plus Rechargeable - Talla Grande (RIC) -
Audífono intraauricular receptor en el canal (RIC) con tecnología Sound
Recognizer para optimizar sonidos importantes. Incluye cargador magnético,
aplicación móvil y compatibilidad con wearables como iOS/Android.
Recomendado para adultos con pérdida auditiva leve a moderada
sentences:
- Piezas de repuesto de motos / Motorcycle spare parts
- Caja de seguridad / Safe deposit box
- Audifono / Hearing Aids
pipeline_tag: sentence-similarity
library_name: sentence-transformers
SentenceTransformer based on sentence-transformers/distiluse-base-multilingual-cased-v2
This is a sentence-transformers model finetuned from sentence-transformers/distiluse-base-multilingual-cased-v2. It maps sentences & paragraphs to a 512-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: sentence-transformers/distiluse-base-multilingual-cased-v2
- Maximum Sequence Length: 128 tokens
- Output Dimensionality: 512 dimensions
- Similarity Function: Cosine Similarity
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 128, 'do_lower_case': False, 'architecture': 'DistilBertModel'})
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Dense({'in_features': 768, 'out_features': 512, 'bias': True, 'activation_function': 'torch.nn.modules.activation.Tanh'})
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("roig/compass-product-classifier")
# Run inference
sentences = [
'Audífono Widex Moment A-RIC Plus Rechargeable - Talla Grande (RIC) - Audífono intraauricular receptor en el canal (RIC) con tecnología Sound Recognizer para optimizar sonidos importantes. Incluye cargador magnético, aplicación móvil y compatibilidad con wearables como iOS/Android. Recomendado para adultos con pérdida auditiva leve a moderada',
'Audifono / Hearing Aids',
'Piezas de repuesto de motos / Motorcycle spare parts',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 512]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[ 1.0000, 0.7342, 0.0265],
# [ 0.7342, 1.0000, -0.0021],
# [ 0.0265, -0.0021, 1.0000]])
Training Details
Training Dataset
Unnamed Dataset
- Size: 3,324 training samples
- Columns:
sentence_0andsentence_1 - Approximate statistics based on the first 1000 samples:
sentence_0 sentence_1 type string string details - min: 5 tokens
- mean: 95.27 tokens
- max: 128 tokens
- min: 3 tokens
- mean: 12.28 tokens
- max: 53 tokens
- Samples:
sentence_0 sentence_1 Nichia J16JL-UN - Bujía de rendimiento extremo - Bujía profesional con electrodo iridio, diseñada para motores deportivos o turismos de alto kilometraje. Resiste condiciones severas y ofrece mejor ignición que los modelos estándarBujías / Spark plugs500 Watt Power Inverter, Dual Power Inverter, Two USB Charging PortsConvertidor, Inversor de corriente / Converter, Power inverterColchón Híbrido de Firmeza Media Queen de 12 pulg., Aislamiento de Movimiento y Transpirable - Si buscas un colchón que sea tanto cómodo como asequible, entonces este colchón híbrido de 12 pulg. es perfecto para ti. Este colchón de 12 pulg. está diseñado con espuma de confort y un sistema de resortes ensacados, proporcionando una experiencia de sueño cómoda. La espuma de flujo de aire confort es suave y agradable, haciendo tu colchón cómodo y transpirable. La espuma de confort alivia los puntos de presión para que puedas despertar sin dolor de espalda. El diseño de resortes ensacados independientes es perfecto para durmientes sensibles, cada resorte funciona de manera independiente. No importa cuánto te muevas, no tendrás que preocuparte por molestar a tu compañero de sueño y disfrutarás de una noche de descanso tranquila e ininterrumpida. Nuestros colchones de 12 pulg. vienen en caja, llegan con una garantía limitada de 10 años; simplemente coloca el colchón en tu cama y deja pasar 72...Mattress / Colchon - Loss:
MultipleNegativesRankingLosswith these parameters:{ "scale": 20.0, "similarity_fct": "cos_sim", "gather_across_devices": false }
Training Hyperparameters
Non-Default Hyperparameters
per_device_train_batch_size: 16per_device_eval_batch_size: 16num_train_epochs: 4multi_dataset_batch_sampler: round_robin
All Hyperparameters
Click to expand
overwrite_output_dir: Falsedo_predict: Falseeval_strategy: noprediction_loss_only: Trueper_device_train_batch_size: 16per_device_eval_batch_size: 16per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 5e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1num_train_epochs: 4max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.0warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falsebf16: Falsefp16: Falsefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}parallelism_config: Nonedeepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torch_fusedoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthproject: huggingfacetrackio_space_id: trackioddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsehub_revision: Nonegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters:auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: noneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseliger_kernel_config: Noneeval_use_gather_object: Falseaverage_tokens_across_devices: Trueprompts: Nonebatch_sampler: batch_samplermulti_dataset_batch_sampler: round_robinrouter_mapping: {}learning_rate_mapping: {}
Training Logs
| Epoch | Step | Training Loss |
|---|---|---|
| 2.4038 | 500 | 0.5086 |
Framework Versions
- Python: 3.14.2
- Sentence Transformers: 5.2.0
- Transformers: 4.57.3
- PyTorch: 2.9.1+cu128
- Accelerate: 1.12.0
- Datasets: 4.4.2
- Tokenizers: 0.22.2
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
MultipleNegativesRankingLoss
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}