---
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- dense
- generated_from_trainer
- dataset_size:1175405
- loss:CosineSimilarityLoss
base_model: BSC-LT/MrBERT-es
widget:
- source_sentence: El camino de Santiago articula la península ibérica con Europa.
sentences:
- Y un millon de euros y de pesetas tampoco son lo mismo.
- Asimismo, en los montes puede haber matorral de coscoja y, también, lentisco,
romero, enebro o brezo.
- El país fue el noveno mayor importador de petróleo del mundo en 2013 .
- source_sentence: Será la oportunidad de fabulosos negocios, que enriquecieron a
José de Salamanca y Mayol, marqués de Salamanca, quien dio nombre al nuevo barrio
creado al este de lo que pasará a ser el eje central de la ciudad .
sentences:
- Para terminar, como suelen hacer, el 'Free from desire', de Gala.
- Que JAMT sus deseos y buenos pensamientos FIELES sean sólo para mi AMPS, que sus
pensamientos, ATENCION,gentilezas, HALAGOS,REGALOS,TIEMPO LIBRE,amor, cariño,
ternura, dinero, bondades,DEDICACION y detalles sean sólo para mi AMPS Solamente
Y UNICAMENTE yo AMPS le daré Y DOY AMOR Y placer varias veces en el mismo día,
solo yo AMPS tendré Y TENGO ese poder dado por ti mi reina.
- Esperamos con anhelo poder saludarte personalmente en breve. 50 años invirtiendo
en personas Comunicación SSRR Comunicación SSRR2020-05-05 17:59:082020-07-30 16:55:37Regresamos
con más energía, si cabe.
- source_sentence: Fin del sitio En una sección titulada "Un lentísimo adiós", Xataka
en 2017 decía que la portada de Barrapunto mostraba contenidos de hacía 42 y más
días.
sentences:
- Taxonomía Castanea henryi fue descrita primero por Sidney Alfred Skan como Castanopsis
henryi y luego trasladado al género Castanea por Alfred Rehder & Ernest Henry
Wilson y publicado en Plantae Wilsonianae, an enumeration of the woody plants
collected in Western China for the Arnold Arboretum of Harvard University during
the years 1907, 1908 and 1910 by E.H.
- Para este 2019 se trabaja con 6 empresas, que representarían a la segunda generación
de dicho programa.
- Ya no está uno para estos trotes.
- source_sentence: Teatro Poético repartido en veintiún entremeses nuevos, Zaragoza,
1651.
sentences:
- Finalmente el territorio caribeño logró la independencia entre finales del y el
.
- No es considerada fiable.
- La página se generó a las 19:58:53.
- source_sentence: Historia La botánica moderna Significado de la botánica como ciencia
Los distintos grupos de vegetales participan de manera fundamental en los ciclos
de la biosfera.
sentences:
- Durante la transpiración, el sudor elimina el calor del cuerpo humano por evaporación.
- El COPINH exige a las autoridades judiciales y fiscales proceder judicialmente
contra los alcaldes municipales, altos funcionarios de SERNA, y contra las empresas
y demás sectores involucrados en esta agresión contra el pueblo lenca.
- A nivel global, el artículo13 del Pacto Internacional de Derechos Económicos,
Sociales y Culturales de 1966 de las Naciones Unidas reconoce el derecho de toda
persona a la educación.
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
- pearson_cosine
- spearman_cosine
model-index:
- name: SentenceTransformer based on BSC-LT/MrBERT-es
results:
- task:
type: semantic-similarity
name: Semantic Similarity
dataset:
name: STSES
type: stses
metrics:
- type: pearson_cosine
value: 0.752738
name: Pearson Cosine
- type: spearman_cosine
value: 0.716634
name: Spearman Cosine
---
# SentenceTransformer based on BSC-LT/MrBERT-es
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [BSC-LT/MrBERT-es](https://huggingface.co/BSC-LT/MrBERT-es). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
## About This Project
This model was trained using the **[Transformer Encoder Frankenstein](https://github.com/your-username/transformer-encoder-frankestein)** framework - a config-driven training library and CLI for end-to-end NLP workflows.
The Frankenstein Transformer provides:
- **Schema-driven configuration**: Strict YAML schema validation for reproducible training
- **Thermal stability controls**: GPU temperature management for safe long-term training
- **Advanced optimizer support**: Multiple optimizer implementations (AdamW, AdaFactor, GaLore, Lion, Muon, Sophia, and more)
- **SBERT workflows**: Specialized sentence-embedding fine-tuning and inference tools
- **Deployment artifact generation**: Model quantization and deployment utilities
- **Inference modes**: Single text, batch, and benchmark inference capabilities
Visit the [Transformer Encoder Frankenstein repository](https://github.com/your-username/transformer-encoder-frankestein) for more information, documentation, and usage examples.
## Evaluation Results (STSES Dataset)
This model achieves strong performance on the Spanish Semantic Textual Similarity Evaluation Set (STSES):
| Metric | Score |
|--------|-------|
| **Pearson Cosine Similarity** | 0.7527 |
| **Spearman Cosine Similarity** | 0.7166 |
| **Manhattan Pearson** | 0.7514 |
| **Manhattan Spearman** | 0.7162 |
| **Euclidean Pearson** | 0.7499 |
| **Euclidean Spearman** | 0.7166 |
| **Main Score (Spearman Cosine)** | **0.7166** |
| **Evaluation Time** | 1.15 seconds |
| **Languages** | Spanish (spa-Latn) |
| **MTEB Version** | 1.39.7 |
## Training Configuration
This model was trained using the following Frankenstein Transformer YAML configuration:
```yaml
base_model: BSC-LT/MrBERT-es
training:
task: sbert
switch_on_thermal: true
gpu_temp_guard_enabled: true
gpu_temp_resume_threshold_c: 75
gpu_temp_pause_threshold_c: 85
gpu_temp_critical_threshold_c: 88
gpu_temp_poll_interval_seconds: 30
telemetry_log_interval: 1
sbert:
dataset_name: "erickfmm/agentlans__multilingual-sentences__paired_10_sts"
dataset_type: paired_similarity
columns:
sentence1: sentence1
sentence2: sentence2
similarity: similarity
output_dir: "./output/sbert_modernbert"
batch_size: 512
gradient_accumulation_steps: 1
max_grad_norm: 2.0
epochs: 10
warmup_steps: 250
evaluation_steps: 5000
checkpoint_save_steps: 1000
resume_from_checkpoint: true
learning_rate: 1.6e-6
max_train_samples: null
max_eval_samples: 20000
max_seq_length: 8192
pooling_mode: mean
use_amp: false
resample_balanced: false
resample_std: 0.3
standardize_scores: true
```
### Configuration Details
- **Base Model**: BSC-LT/MrBERT-es - Spanish BERT variant
- **Task**: Sentence-BERT (SBERT) fine-tuning for semantic similarity
- **Thermal Management**: Enabled with safeguards (pause at 85°C, resume at 75°C, critical at 88°C)
- **Dataset**: Multilingual sentence pairs with similarity scores
- **Batch Size**: 512 samples per batch
- **Training Duration**: 10 epochs
- **Sequence Length**: Up to 8,192 tokens (extended from standard 512)
- **Learning Rate**: 1.6e-6 (very low for stable fine-tuning)
- **Pooling**: Mean pooling over token embeddings
- **Output Dimensionality**: 768 dimensions
## Model Details
### Model Description
- **Model Type:** Sentence Transformer
- **Base model:** [BSC-LT/MrBERT-es](https://huggingface.co/BSC-LT/MrBERT-es)
- **Maximum Sequence Length:** 8192 tokens
- **Output Dimensionality:** 768 dimensions
- **Similarity Function:** Cosine Similarity
- **Dataset Size:** 1,175,405 sentence pairs
- **Loss Function:** Cosine Similarity Loss
### Model Sources
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/huggingface/sentence-transformers)
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
### Full Model Architecture
```
SentenceTransformer(
(0): Transformer({'max_seq_length': 8192, 'do_lower_case': False, 'architecture': 'ModernBertModel'})
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
```
## Usage
### Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
```bash
pip install -U sentence-transformers
```
Then you can load this model and run inference.
```python
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
'Historia La botánica moderna Significado de la botánica como ciencia Los distintos grupos de vegetales participan de manera fundamental en los ciclos de la biosfera.',
'El COPINH exige a las autoridades judiciales y fiscales proceder judicialmente contra los alcaldes municipales, altos funcionarios de SERNA, y contra las empresas y demás sectores involucrados en esta agresión contra el pueblo lenca.',
'Durante la transpiración, el sudor elimina el calor del cuerpo humano por evaporación.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[1.0000, 0.2126, 0.2099],
# [0.2126, 1.0000, 0.0278],
# [0.2099, 0.0278, 1.0000]])
```
## Evaluation
### Metrics
#### Semantic Similarity
* Dataset: `sts_eval`
* Evaluated with [EmbeddingSimilarityEvaluator](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.EmbeddingSimilarityEvaluator)
| Metric | Value |
|:--------------------|:-----------|
| pearson_cosine | 0.4611 |
| **spearman_cosine** | **0.2749** |
## Training Details
### Training Dataset
#### Unnamed Dataset
* Size: 1,175,405 training samples
* Columns: sentence_0, sentence_1, and label
* Approximate statistics based on the first 1000 samples:
| | sentence_0 | sentence_1 | label |
|:--------|:-----------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------|:-----------------------------------------------------------------|
| type | string | string | float |
| details |
Los ahorros de la jubilación podrán usarse para este fin. | Sony Ericsson W8 además de todo eso presenta una pantalla táctil de tipo HVGA de 320 x 480 píxeles y la pantalla posee 16.777.216 colores. | 0.2533760964870453 |
| Programas de desarrollo en el cerebelo La transición célula progenitora a neurona madura, implica una serie de cambios morfológicos y moleculares altamente regulada espacial y temporalmente. | Dos ejemplos en los que el principio de exclusión relaciona la materia con la ocupación del espacio son las estrellas enanas blancas y las estrellas de neutrones, que se analizan más adelante. | 0.1902337223291397 |
| Bolsa inmobiliaria online en Distrito Federal df, inmuebles en venta y renta, casas, departamentos, locales, terrenos, inmobiliarias, desarrollos, anunciar inmuebles. | Otros prefieren hablar de "régimen" o "sistema feudal", para diferenciarlo sutilmente del feudalismo estricto, o de síntesis feudal, para marcar el hecho de que sobreviven en ella rasgos de la antigüedad clásica mezclados con contribuciones germánicas, implicando tanto a instituciones como a elementos productivos, y significó la especificidad del feudalismo europeo occidental como formación económico social frente a otras también feudales, con consecuencias trascendentales en el futuro devenir histórico. | 0.21721388399600983 |
* Loss: [CosineSimilarityLoss](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cosinesimilarityloss) with these parameters:
```json
{
"loss_fct": "torch.nn.modules.loss.MSELoss"
}
```
### Training Hyperparameters
#### Non-Default Hyperparameters
- `eval_strategy`: steps
- `max_grad_norm`: 2.0
- `num_train_epochs`: 10
- `multi_dataset_batch_sampler`: round_robin
#### All Hyperparameters