Fremtind
/

norsbert4-base

@@ -9,15 +9,17 @@ tags:
 - generated_from_trainer
 - dataset_size:556367
 - loss:CachedMultipleNegativesRankingLoss
-base_model: Murhaf/ltg-norbert4-base_ndla
 widget:
 - source_sentence: Inne i igloen gjør den unge mannen seg klar for sitt overnattingsopphold.
   sentences:
   - Folk danser i gaten.
   - Den unge mannen gjør seg klar for sitt overnattingsopphold.
   - Den unge mannen gjør seg klar til å dra.
-- source_sentence: En kvinne i rullestol snakker med vennen sin mens hun er omgitt
-    av andre mennesker som går i parken.
   sentences:
   - Barna blir fotografert.
   - Kvinnen er utendørs.
@@ -27,8 +29,9 @@ widget:
   - En mann og en kvinne ser på frukt og grønnsaker.
   - En kvinne løper.
   - En kvinne sitter ved et piknikbord nær den steinete kysten.
-- source_sentence: To basketballspillere i svart og hvitt antrekk står på en basketballbane
-    og snakker.
   sentences:
   - De to basketballspillerne snakker sammen.
   - Den unge gutten multitasker.
@@ -39,7 +42,8 @@ widget:
   - På fornøyelsesturen var det to jenter som smilte og lo
   - En kvinne ødelegger et sandmaleri.
 datasets:
-- Murhaf/all-nli-norwegian
 pipeline_tag: sentence-similarity
 library_name: sentence-transformers
 metrics:
@@ -57,6 +61,7 @@ model-index:
     - type: cosine_accuracy
       value: 0.9470000267028809
       name: Cosine Accuracy
 ---
 # SentenceTransformer based on Murhaf/ltg-norbert4-base_ndla
@@ -67,20 +72,15 @@ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [M
 ### Model Description
 - **Model Type:** Sentence Transformer
-- **Base model:** [Murhaf/ltg-norbert4-base_ndla](https://huggingface.co/Murhaf/ltg-norbert4-base_ndla) <!-- at revision 762fb095e1c571e52d8690bf07ec8b65d3551026 -->
 - **Maximum Sequence Length:** 75 tokens
 - **Output Dimensionality:** 640 dimensions
 - **Similarity Function:** Cosine Similarity
 - **Training Dataset:**
-    - [all-nli-norwegian](https://huggingface.co/datasets/Murhaf/all-nli-norwegian)
 - **Language:** no
 <!-- - **License:** Unknown -->
-### Model Sources
-- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
-- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
-- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
 ### Full Model Architecture
@@ -234,6 +234,7 @@ You can finetune this model on your own dataset.
 ### Training Hyperparameters
 #### Non-Default Hyperparameters
 - `eval_strategy`: steps
 - `per_device_train_batch_size`: 512
@@ -241,6 +242,7 @@ You can finetune this model on your own dataset.
 - `num_train_epochs`: 1
 - `warmup_ratio`: 0.1
 - `batch_sampler`: no_duplicates
 #### All Hyperparameters
 <details><summary>Click to expand</summary>
@@ -366,14 +368,12 @@ You can finetune this model on your own dataset.
 </details>
-### Training Logs
-| Epoch  | Step | Training Loss | Validation Loss | nob_all_nli_test_cosine_accuracy |
-|:------:|:----:|:-------------:|:---------------:|:--------------------------------:|
-| 0.3690 | 100  | 1.8282        | 0.6138          | 0.9420                           |
-| 0.7380 | 200  | 1.1887        | 0.5645          | 0.9470                           |
 ### Framework Versions
 - Python: 3.12.11
 - Sentence Transformers: 5.1.1
 - Transformers: 4.56.2
@@ -382,34 +382,8 @@ You can finetune this model on your own dataset.
 - Datasets: 4.1.1
 - Tokenizers: 0.22.1
-## Citation
-### BibTeX
-#### Sentence Transformers
-```bibtex
-@inproceedings{reimers-2019-sentence-bert,
-    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
-    author = "Reimers, Nils and Gurevych, Iryna",
-    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
-    month = "11",
-    year = "2019",
-    publisher = "Association for Computational Linguistics",
-    url = "https://arxiv.org/abs/1908.10084",
-}
-```
-#### CachedMultipleNegativesRankingLoss
-```bibtex
-@misc{gao2021scaling,
-    title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
-    author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
-    year={2021},
-    eprint={2101.06983},
-    archivePrefix={arXiv},
-    primaryClass={cs.LG}
-}
-```
 <!--
 ## Glossary

 - generated_from_trainer
 - dataset_size:556367
 - loss:CachedMultipleNegativesRankingLoss
+base_model:
+- ltg/norbert4-base
 widget:
 - source_sentence: Inne i igloen gjør den unge mannen seg klar for sitt overnattingsopphold.
   sentences:
   - Folk danser i gaten.
   - Den unge mannen gjør seg klar for sitt overnattingsopphold.
   - Den unge mannen gjør seg klar til å dra.
+- source_sentence: >-
+    En kvinne i rullestol snakker med vennen sin mens hun er omgitt av andre
+    mennesker som går i parken.
   sentences:
   - Barna blir fotografert.
   - Kvinnen er utendørs.
   - En mann og en kvinne ser på frukt og grønnsaker.
   - En kvinne løper.
   - En kvinne sitter ved et piknikbord nær den steinete kysten.
+- source_sentence: >-
+    To basketballspillere i svart og hvitt antrekk står på en basketballbane og
+    snakker.
   sentences:
   - De to basketballspillerne snakker sammen.
   - Den unge gutten multitasker.
   - På fornøyelsesturen var det to jenter som smilte og lo
   - En kvinne ødelegger et sandmaleri.
 datasets:
+- Fremtind/all-nli-norwegian
+- NbAiLab/ndla_parallel_paragraphs
 pipeline_tag: sentence-similarity
 library_name: sentence-transformers
 metrics:
     - type: cosine_accuracy
       value: 0.9470000267028809
       name: Cosine Accuracy
+license: apache-2.0
 ---
 # SentenceTransformer based on Murhaf/ltg-norbert4-base_ndla
 ### Model Description
 - **Model Type:** Sentence Transformer
+- **Base model:** [ltg/norbert4-base](https://huggingface.co/ltg/norbert4-base) <!-- at revision 762fb095e1c571e52d8690bf07ec8b65d3551026 -->
 - **Maximum Sequence Length:** 75 tokens
 - **Output Dimensionality:** 640 dimensions
 - **Similarity Function:** Cosine Similarity
 - **Training Dataset:**
+    - [all-nli-norwegian](https://huggingface.co/datasets/Fremtind/all-nli-norwegian)
 - **Language:** no
 <!-- - **License:** Unknown -->
 ### Full Model Architecture
 ### Training Hyperparameters
 #### Non-Default Hyperparameters
+<details><summary>Click to expand</summary>
 - `eval_strategy`: steps
 - `per_device_train_batch_size`: 512
 - `num_train_epochs`: 1
 - `warmup_ratio`: 0.1
 - `batch_sampler`: no_duplicates
+</details>
 #### All Hyperparameters
 <details><summary>Click to expand</summary>
 </details>
 ### Framework Versions
+<details><summary>Click to expand</summary>
 - Python: 3.12.11
 - Sentence Transformers: 5.1.1
 - Transformers: 4.56.2
 - Datasets: 4.1.1
 - Tokenizers: 0.22.1
+</details>
 <!--
 ## Glossary