inesaltemir
/

MNLP_M2_document_encoder

Sentence Similarity

sentence-transformers

Transformers.js

feature-extraction

Eval Results (legacy)

text-embeddings-inference

Model card Files Files and versions

zpn commited on Jan 31, 2024

Commit

70cf0fe

·

verified ·

1 Parent(s): 66f8412

Update README.md

Files changed (1) hide show

README.md +6 -0

README.md CHANGED Viewed

@@ -2636,6 +2636,12 @@ print(output)
 For more information, see the [API reference](https://docs.nomic.ai/reference/endpoints/nomic-embed-text)
 ## Training Details
 We train our embedder using a multi-stage training pipeline. Starting from a long-context [BERT model](https://huggingface.co/nomic-ai/nomic-bert-2048),

 For more information, see the [API reference](https://docs.nomic.ai/reference/endpoints/nomic-embed-text)
+## Data Visualization
+Click the Nomic Atlas map below to visualize a 5M sample of our contrastive pretraining data!
+[![image/webp](https://cdn-uploads.huggingface.co/production/uploads/607997c83a565c15675055b3/pjhJhuNyRfPagRd_c_iUz.webp)](https://atlas.nomic.ai/map/nomic-text-embed-v1-5m-sample)
 ## Training Details
 We train our embedder using a multi-stage training pipeline. Starting from a long-context [BERT model](https://huggingface.co/nomic-ai/nomic-bert-2048),