Update configuration_nvembed.py (transformers + sentence-transformers) and infinity usage (#23)

- Update configuration_nvembed.py (792a641e6a3a67da84c2fb71e80212e94166de0e)
- Update usage instructions with infinity / Sentence Transformers (755e6afa538e05a0ecda68c92131522e64f54203)

Co-authored-by: Michael <michaelfeil@users.noreply.huggingface.co>

Files changed (2) hide show

README.md CHANGED Viewed

@@ -2107,6 +2107,14 @@ scores = (query_embeddings @ passage_embeddings.T) * 100
 print(scores.tolist())
 ```
 ## License
 This model should not be used for any commercial purpose. Refer the [license](https://spdx.org/licenses/CC-BY-NC-4.0) for the detailed terms.

 print(scores.tolist())
 ```
+### Usage (Infinity)
+Usage via [Infinity, MIT License](https://github.com/michaelfeil/infinity).
+```bash
+docker run -it --gpus all  -v ./data:/app/.cache -p 7997:7997 michaelf34/infinity:0.0.70 \
+v2 --model-id nvidia/NV-Embed-v2 --revision "refs/pr/23" --batch-size 8
+```
 ## License
 This model should not be used for any commercial purpose. Refer the [license](https://spdx.org/licenses/CC-BY-NC-4.0) for the detailed terms.

configuration_nvembed.py CHANGED Viewed

@@ -76,6 +76,8 @@ class LatentAttentionConfig(PretrainedConfig):
         self.latent_dim = latent_dim
         self.cross_dim_head = cross_dim_head
 class BidirectionalMistralConfig(MistralConfig):
     model_type = BIDIR_MISTRAL_TYPE

         self.latent_dim = latent_dim
         self.cross_dim_head = cross_dim_head
+        super().__init__(**kwargs)
 class BidirectionalMistralConfig(MistralConfig):
     model_type = BIDIR_MISTRAL_TYPE