Modotte
/

SparkEmbedding-300m

Sentence Similarity

sentence-transformers

semantic-search

vector-embedding

Model card Files Files and versions

Parveshiiii commited on Nov 10, 2025

Commit

ee47138

·

verified ·

1 Parent(s): 300db4e

Update README.md

Files changed (1) hide show

README.md +10 -0

README.md CHANGED Viewed

@@ -13,6 +13,16 @@ tags:
 # SparkEmbedding-300m Model Card
 ### Description
 SparkEmbedding-300m is a 300 million parameter multilingual text embedding model with **SoTA cross‑lingual retrieval** developed by the XenArcAI team. Fine-tuned from Google's EmbeddingGemma-300m, it incorporates an additional 1 million curated samples across 119 languages, emphasizing data complexity, linguistic diversity, and deep language understanding. This optimization enhances cross-lingual retrieval, producing embeddings with superior semantic alignment and efficacy in multilingual settings.

 # SparkEmbedding-300m Model Card
+<p align="center">
+  <img
+    src="https://cdn-uploads.huggingface.co/production/uploads/677fcdf29b9a9863eba3f29f/MMX5ZPqxa639HtG-cpt6c.png"
+    alt="CodeX Banner"
+    width="70%"
+    style="border-radius:15px;"
+  />
 ### Description
 SparkEmbedding-300m is a 300 million parameter multilingual text embedding model with **SoTA cross‑lingual retrieval** developed by the XenArcAI team. Fine-tuned from Google's EmbeddingGemma-300m, it incorporates an additional 1 million curated samples across 119 languages, emphasizing data complexity, linguistic diversity, and deep language understanding. This optimization enhances cross-lingual retrieval, producing embeddings with superior semantic alignment and efficacy in multilingual settings.