mixedbread-ai
/

mxbai-embed-large-v1

Feature Extraction

sentence-transformers

Transformers.js

Eval Results (legacy)

text-embeddings-inference

Model card Files Files and versions

Instructions to use mixedbread-ai/mxbai-embed-large-v1 with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

Libraries

sentence-transformers

How to use mixedbread-ai/mxbai-embed-large-v1 with sentence-transformers:

from sentence_transformers import SentenceTransformer

model = SentenceTransformer("mixedbread-ai/mxbai-embed-large-v1")

sentences = [
    "The weather is lovely today.",
    "It's so sunny outside!",
    "He drove to the stadium."
]
embeddings = model.encode(sentences)

similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Transformers.js

How to use mixedbread-ai/mxbai-embed-large-v1 with Transformers.js:

// npm i @huggingface/transformers
import { pipeline } from '@huggingface/transformers';

// Allocate pipeline
const pipe = await pipeline('feature-extraction', 'mixedbread-ai/mxbai-embed-large-v1');

How to use mixedbread-ai/mxbai-embed-large-v1 with Transformers:

# Use a pipeline as a high-level helper
from transformers import pipeline

pipe = pipeline("feature-extraction", model="mixedbread-ai/mxbai-embed-large-v1")

# Load model directly
from transformers import AutoTokenizer, AutoModel

tokenizer = AutoTokenizer.from_pretrained("mixedbread-ai/mxbai-embed-large-v1")
model = AutoModel.from_pretrained("mixedbread-ai/mxbai-embed-large-v1")

llama-cpp-python

How to use mixedbread-ai/mxbai-embed-large-v1 with llama-cpp-python:

# !pip install llama-cpp-python

from llama_cpp import Llama

llm = Llama.from_pretrained(
	repo_id="mixedbread-ai/mxbai-embed-large-v1",
	filename="gguf/mxbai-embed-large-v1-f16.gguf",
)

output = llm(
	"Once upon a time,",
	max_tokens=512,
	echo=True
)
print(output)

Inference
Notebooks
Google Colab
Kaggle
Local Apps Settings

How to use mixedbread-ai/mxbai-embed-large-v1 with llama.cpp:

Install from brew

brew install llama.cpp
# Start a local OpenAI-compatible server with a web UI:
llama-server -hf mixedbread-ai/mxbai-embed-large-v1:F16
# Run inference directly in the terminal:
llama-cli -hf mixedbread-ai/mxbai-embed-large-v1:F16

Install from WinGet (Windows)

winget install llama.cpp
# Start a local OpenAI-compatible server with a web UI:
llama-server -hf mixedbread-ai/mxbai-embed-large-v1:F16
# Run inference directly in the terminal:
llama-cli -hf mixedbread-ai/mxbai-embed-large-v1:F16

Use pre-built binary

# Download pre-built binary from:
# https://github.com/ggerganov/llama.cpp/releases
# Start a local OpenAI-compatible server with a web UI:
./llama-server -hf mixedbread-ai/mxbai-embed-large-v1:F16
# Run inference directly in the terminal:
./llama-cli -hf mixedbread-ai/mxbai-embed-large-v1:F16

Build from source code

git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
cmake -B build
cmake --build build -j --target llama-server llama-cli
# Start a local OpenAI-compatible server with a web UI:
./build/bin/llama-server -hf mixedbread-ai/mxbai-embed-large-v1:F16
# Run inference directly in the terminal:
./build/bin/llama-cli -hf mixedbread-ai/mxbai-embed-large-v1:F16

Use Docker

docker model run hf.co/mixedbread-ai/mxbai-embed-large-v1:F16

LM Studio
Jan
Ollama
How to use mixedbread-ai/mxbai-embed-large-v1 with Ollama:
```
ollama run hf.co/mixedbread-ai/mxbai-embed-large-v1:F16
```

How to use mixedbread-ai/mxbai-embed-large-v1 with Unsloth Studio:

Install Unsloth Studio (macOS, Linux, WSL)

curl -fsSL https://unsloth.ai/install.sh | sh
# Run unsloth studio
unsloth studio -H 0.0.0.0 -p 8888
# Then open http://localhost:8888 in your browser
# Search for mixedbread-ai/mxbai-embed-large-v1 to start chatting

Install Unsloth Studio (Windows)

irm https://unsloth.ai/install.ps1 | iex
# Run unsloth studio
unsloth studio -H 0.0.0.0 -p 8888
# Then open http://localhost:8888 in your browser
# Search for mixedbread-ai/mxbai-embed-large-v1 to start chatting

Using HuggingFace Spaces for Unsloth

# No setup required
# Open https://huggingface.co/spaces/unsloth/studio in your browser
# Search for mixedbread-ai/mxbai-embed-large-v1 to start chatting

Docker Model Runner
How to use mixedbread-ai/mxbai-embed-large-v1 with Docker Model Runner:
```
docker model run hf.co/mixedbread-ai/mxbai-embed-large-v1:F16
```

How to use mixedbread-ai/mxbai-embed-large-v1 with Lemonade:

Pull the model

# Download Lemonade from https://lemonade-server.ai/
lemonade pull mixedbread-ai/mxbai-embed-large-v1:F16

Run and chat with the model

lemonade run user.mxbai-embed-large-v1-F16

List all available models

lemonade list

mxbai-embed-large-v1

Commit History

Update Transformers.js code snippets to V3 (#28)

b33106f
verified

Xenova HF Staff commited on Jan 23

Update README.md

db9d1fe
verified

juliuslipp commited on Mar 13, 2025

Update README.md

972546f
verified

juliuslipp commited on Mar 13, 2025

Update LICENSE

2b0291d
verified

juliuslipp commited on Mar 10, 2025

Update README.md

e5584fb
verified

aamirshakir commited on Mar 10, 2025

Update Readme: formatting and usage with infinity (#20)

e785744
verified

michaelfeil commited on Nov 26, 2024

Add exported openvino model 'openvino_model_qint8_quantized.xml' (#22)

b5d1f23
verified

tomaarsen HF Staff commited on Nov 14, 2024

Add exported openvino model 'openvino_model.xml' (#21)

85b2373
verified

tomaarsen HF Staff commited on Nov 14, 2024

Update config_sentence_transformers.json

5ddaccf
verified

juliuslipp commited on Oct 28, 2024

Update config_sentence_transformers.json

02067f5
verified

juliuslipp commited on Oct 28, 2024

Build in query prompt to Sentence Transformers Config (#19)

187332c
verified

jdwh08s commited on Oct 28, 2024

Update README.md

526dc52
verified

juliuslipp commited on Sep 17, 2024

fix citation

c841373
verified

SeanLee97 commited on Aug 13, 2024

Update README.md

e4614dd
verified

aamirshakir commited on Aug 5, 2024

Update README.md

2a9c989
verified

aamirshakir commited on Jul 22, 2024

Add LICENSE

35bbf92
verified

RuiTheBaker commited on Jul 18, 2024

Update README.md (#10)

990580e
verified

CoralLeiCN commited on Apr 18, 2024

Update README.md

81e7ea9
verified

juliuslipp commited on Apr 17, 2024

Update README.md

69b25ae
verified

juliuslipp commited on Apr 17, 2024

Update README.md

8eb1294
verified

juliuslipp commited on Apr 17, 2024

Update README.md

6e4fca3
verified

juliuslipp commited on Apr 17, 2024

Update README.md

d5e3a9a
verified

juliuslipp commited on Apr 4, 2024

Update README.md

fcf8910
verified

juliuslipp commited on Apr 4, 2024

Update README.md

d41dac6
verified

juliuslipp commited on Apr 4, 2024

Update README.md

456b7cf
verified

mixed-nlp commited on Mar 19, 2024

Update README.md

6c1def8
verified

mixed-nlp commited on Mar 19, 2024

update config.json

084a32a
verified

mixed-nlp commited on Mar 13, 2024

Update config.json

8e55a54
verified

mixed-nlp commited on Mar 13, 2024

Add GGUF model file for llama.cpp (f16) (#3)

7130e2d
verified

iamlemec commited on Mar 12, 2024

Add fp16 ONNX weights (#5)

ab621ab
verified

Xenova HF Staff commited on Mar 12, 2024

Update README.md

d5c6429
verified

Aamir commited on Mar 9, 2024

Upload ONNX weights + add transformers.js code/tags (#2)

b4f2635
verified

Xenova HF Staff commited on Mar 9, 2024

update

b85038e

aamirshakir commited on Mar 8, 2024

Update

5bd4700

aamirshakir commited on Mar 8, 2024

initial commit

37bf75f

Aamir commited on Mar 7, 2024