Spaces:

mnoorchenar
/

docmind

Sleeping

docmind / rag /embeddings.py

Update 2026-03-22 20:53:33

693f74a 2 months ago

1.18 kB

	"""
	Embedding layer — LangChain HuggingFaceEmbeddings.

	Wraps BAAI/bge-small-en-v1.5 as a LangChain-native embeddings object so it
	can be swapped for any other LangChain-compatible embeddings (OpenAI,
	Cohere, etc.) in one line.

	The model is lazy-loaded on first call and cached as a module-level singleton
	(SentenceTransformer load costs ~1–2 s; subsequent calls are instant).
	"""
	import os
	import numpy as np
	from langchain_huggingface import HuggingFaceEmbeddings

	# Suppress tokenizer parallelism warning in multi-threaded Flask context
	os.environ.setdefault("TOKENIZERS_PARALLELISM", "false")

	_MODEL_NAME = "BAAI/bge-small-en-v1.5"
	_embeddings: HuggingFaceEmbeddings \| None = None


	def _get_embeddings() -> HuggingFaceEmbeddings:
	global _embeddings
	if _embeddings is None:
	_embeddings = HuggingFaceEmbeddings(
	model_name=_MODEL_NAME,
	encode_kwargs={"normalize_embeddings": True},
	)
	return _embeddings


	def embed(texts: list) -> np.ndarray:
	"""Embed a list of texts. Returns a float32 ndarray of shape (N, dim)."""
	vecs = _get_embeddings().embed_documents(texts)
	return np.array(vecs, dtype="float32")