lexrivera
/

zembed-1-embedding-mlx-6Bit

Feature Extraction

sentence-transformers

text-embeddings-inference

Model card Files Files and versions

zembed-1-embedding-mlx-6Bit / modeling_zembed.py

lexrivera's picture

Upload folder using huggingface_hub

e93ec73 verified 17 days ago

History Blame Contribute Delete

593 Bytes

	import torch
	from sentence_transformers.models import Transformer

	# pyright: basic


	class ZembedTransformer(Transformer):
	def tokenize(
	self,
	texts: list[str] \| list[dict] \| list[tuple[str, str]],
	padding: str \| bool = True,
	) -> dict[str, torch.Tensor]:
	texts = [text + "<\|im_end\|>\n" for text in texts] # pyright: ignore[reportOperatorIssue]
	return self.tokenizer(
	texts,
	padding=padding,
	truncation="longest_first",
	return_tensors="pt",
	max_length=self.max_seq_length,
	)