lsmpp
/

qwenillustrious

Model card Files Files and versions

qwenillustrious / sentence-transformers /examples /sparse_encoder /evaluation /sparse_mse_evaluator.py

lsmpp's picture

Add files using upload-large-folder tool

bd33eac verified 4 months ago

history blame contribute delete

1.26 kB

	import logging

	from datasets import load_dataset

	from sentence_transformers import SparseEncoder
	from sentence_transformers.sparse_encoder.evaluation import SparseMSEEvaluator

	logging.basicConfig(format="%(message)s", level=logging.INFO)

	# Load a model
	student_model = SparseEncoder("prithivida/Splade_PP_en_v1")
	teacher_model = SparseEncoder("naver/splade-cocondenser-ensembledistil")

	# Load any dataset with some texts
	dataset = load_dataset("sentence-transformers/stsb", split="validation")
	sentences = dataset["sentence1"] + dataset["sentence2"]

	# Given queries, a corpus and a mapping with relevant documents, the SparseMSEEvaluator computes different MSE metrics.
	mse_evaluator = SparseMSEEvaluator(
	source_sentences=sentences,
	target_sentences=sentences,
	teacher_model=teacher_model,
	name="stsb-dev",
	)
	results = mse_evaluator(student_model)
	"""
	MSE evaluation (lower = better) on the stsb-dev dataset:
	MSE (*100): 0.034905
	Model Sparsity: Active Dimensions: 54.6, Sparsity Ratio: 0.9982
	"""
	# Print the results
	print(f"Primary metric: {mse_evaluator.primary_metric}")
	# => Primary metric: stsb-dev_negative_mse
	print(f"Primary metric value: {results[mse_evaluator.primary_metric]:.4f}")
	# => Primary metric value: -0.0349