lsmpp
/

qwenillustrious

Model card Files Files and versions

qwenillustrious / sentence-transformers /examples /sparse_encoder /evaluation /sparse_nanobeir_evaluator.py

lsmpp's picture

Add files using upload-large-folder tool

bd33eac verified 4 months ago

history blame contribute delete

2.32 kB

	import logging

	from sentence_transformers import SparseEncoder
	from sentence_transformers.sparse_encoder.evaluation import SparseNanoBEIREvaluator

	logging.basicConfig(format="%(message)s", level=logging.INFO)

	# Load a model
	model = SparseEncoder("naver/splade-cocondenser-ensembledistil")

	datasets = ["QuoraRetrieval", "MSMARCO"]

	evaluator = SparseNanoBEIREvaluator(
	dataset_names=datasets,
	show_progress_bar=True,
	batch_size=32,
	)

	# Run evaluation
	results = evaluator(model)
	"""
	Evaluating NanoQuoraRetrieval
	Information Retrieval Evaluation of the model on the NanoQuoraRetrieval dataset:
	Queries: 50
	Corpus: 5046

	Score-Function: dot
	Accuracy@1: 92.00%
	Accuracy@3: 96.00%
	Accuracy@5: 98.00%
	Accuracy@10: 100.00%
	Precision@1: 92.00%
	Precision@3: 40.00%
	Precision@5: 24.80%
	Precision@10: 13.20%
	Recall@1: 79.73%
	Recall@3: 92.53%
	Recall@5: 94.93%
	Recall@10: 98.27%
	MRR@10: 0.9439
	NDCG@10: 0.9339
	MAP@100: 0.9070
	Model Query Sparsity: Active Dimensions: 59.4, Sparsity Ratio: 0.9981
	Model Corpus Sparsity: Active Dimensions: 61.9, Sparsity Ratio: 0.9980

	Information Retrieval Evaluation of the model on the NanoMSMARCO dataset:
	Queries: 50
	Corpus: 5043

	Score-Function: dot
	Accuracy@1: 48.00%
	Accuracy@3: 74.00%
	Accuracy@5: 76.00%
	Accuracy@10: 86.00%
	Precision@1: 48.00%
	Precision@3: 24.67%
	Precision@5: 15.20%
	Precision@10: 8.60%
	Recall@1: 48.00%
	Recall@3: 74.00%
	Recall@5: 76.00%
	Recall@10: 86.00%
	MRR@10: 0.6191
	NDCG@10: 0.6780
	MAP@100: 0.6277
	Model Query Sparsity: Active Dimensions: 45.4, Sparsity Ratio: 0.9985
	Model Corpus Sparsity: Active Dimensions: 122.6, Sparsity Ratio: 0.9960

	Average Queries: 50.0
	Average Corpus: 5044.5
	Aggregated for Score Function: dot
	Accuracy@1: 70.00%
	Accuracy@3: 85.00%
	Accuracy@5: 87.00%
	Accuracy@10: 93.00%
	Precision@1: 70.00%
	Recall@1: 63.87%
	Precision@3: 32.33%
	Recall@3: 83.27%
	Precision@5: 20.00%
	Recall@5: 85.47%
	Precision@10: 10.90%
	Recall@10: 92.13%
	MRR@10: 0.7815
	NDCG@10: 0.8060
	Model Query Sparsity: Active Dimensions: 52.4, Sparsity Ratio: 0.9983
	Model Corpus Sparsity: Active Dimensions: 92.2, Sparsity Ratio: 0.9970
	"""
	# Print the results
	print(f"Primary metric: {evaluator.primary_metric}")
	# => Primary metric: NanoBEIR_mean_dot_ndcg@10
	print(f"Primary metric value: {results[evaluator.primary_metric]:.4f}")
	# => Primary metric value: 0.8060