Spaces:

Madras1
/

Lancer

Sleeping

App Files Files Community

Lancer / app /reranking /embeddings.py

Madras1

Upload 40 files

55cd806 verified about 1 month ago

raw

history blame contribute delete

2.79 kB

	"""Embedding-based reranking using sentence-transformers.

	Provides bi-encoder and cross-encoder reranking for better relevance scoring.
	"""

	from functools import lru_cache
	from typing import Optional

	import numpy as np

	from app.config import get_settings


	@lru_cache(maxsize=1)
	def get_bi_encoder():
	"""Load and cache the bi-encoder model."""
	from sentence_transformers import SentenceTransformer
	settings = get_settings()
	return SentenceTransformer(settings.bi_encoder_model)


	@lru_cache(maxsize=1)
	def get_cross_encoder():
	"""Load and cache the cross-encoder model."""
	from sentence_transformers import CrossEncoder
	settings = get_settings()
	return CrossEncoder(settings.cross_encoder_model)


	def compute_bi_encoder_scores(
	query: str,
	documents: list[str],
	) -> list[float]:
	"""
	Compute semantic similarity scores using bi-encoder.

	Fast but less accurate than cross-encoder.
	Good for initial filtering of large result sets.

	Args:
	query: Search query
	documents: List of document texts

	Returns:
	List of similarity scores (0-1)
	"""
	if not documents:
	return []

	model = get_bi_encoder()

	# Encode query and documents
	query_embedding = model.encode(query, normalize_embeddings=True)
	doc_embeddings = model.encode(documents, normalize_embeddings=True)

	# Compute cosine similarities (embeddings are normalized, so dot product = cosine)
	similarities = np.dot(doc_embeddings, query_embedding)

	# Convert to list and ensure values are in [0, 1]
	scores = [(float(s) + 1) / 2 for s in similarities] # Map from [-1, 1] to [0, 1]

	return scores


	def compute_cross_encoder_scores(
	query: str,
	documents: list[str],
	) -> list[float]:
	"""
	Compute relevance scores using cross-encoder.

	More accurate than bi-encoder but slower.
	Use after initial filtering for precise ranking.

	Args:
	query: Search query
	documents: List of document texts

	Returns:
	List of relevance scores (0-1)
	"""
	if not documents:
	return []

	model = get_cross_encoder()

	# Create query-document pairs
	pairs = [[query, doc] for doc in documents]

	# Get scores
	scores = model.predict(pairs)

	# Normalize to [0, 1] using sigmoid if needed
	min_score = float(np.min(scores))
	max_score = float(np.max(scores))

	if max_score > min_score:
	normalized = [(float(s) - min_score) / (max_score - min_score) for s in scores]
	else:
	normalized = [0.5] * len(scores)

	return normalized