Spaces:

Satyam810
/

lexai

Sleeping

App Files Files Community

lexai / src /reranker.py

Satyam810

Deploy LexAI v3.4

b2fe8d1 21 days ago

raw

history blame contribute delete

2.59 kB

	"""
	Cross-encoder re-ranker — sits between FAISS and explanation engine.

	Pipeline: FAISS top 50 → CrossEncoder rerank → top 5 → Explanation.

	MODEL: cross-encoder/nli-deberta-v3-small
	- 3 output labels: [contradiction=0, neutral=1, entailment=2]
	- We extract entailment score (index 2) as the relevance signal
	- Legal relevance = entailment logic, not webpage click relevance

	CRITICAL BUG FIXED IN v3.2.1:
	Old: scores = model.predict(pairs)
	→ returns shape (n, 3) for NLI models
	→ using raw array as score accidentally sorted by contradiction

	New: scores = model.predict(pairs, apply_softmax=True)[:, 2]
	→ softmax normalizes the 3 logits to probabilities
	→ we take column 2 (entailment probability) as the score
	→ higher entailment = more legally relevant result
	"""

	import numpy as np
	from sentence_transformers import CrossEncoder
	from config import RERANKER_MODEL

	_model = None # lazy-loaded singleton


	def get_reranker():
	"""Load cross-encoder once and reuse. Thread-safe for Streamlit."""
	global _model
	if _model is None:
	print(f"Loading cross-encoder: {RERANKER_MODEL}")
	print("(First run only — ~110MB download, cached after)")
	_model = CrossEncoder(RERANKER_MODEL, max_length=512)
	print("Cross-encoder loaded.")
	return _model


	def rerank(query_text: str, candidates: list, top_k: int = 5) -> list:
	"""
	Re-rank FAISS candidates using cross-encoder entailment scores.

	Args:
	query_text: raw query string
	candidates: list of (case_dict, faiss_score) tuples
	top_k: number of results to return

	Returns:
	list of (case_dict, entailment_score) sorted descending
	"""
	if not candidates:
	return []

	model = get_reranker()

	# Build (query, candidate_text) pairs
	pairs = [
	[query_text[:256], case["text"][:400]]
	for case, _ in candidates
	]

	# Predict: returns shape (n_pairs, 3) for NLI model
	# apply_softmax=True converts logits → probabilities
	raw = model.predict(pairs, show_progress_bar=False)
	raw = np.array(raw)

	if raw.ndim == 2 and raw.shape[1] == 3:
	scores = raw[:, 2] # NLI model — entailment column
	else:
	scores = raw.flatten() # single-score model — use directly

	# Zip scores back to candidates and sort descending
	scored = [
	(candidates[i][0], float(scores[i]))
	for i in range(len(candidates))
	]
	scored.sort(key=lambda x: x[1], reverse=True)

	return scored[:top_k]