Spaces:

MohitRajput45
/

Fraud-Guard-Intelligence

Sleeping

Upload 21 files

97ac315 verified about 1 month ago

1.65 kB

	"""
	Prediction Pipeline

	Loads trained models and scaler, applies preprocessing,
	and returns final prediction using an ensemble threshold.
	"""

	import joblib
	import os
	import pandas as pd

	class PredictPipeline:

	def __init__(self):
	BASE_DIR = os.path.abspath(os.path.join(os.path.dirname(__file__), "../../"))
	ARTIFACTS_PATH = os.path.join(BASE_DIR, "artifacts")

	self.rf_model = joblib.load(os.path.join(ARTIFACTS_PATH, "rf_model.pkl"))
	self.xgb_model = joblib.load(os.path.join(ARTIFACTS_PATH, "xgb_model.pkl"))
	self.scaler = joblib.load(os.path.join(ARTIFACTS_PATH, "scaler.pkl"))

	def preprocess(self, data: pd.DataFrame):
	"""Apply same preprocessing as training"""
	data = data.copy()

	# 🔥 THE FIX: Add .flatten() to strip away the array brackets
	# This turns [[value]] into a raw, safe float for SHAP
	data["Amount"] = self.scaler.transform(data[["Amount"]]).flatten()

	return data

	def predict(self, data: pd.DataFrame):
	"""Make prediction using ensemble logic"""
	# Preprocess the data first
	data = self.preprocess(data)

	# Get fraud probabilities from both models
	rf_prob = self.rf_model.predict_proba(data)[:, 1]
	xgb_prob = self.xgb_model.predict_proba(data)[:, 1]

	# Ensemble: Average the probabilities
	final_prob = (rf_prob + xgb_prob) / 2

	# 🔥 FIX: Lowered Decision Threshold from 0.5 down to 0.15
	final_pred = (final_prob > 0.15).astype(int)

	return final_pred[0], final_prob[0]