Spaces:

Nahiyan14
/

test

Sleeping

App Files Files Community

test / app.py

Nahiyan14

Update app.py

8ffade3 verified about 1 year ago

raw

history blame contribute delete

5.1 kB

	import pandas as pd
	import numpy as np
	import joblib
	from sklearn.base import BaseEstimator, TransformerMixin
	from sklearn.preprocessing import QuantileTransformer, StandardScaler
	from sklearn.cluster import KMeans
	import gradio as gr

	# Define the feat_eng function
	def feat_eng(df):
	# Replace spaces in column names
	df.columns = df.columns.str.replace(' ', '_')

	# Create new features
	df['total_acidity'] = df['fixed_acidity'] + df['volatile_acidity'] + df['citric_acid']
	df['acidity_to_pH_ratio'] = df['total_acidity'] / df['pH']
	df['free_sulfur_dioxide_to_total_sulfur_dioxide_ratio'] = df['free_sulfur_dioxide'] / df['total_sulfur_dioxide']
	df['alcohol_to_acidity_ratio'] = df['alcohol'] / df['total_acidity']
	df['residual_sugar_to_citric_acid_ratio'] = df['residual_sugar'] / df['citric_acid']
	df['alcohol_to_density_ratio'] = df['alcohol'] / df['density']
	df['total_alkalinity'] = df['pH'] + df['alcohol']
	df['total_minerals'] = df['chlorides'] + df['sulphates'] + df['residual_sugar']

	# Handle infinite and missing values
	df = df.replace([np.inf, -np.inf], 0)
	df = df.dropna()

	# Select relevant features
	selected_features = [
	'total_acidity', 'acidity_to_pH_ratio',
	'free_sulfur_dioxide_to_total_sulfur_dioxide_ratio',
	'alcohol_to_acidity_ratio', 'residual_sugar_to_citric_acid_ratio',
	'alcohol_to_density_ratio', 'total_alkalinity', 'total_minerals'
	]
	return df[selected_features]

	# Custom Quantile Transformer
	class CustomQuantileTransformer(BaseEstimator, TransformerMixin):
	def __init__(self, random_state=None):
	self.random_state = random_state
	self.quantile_transformer = QuantileTransformer(output_distribution='normal', random_state=self.random_state)

	def fit(self, X, y=None):
	self.quantile_transformer.fit(X)
	return self

	def transform(self, X):
	X_transformed = self.quantile_transformer.transform(X)
	return pd.DataFrame(X_transformed, columns=X.columns)

	# Custom Standard Scaler
	class CustomStandardScaler(BaseEstimator, TransformerMixin):
	def __init__(self):
	self.scaler = StandardScaler()

	def fit(self, X, y=None):
	self.scaler.fit(X)
	return self

	def transform(self, X):
	X_transformed = self.scaler.transform(X)
	return pd.DataFrame(X_transformed, columns=X.columns)

	# KMeans Transformer
	class KMeansTransformer(BaseEstimator, TransformerMixin):
	def __init__(self, n_clusters=3, random_state=None):
	self.n_clusters = n_clusters
	self.random_state = random_state
	self.kmeans = KMeans(n_clusters=self.n_clusters, random_state=self.random_state)

	def fit(self, X, y=None):
	self.kmeans.fit(X)
	return self

	def transform(self, X):
	cluster_labels = self.kmeans.predict(X)
	X_clustered = X.copy()
	X_clustered['Cluster'] = cluster_labels
	return X_clustered

	# Load the pipeline
	pipeline = joblib.load("pipeline.pkl")

	# Define the prediction function
	def predict(fixed_acidity, volatile_acidity, citric_acid, residual_sugar,
	chlorides, free_sulfur_dioxide, total_sulfur_dioxide, density,
	pH, sulphates, alcohol, Id=None):
	# Prepare input data
	input_data = {
	'fixed_acidity': [float(fixed_acidity)],
	'volatile_acidity': [float(volatile_acidity)],
	'citric_acid': [float(citric_acid)],
	'residual_sugar': [float(residual_sugar)],
	'chlorides': [float(chlorides)],
	'free_sulfur_dioxide': [float(free_sulfur_dioxide)],
	'total_sulfur_dioxide': [float(total_sulfur_dioxide)],
	'density': [float(density)],
	'pH': [float(pH)],
	'sulphates': [float(sulphates)],
	'alcohol': [float(alcohol)],
	'Id': [Id] if Id else [0] # Optional ID column
	}
	df = pd.DataFrame(input_data)

	# Make predictions
	prediction = pipeline.predict(df)
	probabilities = pipeline.predict_proba(df)
	# Prepare the result
	result = {
	"Predicted Quality": int(prediction[0]), # Convert NumPy value to a Python int
	"Class Probabilities": {str(i): prob for i, prob in enumerate(probabilities[0])}
	}
	return result

	# Define input components for Gradio
	inputs = [
	gr.Number(label='Fixed Acidity'),
	gr.Number(label='Volatile Acidity'),
	gr.Number(label='Citric Acid'),
	gr.Number(label='Residual Sugar'),
	gr.Number(label='Chlorides'),
	gr.Number(label='Free Sulfur Dioxide'),
	gr.Number(label='Total Sulfur Dioxide'),
	gr.Number(label='Density'),
	gr.Number(label='pH'),
	gr.Number(label='Sulphates'),
	gr.Number(label='Alcohol'),
	gr.Textbox(label='Id (Optional)', placeholder="Optional"),
	]

	# Define the Gradio interface
	interface = gr.Interface(
	fn=predict,
	inputs=inputs,
	outputs=gr.Json(label="Prediction Output"),
	title="Wine Quality Prediction",
	description="Enter wine parameters to predict its quality."
	)

	# Launch the Gradio app
	if __name__ == "__main__":
	interface.launch()