Spaces:

Man0707
/

trial

Sleeping

App Files Files Community

Man0707 commited on Nov 28, 2025

Commit

08dae5c

verified ·

1 Parent(s): 64a8f54

Update src/streamlit_app.py

Browse files

Files changed (1) hide show

src/streamlit_app.py +70 -16

src/streamlit_app.py CHANGED Viewed

@@ -1,34 +1,88 @@
 import pandas as pd
-import numpy as np
 from sklearn.model_selection import train_test_split
 from sklearn.preprocessing import StandardScaler
 from sklearn.ensemble import RandomForestClassifier
 from sklearn.metrics import accuracy_score
 from datasets import load_dataset
-ds = load_dataset("codesignal/wine-quality")
-print(df.head())
 X = df.drop(["quality", "Id"], axis=1)
 y = df["quality"]
-X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
 scaler = StandardScaler()
-X_train = scaler.fit_transform(X_train)
-X_test = scaler.transform(X_test)
-model = RandomForestClassifier()
-model.fit(X_train, y_train)
-pred = model.predict(X_test)
-accuracy = accuracy_score(y_test, pred)
-print(accuracy)
-sample = pd.DataFrame([[7.4, 0.7, 0, 1.9, 0.076, 11, 34, 0.9978, 3.51, 0.56, 9.4]],
-                      columns=X.columns)
-sample_scaled = scaler.transform(sample)
-prediction = model.predict(sample_scaled)
-print(prediction[0])

+import streamlit as st
 import pandas as pd
 from sklearn.model_selection import train_test_split
 from sklearn.preprocessing import StandardScaler
 from sklearn.ensemble import RandomForestClassifier
 from sklearn.metrics import accuracy_score
 from datasets import load_dataset
+# -------------------------- Title --------------------------
+st.title("🍷 Wine Quality Prediction")
+st.write("Using Random Forest on the famous Wine Quality dataset")
+# -------------------------- Load Data --------------------------
+@st.cache_data
+def get_data():
+    ds = load_dataset("codesignal/wine-quality")
+    df = ds['train'].to_pandas()
+    return df
+df = get_data()
+st.write("Dataset loaded! Here's a preview:")
+st.dataframe(df.head())
+# -------------------------- Preprocessing --------------------------
+# Drop ID (not useful) and separate features/target
 X = df.drop(["quality", "Id"], axis=1)
 y = df["quality"]
+# Make it a binary classification (good ≥ 6, bad < 6) - common practice
+y = (y >= 6).astype(int)
+# Train-test split
+X_train, X_test, y_train, y_test = train_test_split(
+    X, y, test_size=0.2, random_state=42, stratify=y
+)
+# Scale features
 scaler = StandardScaler()
+X_train_scaled = scaler.fit_transform(X_train)
+X_test_scaled = scaler.transform(X_test)
+# -------------------------- Train Model --------------------------
+@st.cache_resource
+def train_model():
+    model = RandomForestClassifier(
+        n_estimators=200,
+        random_state=42,
+        n_jobs=-1
+    )
+    model.fit(X_train_scaled, y_train)
+    return model
+model = train_model()
+# Predictions & accuracy
+y_pred = model.predict(X_test_scaled)
+accuracy = accuracy_score(y_test, y_pred)
+st.success(f"Model Accuracy: *{accuracy:.4f}* ({accuracy*100:.2f}%)")
+# -------------------------- Interactive Prediction --------------------------
+st.header("Predict quality of a new wine")
+cols = st.columns(3)
+input_data = {}
+features = X.columns.tolist()
+for i, feature in enumerate(features):
+    with cols[i % 3]:
+        val = st.slider(
+            feature,
+            float(X[feature].min()),
+            float(X[feature].max()),
+            float(X[feature].mean())
+        )
+        input_data[feature] = val
+if st.button("Predict Quality"):
+    input_df = pd.DataFrame([input_data])
+    input_scaled = scaler.transform(input_df)
+    pred = model.predict(input_scaled)[0]
+    prob = model.predict_proba(input_scaled)[0]
+    if pred == 1:
+        st.balloons()
+        st.success(f"*Good wine!* 🍾 (confidence: {prob[1]:.2%})")
+    else:
+        st.error(f"*Not great wine* 😢 (confidence: {prob[0]:.2%})")