Spaces:

Haticece
/

HomePricePredictor

Sleeping

App Files Files Community

Haticece commited on Jan 1, 2025

Commit

8ba1a3a

verified ·

1 Parent(s): 76a8a5c

Update app.py

Browse files

Files changed (1) hide show

app.py +53 -88

app.py CHANGED Viewed

@@ -1,97 +1,62 @@
 import streamlit as st
 import pandas as pd
 from sklearn.model_selection import train_test_split
 from sklearn.linear_model import LinearRegression
-from sklearn.metrics import mean_squared_error
-from sklearn.preprocessing import OneHotEncoder
-from sklearn.compose import ColumnTransformer
-st.title("Ev Fiyatı Tahmin Uygulaması")
-# Adım 1: Veri Girişi (CSV yerine manuel giriş)
-st.header("Adım 1: Veri Girişi")
-# Kullanıcıdan özellik sayısını al
-num_features = st.number_input("Kaç özellik gireceksiniz?", min_value=1, value=5)
-# Özellik adlarını ve tiplerini belirle
-features_info = []
-for i in range(num_features):
-    col_name = st.text_input(f"Özellik {i+1} adını girin", f"Özellik_{i+1}")
-    col_type = st.selectbox(f"{col_name} tipini seçin", ["Sayısal", "Kategorik"], key=f"type_{i}")
-    features_info.append((col_name, col_type))
-# Hedef değişken adını al
-target = st.text_input("Hedef değişkenin (Ev fiyatı) adını girin", "Fiyat")
-# Veri girişi için boş bir DataFrame oluştur
-data = pd.DataFrame()
-# Kullanıcıdan veri girişi al
-st.subheader("Örnek Veri Girişi")
-for col_name, col_type in features_info:
-    if col_type == "Sayısal":
-        value = st.number_input(f"{col_name} değeri girin", key=f"val_{col_name}")
-    else:  # Kategorik
-        options = st.text_input(f"{col_name} için olası değerleri virgülle ayırarak girin (örn. A,B,C)", key=f"opt_{col_name}")
-        options_list = [option.strip() for option in options.split(',')]
-        value = st.selectbox(f"{col_name} seçin", options_list, key=f"sel_{col_name}")
-    data[col_name] = [value]
-# Hedef değişken için de giriş al
-target_value = st.number_input(f"{target} değeri girin", key="target_val")
-data[target] = [target_value]
-st.write("Girilen Veri:", data)
-# Adım 2: Veri Ön İşleme
-st.header("Adım 2: Veri Ön İşleme")
-if not data.empty:
-    X = data.drop(columns=[target])
-    y = data[target]
-    # Kategorik sütunları işle
-    categorical_features = [col_name for col_name, col_type in features_info if col_type == "Kategorik"]
-    column_transformer = ColumnTransformer(
-        transformers=[
-            ('cat', OneHotEncoder(handle_unknown='ignore'), categorical_features)
-        ],
-        remainder='passthrough'
-    )
-    X = column_transformer.fit_transform(X)
-    # Veri bölme (eğitim için daha fazla veri gerektiğinde burayı düzenleyebilirsiniz)
-    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
-    # Model eğitimi
     model = LinearRegression()
     model.fit(X_train, y_train)
-    # Model değerlendirmesi (yalnızca yeterli veri varsa)
-    if len(X_test) > 0:
-        y_pred = model.predict(X_test)
-        mse = mean_squared_error(y_test, y_pred)
-        st.write(f"Ortalama Kare Hata (MSE): {mse:.2f}")
-    else:
-        st.write("Model değerlendirmesi için yeterli veri yok.")
-    # Adım 3: Tahmin Yapma
-    st.header("Adım 3: Tahmin Yapın")
-    user_input = []
-    for col_name, col_type in features_info:
-        if col_type == "Sayısal":
-            value = st.number_input(f"Tahmin için {col_name} değeri girin", value=0.0, key=f"pred_{col_name}")
-        else:
-            options = [option.strip() for option in st.session_state[f"opt_{col_name}"].split(',')]
-            value = st.selectbox(f"Tahmin için {col_name} seçin", options, key=f"pred_{col_name}")
-        user_input.append(value)
-    if len(user_input) == len(features_info):
-        user_input_df = pd.DataFrame([user_input], columns=[col_name for col_name, _ in features_info])
-        user_input_processed = column_transformer.transform(user_input_df)
-        prediction = model.predict(user_input_processed)
-        st.write(f"Ev fiyatı tahmini: {prediction[0]:.2f}")
-else:
-    st.write("Lütfen önce veri girişi yapın.")

 import streamlit as st
 import pandas as pd
+import numpy as np
 from sklearn.model_selection import train_test_split
+from sklearn.preprocessing import StandardScaler
 from sklearn.linear_model import LinearRegression
+from sklearn.metrics import r2_score
+# Veri Yükleme ve Ön İşleme (Kaggle Notebook'tan uyarlanmıştır)
+@st.cache_data
+def load_and_preprocess_data():
+    data = pd.read_csv('Housing.csv')
+    # Gereksiz sütunu sil
+    data.drop('date', axis=1, inplace=True)
+    # Aykırı değerleri işle
+    data = data[data['bedrooms'] != 33]
+    # Saçma değerleri düzelt
+    data.loc[data['bathrooms'] == 0, 'bathrooms'] = 1
+    data.loc[data['bedrooms'] == 0, 'bedrooms'] = 1
+    # Kategorik sütunlar için binary encoding
+    binary_columns = ['waterfront', 'view', 'condition']
+    def binary_encode(df, column, positive_value):
+        df[column] = df[column].apply(lambda x: 1 if x == positive_value else 0)
+    for col in binary_columns:
+        binary_encode(data, col, data[col].max())
+    # Log dönüşümü
+    data['sqft_living'] = np.log(data['sqft_living'])
+    data['sqft_lot'] = np.log(data['sqft_lot'])
+    data['sqft_above'] = np.log(data['sqft_above'])
+    data.loc[data['sqft_basement'] != 0, 'sqft_basement'] = np.log(data.loc[data['sqft_basement'] != 0, 'sqft_basement'])
+    # Normalleştirme
+    scaler = StandardScaler()
+    numerical_cols = ['bedrooms', 'bathrooms', 'sqft_living', 'sqft_lot', 'sqft_above', 'sqft_basement']
+    data[numerical_cols] = scaler.fit_transform(data[numerical_cols])
+    return data
+data = load_and_preprocess_data()
+# Model Eğitimi
+@st.cache_data
+def train_model(data):
+    X = data.drop('price', axis=1)
+    y = data['price']
+    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=7)
     model = LinearRegression()
     model.fit(X_train, y_train)
+    return model, X_test, y_test
+model, X_test, y_test = train_model(data)
+# Streamlit Arayüzü
+st.title("Ev Fiyatı Tahmin Uygulaması")
+# Kenar Çubuğu Filtreleri
+st.sidebar.header("Filtreler")