|
|
--- |
|
|
license: mit |
|
|
language: ko |
|
|
tags: |
|
|
- regression |
|
|
- pytorch |
|
|
- xgboost |
|
|
- sports-car |
|
|
--- |
|
|
|
|
|
# ์คํฌ์ธ ์นด ๊ฐ๊ฒฉ ๋ฐ ์ฑ๋ฅ ์์ธก ๋ชจ๋ธ |
|
|
|
|
|
์ด ๋ชจ๋ธ์ ์คํฌ์ธ ์นด์ ๋ค์ํ ์คํ(์ ์กฐ์ฌ, ์ฐ์, ์์ง ํฌ๊ธฐ ๋ฑ)์ ๊ธฐ๋ฐ์ผ๋ก **๊ฐ๊ฒฉ, ๋ง๋ ฅ, ์ ๋ก๋ฐฑ**์ ์์ธกํ๋ ๋ฅ๋ฌ๋ ๋ฐ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ํฌํจํ๊ณ ์๋ค. |
|
|
|
|
|
## ํ๋ก์ ํธ ๊ฐ์ |
|
|
|
|
|
๋ค์ํ ์คํฌ์ธ ์นด ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๊ณ , ์ต์ ์ ์์ธก ๋ชจ๋ธ์ ์ฐพ๊ธฐ ์ํด ๋ค์๊ณผ ๊ฐ์ ๊ณผ์ ์ ๊ฑฐ์ณค๋ค. |
|
|
1. ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๋ฐ ํผ์ฒ ์์ง๋์ด๋ง (GroupBy ํ์ฉ) |
|
|
2. **๋ฅ๋ฌ๋(TensorFlow/Keras)** ๋ฐ **๋จธ์ ๋ฌ๋(XGBoost)** ๋ชจ๋ธ ๊ตฌ์ถ |
|
|
3. ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋์ ํตํ ๋ชจ๋ธ ์ต์ ํ |
|
|
4. ๋ ๋ชจ๋ธ์ ์ฑ๋ฅ(MSE) ๋น๊ต ๋ฐ ์ต์ข
๋ชจ๋ธ ์ ์ |
|
|
|
|
|
## ๋ชจ๋ธ (Models) |
|
|
|
|
|
์ด ํ๋ก์ ํธ๋ ๋ ๊ฐ์ง ์ต์ ํ๋ ๋ชจ๋ธ์ ์ ๊ณตํ๋ค. |
|
|
|
|
|
| ๋ชจ๋ธ ์ข
๋ฅ | ํ์ผ๋ช
| ์ฃผ์ ํน์ง | |
|
|
| :--- | :--- | :--- | |
|
|
| **๋ฅ๋ฌ๋ (Keras)** | `best_model.keras` | ReLU ํ์ฑํ ํจ์์ Dropout์ ์ฌ์ฉํ 3-Layer ์ ๊ฒฝ๋ง | |
|
|
| **๋จธ์ ๋ฌ๋ (XGBoost)**| `xgboost-model.skops`| ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋์ผ๋ก ์ต์ ํ๋ Gradient Boosting ๋ชจ๋ธ | |
|
|
|
|
|
### ๋ชจ๋ธ ๊ตฌ์กฐ (๋ฅ๋ฌ๋) |
|
|
 |
|
|
|
|
|
## ๋ฐ์ดํฐ์
(Dataset) |
|
|
|
|
|
- **๋ฐ์ดํฐ ์ถ์ฒ**: [Sports Car Price Dataset on Kaggle](https://www.kaggle.com/datasets/rkiattisak/sports-car-prices-dataset/data) (์์ ๋งํฌ) |
|
|
- **ํ๊ฒ ๋ณ์ (์์ธก ๋์)**: `๊ฐ๊ฒฉ(์ํ)`, `๋ง๋ ฅ`, `์ ๋ก๋ฐฑ (0-100km)` |
|
|
- **์ฃผ์ ํผ์ฒ**: `์ ์กฐ์ฌ`, `๋ชจ๋ธ`, `์ฐ์`, `์์ง ํฌ๊ธฐ`, `ํ ํฌ` ๋ฑ |
|
|
|
|
|
## ์ฌ์ฉ ๋ฐฉ๋ฒ |
|
|
|
|
|
์ด ๋ชจ๋ธ์ ๋ถ๋ฌ์ ์ฌ์ฉํ๋ ค๋ฉด `tensorflow`, `xgboost`, `scikit-learn`, `skops` ๋ผ์ด๋ธ๋ฌ๋ฆฌ๊ฐ ํ์ํ๋ค. |
|
|
|
|
|
**XGBoost ๋ชจ๋ธ ๋ถ๋ฌ์ค๊ธฐ ๋ฐ ์์ธก** |
|
|
```python |
|
|
import skops.io as sio |
|
|
|
|
|
# ์ ์ฅ์์์ ๋ชจ๋ธ์ ์ง์ ๋ถ๋ฌ์ฌ ์ ์๋ค (๋๋ ๋ค์ด๋ก๋ ํ) |
|
|
# loaded_model = sio.load("hf://your-hf-username/your-repo-name/xgboost-model.skops") |
|
|
loaded_model = sio.load("xgboost-model.skops") |
|
|
|
|
|
# ์์ธกํ ๋ฐ์ดํฐ๋ฅผ ์ค๋นํ๋ค (์ ์ฒ๋ฆฌ ๋ฐ ์ค์ผ์ผ๋ง ํ์) |
|
|
# preprocessed_data = ... |
|
|
# prediction = loaded_model.predict(preprocessed_data) |
|
|
# print(prediction) |
|
|
``` |
|
|
|
|
|
## ์ต์ข
์ฑ๋ฅ |
|
|
|
|
|
ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋ ํ, ๋ ๋ชจ๋ธ์ ํ
์คํธ ๋ฐ์ดํฐ์
์ ๋ํ ํ๊ท ์ ๊ณฑ ์ค์ฐจ(MSE)๋ ๋ค์๊ณผ ๊ฐ๋ค. |
|
|
|
|
|
- **(ํ๋) ๋ฅ๋ฌ๋ ๋ชจ๋ธ MSE**: `0.010617` |
|
|
- **(ํ๋) XGBoost ๋ชจ๋ธ MSE**: `0.010617` |
|
|
|
|
|
๋ ๋ชจ๋ธ์ด ๊ฑฐ์ ๋์ผํ ์ต๊ณ ์ฑ๋ฅ์ ๊ธฐ๋กํ์ผ๋ฉฐ, ์ด๋ ๋ฐ์ดํฐ์ ํน์ฑ์ ๊ฐ๊ธฐ ๋ค๋ฅธ ๋ฐฉ์์ผ๋ก ์๋ฒฝํ๊ฒ ํ์ตํ์์ ์์ฌํ๋ค. |
|
|
|