docs: Write README.md
Browse files
README.md
CHANGED
|
@@ -1,3 +1,66 @@
|
|
| 1 |
-
---
|
| 2 |
-
license: mit
|
| 3 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
---
|
| 2 |
+
license: mit
|
| 3 |
+
language: ko
|
| 4 |
+
tags:
|
| 5 |
+
- regression
|
| 6 |
+
- pytorch
|
| 7 |
+
- xgboost
|
| 8 |
+
- sports-car
|
| 9 |
+
---
|
| 10 |
+
|
| 11 |
+
# ์คํฌ์ธ ์นด ๊ฐ๊ฒฉ ๋ฐ ์ฑ๋ฅ ์์ธก ๋ชจ๋ธ
|
| 12 |
+
|
| 13 |
+
์ด ๋ชจ๋ธ์ ์คํฌ์ธ ์นด์ ๋ค์ํ ์คํ(์ ์กฐ์ฌ, ์ฐ์, ์์ง ํฌ๊ธฐ ๋ฑ)์ ๊ธฐ๋ฐ์ผ๋ก **๊ฐ๊ฒฉ, ๋ง๋ ฅ, ์ ๋ก๋ฐฑ**์ ์์ธกํ๋ ๋ฅ๋ฌ๋ ๋ฐ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ํฌํจํ๊ณ ์๋ค.
|
| 14 |
+
|
| 15 |
+
## ํ๋ก์ ํธ ๊ฐ์
|
| 16 |
+
|
| 17 |
+
๋ค์ํ ์คํฌ์ธ ์นด ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๊ณ , ์ต์ ์ ์์ธก ๋ชจ๋ธ์ ์ฐพ๊ธฐ ์ํด ๋ค์๊ณผ ๊ฐ์ ๊ณผ์ ์ ๊ฑฐ์ณค๋ค.
|
| 18 |
+
1. ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๋ฐ ํผ์ฒ ์์ง๋์ด๋ง (GroupBy ํ์ฉ)
|
| 19 |
+
2. **๋ฅ๋ฌ๋(TensorFlow/Keras)** ๋ฐ **๋จธ์ ๋ฌ๋(XGBoost)** ๋ชจ๋ธ ๊ตฌ์ถ
|
| 20 |
+
3. ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋์ ํตํ ๋ชจ๋ธ ์ต์ ํ
|
| 21 |
+
4. ๋ ๋ชจ๋ธ์ ์ฑ๋ฅ(MSE) ๋น๊ต ๋ฐ ์ต์ข
๋ชจ๋ธ ์ ์
|
| 22 |
+
|
| 23 |
+
## ๋ชจ๋ธ (Models)
|
| 24 |
+
|
| 25 |
+
์ด ํ๋ก์ ํธ๋ ๋ ๊ฐ์ง ์ต์ ํ๋ ๋ชจ๋ธ์ ์ ๊ณตํ๋ค.
|
| 26 |
+
|
| 27 |
+
| ๋ชจ๋ธ ์ข
๋ฅ | ํ์ผ๋ช
| ์ฃผ์ ํน์ง |
|
| 28 |
+
| :--- | :--- | :--- |
|
| 29 |
+
| **๋ฅ๋ฌ๋ (Keras)** | `best_model.keras` | ReLU ํ์ฑํ ํจ์์ Dropout์ ์ฌ์ฉํ 3-Layer ์ ๊ฒฝ๋ง |
|
| 30 |
+
| **๋จธ์ ๋ฌ๋ (XGBoost)**| `xgboost-model.skops`| ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋์ผ๋ก ์ต์ ํ๋ Gradient Boosting ๋ชจ๋ธ |
|
| 31 |
+
|
| 32 |
+
### ๋ชจ๋ธ ๊ตฌ์กฐ (๋ฅ๋ฌ๋)
|
| 33 |
+

|
| 34 |
+
|
| 35 |
+
## ๐ ๋ฐ์ดํฐ์
(Dataset)
|
| 36 |
+
|
| 37 |
+
- **๋ฐ์ดํฐ ์ถ์ฒ**: [Sports Car Price Dataset on Kaggle](https://www.kaggle.com/datasets/kikun1234/sports-car-prices-dataset) (์์ ๋งํฌ)
|
| 38 |
+
- **ํ๊ฒ ๋ณ์ (์์ธก ๋์)**: `๊ฐ๊ฒฉ(์ํ)`, `๋ง๋ ฅ`, `์ ๋ก๋ฐฑ (0-100km)`
|
| 39 |
+
- **์ฃผ์ ํผ์ฒ**: `์ ์กฐ์ฌ`, `๋ชจ๋ธ`, `์ฐ์`, `์์ง ํฌ๊ธฐ`, `ํ ํฌ` ๋ฑ
|
| 40 |
+
|
| 41 |
+
## ๐ ๏ธ ์ฌ์ฉ ๋ฐฉ๋ฒ
|
| 42 |
+
|
| 43 |
+
์ด ๋ชจ๋ธ์ ๋ถ๋ฌ์ ์ฌ์ฉํ๋ ค๋ฉด `tensorflow`, `xgboost`, `scikit-learn`, `skops` ๋ผ์ด๋ธ๋ฌ๋ฆฌ๊ฐ ํ์ํ๋ค.
|
| 44 |
+
|
| 45 |
+
**XGBoost ๋ชจ๋ธ ๋ถ๋ฌ์ค๊ธฐ ๋ฐ ์์ธก**
|
| 46 |
+
```python
|
| 47 |
+
import skops.io as sio
|
| 48 |
+
|
| 49 |
+
# ์ ์ฅ์์์ ๋ชจ๋ธ์ ์ง์ ๋ถ๋ฌ์ฌ ์ ์๋ค (๋๋ ๋ค์ด๋ก๋ ํ)
|
| 50 |
+
# loaded_model = sio.load("hf://your-hf-username/your-repo-name/xgboost-model.skops")
|
| 51 |
+
loaded_model = sio.load("xgboost-model.skops")
|
| 52 |
+
|
| 53 |
+
# ์์ธกํ ๋ฐ์ดํฐ๋ฅผ ์ค๋นํ๋ค (์ ์ฒ๋ฆฌ ๋ฐ ์ค์ผ์ผ๋ง ํ์)
|
| 54 |
+
# preprocessed_data = ...
|
| 55 |
+
# prediction = loaded_model.predict(preprocessed_data)
|
| 56 |
+
# print(prediction)
|
| 57 |
+
```
|
| 58 |
+
|
| 59 |
+
## ๐ ์ต์ข
์ฑ๋ฅ
|
| 60 |
+
|
| 61 |
+
ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋ ํ, ๋ ๋ชจ๋ธ์ ํ
์คํธ ๋ฐ์ดํฐ์
์ ๋ํ **ํ๊ท ์ ๊ณฑ ์ค์ฐจ(MSE)**๋ ๋ค์๊ณผ ๊ฐ๋ค.
|
| 62 |
+
|
| 63 |
+
- **(ํ๋) ๋ฅ๋ฌ๋ ๋ชจ๋ธ MSE**: `0.010617`
|
| 64 |
+
- **(ํ๋) XGBoost ๋ชจ๋ธ MSE**: `0.010617`
|
| 65 |
+
|
| 66 |
+
๋ ๋ชจ๋ธ์ด ๊ฑฐ์ ๋์ผํ ์ต๊ณ ์ฑ๋ฅ์ ๊ธฐ๋กํ์ผ๋ฉฐ, ์ด๋ ๋ฐ์ดํฐ์ ํน์ฑ์ ๊ฐ๊ธฐ ๋ค๋ฅธ ๋ฐฉ์์ผ๋ก ์๋ฒฝํ๊ฒ ํ์ตํ์์ ์์ฌํ๋ค.
|