File size: 1,727 Bytes
44b8cf0 3ca6783 db81253 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 | ---
library_name: scikit-learn
tags:
- sklearn
- titanic
---
# Zmienne użyte w modelu
- Pclass (Passenger Class): Klasa biletu, która jest również wyznacznikiem statusu socjoekonomicznego.
- 1 = 1. klasa (Upper)
- 2 = 2. klasa (Middle)
- 3 = 3. klasa (Lower)
- Sex: Płeć pasażera (male – mężczyzna, female – kobieta).
- Age: Wiek w latach. Jeśli wiek jest mniejszy niż 1, jest podany jako ułamek (np. 0.5).
- SibSp (Siblings/Spouses): Liczba rodzeństwa (brother, sister, stepbrother, stepsister) lub małżonków (husband, wife) na pokładzie.
- Parch (Parents/Children): Liczba rodziców (mother, father) lub dzieci (daughter, son, stepdaughter, stepson) na pokładzie. Niektóre dzieci podróżowały tylko z nianią, więc miały wartość 0.
- Fare: Opłata za bilet (cena w funtach brytyjskich).
- Embarked: Port zaokrętowania, czyli miejsce, w którym pasażer wsiadł na statek:
- C = Cherbourg
- Q = Queenstown
- S = Southampton
Przykład użycia modelu:
```python
import joblib
import pandas as pd
from huggingface_hub import hf_hub_download
import numpy as np
repo_id = "studentscolab/titanic"
model_path = hf_hub_download(repo_id=repo_id, filename="model.joblib")
model = joblib.load(model_path)
sample_data = pd.DataFrame([
{'Pclass': 3, 'Sex': 'male', 'Age': 25, 'SibSp': 0, 'Parch': 0, 'Fare': 7.5, 'Embarked': 'S'},
{'Pclass': 1, 'Sex': 'female', 'Age': 35, 'SibSp': 1, 'Parch': 0, 'Fare': 1.5, 'Embarked': 'S'}
])
np.set_printoptions(precision=10, suppress=True)
print(sample_data)
prediction = model.predict(sample_data)
for p in prediction:
print(f"Prognoza dla danych próbnych [{p}]: {'przeżył' if prediction[p] == 1 else 'nie przeżył'}")
``` |