Spaces:

MGonzalez117
/

ai-engineer-p8

Sleeping

CI Bot

CI deploy Thu Nov 20 12:51:31 UTC 2025

ad86b94 5 months ago

1.06 kB

	import src.ml.pipeline as preparation
	import src.ml.model as model
	from pathlib import Path
	import pandas as pd

	# 1. données brutes
	app_train, bureau = preparation.load_raw_data()

	# 1bis. Séparer X et y AVANT le pipeline
	y = app_train["TARGET"]
	X = app_train.drop(columns=["TARGET"])

	# 2. instancier le pipeline
	pipeline = preparation.ApplicationBureauPipeline()

	# 3. fit + transform sur X uniquement (sans TARGET)
	pipeline.fit(X, bureau)
	X_processed = pipeline.transform(X, bureau)

	# 4. sauvegarde pipeline
	preparation.save_preprocessing_pipeline(pipeline)

	# 5. sauvegarde données transformées pour train_model
	Path('.data/ml').mkdir(parents=True, exist_ok=True)
	df_out = pd.DataFrame(X_processed)

	# on rajoute la target dans le app_train :
	df_out["TARGET"] = y.values
	df_out.to_csv('.data/ml/app_train.csv', index=False)

	print("Préprocessing terminé et pipeline sauvegardée.")

	# 6. entraînement modèle (qui lit .data/ml/app_train.csv)
	results = model.train_model()
	print("Modèle entraîné et sauvegardé.")