Transformer-PINN / train.py

Upload 5 files

5e4dee3 verified 3 months ago

11.4 kB

	import os
	import numpy as np
	import torch
	import matplotlib.pyplot as plt
	from sklearn.model_selection import train_test_split
	import pickle

	from data_loader import CrackDataLoader, DamageCalculator
	from model import CrackTransformerPINN, CrackPINNTrainer


	def plot_training_history(trainer, save_path=None):
	fig, axes = plt.subplots(1, 3, figsize=(15, 4))

	axes[0].plot(trainer.train_losses, label='Train Loss', linewidth=2)
	axes[0].plot(trainer.val_losses, label='Val Loss', linewidth=2)
	axes[0].set_xlabel('Epoch', fontsize=12)
	axes[0].set_ylabel('Loss', fontsize=12)
	axes[0].set_title('Training History', fontsize=14, fontweight='bold')
	axes[0].legend()
	axes[0].grid(True, alpha=0.3)

	axes[1].semilogy(trainer.train_losses, label='Train Loss', linewidth=2)
	axes[1].semilogy(trainer.val_losses, label='Val Loss', linewidth=2)
	axes[1].set_xlabel('Epoch', fontsize=12)
	axes[1].set_ylabel('Loss (log scale)', fontsize=12)
	axes[1].set_title('Training History (Log Scale)', fontsize=14, fontweight='bold')
	axes[1].legend()
	axes[1].grid(True, alpha=0.3)

	if len(trainer.train_losses) > 1:
	train_improvement = np.diff(trainer.train_losses)
	axes[2].plot(train_improvement, linewidth=2, alpha=0.7)
	axes[2].axhline(y=0, color='r', linestyle='--', alpha=0.5)
	axes[2].set_xlabel('Epoch', fontsize=12)
	axes[2].set_ylabel('Loss Change', fontsize=12)
	axes[2].set_title('Convergence Rate', fontsize=14, fontweight='bold')
	axes[2].grid(True, alpha=0.3)

	plt.tight_layout()

	if save_path:
	plt.savefig(save_path, dpi=300, bbox_inches='tight')
	print(f"Training history saved to: {save_path}")

	plt.close()


	def plot_prediction_examples(X_test, y_test, trainer, angle_bins, loader, n_examples=4, save_path=None):
	X_test_original = loader.scaler_X.inverse_transform(X_test)
	y_test_original = loader.scaler_y.inverse_transform(y_test)

	y_pred_norm, pred_totals = trainer.predict(X_test[:n_examples])
	y_pred = loader.scaler_y.inverse_transform(y_pred_norm)

	fig, axes = plt.subplots(2, 2, figsize=(14, 10), subplot_kw=dict(projection='polar'))
	axes = axes.flatten()

	for i in range(min(n_examples, len(axes))):
	ax = axes[i]

	theta = np.deg2rad(angle_bins)

	ax.plot(theta, y_test_original[i], 'o-', label='True', linewidth=2, markersize=4, alpha=0.7)
	ax.plot(theta, y_pred[i], 's-', label='Predicted', linewidth=2, markersize=3, alpha=0.7)

	pH = X_test_original[i, 0]
	FN = X_test_original[i, 1]
	FT = X_test_original[i, 2]
	T = X_test_original[i, 3]
	phase = X_test_original[i, 4]
	phase_str = "Unstable" if phase < 0.5 else "Peak"

	D0 = DamageCalculator.compute_total_damage(pH, FN, FT, T)
	lambda_coef = DamageCalculator.compute_lambda(D0)

	true_total = y_test_original[i].sum()
	pred_total = y_pred[i].sum()

	title = f"pH={pH:.0f}, FN={FN:.0f}, FT={FT:.0f}, T={T:.0f}C\n"
	title += f"D0={D0:.3f}, lambda={lambda_coef:.3f}\n"
	title += f"{phase_str} \| True: {true_total:.0f}, Pred: {pred_total:.0f}"

	ax.set_title(title, fontsize=9, pad=20)
	ax.legend(loc='upper right', fontsize=8)
	ax.set_theta_zero_location('N')
	ax.set_theta_direction(-1)
	ax.grid(True, alpha=0.3)

	plt.tight_layout()

	if save_path:
	plt.savefig(save_path, dpi=300, bbox_inches='tight')
	print(f"Prediction examples saved to: {save_path}")

	plt.close()


	def plot_damage_analysis(X, y, save_path=None):
	fig, axes = plt.subplots(2, 2, figsize=(12, 10))

	D0_values = []
	total_cracks = y.sum(axis=1)

	for i in range(X.shape[0]):
	D0 = DamageCalculator.compute_total_damage(X[i, 0], X[i, 1], X[i, 2], X[i, 3])
	D0_values.append(D0)

	D0_values = np.array(D0_values)

	axes[0, 0].scatter(D0_values, total_cracks, alpha=0.6, edgecolors='black', linewidth=0.5)
	axes[0, 0].set_xlabel('Initial Damage Factor D0', fontsize=12)
	axes[0, 0].set_ylabel('Total Crack Count', fontsize=12)
	axes[0, 0].set_title('D0 vs Total Cracks', fontsize=14, fontweight='bold')
	axes[0, 0].grid(True, alpha=0.3)

	axes[0, 1].scatter(X[:, 0], total_cracks, alpha=0.6, c=D0_values, cmap='viridis')
	axes[0, 1].set_xlabel('pH Value', fontsize=12)
	axes[0, 1].set_ylabel('Total Crack Count', fontsize=12)
	axes[0, 1].set_title('pH vs Total Cracks', fontsize=14, fontweight='bold')
	axes[0, 1].grid(True, alpha=0.3)

	axes[1, 0].scatter(X[:, 1], total_cracks, alpha=0.6, c=D0_values, cmap='viridis')
	axes[1, 0].set_xlabel('Freeze-thaw Cycles (FN)', fontsize=12)
	axes[1, 0].set_ylabel('Total Crack Count', fontsize=12)
	axes[1, 0].set_title('FN vs Total Cracks', fontsize=14, fontweight='bold')
	axes[1, 0].grid(True, alpha=0.3)

	scatter = axes[1, 1].scatter(X[:, 3], total_cracks, alpha=0.6, c=D0_values, cmap='viridis')
	axes[1, 1].set_xlabel('Damage Temperature (T)', fontsize=12)
	axes[1, 1].set_ylabel('Total Crack Count', fontsize=12)
	axes[1, 1].set_title('T vs Total Cracks', fontsize=14, fontweight='bold')
	axes[1, 1].grid(True, alpha=0.3)

	plt.colorbar(scatter, ax=axes[1, 1], label='D0')

	plt.tight_layout()

	if save_path:
	plt.savefig(save_path, dpi=300, bbox_inches='tight')
	print(f"Damage analysis saved to: {save_path}")

	plt.close()


	def main():
	print("=" * 80)
	print("Transformer-PINN Crack Prediction Model")
	print("Based on: Mechanism of micro-damage evolution in rocks")
	print("under multiple coupled cyclic stresses")
	print("=" * 80)

	base_path = "./data"
	output_dir = "./output"

	if not os.path.exists(output_dir):
	os.makedirs(output_dir)

	print("\n" + "=" * 80)
	print("Step 1: Loading/Generating Data")
	print("=" * 80)

	loader = CrackDataLoader(base_path, stress_type="major")

	try:
	X, y, angle_bins, damage_list = loader.load_all_data(phase="both")
	except:
	print("Real data not found. Generating synthetic data...")
	X, y, angle_bins = loader.create_synthetic_data(n_samples=200, output_dim=72)

	stats = loader.get_statistics(X, y)
	print("\nData statistics:")
	for key, value in stats.items():
	print(f" {key}: {value}")

	print("\n" + "=" * 80)
	print("Step 2: Splitting Dataset (Train:Val:Test = 64:16:20)")
	print("=" * 80)

	X_train, X_test, y_train, y_test = train_test_split(
	X, y, test_size=0.2, random_state=42
	)

	X_train, X_val, y_train, y_val = train_test_split(
	X_train, y_train, test_size=0.2, random_state=42
	)

	print(f"Training set: {X_train.shape[0]} samples")
	print(f"Validation set: {X_val.shape[0]} samples")
	print(f"Test set: {X_test.shape[0]} samples")

	print("\n" + "=" * 80)
	print("Step 3: Normalizing Data")
	print("=" * 80)

	X_train_norm, y_train_norm, X_val_norm, y_val_norm = loader.normalize_data(
	X_train, y_train, X_val, y_val
	)

	X_test_norm = loader.scaler_X.transform(X_test)
	y_test_norm = loader.scaler_y.transform(y_test)

	print("Normalization complete")

	print("\n" + "=" * 80)
	print("Step 4: Creating Model")
	print("=" * 80)

	device = 'cuda' if torch.cuda.is_available() else 'cpu'
	print(f"Using device: {device}")

	model = CrackTransformerPINN(
	input_dim=5,
	output_dim=y.shape[1],
	hidden_dims=[128, 256, 256, 128],
	dropout=0.2
	)

	n_params = sum(p.numel() for p in model.parameters())
	print(f"Model parameters: {n_params:,}")

	print("\nModel components:")
	print(" - Transformer Encoder (8 heads, 4 layers)")
	print(" - Mogi-Coulomb Yield Criterion Layer")
	print(" - Weibull Strength Distribution Layer")
	print(" - Energy-based Damage Evolution Layer")
	print(" - PINN Decoder with Physics Constraints")

	print("\n" + "=" * 80)
	print("Step 5: Training Model")
	print("=" * 80)

	trainer = CrackPINNTrainer(
	model,
	device=device,
	lr=1e-3,
	weight_decay=1e-4
	)

	trainer.fit(
	X_train_norm, y_train_norm,
	X_val_norm, y_val_norm,
	epochs=300,
	batch_size=8,
	patience=50
	)

	print("\n" + "=" * 80)
	print("Step 6: Testing Model")
	print("=" * 80)

	test_loss, test_metrics = trainer.validate(
	torch.utils.data.DataLoader(
	torch.utils.data.TensorDataset(
	torch.FloatTensor(X_test_norm),
	torch.FloatTensor(y_test_norm)
	),
	batch_size=8,
	shuffle=False
	)
	)

	print(f"Test set performance:")
	print(f" Loss: {test_loss:.4f}")
	print(f" R2: {test_metrics['r2']:.4f}")
	print(f" RMSE: {test_metrics['rmse']:.2f}")
	print(f" Total Count MAE: {test_metrics['total_count_mae']:.2f}")

	print("\n" + "=" * 80)
	print("Step 7: Saving Model")
	print("=" * 80)

	model_path = os.path.join(output_dir, "crack_transformer_pinn.pth")
	torch.save({
	'model_state_dict': model.state_dict(),
	'model_config': {
	'input_dim': 5,
	'output_dim': y.shape[1],
	'hidden_dims': [128, 256, 256, 128],
	'dropout': 0.2
	},
	'test_metrics': test_metrics
	}, model_path)
	print(f"Model saved to: {model_path}")

	scaler_path = os.path.join(output_dir, "scalers.pkl")
	with open(scaler_path, 'wb') as f:
	pickle.dump({
	'scaler_X': loader.scaler_X,
	'scaler_y': loader.scaler_y,
	'angle_bins': angle_bins
	}, f)
	print(f"Scalers saved to: {scaler_path}")

	print("\n" + "=" * 80)
	print("Step 8: Generating Visualizations")
	print("=" * 80)

	history_path = os.path.join(output_dir, "training_history.png")
	plot_training_history(trainer, save_path=history_path)

	examples_path = os.path.join(output_dir, "prediction_examples.png")
	plot_prediction_examples(
	X_test_norm, y_test_norm,
	trainer, angle_bins, loader,
	n_examples=4,
	save_path=examples_path
	)

	damage_path = os.path.join(output_dir, "damage_analysis.png")
	plot_damage_analysis(X, y, save_path=damage_path)

	print("\n" + "=" * 80)
	print("Training Pipeline Complete!")
	print("=" * 80)
	print(f"\nGenerated files:")
	print(f" 1. Model checkpoint: {model_path}")
	print(f" 2. Scalers: {scaler_path}")
	print(f" 3. Training history: {history_path}")
	print(f" 4. Prediction examples: {examples_path}")
	print(f" 5. Damage analysis: {damage_path}")

	print("\nPhysics constraints applied:")
	print(" - Mogi-Coulomb yield criterion: tau_oct = C1 + C2 * sigma_m2")
	print(" - Weibull strength: D_q = 1 - exp(-(F/F0)^m)")
	print(" - Energy damage: D_n = (2/pi) * arctan(b * U_p)")
	print(" - Total damage: D_total = 1 - (1-D_ft)(1-D_ch)(1-D_th)")


	if __name__ == "__main__":
	main()