Spaces:

suzakudry
/

resNet0

Sleeping

App Files Files Community

resNet0 / train_predict.py

suzakudry

Upload 6 files

d426cb8 verified 10 months ago

raw

history blame contribute delete

51.1 kB

	# train_predict.py
	import torch
	import torch.nn as nn
	from torch.utils.data import DataLoader, random_split
	import numpy as np
	import matplotlib.pyplot as plt
	import os
	import joblib
	from pathlib import Path
	from PIL import Image
	import json

	# 从config.py导入配置
	from config import DATA_DIR, SCORE_FILE_NAME, MODEL_SAVE_BASE_PATH, \
	DEFAULT_BATCH_SIZE, DEFAULT_EPOCHS, DEFAULT_LR, \
	DEFAULT_DROPOUT_RATE, DEFAULT_WEIGHT_DECAY, DEFAULT_PCA_VARIANCE_RATIO, \
	DEFAULT_OPTIMIZER, DEFAULT_LR_SCHEDULER, DEFAULT_SCHEDULER_PATIENCE, \
	DEFAULT_SCHEDULER_FACTOR, DEFAULT_SCHEDULER_T_MAX, DEFAULT_LOSS_FUNCTION, \
	DEFAULT_EARLY_STOPPING_PATIENCE, VALIDATION_SPLIT_RATIO, DEFAULT_DATA_AUGMENTATION

	# 从其他模块导入
	from utils import ScoreDataset, get_transforms, get_image_size_by_model_name, calculate_metrics
	from feature_extractor import FeatureExtractor
	from regressors import PytorchRegressor, get_sklearn_model_pipeline, FullCNNRegressor

	# --- 配置 Matplotlib 支持中文 ---
	plt.rcParams['font.sans-serif'] = ['Microsoft YaHei', 'SimHei', 'Arial Unicode MS', 'DejaVu Sans']
	plt.rcParams['axes.unicode_minus'] = False


	# ------------------------------------

	class TrainingAndPredictionEngine:
	"""
	负责管理整个训练和预测流程的引擎。
	包含数据准备、模型切换、训练循环和预测功能。
	"""

	def __init__(self):
	self.device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
	print(f"PyTorch Version: {torch.__version__}")
	print(f"CUDA Available: {torch.cuda.is_available()}")
	if torch.cuda.is_available():
	print(f"CUDA Device Count: {torch.cuda.device_count()}")
	print(f"Current CUDA Device Name: {torch.cuda.get_device_name(0)}")

	self.feature_extractor = None
	self.pytorch_regressor = None
	self.full_cnn_regressor = None
	self.sklearn_regressor = None
	self.sklearn_feature_pipeline = None

	self.current_model_type = None
	self.active_base_cnn_name = None

	self.train_loss_history = []
	self.val_loss_history = []
	self.val_mse_history = []
	self.val_mae_history = []
	self.val_r2_history = []

	self.train_dataloader = None
	self.val_dataloader = None

	# 新增：保存数据集的 min_label 和 max_label，用于后续的反归一化
	self.dataset_min_label = 0.0
	self.dataset_max_label = 100.0

	# 保存训练时使用的超参数，以便保存和加载模型时使用
	self.last_trained_params = {
	"model_type": None,
	"base_cnn_name": None,
	"dropout_rate": DEFAULT_DROPOUT_RATE,
	"weight_decay": DEFAULT_WEIGHT_DECAY,
	"pca_variance_ratio": DEFAULT_PCA_VARIANCE_RATIO,
	"optimizer": DEFAULT_OPTIMIZER,
	"lr_scheduler": DEFAULT_LR_SCHEDULER,
	"scheduler_patience": DEFAULT_SCHEDULER_PATIENCE,
	"scheduler_factor": DEFAULT_SCHEDULER_FACTOR,
	"scheduler_t_max": DEFAULT_SCHEDULER_T_MAX,
	"loss_function": DEFAULT_LOSS_FUNCTION,
	"early_stopping_patience": DEFAULT_EARLY_STOPPING_PATIENCE,
	"validation_split_ratio": VALIDATION_SPLIT_RATIO,
	"batch_size": DEFAULT_BATCH_SIZE,
	"min_label": self.dataset_min_label, # 初始值
	"max_label": self.dataset_max_label, # 初始值
	"enable_augmentation": DEFAULT_DATA_AUGMENTATION
	}

	Path(os.path.dirname(MODEL_SAVE_BASE_PATH)).mkdir(exist_ok=True, parents=True)

	def _get_internal_model_name(self, ui_model_name):
	mapping = {
	"深度学习": "pytorch_detached",
	"端到端深度学习": "pytorch_full_cnn",
	"随机森林": "random_forest",
	"支持向量回归": "svr",
	"梯度提升回归": "gradient_boosting",
	"堆叠回归": "stacking",
	"K近邻": "knn", # <-- 新增
	"线性回归": "linear_regression" # <-- 新增
	}
	return mapping.get(ui_model_name, "unknown_model")

	def _get_optimizer(self, model_params, optimizer_name, lr, weight_decay):
	if optimizer_name == "Adam":
	return torch.optim.Adam(model_params, lr=lr, weight_decay=weight_decay)
	elif optimizer_name == "AdamW":
	return torch.optim.AdamW(model_params, lr=lr, weight_decay=weight_decay)
	elif optimizer_name == "SGD":
	# 对于SGD，通常需要动量，这里可以增加一个默认值或UI参数
	return torch.optim.SGD(model_params, lr=lr, momentum=0.9, weight_decay=weight_decay)
	else:
	raise ValueError(f"不支持的优化器: {optimizer_name}")

	def _get_lr_scheduler(self, optimizer, scheduler_name, patience, factor, t_max):
	if scheduler_name == "None":
	return None
	elif scheduler_name == "ReduceLROnPlateau":
	return torch.optim.lr_scheduler.ReduceLROnPlateau(optimizer, mode='min', patience=patience, factor=factor,
	verbose=True)
	elif scheduler_name == "CosineAnnealingLR":
	return torch.optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=t_max)
	else:
	raise ValueError(f"不支持的学习率调度器: {scheduler_name}")

	def _get_loss_function(self, loss_name):
	if loss_name == "MSELoss":
	return nn.MSELoss()
	elif loss_name == "L1Loss":
	return nn.L1Loss()
	elif loss_name == "SmoothL1Loss":
	return nn.SmoothL1Loss()
	else:
	raise ValueError(f"不支持的损失函数: {loss_name}")

	def switch_model_type(self, model_type_str, base_cnn_name="resnet50",
	dropout_rate=DEFAULT_DROPOUT_RATE,
	weight_decay=DEFAULT_WEIGHT_DECAY,
	pca_variance_ratio=DEFAULT_PCA_VARIANCE_RATIO,
	optimizer_name=DEFAULT_OPTIMIZER,
	lr_scheduler_name=DEFAULT_LR_SCHEDULER,
	scheduler_patience=DEFAULT_SCHEDULER_PATIENCE,
	scheduler_factor=DEFAULT_SCHEDULER_FACTOR,
	scheduler_t_max=DEFAULT_SCHEDULER_T_MAX,
	loss_function_name=DEFAULT_LOSS_FUNCTION,
	early_stopping_patience=DEFAULT_EARLY_STOPPING_PATIENCE,
	batch_size=DEFAULT_BATCH_SIZE,
	enable_augmentation=DEFAULT_DATA_AUGMENTATION
	):
	self.current_model_type = model_type_str
	self.active_base_cnn_name = base_cnn_name

	# 批量大小和验证集比例在 prepare_data_for_training 中会用到，需要先设置
	self.last_trained_params['batch_size'] = batch_size
	self.last_trained_params['validation_split_ratio'] = VALIDATION_SPLIT_RATIO # 确保这里是固定的值

	# 其他参数保存到实例变量，供训练和保存时使用
	self.last_trained_params.update({
	"model_type": model_type_str,
	"base_cnn_name": base_cnn_name,
	"dropout_rate": dropout_rate,
	"weight_decay": weight_decay,
	"pca_variance_ratio": pca_variance_ratio,
	"optimizer": optimizer_name,
	"lr_scheduler": lr_scheduler_name,
	"scheduler_patience": scheduler_patience,
	"scheduler_factor": scheduler_factor,
	"scheduler_t_max": scheduler_t_max,
	"loss_function": loss_function_name,
	"early_stopping_patience": early_stopping_patience,
	# min_label和max_label会在prepare_data_for_training中更新并保存
	"enable_augmentation": enable_augmentation
	})

	print(f"已切换到 {self.current_model_type} 模型模式, 基础CNN: {self.active_base_cnn_name}.")
	print(
	f"参数: BatchSize={batch_size}, Dropout={dropout_rate}, WeightDecay={weight_decay}, PCA={pca_variance_ratio},")
	print(
	f" Optimizer={optimizer_name}, Scheduler={lr_scheduler_name}, Loss={loss_function_name}, EarlyStopping={early_stopping_patience},")
	print(f" Data Augmentation: {enable_augmentation}")

	if self.current_model_type == "深度学习":
	self.feature_extractor = FeatureExtractor(model_name=self.active_base_cnn_name).to(self.device)
	self.feature_extractor.eval()
	feature_dim = self.feature_extractor.get_output_dim()
	self.pytorch_regressor = PytorchRegressor(in_features=feature_dim, dropout_rate=dropout_rate).to(
	self.device)
	self.full_cnn_regressor = None
	self.sklearn_regressor = None
	self.sklearn_feature_pipeline = None
	elif self.current_model_type == "端到端深度学习":
	self.full_cnn_regressor = FullCNNRegressor(model_name=self.active_base_cnn_name,
	dropout_rate=dropout_rate).to(self.device)
	self.feature_extractor = None
	self.pytorch_regressor = None
	self.sklearn_regressor = None
	self.sklearn_feature_pipeline = None
	else: # Sklearn模型
	self.feature_extractor = FeatureExtractor(model_name=self.active_base_cnn_name).to(self.device)
	self.feature_extractor.eval()
	self.sklearn_regressor, self.sklearn_feature_pipeline = \
	get_sklearn_model_pipeline(self.current_model_type, pca_variance_ratio=pca_variance_ratio)
	self.pytorch_regressor = None
	self.full_cnn_regressor = None

	return f"已切换到 {self.current_model_type} 模型模式, 基础CNN: {self.active_base_cnn_name}. 参数已设置。"

	def prepare_data_for_training(self):
	image_paths = []
	scores = []

	score_file_path = Path(DATA_DIR) / SCORE_FILE_NAME
	if not score_file_path.exists():
	return False, f"错误: 训练数据文件 {score_file_path} 不存在。请先在‘原始数据导入’或‘训练数据管理’标签页保存数据。"

	try:
	with open(score_file_path, 'r') as f:
	for line in f:
	filename, score_str = line.strip().split(',')
	full_image_path = Path(DATA_DIR) / filename
	if full_image_path.exists():
	image_paths.append(str(full_image_path))
	scores.append(float(score_str))
	else:
	print(f"警告: 图像文件 {full_image_path} 不存在，已跳过。")

	except Exception as e:
	return False, f"错误: 读取分数文件 {score_file_path} 为空或失败: {e}"

	if not image_paths:
	return False, "没有找到有效的图片数据用于训练。请检查 'data' 文件夹。"

	current_image_size = get_image_size_by_model_name(self.active_base_cnn_name)

	temp_dataset = ScoreDataset(image_paths, scores, transform=None)
	self.dataset_min_label = temp_dataset.min_label
	self.dataset_max_label = temp_dataset.max_label

	self.last_trained_params['min_label'] = self.dataset_min_label
	self.last_trained_params['max_label'] = self.dataset_max_label

	full_dataset = ScoreDataset(image_paths, scores,
	transform=get_transforms(train=True, image_size=current_image_size,
	enable_augmentation=self.last_trained_params[
	'enable_augmentation']))

	num_total = len(full_dataset)
	num_val = int(self.last_trained_params['validation_split_ratio'] * num_total)
	num_train = num_total - num_val

	if num_train < 1:
	return False, f"错误: 训练集样本数量不足1。总数据量: {num_total}, 训练集: {num_train}，请增加数据量或调整验证集比例。"

	if num_total <= 1:
	num_train = num_total
	num_val = 0
	print(f"警告: 总样本数过少({num_total})，不进行验证集划分。")
	elif num_val < 1:
	print(f"警告: 验证集样本数量不足1 ({num_val})。总数据量: {num_total}。验证集可能无法进行评估。")

	try:
	train_dataset, val_dataset = random_split(full_dataset, [num_train, num_val],
	generator=torch.Generator().manual_seed(42))
	except ValueError as e:
	return False, f"数据划分失败: {e}。请检查数据量({num_total})和划分比例({self.last_trained_params['validation_split_ratio']})。"

	self.train_dataloader = DataLoader(
	train_dataset,
	batch_size=self.last_trained_params['batch_size'],
	shuffle=True,
	num_workers=os.cpu_count() // 2 or 1,
	drop_last=True
	)
	if len(self.train_dataloader) == 0:
	return False, f"错误: 训练数据加载器为空。训练集样本数量: {len(train_dataset)}, 批量大小: {self.last_trained_params['batch_size']}。请减小批量大小或增加训练集样本。"

	self.val_dataloader = DataLoader(
	val_dataset,
	batch_size=self.last_trained_params['batch_size'],
	shuffle=False,
	num_workers=os.cpu_count() // 2 or 1,
	drop_last=False
	)
	if len(val_dataset) > 0 and len(self.val_dataloader) == 0:
	print(
	f"警告: 验证数据加载器为空。验证集样本数量: {len(val_dataset)}, 批量大小: {self.last_trained_params['batch_size']}。验证集可能无法进行评估。")

	return True, f"数据准备完成。训练集: {len(train_dataset)} 张图片, 验证集: {len(val_dataset)} 张图片。"

	def train_model(self, epochs=DEFAULT_EPOCHS, lr=DEFAULT_LR):
	self.train_loss_history = []
	self.val_loss_history = []
	self.val_mse_history = []
	self.val_mae_history = []
	self.val_r2_history = []
	# 创建第一个子图：只用于训练损失和验证损失
	fig_loss, ax_loss = plt.subplots(figsize=(10, 6)) # 命名为 fig_loss, ax_loss
	ax_loss.set_xlabel("Epoch")
	ax_loss.set_ylabel("损失")
	ax_loss.set_title("训练与验证损失")
	# 创建第二个子图：用于验证MSE和MAE
	fig_metrics, ax_metrics = plt.subplots(figsize=(10, 6)) # 命名为 fig_metrics, ax_metrics
	ax_metrics.set_xlabel("Epoch")
	ax_metrics.set_ylabel("误差指标")
	ax_metrics.set_title("验证MSE与MAE")
	if self.train_dataloader is None or len(self.train_dataloader) == 0:
	ax_loss.text(0.5, 0.5, "训练数据加载器为空。请先正确加载数据。", horizontalalignment='center',
	verticalalignment='center',
	transform=ax_loss.transAxes, fontsize=12, color='red')
	ax_metrics.text(0.5, 0.5, "训练数据加载器为空。", horizontalalignment='center', verticalalignment='center',
	transform=ax_metrics.transAxes, fontsize=12, color='red')
	fig_loss.tight_layout()
	fig_metrics.tight_layout()
	return fig_loss, fig_metrics
	min_label = self.dataset_min_label
	max_label = self.dataset_max_label
	if min_label is None or max_label is None:
	print("错误: dataset_min_label/max_label 未设置，使用默认 0-100。")
	min_label = 0.0
	max_label = 100.0
	if self.current_model_type == "深度学习":
	if self.pytorch_regressor is None or self.feature_extractor is None:
	ax_loss.text(0.5, 0.5, "深度学习模型（分离模式）未正确初始化。请重试。", horizontalalignment='center',
	verticalalignment='center', transform=ax_loss.transAxes, fontsize=12, color='red')
	ax_metrics.text(0.5, 0.5, "深度学习模型未初始化。", horizontalalignment='center',
	verticalalignment='center', transform=ax_metrics.transAxes, fontsize=12, color='red')
	fig_loss.tight_layout()
	fig_metrics.tight_layout()
	return fig_loss, fig_metrics
	model = self.pytorch_regressor
	optimizer = self._get_optimizer(model.parameters(), self.last_trained_params["optimizer"], lr,
	self.last_trained_params["weight_decay"])
	criterion = self._get_loss_function(self.last_trained_params["loss_function"])
	lr_scheduler = self._get_lr_scheduler(optimizer, self.last_trained_params["lr_scheduler"],
	self.last_trained_params["scheduler_patience"],
	self.last_trained_params["scheduler_factor"],
	self.last_trained_params["scheduler_t_max"])
	best_val_loss = float('inf')
	epochs_no_improve = 0
	best_epoch = 0
	best_regressor_state = None
	best_feature_extractor_state = None
	print(f"开始训练深度学习模型 (PyTorch, 分离模式, 基础CNN: {self.active_base_cnn_name})，共 {epochs} 轮次...")
	print(
	f"学习率: {lr}, 批量大小: {self.last_trained_params['batch_size']}, Dropout: {self.last_trained_params['dropout_rate']}, Weight Decay: {self.last_trained_params['weight_decay']}")
	print(
	f"优化器: {self.last_trained_params['optimizer']}, 损失函数: {self.last_trained_params['loss_function']}, 调度器: {self.last_trained_params['lr_scheduler']}, 早停耐心: {self.last_trained_params['early_stopping_patience']}")
	print(
	f"原始分数范围: [{min_label:.2f}, {max_label:.2f}], 数据增强: {self.last_trained_params['enable_augmentation']}")
	for epoch in range(epochs):
	# --- 训练阶段 ---
	model.train()
	self.feature_extractor.eval()
	running_train_loss = 0.0
	for batch_idx, (images, labels) in enumerate(self.train_dataloader):
	images = images.to(self.device)
	labels = labels.unsqueeze(1).to(self.device)
	with torch.no_grad():
	features = self.feature_extractor(images)
	optimizer.zero_grad()
	outputs = model(features)
	loss = criterion(outputs, labels)
	loss.backward()
	optimizer.step()

	running_train_loss += loss.item()

	avg_train_loss = running_train_loss / len(self.train_dataloader)
	self.train_loss_history.append(avg_train_loss)
	# --- 验证阶段 ---
	if len(self.val_dataloader.dataset) > 0 and len(self.val_dataloader) > 0:
	model.eval()
	val_losses = []
	val_predictions_normalized = []
	val_true_labels_normalized = []
	with torch.no_grad():
	for images, labels in self.val_dataloader:
	images = images.to(self.device)
	labels = labels.unsqueeze(1).to(self.device)
	features = self.feature_extractor(images)
	outputs = model(features)

	loss = criterion(outputs, labels)
	val_losses.append(loss.item())
	val_predictions_normalized.extend(outputs.cpu().numpy().flatten())
	val_true_labels_normalized.extend(labels.cpu().numpy().flatten())

	avg_val_loss = np.mean(val_losses)
	self.val_loss_history.append(avg_val_loss)
	val_mse, val_mae, val_r2 = calculate_metrics(
	val_true_labels_normalized,
	val_predictions_normalized,
	min_label, max_label
	)
	self.val_mse_history.append(val_mse)
	self.val_mae_history.append(val_mae)
	self.val_r2_history.append(val_r2) # R2仍会计算并记录
	print(
	f"Epoch {epoch + 1}/{epochs}: Train Loss: {avg_train_loss:.4f}, Val Loss: {avg_val_loss:.4f}, Val MSE: {val_mse:.2f}, Val MAE: {val_mae:.2f}, Val R2: {val_r2:.2f}")
	if lr_scheduler:
	if isinstance(lr_scheduler, torch.optim.lr_scheduler.ReduceLROnPlateau):
	lr_scheduler.step(avg_val_loss)
	else:
	lr_scheduler.step()
	if avg_val_loss < best_val_loss:
	best_val_loss = avg_val_loss
	epochs_no_improve = 0
	best_epoch = epoch + 1
	best_regressor_state = model.state_dict()
	best_feature_extractor_state = self.feature_extractor.state_dict()
	else:
	epochs_no_improve += 1
	if epochs_no_improve >= self.last_trained_params['early_stopping_patience']:
	print(
	f"早停触发！验证损失在 {self.last_trained_params['early_stopping_patience']} 个Epochs内没有改善。")
	break
	else:
	print(
	f"Epoch {epoch + 1}/{epochs}: Train Loss: {avg_train_loss:.4f} (无验证集评估或验证dataloader为空)")

	if best_regressor_state and best_feature_extractor_state:
	model.load_state_dict(best_regressor_state)
	self.feature_extractor.load_state_dict(best_feature_extractor_state)
	print(f"已加载第 {best_epoch} 轮次的最佳模型。")
	else:
	print("没有找到更好的验证损失模型（无验证集或未改善）。使用最后一次训练的模型状态。")
	# 绘制第一个图：损失
	ax_loss.clear()
	ax_loss.plot(self.train_loss_history, label="训练损失", color='blue')
	if len(self.val_loss_history) > 0:
	ax_loss.plot(self.val_loss_history, label="验证损失", color='orange')
	ax_loss.legend()
	ax_loss.set_xlabel("Epoch")
	ax_loss.set_ylabel("损失")

	if len(self.val_loss_history) > 0:
	ax_loss.set_title(f"深度学习模型训练完成 (分离模式, 基础CNN: {self.active_base_cnn_name})\n"
	f"最佳验证损失: {best_val_loss:.4f} (Epoch {best_epoch})")
	else:
	ax_loss.set_title(f"深度学习模型训练完成 (分离模式, 基础CNN: {self.active_base_cnn_name})\n"
	f"最终训练损失: {self.train_loss_history[-1]:.4f} (无验证集)")

	fig_loss.tight_layout() # 确保对正确的图表进行布局
	# 绘制第二个图：MSE和MAE
	ax_metrics.clear()
	if len(self.val_mse_history) > 0:
	ax_metrics.plot(self.val_mse_history, label="验证MSE", color='green', linestyle='--')
	ax_metrics.plot(self.val_mae_history, label="验证MAE", color='red', linestyle=':')
	ax_metrics.legend()
	ax_metrics.set_xlabel("Epoch")
	ax_metrics.set_ylabel("误差指标")
	ax_metrics.set_title(f"验证MSE与MAE (深度学习模型)")

	fig_metrics.tight_layout() # 确保对正确的图表进行布局

	self._save_model_artifacts("深度学习")
	return fig_loss, fig_metrics
	elif self.current_model_type == "端到端深度学习":
	if self.full_cnn_regressor is None:
	ax_loss.text(0.5, 0.5, "端到端深度学习模型未正确初始化。请重试。", horizontalalignment='center',
	verticalalignment='center', transform=ax_loss.transAxes, fontsize=12, color='red')
	ax_metrics.text(0.5, 0.5, "端到端深度学习模型未初始化。", horizontalalignment='center',
	verticalalignment='center', transform=ax_metrics.transAxes, fontsize=12, color='red')
	fig_loss.tight_layout()
	fig_metrics.tight_layout()
	return fig_loss, fig_metrics

	model = self.full_cnn_regressor
	optimizer = self._get_optimizer(model.parameters(), self.last_trained_params["optimizer"], lr,
	self.last_trained_params["weight_decay"])
	criterion = self._get_loss_function(self.last_trained_params["loss_function"])
	lr_scheduler = self._get_lr_scheduler(optimizer, self.last_trained_params["lr_scheduler"],
	self.last_trained_params["scheduler_patience"],
	self.last_trained_params["scheduler_factor"],
	self.last_trained_params["scheduler_t_max"])
	best_val_loss = float('inf')
	epochs_no_improve = 0
	best_epoch = 0
	best_model_state = None
	print(f"开始训练端到端深度学习模型 (基础CNN: {self.active_base_cnn_name})，共 {epochs} 轮次...")
	print(
	f"学习率: {lr}, 批量大小: {self.last_trained_params['batch_size']}, Dropout: {self.last_trained_params['dropout_rate']}, Weight Decay: {self.last_trained_params['weight_decay']}")
	print(
	f"优化器: {self.last_trained_params['optimizer']}, 损失函数: {self.last_trained_params['loss_function']}, 调度器: {self.last_trained_params['lr_scheduler']}, 早停耐心: {self.last_trained_params['early_stopping_patience']}")
	print(
	f"原始分数范围: [{min_label:.2f}, {max_label:.2f}], 数据增强: {self.last_trained_params['enable_augmentation']}")
	for epoch in range(epochs):
	# --- 训练阶段 ---
	model.train()
	running_train_loss = 0.0
	for batch_idx, (images, labels) in enumerate(self.train_dataloader):
	images = images.to(self.device)
	labels = labels.unsqueeze(1).to(self.device)
	optimizer.zero_grad()
	outputs = model(images)
	loss = criterion(outputs, labels)
	loss.backward()
	optimizer.step()

	running_train_loss += loss.item()

	avg_train_loss = running_train_loss / len(self.train_dataloader)
	self.train_loss_history.append(avg_train_loss)
	# --- 验证阶段 ---
	if len(self.val_dataloader.dataset) > 0 and len(self.val_dataloader) > 0:
	model.eval()
	val_losses = []
	val_predictions_normalized = []
	val_true_labels_normalized = []
	with torch.no_grad():
	for images, labels in self.val_dataloader:
	images = images.to(self.device)
	labels = labels.unsqueeze(1).to(self.device)
	outputs = model(images)

	loss = criterion(outputs, labels)
	val_losses.append(loss.item())
	val_predictions_normalized.extend(outputs.cpu().numpy().flatten())
	val_true_labels_normalized.extend(labels.cpu().numpy().flatten())

	avg_val_loss = np.mean(val_losses)
	self.val_loss_history.append(avg_val_loss)
	val_mse, val_mae, val_r2 = calculate_metrics(
	val_true_labels_normalized,
	val_predictions_normalized,
	min_label, max_label
	)
	self.val_mse_history.append(val_mse)
	self.val_mae_history.append(val_mae)
	self.val_r2_history.append(val_r2)
	print(
	f"Epoch {epoch + 1}/{epochs}: Train Loss: {avg_train_loss:.4f}, Val Loss: {avg_val_loss:.4f}, Val MSE: {val_mse:.2f}, Val MAE: {val_mae:.2f}, Val R2: {val_r2:.2f}")
	if lr_scheduler:
	if isinstance(lr_scheduler, torch.optim.lr_scheduler.ReduceLROnPlateau):
	lr_scheduler.step(avg_val_loss)
	else:
	lr_scheduler.step()
	if avg_val_loss < best_val_loss:
	best_val_loss = avg_val_loss
	epochs_no_improve = 0
	best_epoch = epoch + 1
	best_model_state = model.state_dict()
	else:
	epochs_no_improve += 1
	if epochs_no_improve >= self.last_trained_params['early_stopping_patience']:
	print(
	f"早停触发！验证损失在 {self.last_trained_params['early_stopping_patience']} 个Epochs内没有改善。")
	break
	else:
	print(
	f"Epoch {epoch + 1}/{epochs}: Train Loss: {avg_train_loss:.4f} (无验证集评估或验证dataloader为空)")

	if best_model_state:
	model.load_state_dict(best_model_state)
	print(f"已加载第 {best_epoch} 轮次的最佳模型。")
	else:
	print("没有找到更好的验证损失模型（无验证集或未改善）。使用最后一次训练的模型状态。")
	# 绘制第一个图：损失
	ax_loss.clear()
	ax_loss.plot(self.train_loss_history, label="训练损失", color='blue')
	if len(self.val_loss_history) > 0:
	ax_loss.plot(self.val_loss_history, label="验证损失", color='orange')
	ax_loss.legend()
	ax_loss.set_xlabel("Epoch")
	ax_loss.set_ylabel("损失")

	if len(self.val_loss_history) > 0:
	ax_loss.set_title(f"端到端深度学习模型训练完成 (基础CNN: {self.active_base_cnn_name})\n"
	f"最佳验证损失: {best_val_loss:.4f} (Epoch {best_epoch})")
	else:
	ax_loss.set_title(f"端到端深度学习模型训练完成 (基础CNN: {self.active_base_cnn_name})\n"
	f"最终训练损失: {self.train_loss_history[-1]:.4f} (无验证集)")
	fig_loss.tight_layout()
	# 绘制第二个图：MSE和MAE
	ax_metrics.clear()
	if len(self.val_mse_history) > 0:
	ax_metrics.plot(self.val_mse_history, label="验证MSE", color='green', linestyle='--')
	ax_metrics.plot(self.val_mae_history, label="验证MAE", color='red', linestyle=':')
	ax_metrics.legend()
	ax_metrics.set_xlabel("Epoch")
	ax_metrics.set_ylabel("误差指标")
	ax_metrics.set_title(f"验证MSE与MAE (端到端深度学习模型)")

	fig_metrics.tight_layout()

	self._save_model_artifacts("端到端深度学习")
	return fig_loss, fig_metrics
	elif self.current_model_type in ["随机森林", "支持向量回归", "梯度提升回归", "堆叠回归", "K近邻", "线性回归"]:
	if self.sklearn_regressor is None or self.sklearn_feature_pipeline is None or self.feature_extractor is None:
	ax_loss.text(0.5, 0.5, "Sklearn模型或其特征提取器未正确初始化。请重试。", horizontalalignment='center',
	verticalalignment='center', transform=ax_loss.transAxes, fontsize=12, color='red')
	ax_metrics.text(0.5, 0.5, "Sklearn模型未初始化。", horizontalalignment='center',
	verticalalignment='center', transform=ax_metrics.transAxes, fontsize=12, color='red')
	fig_loss.tight_layout()
	fig_metrics.tight_layout()
	return fig_loss, fig_metrics
	print(f"正在提取所有图片的特征用于Sklearn模型训练 (基础CNN: {self.active_base_cnn_name})...")
	print(f"PCA保留方差比例: {self.last_trained_params['pca_variance_ratio']}")
	print(
	f"原始分数范围: [{min_label:.2f}, {max_label:.2f}], 数据增强: {self.last_trained_params['enable_augmentation']}")
	self.sklearn_regressor, self.sklearn_feature_pipeline = \
	get_sklearn_model_pipeline(self.current_model_type, self.last_trained_params["pca_variance_ratio"])
	X_train_features = []
	y_train_labels_normalized = []
	X_val_features = []
	y_val_labels_normalized = []
	self.feature_extractor.eval()
	with torch.no_grad():
	for images, labels in self.train_dataloader:
	images = images.to(self.device)
	features = self.feature_extractor(images).cpu().numpy()
	X_train_features.extend(features)
	y_train_labels_normalized.extend(labels.cpu().numpy())

	if len(self.val_dataloader.dataset) > 0 and len(self.val_dataloader) > 0:
	for images, labels in self.val_dataloader:
	images = images.to(self.device)
	features = self.feature_extractor(images).cpu().numpy()
	X_val_features.extend(features)
	y_val_labels_normalized.extend(labels.cpu().numpy())
	X_train = np.array(X_train_features)
	y_train_normalized = np.array(y_train_labels_normalized)
	X_val = np.array(X_val_features)
	y_val_normalized = np.array(y_val_labels_normalized)
	if X_train.shape[0] == 0:
	ax_loss.text(0.5, 0.5, "无训练特征数据，请检查图片加载。", horizontalalignment='center',
	verticalalignment='center', transform=ax_loss.transAxes, fontsize=12, color='red')
	ax_metrics.text(0.5, 0.5, "无训练特征数据。", horizontalalignment='center', verticalalignment='center',
	transform=ax_metrics.transAxes, fontsize=12, color='red')
	fig_loss.tight_layout()
	fig_metrics.tight_layout()
	return fig_loss, fig_metrics
	print("正在对提取的特征进行预处理 (标准化, PCA)...")
	X_train_processed = self.sklearn_feature_pipeline.fit_transform(X_train)

	print(f"正在训练Sklearn {self.current_model_type} 模型...")
	self.sklearn_regressor.fit(X_train_processed, y_train_normalized)
	print(f"Sklearn {self.current_model_type} 模型训练完成。")
	train_predictions_normalized = self.sklearn_regressor.predict(X_train_processed)

	train_mse, train_mae, train_r2 = calculate_metrics(
	y_train_normalized, train_predictions_normalized, min_label, max_label
	)
	# Sklearn模型没有Epochs概念，只显示最终状态
	ax_loss.clear()
	ax_metrics.clear()
	if len(X_val) > 0:
	X_val_processed = self.sklearn_feature_pipeline.transform(X_val)
	val_predictions_normalized = self.sklearn_regressor.predict(X_val_processed)
	val_mse, val_mae, val_r2 = calculate_metrics(
	y_val_normalized, val_predictions_normalized, min_label, max_label
	)

	print(f"训练完成: Train MSE: {train_mse:.2f}, Train MAE: {train_mae:.2f}, Train R2: {train_r2:.2f}")
	print(f" Val MSE: {val_mse:.2f}, Val MAE: {val_mae:.2f}, Val R2: {val_r2:.2f}")

	# Sklearn模型的损失图可以显示一个文本摘要
	ax_loss.text(0.5, 0.5, f"Sklearn {self.current_model_type} 训练完成\n"
	f"训练集损失 (MSE/MAE): {train_mse:.2f}/{train_mae:.2f}\n" # 显示损失
	f"验证集损失 (MSE/MAE): {val_mse:.2f}/{val_mae:.2f}\n" # 显示损失
	f"训练集 R2: {train_r2:.2f}, 验证集 R2: {val_r2:.2f}", # 显示 R2
	horizontalalignment='center', verticalalignment='center',
	transform=ax_loss.transAxes, fontsize=10, color='green')
	ax_loss.axis('off') # 隐藏坐标轴，因为没有连续曲线

	# Sklearn的第二个图仍然是MSE/MAE
	ax_metrics.text(0.5, 0.5, f"Sklearn {self.current_model_type} 训练完成\n"
	f"训练集 MSE: {train_mse:.2f}\n"
	f"验证集 MSE: {val_mse:.2f}\n"
	f"训练集 MAE: {train_mae:.2f}\n"
	f"验证集 MAE: {val_mae:.2f}",
	horizontalalignment='center', verticalalignment='center',
	transform=ax_metrics.transAxes, fontsize=10, color='green')
	ax_metrics.axis('off')
	else:
	print(
	f"训练完成: Train MSE: {train_mse:.2f}, Train MAE: {train_mae:.2f}, Train R2: {train_r2:.2f} (无验证集评估)")
	ax_loss.text(0.5, 0.5, f"Sklearn {self.current_model_type} 训练完成\n"
	f"训练集损失 (MSE/MAE): {train_mse:.2f}/{train_mae:.2f}\n"
	f"训练集 R2: {train_r2:.2f} (无验证集)",
	horizontalalignment='center', verticalalignment='center',
	transform=ax_loss.transAxes, fontsize=10, color='green')
	ax_loss.axis('off')
	ax_metrics.text(0.5, 0.5, f"Sklearn {self.current_model_type} 训练完成\n"
	f"训练集 MSE: {train_mse:.2f}\n"
	f"训练集 MAE: {train_mae:.2f} (无验证集)",
	horizontalalignment='center', verticalalignment='center',
	transform=ax_metrics.transAxes, fontsize=10, color='green')
	ax_metrics.axis('off')
	ax_loss.set_title(f"Sklearn模型训练状态 ({self.current_model_type})") # 更具体标题
	ax_metrics.set_title(f"Sklearn模型训练状态 ({self.current_model_type}) - 误差指标") # 更具体标题

	fig_loss.tight_layout()
	fig_metrics.tight_layout()
	self._save_model_artifacts(self.current_model_type)
	return fig_loss, fig_metrics
	else:
	ax_loss.text(0.5, 0.5, "未选择有效的模型类型进行训练。", horizontalalignment='center',
	verticalalignment='center',
	transform=ax_loss.transAxes, fontsize=12, color='red')
	ax_metrics.text(0.5, 0.5, "未选择有效的模型类型。", horizontalalignment='center', verticalalignment='center',
	transform=ax_metrics.transAxes, fontsize=12, color='red')
	fig_loss.tight_layout()
	fig_metrics.tight_layout()
	return fig_loss, fig_metrics

	# <-- 重新添加的 predict_score 方法！
	def predict_score(self, image_path, model_type_str, base_cnn_name_for_predict):
	if not self._load_model_artifacts(model_type_str, base_cnn_name_for_predict):
	return "模型未训练或未加载！请先训练对应模型。"

	current_image_size = get_image_size_by_model_name(base_cnn_name_for_predict)
	# 预测时不进行数据增强
	transform = get_transforms(train=False, image_size=current_image_size, enable_augmentation=False)
	try:
	image = Image.open(image_path).convert("RGB")
	image_tensor = transform(image).unsqueeze(0).to(self.device)
	except Exception as e:
	return f"图片加载或预处理失败: {e}"

	output_score_normalized = 0 # 0-1 范围的预测值
	if model_type_str == "深度学习":
	self.pytorch_regressor.eval()
	self.feature_extractor.eval()
	with torch.no_grad():
	features = self.feature_extractor(image_tensor)
	output_score_normalized = self.pytorch_regressor(features).item()
	elif model_type_str == "端到端深度学习":
	self.full_cnn_regressor.eval()
	with torch.no_grad():
	output_score_normalized = self.full_cnn_regressor(image_tensor).item()
	else: # Sklearn模型
	self.feature_extractor.eval()
	with torch.no_grad():
	features = self.feature_extractor(image_tensor).cpu().numpy()
	processed_features = self.sklearn_feature_pipeline.transform(features)
	output_score_normalized = self.sklearn_regressor.predict(processed_features)[0]

	# 确保预测值在0-1范围内（如果模型没有Sigmoid，可能会超出）
	output_score_normalized = max(0.0, min(1.0, output_score_normalized))

	# 将归一化的预测值反归一化到原始分数范围
	predicted_original_score = output_score_normalized * (
	self.dataset_max_label - self.dataset_min_label) + self.dataset_min_label

	# 最终钳制到0-100（因为原始分数可能不是0-100，但显示时通常希望在0-100）
	predicted_original_score = max(0, min(100, predicted_original_score))

	return f"预测分数: {predicted_original_score:.2f} (百分制)"

	def _save_model_artifacts(self, model_type_str):
	internal_name = self._get_internal_model_name(model_type_str)
	meta_data_path = f"{MODEL_SAVE_BASE_PATH}_{internal_name}_meta.json"

	if internal_name in ["pytorch_detached", "pytorch_full_cnn"]:
	meta_data_path = f"{MODEL_SAVE_BASE_PATH}_{self.active_base_cnn_name}_{internal_name}_meta.json"
	try:
	with open(meta_data_path, 'w') as f:
	json.dump(self.last_trained_params, f, indent=4)
	print(f"模型元数据已保存到: {meta_data_path}")
	except Exception as e:
	print(f"保存模型元数据失败: {e}")
	if internal_name == "pytorch_detached":
	feat_extractor_path = f"{MODEL_SAVE_BASE_PATH}_{self.active_base_cnn_name}_features.pth"
	regressor_path = f"{MODEL_SAVE_BASE_PATH}_{self.active_base_cnn_name}_pytorch_detached_regressor.pth"
	torch.save(self.feature_extractor.state_dict(), feat_extractor_path)
	torch.save(self.pytorch_regressor.state_dict(), regressor_path)
	print(f"PyTorch模型组件 (分离模式) 已保存。")
	elif internal_name == "pytorch_full_cnn":
	full_cnn_path = f"{MODEL_SAVE_BASE_PATH}_{self.active_base_cnn_name}_full_cnn.pth"
	torch.save(self.full_cnn_regressor.state_dict(), full_cnn_path)
	print(f"端到端深度学习模型已保存。")
	else: # Sklearn 模型
	regressor_path = f"{MODEL_SAVE_BASE_PATH}_{internal_name}_regressor.pkl"
	pipeline_path = f"{MODEL_SAVE_BASE_PATH}_{internal_name}_feature_pipeline.pkl"
	joblib.dump(self.sklearn_regressor, regressor_path)
	joblib.dump(self.sklearn_feature_pipeline, pipeline_path)
	print(f"Sklearn {model_type_str} 模型和特征管道已保存。")
	# <-- 重新添加的 _load_model_artifacts 方法！
	def _load_model_artifacts(self, model_type_str, base_cnn_name_to_load):
	internal_name = self._get_internal_model_name(model_type_str)

	loaded_params = None
	# 尝试加载对应模型类型的元数据
	meta_data_path = f"{MODEL_SAVE_BASE_PATH}_{internal_name}_meta.json"
	if internal_name in ["pytorch_detached", "pytorch_full_cnn"]:
	meta_data_path = f"{MODEL_SAVE_BASE_PATH}_{base_cnn_name_to_load}_{internal_name}_meta.json"

	try:
	with open(meta_data_path, 'r') as f:
	loaded_params = json.load(f)
	self.active_base_cnn_name = loaded_params.get("base_cnn_name", base_cnn_name_to_load)
	# 加载 min_label 和 max_label
	self.dataset_min_label = loaded_params.get("min_label", 0.0)
	self.dataset_max_label = loaded_params.get("max_label", 100.0)
	print(f"加载模型参数: {loaded_params}")
	except FileNotFoundError:
	print(f"警告: 模型元数据文件 {meta_data_path} 未找到。使用默认参数进行加载。")
	loaded_params = {
	"base_cnn_name": base_cnn_name_to_load,
	"dropout_rate": DEFAULT_DROPOUT_RATE,
	"weight_decay": DEFAULT_WEIGHT_DECAY,
	"pca_variance_ratio": DEFAULT_PCA_VARIANCE_RATIO,
	"min_label": 0.0, # 默认值
	"max_label": 100.0 # 默认值
	}
	self.active_base_cnn_name = base_cnn_name_to_load
	self.dataset_min_label = 0.0
	self.dataset_max_label = 100.0

	# 使用加载或默认的参数来实例化模型
	if internal_name == "pytorch_detached":
	try:
	self.feature_extractor = FeatureExtractor(model_name=self.active_base_cnn_name).to(self.device)
	feat_extractor_path = f"{MODEL_SAVE_BASE_PATH}_{self.active_base_cnn_name}_features.pth"
	self.feature_extractor.load_state_dict(
	torch.load(feat_extractor_path, map_location=self.device))
	self.feature_extractor.eval()

	feature_dim = self.feature_extractor.get_output_dim()
	self.pytorch_regressor = PytorchRegressor(
	in_features=feature_dim,
	dropout_rate=loaded_params.get("dropout_rate", DEFAULT_DROPOUT_RATE)
	).to(self.device)
	regressor_path = f"{MODEL_SAVE_BASE_PATH}_{self.active_base_cnn_name}_pytorch_detached_regressor.pth"
	self.pytorch_regressor.load_state_dict(
	torch.load(regressor_path, map_location=self.device))
	self.pytorch_regressor.eval()
	print(f"PyTorch模型组件 (分离模式, 基础CNN: {self.active_base_cnn_name}) 已加载。")
	return True
	except FileNotFoundError as e:
	print(f"PyTorch模型文件 (分离模式, 基础CNN: {self.active_base_cnn_name}) 未找到: {e}")
	self.pytorch_regressor = None
	self.feature_extractor = None
	return False
	elif internal_name == "pytorch_full_cnn":
	try:
	self.full_cnn_regressor = FullCNNRegressor(
	model_name=self.active_base_cnn_name,
	dropout_rate=loaded_params.get("dropout_rate", DEFAULT_DROPOUT_RATE)
	).to(self.device)
	full_cnn_path = f"{MODEL_SAVE_BASE_PATH}_{self.active_base_cnn_name}_full_cnn.pth"
	self.full_cnn_regressor.load_state_dict(
	torch.load(full_cnn_path, map_location=self.device))
	self.full_cnn_regressor.eval()
	print(f"端到端深度学习模型 ({self.active_base_cnn_name}) 已加载。")
	return True
	except FileNotFoundError as e:
	print(f"端到端深度学习模型文件 ({self.active_base_cnn_name}) 未找到: {e}")
	self.full_cnn_regressor = None
	return False
	else: # Sklearn 模型
	try:
	self.feature_extractor = FeatureExtractor(model_name=self.active_base_cnn_name).to(self.device)
	self.feature_extractor.eval()

	regressor_path = f"{MODEL_SAVE_BASE_PATH}_{internal_name}_regressor.pkl"
	pipeline_path = f"{MODEL_SAVE_BASE_PATH}_{internal_name}_feature_pipeline.pkl"

	# 重新实例化 Sklearn 模型和管道，以便使用加载的PCA参数
	self.sklearn_regressor, self.sklearn_feature_pipeline = \
	get_sklearn_model_pipeline(
	model_type_str,
	pca_variance_ratio=loaded_params.get("pca_variance_ratio", DEFAULT_PCA_VARIANCE_RATIO)
	)

	self.sklearn_regressor = joblib.load(regressor_path)
	self.sklearn_feature_pipeline = joblib.load(pipeline_path)
	print(f"Sklearn {model_type_str} 模型和特征管道 (基础CNN: {self.active_base_cnn_name}) 已加载。")
	return True
	except FileNotFoundError as e:
	print(f"Sklearn模型文件 {regressor_path} 或 {pipeline_path} 未找到: {e}")
	self.sklearn_regressor = None
	self.sklearn_feature_pipeline = None
	self.feature_extractor = None
	return False
	return False