Spaces:

Fancy-yousa
/

FeatureSelect-Methods-Leaderboard

Sleeping

App Files Files Community

FeatureSelect-Methods-Leaderboard / AutoFS /leaderboard.py

Fancy-yousa

Upload 18 files

94e0fc9 verified about 1 month ago

raw

history blame contribute delete

3.21 kB

	import numpy as np
	import pandas as pd
	# def rank_results(
	# results,
	# metric="f1",
	# clf_average="mean",
	# weights=None
	# ):
	# """
	# 对 FSExecutor 输出结果进行排行榜排序

	# Parameters
	# ----------
	# results : list of dict
	# 每个 dict 是一个算法在一个数据集上的结果
	# metric : str
	# 使用的指标: 'f1' or 'auc'
	# clf_average : str
	# 'mean' 或 'max'，表示跨分类器如何聚合
	# weights : dict or None
	# 多指标加权，例如 {'f1':0.5, 'auc':0.5}

	# Returns
	# -------
	# ranked_df : pd.DataFrame
	# """

	# rows = []

	# for res in results:
	# algo = res["algorithm"]
	# metrics = res["metrics"]

	# # --------- 单指标 ----------
	# if weights is None:
	# vals = []
	# for clf, m in metrics.items():
	# if metric in m:
	# vals.append(m[metric])

	# if not vals:
	# raise ValueError(f"No metric {metric} for {algo}")

	# score = np.mean(vals) if clf_average == "mean" else np.max(vals)

	# # --------- 多指标加权 ----------
	# else:
	# score = 0.0
	# for m_name, w in weights.items():
	# vals = [
	# metrics[clf][m_name]
	# for clf in metrics
	# if m_name in metrics[clf]
	# ]
	# score += w * np.mean(vals)

	# rows.append({
	# "algorithm": algo,
	# "score": score,
	# "num_features": res["num_features"],
	# "time": res.get("time", None)
	# })

	# df = pd.DataFrame(rows)

	# # --------- 按 score 排序 ----------
	# df = df.sort_values(
	# by="score",
	# ascending=False
	# ).reset_index(drop=True)

	# df["rank"] = df.index + 1

	# return df

	def aggregate_metrics(metrics, w_f1=0.7, w_auc=0.3):
	"""
	metrics:
	{
	"nb": {"f1": x, "auc": y},
	"svm": {"f1": x, "auc": y},
	"rf": {"f1": x, "auc": y},
	}
	"""
	f1s = [m["f1"] for m in metrics.values()]
	aucs = [m["auc"] for m in metrics.values()]

	mean_f1 = sum(f1s) / len(f1s)
	mean_auc = sum(aucs) / len(aucs)

	return w_f1 * mean_f1 + w_auc * mean_auc,mean_f1,mean_auc

	def rank_results(
	results,
	):
	"""
	results: list[dict]
	return: 排序后的 list[dict]（每个 dict 会新增 score 字段）
	"""

	ranked = []

	for r in results:
	# 1. 性能融合
	perf_score,mean_f1,mean_auc = aggregate_metrics(r["metrics"])

	# 2. 惩罚项
	# feature_penalty = alpha * r["num_features"]
	# time_penalty = beta * r["time"]

	# final_score = perf_score - feature_penalty - time_penalty
	final_score = perf_score
	ranked.append({
	**r,
	"mean_f1":mean_f1,
	"mean_auc":mean_auc,
	"score": final_score,
	"perf_score": perf_score
	})

	# 3. 排序（score 越大越好）
	ranked.sort(key=lambda x: x["score"], reverse=True)

	return ranked