PIVOT / scripts /extra_ablations.py

pivot: code + trained checkpoints (norman, replogle k562)

3b4941f verified 1 day ago

6.15 kB

	"""extra experiments to fill in the runnable table cells. external methods we
	can't reproduce stay unreported; only real computed values get emitted."""
	import sys, os, json, time
	sys.path.insert(0, os.path.abspath(os.path.join(os.path.dirname(__file__), "..")))
	import numpy as np, torch
	from src.data.perturb_data import load_dataset
	from src.data.splits import load_split
	from src.training.train import TrainConfig, train
	from src.experiments.predictors import PivotPredictor, BaselinePredictor
	from src.experiments.forward_eval import evaluate_forward
	from src.experiments.nomination_eval import evaluate_nomination
	from src.evaluation.baselines import build_baseline
	from src.utils.common import save_json

	gpu = int(os.environ.get("PIVOT_GPU", "3"))
	data = load_dataset("norman")
	out = {}

	# ===== core-ablation extras (centroid reward, held-out perturbation) =====
	sp = load_split(data.dir, "perturbation")
	cands = [p for p in data.perturbations if len(data.parse(p)) == 1]
	targets = [p for p in sp["test_perts"] if len(data.parse(p)) == 1 and p in cands][:30]
	gc = data.functional_clusters(seed=0)

	def fwd_inv(model, reward="centroid"):
	dev = next(model.parameters()).device
	pred = PivotPredictor(model, data, dev)
	f = evaluate_forward(pred, data, list(sp["test_perts"])[:50], data.control_idx, max_perts=50)
	r = evaluate_nomination(pred, data, targets, cands, data.control_idx, reward_kind=reward,
	method="ranking", gene_cluster=gc, device=dev)
	g = evaluate_nomination(pred, data, targets, cands, data.control_idx, reward_kind=reward,
	method="guidance", guidance_init="warm", rerank=False,
	gene_cluster=gc, model=model, device=dev)
	return f, r, g

	# velocity-only: train with only the tangent (velocity) loss
	mv, _ = train(TrainConfig(dataset="norman", split="perturbation", epochs=60, device_index=gpu,
	components=["tan"]), data=data, verbose=False)
	fv, rv, _ = fwd_inv(mv)
	out["velocity_only"] = {"mse": fv["mse"], "de_corr": fv["de_corr"], "mmd": fv["mmd"],
	"endpoint_dist": rv["endpoint_dist"], "top5": rv["top5"], "ndcg": rv["ndcg"]}
	print("velocity_only", out["velocity_only"], flush=True)

	# full model: ranking-only and guidance-without-reranking inverse rows
	mf, info = train(TrainConfig(dataset="norman", split="perturbation", epochs=60, device_index=gpu),
	data=data, verbose=False)
	dev = next(mf.parameters()).device
	ff, rf, gf = fwd_inv(mf)
	out["ranking_only"] = {"mse": ff["mse"], "de_corr": ff["de_corr"], "mmd": ff["mmd"],
	"endpoint_dist": rf["endpoint_dist"], "top5": rf["top5"], "ndcg": rf["ndcg"]}
	out["guidance_no_rerank"] = {"mse": ff["mse"], "de_corr": ff["de_corr"], "mmd": ff["mmd"],
	"endpoint_dist": gf["endpoint_dist"], "top5": gf["top5"], "ndcg": gf["ndcg"]}
	print("ranking_only", out["ranking_only"], flush=True)
	print("guidance_no_rerank", out["guidance_no_rerank"], flush=True)

	# ===== inverse-table baseline: average perturbation effect + ranking (cosine) =====
	bl = BaselinePredictor(build_baseline("AvgPerturbationEffect").fit(data, sp["train_perts"], sp["train_idx"]))
	ra = evaluate_nomination(bl, data, targets, cands, data.control_idx, reward_kind="cosine",
	method="ranking", gene_cluster=gc, device=dev)
	out["avg_effect_ranking"] = {k: ra[k] for k in ["top1", "top5", "ndcg", "func_top5"]}
	out["avg_effect_ranking"]["med_rank"] = float(np.median(ra["_per"]["rank"]))
	print("avg_effect_ranking", out["avg_effect_ranking"], flush=True)

	# ===== gpu memory for compute table =====
	torch.cuda.reset_peak_memory_stats(dev)
	c0 = torch.as_tensor(data.emb[data.control_idx[:256]], dtype=torch.float32, device=dev)
	from src.evaluation import inference as inf
	_ = inf.endpoint_ranking(mf, data, cands, c0, __import__("src.evaluation.rewards", fromlist=["Reward"]).Reward(
	"centroid", target_c=data.emb[data.pert_to_idx[targets[0]]].mean(0), device=dev), device=dev)
	out["gpu_mem_mb"] = round(torch.cuda.max_memory_allocated(dev) / 1e6, 1)
	print("gpu_mem_mb", out["gpu_mem_mb"], flush=True)

	# ===== combination table: additive + random + pivot guidance (combination split) =====
	spc = load_split(data.dir, "combination")
	combo_cands = data.combos
	ctgt = [p for p in spc["test_perts"] if len(data.parse(p)) == 2][:26]
	mc, _ = train(TrainConfig(dataset="norman", split="combination", epochs=60, device_index=gpu),
	data=data, verbose=False)
	devc = next(mc.parameters()).device
	predc = PivotPredictor(mc, data, devc)
	from src.experiments.nomination_eval import rank_candidates
	import src.evaluation.metrics as M
	rng = np.random.default_rng(0)
	# additive baseline ranking over observed combos
	addb = build_baseline("Additive").fit(data, spc["train_perts"], spc["train_idx"])
	addp = BaselinePredictor(addb)
	def combo_eval(predictor):
	e1=e5=ov=0.0
	for p in ctgt:
	cstar = data.emb[data.pert_to_idx[p]].mean(0)
	c0n = data.emb[rng.choice(data.control_idx, 128, replace=False)]
	sk = dict(kind="centroid", c_star=cstar, target_sample=data.emb[data.pert_to_idx[p]],
	device=devc, control_ref=data.emb[data.control_idx].mean(0))
	ranked,_ = rank_candidates(predictor, combo_cands, c0n, sk)
	e1 += M.top_k_accuracy(ranked,p,1); e5 += M.top_k_accuracy(ranked,p,5)
	ov += M.partial_overlap(data.parse(ranked[0]), set(data.parse(p)))
	n=len(ctgt); return e1/n, e5/n, ov/n
	ae1, ae5, aov = combo_eval(addp)
	out["combo_additive"] = {"exact1": ae1, "exact5": ae5, "overlap": aov}
	# random combos
	r_e1=r_e5=r_ov=0.0
	for p in ctgt:
	pick = list(rng.choice(combo_cands, 5, replace=False))
	r_e1 += float(p==pick[0]); r_e5 += float(p in pick)
	r_ov += M.partial_overlap(data.parse(pick[0]), set(data.parse(p)))
	n=len(ctgt); out["combo_random"]={"exact1":r_e1/n,"exact5":r_e5/n,"overlap":r_ov/n}
	print("combo_additive", out["combo_additive"], "combo_random", out["combo_random"], flush=True)

	save_json(out, "experiments/results/norman_extra_ablations.json")
	print("FILL_DONE", flush=True)