xsponenta
/

s23-model

Model card Files Files and versions

s23-model / test_local_real.py

IhorIvanyshyn01's picture

IhorIvanyshyn01

Update tuned hyperparameters

8f748c3 29 days ago

history blame contribute delete

1.57 kB

	import io
	import json
	import numpy as np
	import sys
	import os
	from datasets import load_dataset
	from hoho2025.metric_helper import hss

	# Import the solution script locally
	import script

	print("Loading dataset from Hugging Face streaming (usm3d/hoho22k_2026_trainval)...")
	dataset = load_dataset('usm3d/hoho22k_2026_trainval', split='train', streaming=True, trust_remote_code=True)

	scores = []

	for idx, sample in enumerate(dataset):
	if idx >= 3: # Just test first 3 (evaluating takes time for 2D parsing)
	break

	order_id = sample.get('order_id', str(idx))
	print(f"\n--- Testing order_id: {order_id} ---")

	# Run the original example solutions baseline
	from hoho2025 import example_solutions
	base_v, base_e = example_solutions.predict_wireframe(sample)

	# Evaluate user's filtered prediction
	pred_v, pred_e, _ = script.predict_wireframe_safely(sample)

	gt_v = sample.get('wf_vertices')
	gt_e = sample.get('wf_edges')

	if gt_v is None or gt_e is None:
	print("Missing ground truth for this sample.")
	continue

	# 3. Compute HSS metric Score
	base_res = hss(base_v, base_e, gt_v, gt_e)
	res = hss(pred_v, pred_e, gt_v, gt_e)
	scores.append(res.hss)

	print(f"BASELINE Predict -> Vertices: {len(base_v)} \| Edges: {len(base_e)} \| HSS: {base_res.hss:.4f}")
	print(f"FILTERED Predict -> Vertices: {len(pred_v)} \| Edges: {len(pred_e)} \| HSS: {res.hss:.4f}")

	avg_score = sum(scores) / len(scores) if scores else 0
	print(f"\nAverage FILTERED HSS Score on subset: {avg_score:.4f}")