Spaces:

Barisylmz
/

TimesNet-Gen

Sleeping

App Files Files Community

TimesNet-Gen / app.py

Barisylmz

Upload app.py

f181668 verified 4 months ago

raw

history blame contribute delete

18.3 kB

	#!/usr/bin/env python3
	"""
	Gradio app for TimesNet-Gen: Generate seismic samples from latent bank.
	Based on generate_samples_git.py (working GitHub version).

	NO PLOTTING - only NPZ generation and display in Gradio interface.
	Model files are automatically downloaded from Hugging Face Hub.
	"""
	import os
	import gradio as gr
	import torch
	import numpy as np
	from datetime import datetime
	import matplotlib.pyplot as plt
	from io import BytesIO
	from PIL import Image
	from huggingface_hub import hf_hub_download


	# Hugging Face model repository
	HF_REPO_ID = "Barisylmz/TimesNet-Gen-Models" # Your HF model repo
	CHECKPOINT_FILENAME = "timesnet_pointcloud_phase1_final.pth"
	LATENT_BANK_FILENAME = "latent_bank_station_cond.npz" # Actual filename on HF Hub


	def download_model_files():
	"""
	Download model files from Hugging Face Hub if not present locally.

	Returns:
	checkpoint_path: Path to downloaded checkpoint
	latent_bank_path: Path to downloaded latent bank
	"""
	print("[INFO] Checking for model files...")

	# Check if files exist locally first
	if os.path.exists(CHECKPOINT_FILENAME) and os.path.exists(LATENT_BANK_FILENAME):
	print("[INFO] Model files found locally")
	return CHECKPOINT_FILENAME, LATENT_BANK_FILENAME

	print(f"[INFO] Downloading model files from Hugging Face Hub: {HF_REPO_ID}")

	try:
	# Download checkpoint
	if not os.path.exists(CHECKPOINT_FILENAME):
	print(f"[INFO] Downloading {CHECKPOINT_FILENAME}...")
	checkpoint_path = hf_hub_download(
	repo_id=HF_REPO_ID,
	filename=CHECKPOINT_FILENAME,
	cache_dir="./hf_cache"
	)
	print(f"[INFO] ✅ Checkpoint downloaded to {checkpoint_path}")
	else:
	checkpoint_path = CHECKPOINT_FILENAME

	# Download latent bank
	if not os.path.exists(LATENT_BANK_FILENAME):
	print(f"[INFO] Downloading {LATENT_BANK_FILENAME}...")
	latent_bank_path = hf_hub_download(
	repo_id=HF_REPO_ID,
	filename=LATENT_BANK_FILENAME,
	cache_dir="./hf_cache"
	)
	print(f"[INFO] ✅ Latent bank downloaded to {latent_bank_path}")
	else:
	latent_bank_path = LATENT_BANK_FILENAME

	return checkpoint_path, latent_bank_path

	except Exception as e:
	print(f"[ERROR] Failed to download model files: {e}")
	print(f"[INFO] Please ensure files exist at: https://huggingface.co/{HF_REPO_ID}")
	raise


	class SimpleArgs:
	"""Configuration for generation (matching GitHub version)."""
	def __init__(self):
	# Model architecture
	self.seq_len = 6000
	self.d_model = 128
	self.d_ff = 256
	self.e_layers = 2
	self.d_layers = 2
	self.num_kernels = 6
	self.top_k = 2
	self.dropout = 0.1
	self.latent_dim = 256

	# System
	self.use_gpu = torch.cuda.is_available()
	self.seed = 0

	# Point-cloud generation
	self.pcgen_k = 5
	self.pcgen_jitter_std = 0.0


	def load_model(checkpoint_path, args):
	"""Load pre-trained TimesNet-PointCloud model (matching GitHub version)."""
	from TimesNet_PointCloud import TimesNetPointCloud

	# Create model config (NO num_stations - GitHub version doesn't use it)
	class ModelConfig:
	def __init__(self, args):
	self.seq_len = args.seq_len
	self.pred_len = 0
	self.enc_in = 3
	self.c_out = 3
	self.d_model = args.d_model
	self.d_ff = args.d_ff
	self.num_kernels = args.num_kernels
	self.top_k = args.top_k
	self.e_layers = args.e_layers
	self.d_layers = args.d_layers
	self.dropout = args.dropout
	self.embed = 'timeF'
	self.freq = 'h'
	self.latent_dim = args.latent_dim

	config = ModelConfig(args)
	model = TimesNetPointCloud(config)

	# Load checkpoint
	checkpoint = torch.load(checkpoint_path, map_location='cpu')
	if 'model_state_dict' in checkpoint:
	model.load_state_dict(checkpoint['model_state_dict'])
	else:
	model.load_state_dict(checkpoint)

	model.eval()
	if args.use_gpu:
	model = model.cuda()

	print(f"[INFO] Model loaded successfully from {checkpoint_path}")
	return model


	def generate_samples_from_latent_bank(model, latent_bank_path, station_id, num_samples, args):
	"""
	Generate samples directly from pre-computed latent bank (matching GitHub version).

	Args:
	model: TimesNet model
	latent_bank_path: Path to latent_bank_phase1.npz
	station_id: Station ID (e.g., '0205')
	num_samples: Number of samples to generate
	args: Model arguments

	Returns:
	generated_signals: (num_samples, 3, seq_len) array
	real_names_used: List of lists indicating which latent vectors were used
	"""
	print(f"[INFO] Loading latent bank from {latent_bank_path}...")

	try:
	latent_data = np.load(latent_bank_path)
	except Exception as e:
	print(f"[ERROR] Could not load latent bank: {e}")
	return None, None

	# Load latent vectors for this station
	latents_key = f'latents_{station_id}'
	means_key = f'means_{station_id}'
	stdev_key = f'stdev_{station_id}'

	if latents_key not in latent_data:
	print(f"[ERROR] Station {station_id} not found in latent bank!")
	available = [k.replace('latents_', '') for k in latent_data.keys() if k.startswith('latents_')]
	print(f"Available stations: {available}")
	return None, None

	latents = latent_data[latents_key] # (N_samples, seq_len, d_model)
	means = latent_data[means_key] # (N_samples, seq_len, d_model)
	stdevs = latent_data[stdev_key] # (N_samples, seq_len, d_model)

	print(f"[INFO] Loaded {len(latents)} latent vectors for station {station_id}")
	print(f"[INFO] Generating {num_samples} samples via bootstrap aggregation...")

	generated_signals = []
	real_names_used = []

	model.eval()
	with torch.no_grad():
	for i in range(num_samples):
	# Bootstrap: randomly select k latent vectors with replacement
	k = min(args.pcgen_k, len(latents))
	selected_indices = np.random.choice(len(latents), size=k, replace=True)

	# Mix latent features (average)
	selected_latents = latents[selected_indices] # (k, seq_len, d_model)
	selected_means = means[selected_indices] # (k, seq_len, d_model)
	selected_stdevs = stdevs[selected_indices] # (k, seq_len, d_model)

	mixed_features = np.mean(selected_latents, axis=0) # (seq_len, d_model)
	mixed_means = np.mean(selected_means, axis=0) # (seq_len, d_model)
	mixed_stdevs = np.mean(selected_stdevs, axis=0) # (seq_len, d_model)

	# Convert to torch tensors
	mixed_features_torch = torch.from_numpy(mixed_features).float().unsqueeze(0) # (1, seq_len, d_model)
	means_b = torch.from_numpy(mixed_means).float().unsqueeze(0) # (1, seq_len, d_model)
	stdev_b = torch.from_numpy(mixed_stdevs).float().unsqueeze(0) # (1, seq_len, d_model)

	if args.use_gpu:
	mixed_features_torch = mixed_features_torch.cuda()
	means_b = means_b.cuda()
	stdev_b = stdev_b.cuda()

	# Decode
	xg = model.project_features_for_reconstruction(mixed_features_torch, means_b, stdev_b)

	# Store - transpose to (3, 6000)
	generated_np = xg.squeeze(0).cpu().numpy().T # (6000, 3) → (3, 6000)
	generated_signals.append(generated_np)

	# Track which latent indices were used
	real_names_used.append([f"latent_{idx}" for idx in selected_indices])

	if (i + 1) % 10 == 0:
	print(f" Generated {i + 1}/{num_samples} samples...")

	return np.array(generated_signals), real_names_used


	def save_generated_samples(generated_signals, real_names, station_id, output_dir):
	"""Save generated samples to NPZ file (NO PLOTTING)."""
	os.makedirs(output_dir, exist_ok=True)

	# Save timeseries NPZ
	output_path = os.path.join(output_dir, f'station_{station_id}_generated_timeseries.npz')
	np.savez_compressed(
	output_path,
	generated_signals=generated_signals,
	signals_generated=generated_signals, # Alias for compatibility
	real_names=real_names,
	station_id=station_id,
	station=station_id, # Alias for compatibility
	)

	print(f"[INFO] Saved {len(generated_signals)} generated samples to {output_path}")
	return output_path


	def plot_signal_for_display(signal):
	"""
	Plot a single 3-component seismic signal for Gradio display.

	Args:
	signal: (3, 6000) array [E, N, Z]

	Returns:
	PIL Image
	"""
	fig, axes = plt.subplots(3, 1, figsize=(12, 8), sharex=True)

	component_names = ['East', 'North', 'Vertical']
	colors = ['#1f77b4', '#ff7f0e', '#2ca02c']

	t = np.arange(signal.shape[1]) / 100.0 # 100 Hz sampling

	for idx, (ax, name, color) in enumerate(zip(axes, component_names, colors)):
	ax.plot(t, signal[idx], color=color, linewidth=0.5, alpha=0.8)
	ax.set_ylabel(f'{name}\n(cm/s²)', fontsize=10)
	ax.grid(True, alpha=0.3)
	ax.set_xlim(0, 60)

	axes[-1].set_xlabel('Time (s)', fontsize=11)
	fig.suptitle('Generated Seismic Signal (3 Components)', fontsize=13, fontweight='bold')
	plt.tight_layout()

	# Convert to PIL Image
	buf = BytesIO()
	plt.savefig(buf, format='png', dpi=100, bbox_inches='tight')
	plt.close(fig)
	buf.seek(0)
	return Image.open(buf)


	# ===========================
	# Gradio Interface Functions
	# ===========================

	def generate_samples_interface(station_id, num_samples, progress=gr.Progress()):
	"""
	Generate samples for Gradio interface.

	Args:
	station_id: Station ID (e.g., '0205')
	num_samples: Number of samples to generate
	progress: Gradio progress tracker

	Returns:
	status_message: Generation status
	npz_path: Path to saved NPZ file
	sample_plot: Preview plot of first generated sample
	"""
	try:
	# Convert num_samples to int (Gradio might pass float)
	num_samples = int(num_samples)
	print(f"[DEBUG] Requested num_samples: {num_samples} (type: {type(num_samples)})")

	progress(0, desc="Checking model files...")

	# Download model files from HF Hub if needed
	try:
	checkpoint_path, latent_bank_path = download_model_files()
	except Exception as e:
	error_msg = f"❌ Error downloading model files:\n{str(e)}\n\n"
	error_msg += "Please ensure model files are uploaded to:\n"
	error_msg += f"https://huggingface.co/{HF_REPO_ID}"
	return error_msg, None, None

	output_dir = 'generated_outputs'

	progress(0.1, desc="Loading model...")

	# Load model
	args = SimpleArgs()
	model = load_model(checkpoint_path, args)

	progress(0.3, desc=f"Generating {num_samples} samples...")

	# Generate samples
	generated_signals, real_names = generate_samples_from_latent_bank(
	model, latent_bank_path, station_id, num_samples, args
	)

	if generated_signals is None:
	return f"❌ Error: Failed to generate samples for station {station_id}", None, None

	progress(0.8, desc="Saving NPZ file...")

	# Save NPZ (NO PLOTTING)
	npz_path = save_generated_samples(generated_signals, real_names, station_id, output_dir)

	progress(0.95, desc="Creating preview plot...")

	# Create preview plot for first sample
	sample_plot = plot_signal_for_display(generated_signals[0])

	progress(1.0, desc="Done!")

	# Verify actual number of samples generated
	actual_count = len(generated_signals)

	status_msg = f"✅ Successfully generated {actual_count} samples for station {station_id}!\n"
	status_msg += f"📊 Requested: {num_samples} samples\n"
	status_msg += f"📁 Saved to: {npz_path}\n"
	status_msg += f"📈 Preview of first generated sample shown below."

	return status_msg, npz_path, sample_plot

	except Exception as e:
	import traceback
	error_msg = f"❌ Error during generation:\n{str(e)}\n\n{traceback.format_exc()}"
	return error_msg, None, None


	def load_and_display_npz(npz_file, sample_idx):
	"""
	Load NPZ file and display a specific sample.

	Args:
	npz_file: Path to NPZ file
	sample_idx: Index of sample to display (0-based)

	Returns:
	status_message: Load status
	sample_plot: Plot of selected sample
	"""
	try:
	if npz_file is None:
	return "⚠️ No NPZ file provided", None

	# Load NPZ
	data = np.load(npz_file)
	generated_signals = data['generated_signals']

	if sample_idx < 0 or sample_idx >= len(generated_signals):
	return f"⚠️ Sample index {sample_idx} out of range (0-{len(generated_signals)-1})", None

	# Plot selected sample
	sample_plot = plot_signal_for_display(generated_signals[sample_idx])

	status_msg = f"✅ Loaded NPZ with {len(generated_signals)} samples\n"
	status_msg += f"📊 Displaying sample #{sample_idx}"

	return status_msg, sample_plot

	except Exception as e:
	import traceback
	error_msg = f"❌ Error loading NPZ:\n{str(e)}\n\n{traceback.format_exc()}"
	return error_msg, None


	# ===========================
	# Gradio App
	# ===========================

	def create_demo():
	"""Create Gradio interface."""

	with gr.Blocks(title="TimesNet-Gen Demo: Station-Specific Seismic Generator") as demo:
	gr.Markdown("""
	# 🌍 TimesNet-Gen Demo: Station-Specific Seismic Sample Generator

	For more detailed information: https://arxiv.org/abs/2512.04694

	Generate realistic synthetic seismic signals with station-specific characteristics.

	Instructions:
	1. Select a station ID (5 fine-tuned stations available)
	2. Choose number of samples to generate
	3. Click "Generate Samples" and wait
	4. Preview generated samples or download NPZ file
	""")

	with gr.Tab("Generate Samples"):
	with gr.Row():
	with gr.Column(scale=1):
	station_dropdown = gr.Dropdown(
	choices=['0205', '1716', '2020', '3130', '4628'],
	value='0205',
	label="Station ID",
	info="Select target station"
	)
	num_samples_slider = gr.Slider(
	minimum=1,
	maximum=200,
	value=50,
	step=1,
	label="Number of Samples",
	info="How many samples to generate"
	)
	generate_btn = gr.Button("🚀 Generate Samples", variant="primary")

	with gr.Column(scale=2):
	status_text = gr.Textbox(
	label="Status",
	lines=5,
	interactive=False
	)
	npz_file_output = gr.File(
	label="Generated NPZ File",
	interactive=False
	)

	gr.Markdown("### Preview (First Generated Sample)")
	preview_plot = gr.Image(label="Sample Preview")

	generate_btn.click(
	fn=generate_samples_interface,
	inputs=[station_dropdown, num_samples_slider],
	outputs=[status_text, npz_file_output, preview_plot]
	)

	with gr.Tab("View Saved Samples"):
	gr.Markdown("### Load and view samples from saved NPZ file")

	with gr.Row():
	with gr.Column(scale=1):
	npz_upload = gr.File(
	label="Upload NPZ File",
	file_types=['.npz']
	)
	sample_idx_slider = gr.Slider(
	minimum=0,
	maximum=199,
	value=0,
	step=1,
	label="Sample Index",
	info="Which sample to display (0-based)"
	)
	load_btn = gr.Button("📊 Load and Display", variant="secondary")

	with gr.Column(scale=2):
	load_status = gr.Textbox(
	label="Status",
	lines=3,
	interactive=False
	)

	display_plot = gr.Image(label="Sample Display")

	load_btn.click(
	fn=load_and_display_npz,
	inputs=[npz_upload, sample_idx_slider],
	outputs=[load_status, display_plot]
	)

	gr.Markdown("""
	---
	Model: TimesNet-PointCloud
	Method: Bootstrap aggregation from latent bank
	Stations: 5 fine-tuned Turkish strong-motion stations
	Output: 3-component acceleration signals (E, N, Z) @ 100 Hz
	""")

	return demo


	if __name__ == "__main__":
	demo = create_demo()
	demo.launch(server_name="0.0.0.0", server_port=7860)