Spaces:

abdelac
/

Fake

Runtime error

Fake / create_new_model.py

2ae87d4 2 months ago

6.51 kB

	"""
	create_new_model.py - Create a new working model from scratch
	"""

	import tensorflow as tf
	from tensorflow.keras import layers, Model
	import numpy as np
	import os

	print("=" * 60)
	print("CREATING NEW WORKING MODEL")
	print("=" * 60)

	def create_vit_extractor():
	"""Create a Vision Transformer feature extractor."""
	print("Building Vision Transformer extractor...")

	# Input layer
	inputs = layers.Input(shape=(224, 224, 3), name='input_image')

	# Preprocessing
	x = layers.Rescaling(1./255)(inputs)

	# Patch embeddings (simulated with Conv2D)
	x = layers.Conv2D(
	filters=768,
	kernel_size=16,
	strides=16,
	padding='valid',
	name='patch_embeddings'
	)(x)

	# Reshape to (batch, num_patches, embed_dim)
	batch_size = tf.shape(x)[0]
	x = tf.reshape(x, [batch_size, -1, 768])

	# Add class token
	cls_token = tf.Variable(
	tf.random.normal((1, 1, 768)),
	trainable=True,
	name='cls_token'
	)
	cls_token = tf.tile(cls_token, [batch_size, 1, 1])
	x = tf.concat([cls_token, x], axis=1)

	# Position embeddings
	pos_emb = layers.Dense(768, name='position_embeddings')(tf.zeros((1, 197, 768)))
	x = x + pos_emb

	# Transformer blocks
	for i in range(6):
	# Layer norm 1
	x_norm = layers.LayerNormalization(epsilon=1e-6, name=f'transformer_{i}_ln1')(x)

	# Multi-head attention
	attn = layers.MultiHeadAttention(
	num_heads=12,
	key_dim=64,
	name=f'transformer_{i}_attn'
	)
	attn_output = attn(x_norm, x_norm)

	# First residual
	x = x + attn_output

	# Layer norm 2
	x_norm = layers.LayerNormalization(epsilon=1e-6, name=f'transformer_{i}_ln2')(x)

	# MLP
	mlp = tf.keras.Sequential([
	layers.Dense(3072, activation='gelu', name=f'transformer_{i}_mlp1'),
	layers.Dropout(0.1),
	layers.Dense(768, name=f'transformer_{i}_mlp2'),
	layers.Dropout(0.1)
	], name=f'transformer_{i}_mlp')

	mlp_output = mlp(x_norm)

	# Second residual
	x = x + mlp_output

	# Extract class token
	x = x[:, 0, :] # Shape: (batch, 768)

	# Project to feature space
	x = layers.Dense(512, activation='relu', name='proj1')(x)
	x = layers.Dropout(0.3, name='dropout1')(x)
	x = layers.Dense(256, activation='relu', name='proj2')(x)
	outputs = layers.Dense(512, activation='relu', name='output_features')(x)

	# Create model
	model = Model(inputs=inputs, outputs=outputs, name='hybrid_feature_extractor')

	# Compile (not needed for inference but helps)
	model.compile(optimizer='adam', loss='mse')

	print(f"✓ Vision Transformer created")
	return model

	def create_cnn_extractor():
	"""Create a CNN-based feature extractor (faster)."""
	print("Building CNN extractor...")

	inputs = layers.Input(shape=(224, 224, 3), name='input_image')

	# Use EfficientNetV2B0 for good performance
	base_model = tf.keras.applications.EfficientNetV2B0(
	include_top=False,
	weights='imagenet',
	input_tensor=inputs,
	pooling='avg'
	)
	base_model.trainable = False

	# Get features
	features = base_model.output

	# Add custom layers
	x = layers.Dense(512, activation='relu', name='fc1')(features)
	x = layers.Dropout(0.3, name='dropout1')(x)
	x = layers.Dense(256, activation='relu', name='fc2')(x)
	x = layers.Dropout(0.2, name='dropout2')(x)
	outputs = layers.Dense(512, activation='relu', name='output_features')(x)

	model = Model(inputs=inputs, outputs=outputs, name='cnn_feature_extractor')

	print(f"✓ CNN extractor created")
	return model

	def save_model_multiple_formats(model, base_name):
	"""Save model in multiple formats for compatibility."""
	print(f"\nSaving model in multiple formats...")

	# 1. Save as .keras (recommended)
	keras_path = f"{base_name}.keras"
	model.save(keras_path)
	print(f"✓ Saved as {keras_path}")

	# 2. Save as SavedModel
	sm_path = f"{base_name}_savedmodel"
	model.save(sm_path, save_format='tf')
	print(f"✓ Saved as SavedModel: {sm_path}")

	# 3. Save as H5 (for backward compatibility)
	h5_path = f"{base_name}.h5"
	model.save(h5_path, save_format='h5')
	print(f"✓ Saved as H5: {h5_path}")

	return keras_path, sm_path, h5_path

	def create_dummy_data(model):
	"""Create dummy training data to initialize model."""
	print("\nCreating dummy training data...")

	# Generate random images
	dummy_images = np.random.randn(10, 224, 224, 3).astype('float32')
	dummy_features = np.random.randn(10, model.output_shape[1]).astype('float32')

	# Train for 1 epoch (just to initialize weights properly)
	model.fit(
	dummy_images,
	dummy_features,
	epochs=1,
	verbose=0
	)

	print("✓ Model initialized with dummy data")

	if __name__ == "__main__":
	print("Select model type:")
	print("1. Vision Transformer (ViT) - More accurate")
	print("2. CNN (EfficientNet) - Faster inference")
	print("3. Hybrid (CNN + Transformer) - Best of both")

	choice = input("\nEnter choice (1, 2, or 3): ").strip()

	if choice == '1':
	model = create_vit_extractor()
	model_name = "vit_extractor"
	elif choice == '2':
	model = create_cnn_extractor()
	model_name = "cnn_extractor"
	else:
	# Create hybrid model
	print("Building hybrid model...")
	model = create_cnn_extractor()
	model_name = "hybrid_extractor"

	# Show model summary
	print(f"\nModel Summary:")
	model.summary()

	# Initialize with dummy data
	create_dummy_data(model)

	# Save in multiple formats
	keras_path, sm_path, h5_path = save_model_multiple_formats(model, model_name)

	print("\n" + "=" * 60)
	print("MODEL CREATION COMPLETE")
	print("=" * 60)
	print(f"✅ Model: {model.name}")
	print(f"✅ Input shape: {model.input_shape}")
	print(f"✅ Output shape: {model.output_shape}")
	print(f"✅ Formats available:")
	print(f" - {keras_path} (recommended)")
	print(f" - {sm_path}/ (SavedModel)")
	print(f" - {h5_path} (H5 for compatibility)")
	print("\nNow update your app.py to use one of these files!")
	print("=" * 60)