nvidia
/

C-RADIOv4-SO400M

Feature Extraction

Model card Files Files and versions

C-RADIOv4-SO400M / adaptor_attn.py

mranzinger's picture

Upload model (#3)

c260a86 verified 2 months ago

1.8 kB

	# Copyright (c) 2026, NVIDIA CORPORATION. All rights reserved.
	#
	# NVIDIA CORPORATION and its licensors retain all intellectual property
	# and proprietary rights in and to this software, related documentation
	# and any modifications thereto. Any use, reproduction, disclosure or
	# distribution of this software and related documentation without an express
	# license agreement from NVIDIA CORPORATION is strictly prohibited.
	import math
	from typing import Dict, Optional

	import torch
	from torch import nn

	from einops import rearrange
	from timm.models.vision_transformer import Block

	from .enable_spectral_reparam import disable_spectral_reparam, enable_spectral_reparam
	from .adaptor_base import AdaptorModuleBase
	from .adaptor_mlp import MLP2


	class AttnFDHead(AdaptorModuleBase):
	def __init__(
	self,
	input_size: int,
	hidden_size: int,
	output_size: int,
	num_inner: int = 0,
	pre_norm: bool = False,
	device: torch.device = None,
	upsample_factor: int = 1,
	upsample_rank: int = 0,
	**kwargs # Ignore kwargs that might be to other "mlp" verions, e.g. teacher_summary_idxs
	) -> None:
	super().__init__(requires_summary_and_spatial=False)
	from timm.models.vision_transformer import Block
	self.blocks = nn.Sequential(*[
	Block(input_size, num_heads=16, init_values=1e-5)
	for _ in range(2)
	])
	self.mlp = MLP2(input_size, hidden_size, output_size,
	num_inner=0, pre_norm=pre_norm, device=device,
	upsample_factor=upsample_factor, upsample_rank=upsample_rank, **kwargs)

	def forward(self, x: torch.Tensor, **kwargs) -> torch.Tensor:
	x = self.blocks(x)
	x = self.mlp(x)
	return x