msj19
/

gated_deltaproduct_layer17

gated_deltaproduct

Model card Files Files and versions

gated_deltaproduct_layer17 / fla2 /__init__.py

msj19's picture

Add files using upload-large-folder tool

fe0450e verified about 1 month ago

history blame contribute delete

1.81 kB

	# -- coding: utf-8 --

	# from fla.layers import (ABCAttention, Attention, BasedLinearAttention,
	# DeltaNet, GatedLinearAttention, HGRN2Attention,
	# LinearAttention, MultiScaleRetention,
	# ReBasedLinearAttention)
	# from fla.models import (ABCForCausalLM, ABCModel, DeltaNetForCausalLM,
	# DeltaNetModel, GLAForCausalLM, GLAModel,
	# HGRN2ForCausalLM, HGRN2Model, HGRNForCausalLM,
	# HGRNModel, LinearAttentionForCausalLM,
	# LinearAttentionModel, RetNetForCausalLM, RetNetModel,
	# RWKV6ForCausalLM, RWKV6Model, TransformerForCausalLM,
	# TransformerModel)
	# from fla.ops import (chunk_gla, chunk_retention, fused_chunk_based,
	# fused_chunk_gla, fused_chunk_retention)
	from .models import emla,emgla,mask_deltanet,mask_gdn,transformer

	# __all__ = [
	# 'ABCAttention',
	# 'Attention',
	# 'BasedLinearAttention',
	# 'DeltaNet',
	# 'HGRN2Attention',
	# 'GatedLinearAttention',
	# 'LinearAttention',
	# 'MultiScaleRetention',
	# 'ReBasedLinearAttention',
	# 'ABCForCausalLM',
	# 'ABCModel',
	# 'DeltaNetForCausalLM',
	# 'DeltaNetModel',
	# 'HGRNForCausalLM',
	# 'HGRNModel',
	# 'HGRN2ForCausalLM',
	# 'HGRN2Model',
	# 'GLAForCausalLM',
	# 'GLAModel',
	# 'LinearAttentionForCausalLM',
	# 'LinearAttentionModel',
	# 'RetNetForCausalLM',
	# 'RetNetModel',
	# 'RWKV6ForCausalLM',
	# 'RWKV6Model',
	# 'TransformerForCausalLM',
	# 'TransformerModel',
	# 'chunk_gla',
	# 'chunk_retention',
	# 'fused_chunk_based',
	# 'fused_chunk_gla',
	# 'fused_chunk_retention'
	# ]

	__version__ = '0.1'