sohv
/

nanokimi-mini

Text Generation

Model card Files Files and versions

sohv commited on Oct 9, 2025

Commit

2fe1ac9

·

verified ·

1 Parent(s): 5c92b9a

Upload src/init.py

Files changed (1) hide show

src/__init__.py +26 -0

src/__init__.py ADDED Viewed

	@@ -0,0 +1,26 @@

+"""
+nanoKimi - The simplest, fastest repository for training/finetuning Kimi-K2 models
+This package implements the Kimi-K2 architecture with key innovations:
+- Muon Optimizer: Advanced optimization for faster convergence
+- Mixture of Experts (MoE): Efficient scaling with expert routing
+- Latent Attention: Memory-efficient attention mechanism
+"""
+from .model import KimiK2
+from .optimizer import Muon, create_muon_optimizer
+from .attention import LatentAttention, MultiHeadAttention
+from .moe import MoELayer, StandardFFN
+__version__ = "0.1.0"
+__author__ = "nanoKimi Team"
+__all__ = [
+    "KimiK2",
+    "Muon",
+    "create_muon_optimizer",
+    "LatentAttention",
+    "MultiHeadAttention",
+    "MoELayer",
+    "StandardFFN"
+]