Kazuki Fujii

kazukifujii

https://okoge-kaz.github.io/

AI & ML interests

Distributed Training, ML Systems, VLA

Recent Activity

liked a dataset about 8 hours ago

nvidia/Nemotron-RL-agent-workplace_assistant

upvoted an article about 10 hours ago

PipelineRL

liked a dataset 1 day ago

Inferact/codex_swebenchpro_traces

View all activity

Organizations

liked a dataset about 8 hours ago

nvidia/Nemotron-RL-agent-workplace_assistant

Viewer • Updated Feb 26 • 1.8k • 1.31k • 29

upvoted an article about 10 hours ago

Article

PipelineRL

ServiceNow

•

Apr 25, 2025

• 46

liked a dataset 1 day ago

Inferact/codex_swebenchpro_traces

Viewer • Updated May 7 • 610 • 716 • 25

upvoted an article 6 days ago

Article

GLM-5.2: Built for Long-Horizon Tasks

zai-org

•

12 days ago

• 110

liked a model 7 days ago

google/gemma-4-12B

Any-to-Any • 12B • Updated 25 days ago • 376k • 624

upvoted an article 7 days ago

Article

The Open Source Community is backing OpenEnv for Agentic RL

burtenshaw, spisakjo, lysandre, darktex, willcb, qjoy, pawalt, cwing-nv, danielhanchen, andrewzhou, thegovind, shimmyshimmer, Hamid-Nazeri, Sanyam, zkwentz, emre0, lewtun, sergiopaniego, banghua

•

21 days ago

• 99

liked a model 8 days ago

modal-labs/Qwen3.5-397B-A17B-DFlash

Text Generation • 1B • Updated 14 days ago • 601 • 5

upvoted a paper 11 days ago

GLM-5V-Turbo: Toward a Native Foundation Model for Multimodal Agents

Paper • 2604.26752 • Published Apr 29 • 112

liked a model 12 days ago

zai-org/GLM-5

Text Generation • 754B • Updated Apr 5 • 65.5k • • 2.11k

liked 2 models 14 days ago

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-Base-BF16

Text Generation • 124B • Updated Mar 14 • 28.1k • 32

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

Text Generation • 67B • Updated May 1 • 1.08M • 367

upvoted an article 14 days ago

Article

Profiling in PyTorch (Part 2): From nn.Linear to a Fused MLP

ariG23498, ror, sergiopaniego, pcuenq, sayakpaul

•

18 days ago

• 50

upvoted 3 articles 29 days ago

Article

Unlocking asynchronicity in continuous batching

ror, pcuenq, ariG23498

•

May 14

• 61

Article

KV Cache from scratch in nanoVLM

ariG23498, kashif, lusxvr, andito, pcuenq

•

Jun 4, 2025

• 120

Article

Continuous batching from first principles

ror, ArthurZ, mcpotato

•

Nov 25, 2025

• 411

upvoted 2 articles about 1 month ago

Article

KV Caching Explained: Optimizing Transformer Inference Efficiency

not-lain

•

Jan 30, 2025

• 355

Article

Profiling in PyTorch (Part 1): A Beginner's Guide to torch.profiler

ariG23498, sayakpaul, sergiopaniego, ror, pcuenq

•

May 29

• 129

upvoted 2 papers about 1 month ago

Efficient Memory Management for Large Language Model Serving with PagedAttention

Paper • 2309.06180 • Published Sep 12, 2023 • 60

Gated DeltaNet-2: Decoupling Erase and Write in Linear Attention

Paper • 2605.22791 • Published May 21 • 33

updated a Space about 1 month ago

README

🌍

Kazuki Fujii

AI & ML interests

Recent Activity

Organizations

kazukifujii's activity

PipelineRL

GLM-5.2: Built for Long-Horizon Tasks

The Open Source Community is backing OpenEnv for Agentic RL

Profiling in PyTorch (Part 2): From nn.Linear to a Fused MLP

Unlocking asynchronicity in continuous batching

KV Cache from scratch in nanoVLM

Continuous batching from first principles

KV Caching Explained: Optimizing Transformer Inference Efficiency

Profiling in PyTorch (Part 1): A Beginner's Guide to torch.profiler

README