Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2506.09967

Resa: Transparent Reasoning Models via SAEs

Paper • 2506.09967 • Published Jun 11 • 21
Gemma Scope: Open Sparse Autoencoders Everywhere All At Once on Gemma 2

Paper • 2408.05147 • Published Aug 9, 2024 • 40
Train Sparse Autoencoders Efficiently by Utilizing Features Correlation

Paper • 2505.22255 • Published May 28 • 24
I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Autoencoders

Paper • 2503.18878 • Published Mar 24 • 119

s3: You Don't Need That Much Data to Train a Search Agent via RL

Paper • 2505.14146 • Published May 20 • 19
Vibe Coding vs. Agentic Coding: Fundamentals and Practical Implications of Agentic AI

Paper • 2505.19443 • Published May 26 • 15
ARM: Adaptive Reasoning Model

Paper • 2505.20258 • Published May 26 • 45
Enigmata: Scaling Logical Reasoning in Large Language Models with Synthetic Verifiable Puzzles

Paper • 2505.19914 • Published May 26 • 43

Interpretability

I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Autoencoders

Paper • 2503.18878 • Published Mar 24 • 119
Truth Neurons

Paper • 2505.12182 • Published May 18 • 8
Resa: Transparent Reasoning Models via SAEs

Paper • 2506.09967 • Published Jun 11 • 21
Why Can't Transformers Learn Multiplication? Reverse-Engineering Reveals Long-Range Dependency Pitfalls

Paper • 2510.00184 • Published Sep 30 • 16

I add and I forget to read

Adapt-Pruner: Adaptive Structural Pruning for Efficient Small Language Model Training

Paper • 2502.03460 • Published Feb 5
LLM-Pruner: On the Structural Pruning of Large Language Models

Paper • 2305.11627 • Published May 19, 2023 • 3
Pruning as a Domain-specific LLM Extractor

Paper • 2405.06275 • Published May 10, 2024 • 1
KnowTuning: Knowledge-aware Fine-tuning for Large Language Models

Paper • 2402.11176 • Published Feb 17, 2024 • 2

Reasoning Language Models

Tina: Tiny Reasoning Models via LoRA

Paper • 2504.15777 • Published Apr 22 • 56
Resa: Transparent Reasoning Models via SAEs

Paper • 2506.09967 • Published Jun 11 • 21

Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18, 2024 • 151
Orion-14B: Open-source Multilingual Large Language Models

Paper • 2401.12246 • Published Jan 20, 2024 • 14
MambaByte: Token-free Selective State Space Model

Paper • 2401.13660 • Published Jan 24, 2024 • 60
MM-LLMs: Recent Advances in MultiModal Large Language Models

Paper • 2401.13601 • Published Jan 24, 2024 • 48

Resa: Transparent Reasoning Models via SAEs

Paper • 2506.09967 • Published Jun 11 • 21
Gemma Scope: Open Sparse Autoencoders Everywhere All At Once on Gemma 2

Paper • 2408.05147 • Published Aug 9, 2024 • 40
Train Sparse Autoencoders Efficiently by Utilizing Features Correlation

Paper • 2505.22255 • Published May 28 • 24
I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Autoencoders

Paper • 2503.18878 • Published Mar 24 • 119

I add and I forget to read

Adapt-Pruner: Adaptive Structural Pruning for Efficient Small Language Model Training

Paper • 2502.03460 • Published Feb 5
LLM-Pruner: On the Structural Pruning of Large Language Models

Paper • 2305.11627 • Published May 19, 2023 • 3
Pruning as a Domain-specific LLM Extractor

Paper • 2405.06275 • Published May 10, 2024 • 1
KnowTuning: Knowledge-aware Fine-tuning for Large Language Models

Paper • 2402.11176 • Published Feb 17, 2024 • 2

s3: You Don't Need That Much Data to Train a Search Agent via RL

Paper • 2505.14146 • Published May 20 • 19
Vibe Coding vs. Agentic Coding: Fundamentals and Practical Implications of Agentic AI

Paper • 2505.19443 • Published May 26 • 15
ARM: Adaptive Reasoning Model

Paper • 2505.20258 • Published May 26 • 45
Enigmata: Scaling Logical Reasoning in Large Language Models with Synthetic Verifiable Puzzles

Paper • 2505.19914 • Published May 26 • 43

Reasoning Language Models

Tina: Tiny Reasoning Models via LoRA

Paper • 2504.15777 • Published Apr 22 • 56
Resa: Transparent Reasoning Models via SAEs

Paper • 2506.09967 • Published Jun 11 • 21

Interpretability

I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Autoencoders

Paper • 2503.18878 • Published Mar 24 • 119
Truth Neurons

Paper • 2505.12182 • Published May 18 • 8
Resa: Transparent Reasoning Models via SAEs

Paper • 2506.09967 • Published Jun 11 • 21
Why Can't Transformers Learn Multiplication? Reverse-Engineering Reveals Long-Range Dependency Pitfalls

Paper • 2510.00184 • Published Sep 30 • 16

Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18, 2024 • 151
Orion-14B: Open-source Multilingual Large Language Models

Paper • 2401.12246 • Published Jan 20, 2024 • 14
MambaByte: Token-free Selective State Space Model

Paper • 2401.13660 • Published Jan 24, 2024 • 60
MM-LLMs: Recent Advances in MultiModal Large Language Models

Paper • 2401.13601 • Published Jan 24, 2024 • 48

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs