kje2952

AI & ML interests

None yet

Recent Activity

updated a collection 2 minutes ago

reasoning

updated a collection 3 minutes ago

moe

upvoted a paper 4 minutes ago

OmniMoE: An Efficient MoE by Orchestrating Atomic Experts at Scale

View all activity

Organizations

None yet

updated a collection 2 minutes ago

reasoning

Collection

2 items • Updated 2 minutes ago

updated a collection 3 minutes ago

moe

Collection

2 items • Updated 3 minutes ago

upvoted a paper 4 minutes ago

OmniMoE: An Efficient MoE by Orchestrating Atomic Experts at Scale

Paper • 2602.05711 • Published 5 days ago • 8

upvoted a paper 9 minutes ago

LLaDA2.1: Speeding Up Text Diffusion via Token Editing

Paper • 2602.08676 • Published about 21 hours ago • 31

upvoted a paper 10 minutes ago

LatentChem: From Textual CoT to Latent Thinking in Chemical Reasoning

Paper • 2602.07075 • Published 4 days ago • 15

updated a model about 11 hours ago

kje2952/moe-prefill-lora-v2

Updated 22 minutes ago

upvoted 2 papers about 11 hours ago

SEMA: Simple yet Effective Learning for Multi-Turn Jailbreak Attacks

Paper • 2602.06854 • Published 4 days ago • 5

LatentMem: Customizing Latent Memory for Multi-Agent Systems

Paper • 2602.03036 • Published 7 days ago • 14

upvoted 2 papers about 21 hours ago

Scaling Embedding Layers in Language Models

Paper • 2502.01637 • Published Feb 3, 2025 • 24

Scaling Embeddings Outperforms Scaling Experts in Language Models

Paper • 2601.21204 • Published 12 days ago • 98

upvoted 2 papers about 22 hours ago

Think-at-Hard: Selective Latent Iterations to Improve Reasoning Language Models

Paper • 2511.08577 • Published Nov 11, 2025 • 108

TiDAR: Think in Diffusion, Talk in Autoregression

Paper • 2511.08923 • Published Nov 12, 2025 • 127

upvoted 5 papers about 23 hours ago

DFlash: Block Diffusion for Flash Speculative Decoding

Paper • 2602.06036 • Published 5 days ago • 38

Focus-dLLM: Accelerating Long-Context Diffusion LLM Inference via Confidence-Guided Context Focusing

Paper • 2602.02159 • Published 8 days ago • 1

Exploring Knowledge Purification in Multi-Teacher Knowledge Distillation for LLMs

Paper • 2602.01064 • Published 9 days ago • 1

QuantLRM: Quantization of Large Reasoning Models via Fine-Tuning Signals

Paper • 2602.02581 • Published 10 days ago • 6

On the Entropy Dynamics in Reinforcement Fine-Tuning of Large Language Models

Paper • 2602.03392 • Published 7 days ago • 48

updated a model 1 day ago

kje2952/efkv-poc-results

Updated 1 day ago

published a model 1 day ago

kje2952/efkv-poc-results

Updated 1 day ago

upvoted a paper 5 days ago

MARS: Modular Agent with Reflective Search for Automated AI Research

Paper • 2602.02660 • Published 8 days ago • 60

kje2952

AI & ML interests

Recent Activity

Organizations

kje2952's activity