Hiroshi Yoshihara

RabotniKuma

·

AI & ML interests

None yet

Recent Activity

liked a dataset 6 days ago

genshiai-daichi/med-slm-ja-before-after

liked a dataset about 2 months ago

SakanaAI/FishMath-SFT-Data

liked a model 2 months ago

sbintuitions/sarashina2.2-tts

View all activity

Organizations

upvoted a paper 4 months ago

Nemotron-Cascade 2: Post-Training LLMs with Cascade RL and Multi-Domain On-Policy Distillation

Paper • 2603.19220 • Published Mar 19 • 70

upvoted 2 papers 12 months ago

Wider or Deeper? Scaling LLM Inference-Time Compute with Adaptive Branching Tree Search

Paper • 2503.04412 • Published Mar 6, 2025 • 6

A Practical Two-Stage Recipe for Mathematical LLMs: Maximizing Accuracy with SFT and Efficiency with Reinforcement Learning

Paper • 2507.08267 • Published Jul 11, 2025 • 11

upvoted 2 collections about 1 year ago

OpenMathReasoning

Models and datasets from "AIMO-2 Winning Solution: Building State-of-the-Art Mathematical Reasoning Models with OpenMathReasoning dataset" • 7 items • Updated 25 days ago • 48

Cosmos-Preidct1

⚠️ This collection is archived. 👉 https://huggingface.co/collections/nvidia/cosmos3 • 14 items • Updated 25 days ago • 304

upvoted a collection over 1 year ago

Reasoning Vector

Reasoningモデルとベースモデルの重み差分 • 4 items • Updated Feb 18, 2025 • 3