Sherkhan Umurzak's picture

👋 Open to Work

Sherkhan Umurzak

Sherkhan243

·

AI & ML interests

None yet

Recent Activity

updated a model 4 days ago

Sherkhan243/gemma4-31b-nbk-translate-lora

published a model 4 days ago

Sherkhan243/gemma4-31b-nbk-translate-lora

liked a dataset 3 months ago

MTSAIR/MWS-Vision-Bench

View all activity

Organizations

None yet

upvoted an article 6 months ago

Article

Illustrating Reinforcement Learning from Human Feedback (RLHF)

+2

natolambert, LouisCastricato, lvwerra, Dahoas

•

Dec 9, 2022

• 417

upvoted a paper 8 months ago

TOUCAN: Synthesizing 1.5M Tool-Agentic Data from Real-World MCP Environments

Paper • 2510.01179 • Published Oct 1, 2025 • 29