Zaznov Ilia PRO

izaznov

·

AI & ML interests

None yet

Organizations

None yet

izaznov 's models 27

izaznov/financial-model-json-generator

Text Generation • 8B • Updated May 29, 2025 • 5

izaznov/gpt2_tokenizer

Updated May 26, 2025

izaznov/Qwen2-0.5B-GRPO-test

Updated Mar 29, 2025

izaznov/qihoo360_Light-R1-7B-DS_awq_quantized

Text Generation • 8B • Updated Mar 25, 2025 • 2

izaznov/qihoo360_Light-R1-14B-DS_awq_quantized

Text Generation • 15B • Updated Mar 25, 2025 • 1

izaznov/qwen_32b

Updated Mar 24, 2025

izaznov/r1_qwen_7b_220K_3ep_fn

Text Generation • 8B • Updated Mar 24, 2025 • 5

izaznov/qwen_math_7b

Text Generation • 8B • Updated Nov 26, 2024 • 4

izaznov/qwen_32b_competition_math

Text Generation • 34B • Updated Nov 23, 2024 • 4

izaznov/qwen_14b

Text Generation • 15B • Updated Nov 18, 2024 • 3

izaznov/qwen_arc_lora_model

Updated Nov 7, 2024

izaznov/output

1.26M • Updated May 25, 2024

izaznov/rl_course_vizdoom_health_gathering_supreme

Reinforcement Learning • Updated May 21, 2024

izaznov/ppo_torch_LunarLander-v2

Reinforcement Learning • Updated May 21, 2024

izaznov/poca-SoccerTwos

Reinforcement Learning • Updated May 3, 2024

izaznov/a2c-PandaPickAndPlace-v3

Reinforcement Learning • Updated Apr 29, 2024 • 1

izaznov/a2c-PandaReachDense-v3

Reinforcement Learning • Updated Apr 29, 2024

izaznov/ppo-Pyramids_Training

Reinforcement Learning • Updated Apr 28, 2024 • 2

izaznov/ppo-SnowballTarget

Reinforcement Learning • Updated Apr 28, 2024 • 1

izaznov/Reinforce-policy_pixel_copter

Reinforcement Learning • Updated Apr 27, 2024

izaznov/Reinforce-policy_Cart_Pole

Reinforcement Learning • Updated Apr 22, 2024

izaznov/qrdqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Apr 20, 2024 • 4

izaznov/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Apr 18, 2024

izaznov/taxi_3_Q_learning

Reinforcement Learning • Updated Apr 14, 2024

izaznov/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 12, 2024

izaznov/ppo-Huggy

Reinforcement Learning • Updated Apr 9, 2024 • 19

izaznov/PPO_LunarLander_v2

Reinforcement Learning • Updated Apr 8, 2024