👋 Open to Work

Rijusmit Biswas

Phantomcloak19

1 1

https://rijusmit.vercel.app/

AI & ML interests

Data Science, Machine Learning, Deep Learning

Recent Activity

updated a model about 19 hours ago

Phantomcloak19/qwen3-4b-dpo

updated a model about 19 hours ago

Phantomcloak19/qwen2.5-3b-dpo

updated a model about 19 hours ago

Phantomcloak19/sequntial-sft-dpo-grpo

View all activity

Organizations

None yet

updated 4 models about 19 hours ago

published a model 2 days ago

Phantomcloak19/qwen3-4b-dpo

Text Generation • 4B • Updated about 7 hours ago • 12

updated a model 2 days ago

Phantomcloak19/qwen2.5-3b-dpo-grpo

Text Generation • 3B • Updated 2 days ago • 15

published a model 2 days ago

Phantomcloak19/qwen2.5-3b-dpo-grpo

Text Generation • 3B • Updated 2 days ago • 15

updated a model 2 days ago

Phantomcloak19/TV-CGRPO-reward_soup_gemma-2-2b-it-QLoRA-TRL

Updated 2 days ago

published a model 2 days ago

Phantomcloak19/TV-CGRPO-reward_soup_gemma-2-2b-it-QLoRA-TRL

Updated 2 days ago

updated a model 2 days ago

Phantomcloak19/TV-CGRPO-reward_soup_Qwen2-5-3B-Instruct-QLoRA-TRL

Updated 2 days ago

published 3 models 2 days ago

Phantomcloak19/qwen2.5-3b-dpo

Text Generation • 3B • Updated about 7 hours ago • 15

Phantomcloak19/TV-CGRPO-reward_soup_Qwen2-5-3B-Instruct-QLoRA-TRL

Updated 2 days ago

Phantomcloak19/sequntial-sft-dpo-grpo

Updated about 7 hours ago

published a model 3 days ago

Phantomcloak19/gemma2-2b-dpo

Text Generation • 3B • Updated about 7 hours ago • 24

updated a model 3 days ago

Phantomcloak19/gemma2-2b-dpo-grpo

Text Generation • 3B • Updated 3 days ago • 15

published a model 3 days ago

Phantomcloak19/gemma2-2b-dpo-grpo

Text Generation • 3B • Updated 3 days ago • 15

updated a model 6 days ago

Phantomcloak19/TV-CGRPO-gemma-2-2b-it_two_obj_scalar-QLoRA-TRL

3B • Updated 6 days ago • 17

published a model 6 days ago

Phantomcloak19/TV-CGRPO-gemma-2-2b-it_two_obj_scalar-QLoRA-TRL

3B • Updated 6 days ago • 17

updated a model 6 days ago

Phantomcloak19/TV-CGRPO-gemma-2-2b-it_uniform_scalar-QLoRA-TRL

3B • Updated 6 days ago • 16

published a model 6 days ago

Phantomcloak19/TV-CGRPO-gemma-2-2b-it_uniform_scalar-QLoRA-TRL

3B • Updated 6 days ago • 16

Rijusmit Biswas

AI & ML interests

Recent Activity

Organizations

Phantomcloak19's activity