jayesh thakare

joe-xhedi

·

jayeshthk

AI & ML interests

LLMs, SLMs

Organizations

None yet

joe-xhedi 's models 29

joe-xhedi/ModernBERT-NER

Token Classification • 0.1B • Updated Jun 28, 2025 • 8

joe-xhedi/Qwen-GRPO-geological-training

Text Generation • 0.5B • Updated Jun 13, 2025 • 11 • 1

joe-xhedi/Qwen-GRPO-Training-2

0.5B • Updated Apr 14, 2025 • 2

joe-xhedi/Qwen-GRPO-training

0.5B • Updated Apr 9, 2025 • 2

joe-xhedi/SentimentSeer_LSTM

Updated Aug 20, 2024

joe-xhedi/FashionMNIST-PYTorch-Model

Updated Jul 18, 2024

joe-xhedi/transformer-es-en-model

Updated Jun 23, 2024

joe-xhedi/transformer-de-en-model

Updated Jun 21, 2024

joe-xhedi/gpt-dev-french-english-scrach-model-nn

Updated Mar 30, 2024

joe-xhedi/llama_2_finetuned_product_description

Updated Oct 11, 2023 • 3

joe-xhedi/llama2-qlora-finetunined-french

Updated Oct 5, 2023 • 2

joe-xhedi/llama2-qlora-finetunined-argument_parsiong_test

Updated Sep 13, 2023 • 1

joe-xhedi/llama2-qlora-finetunined-pcs_not_structured-fail

Updated Sep 13, 2023 • 2

joe-xhedi/ludwig-method-not-worked

Updated Sep 12, 2023 • 1

joe-xhedi/rl_course_vizdoom_health_gathering_supreme

Reinforcement Learning • Updated Sep 10, 2023

joe-xhedi/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated Sep 10, 2023

joe-xhedi/Reinforce-CartPole8

Reinforcement Learning • Updated Sep 10, 2023

joe-xhedi/unit8-LunarLander-v2

Reinforcement Learning • Updated Sep 10, 2023

joe-xhedi/poca-SoccerTwos

Reinforcement Learning • Updated Sep 10, 2023 • 1

joe-xhedi/a2c-PandaPickAndPlace-v3

Reinforcement Learning • Updated Sep 9, 2023

joe-xhedi/a2c-PandaReachDense-v3

Reinforcement Learning • Updated Sep 9, 2023

joe-xhedi/llama-2-7b-chuk-test

Text Generation • Updated Sep 6, 2023 • 19 •

joe-xhedi/ppo-Pyramids

Reinforcement Learning • Updated Aug 29, 2023

joe-xhedi/ppo-SnowballTarget

Reinforcement Learning • Updated Aug 29, 2023

joe-xhedi/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Aug 19, 2023

joe-xhedi/Taxi-v3

Reinforcement Learning • Updated Aug 18, 2023

joe-xhedi/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Aug 18, 2023

joe-xhedi/ppo-Huggy

Reinforcement Learning • Updated Aug 17, 2023

joe-xhedi/ppo-LunarLander-v2

Reinforcement Learning • Updated Aug 17, 2023