In a Training Loop 🔄

Namrata Thakur

NamrataThakur

NamrataThakur

AI & ML interests

Small Language Model, Fine-Tuning, From Scratch

Recent Activity

updated a model 24 days ago

NamrataThakur/Small_Language_Model_MOE_127M_Pretrained

updated a model 24 days ago

NamrataThakur/Small_Language_Model_GQA_48M_Pretrained

updated a model 24 days ago

NamrataThakur/Small_Language_Model_MHA_53M_Pretrained

View all activity

Organizations

None yet

updated 3 models 24 days ago

updated a model 27 days ago

NamrataThakur/llama31-8bn_Reinforcement-Fine-Tuned

Question Answering • 8B • Updated 27 days ago • 189

published a model 27 days ago

NamrataThakur/llama31-8bn_Reinforcement-Fine-Tuned

Question Answering • 8B • Updated 27 days ago • 189

updated a model 28 days ago

NamrataThakur/llama31-8bn_SFT

Question Answering • 8B • Updated 28 days ago • 32

published a model about 1 month ago

NamrataThakur/llama31-8bn_SFT

Question Answering • 8B • Updated 28 days ago • 32

liked a model about 1 month ago

NamrataThakur/Small_Language_Model_MOE_127M_Pretrained

Text Generation • Updated 24 days ago • 2.64k • 1

updated a collection about 1 month ago

Stories-SLM

Collection

A collection of Small Language Models pretrained from scratch (using only PyTorch) on Tiny Stories Dataset on a single Tesla-T4 16GB GPU. • 3 items • Updated Mar 8 • 1

published a model about 1 month ago

NamrataThakur/Small_Language_Model_MOE_127M_Pretrained

Text Generation • Updated 24 days ago • 2.64k • 1

updated a collection about 1 month ago

Stories-SLM

Collection

A collection of Small Language Models pretrained from scratch (using only PyTorch) on Tiny Stories Dataset on a single Tesla-T4 16GB GPU. • 3 items • Updated Mar 8 • 1

liked 2 models about 1 month ago

NamrataThakur/Small_Language_Model_GQA_48M_Pretrained

Text Generation • Updated 24 days ago • 2.64k • 1

NamrataThakur/Small_Language_Model_MHA_53M_Pretrained

Text Generation • Updated 24 days ago • 2.64k • 1

updated 2 models about 1 month ago

NamrataThakur/llama32-1bn_finetuned

Question Answering • 1B • Updated Feb 25 • 2

NamrataThakur/llama32-1bn_RAFT

Question Answering • 1B • Updated Feb 25 • 2

published a model about 1 month ago

NamrataThakur/Small_Language_Model_MHA_53M_Pretrained

Text Generation • Updated 24 days ago • 2.64k • 1

updated a model about 1 month ago

NamrataThakur/GPT2_355M_Perference-Fine-Tune_DPO

Question Answering • Updated Feb 24

updated a model about 2 months ago

NamrataThakur/llama32-1bn_FederatedLearning_Fine-Tuned_nonQuantized

Question Answering • 1B • Updated Feb 24 • 3

published a model about 2 months ago

NamrataThakur/llama32-1bn_FederatedLearning_Fine-Tuned_nonQuantized

Question Answering • 1B • Updated Feb 24 • 3

Namrata Thakur

AI & ML interests

Recent Activity

Organizations

NamrataThakur's activity