Shivendra Gupta

ShivendraGupta123

·

AI & ML interests

None yet

Recent Activity

liked a dataset about 1 month ago

InfoBayAI/English_United_Kingdom_Call_Center_Audio_Dataset_Dual_Channel

liked a dataset about 2 months ago

InfoBayAI/English_Podcast_Audio_Dataset

liked a dataset about 2 months ago

InfoBayAI/Hindi_Podcast_Audio_Dataset

View all activity

Organizations

None yet

upvoted 7 collections 3 months ago

STEM & Non-STEM Q&A Datasets for LLM Training

Sample datasets from a 6.5M+ enterprise-grade Q&A corpus across STEM and Non-STEM domains, built for LLM training, instruction tuning, and evaluation. • 6 items • Updated Jun 5 • 1

Academic Textbook Corpora for LLM Training

Sample of a 2.6+ word textbook corpus across 39K+ books, 5K+ subjects, and 15 languages for LLM training and multilingual knowledge modeling. • 21 items • Updated Jun 8 • 1

UGC and STEM Video Datasets

3 items • Updated Jun 5 • 1

Single-channel Podcast Speech Audio Datasets

Sample from a podcast audio dataset, designed for ASR, speech recognition, and conversational AI training using diverse, real-world spoken content. • 12 items • Updated Jun 8 • 1

Dual Channel Global Customer-Agent Interaction Datasets

Sample Datasets of dual-channel call center audio with separate agent and customer channels for ASR, diarization, and conversational AI training. • 24 items • Updated Jun 5 • 1

Healthcare AI Datasets for Clinical & LLM Training

Sample dataset from an enterprise-grade medical corpus built for clinical AI, diagnosis support, and healthcare LLM training. • 18 items • Updated Jun 8 • 1

Computer Vision & Multimodal Datasets

Sample dataset from multilingual image corpus covering medical, STEM, Non-STEM, automobile, and complex domains for computer vision and multimodal AI. • 0 items • Updated about 10 hours ago • 1