Infinite Curiosity Pod with Prateek Joshi

Algorithmic Data Curation

Feb 26, 2024

Explore the importance of data curation in AI models, challenges in data quality, removing types of data, relationship between data size and model size, choosing optimal data subset, future of data curation, impact on service providers. CEO of automated data curation platform shares insights. Estimating conceptual complexity algorithmically, automated data curation for ML training, exploring sector-specific approaches, optimizing model size and data size in ML.

Ask episode

Chapters

Transcript

Episode notes

Introduction

00:00 • 4min

Algorithmic Data Curation in Machine Learning

04:23 • 10min

Estimating Conceptual Complexity Algorithmically in Data Sets

14:19 • 2min

Automated Data Curation for Machine Learning Training

16:16 • 2min

Exploring Data Curation Approaches Across Sectors

17:49 • 2min

Optimizing Model Size and Data Size in Machine Learning

19:54 • 21min