#84- FineWeb, o melhor dataset pra pre-treinar LLMs.
Jun 13, 2024
13:51
forum Ask episode
view_agenda Chapters
auto_awesome Transcript
info_circle Episode notes
Fala galera, nesse episódio do podcast eu falo sobre o dataset FineWeb, o melhor dataset open source de pre-treinamento existente até hoje. No episódio eu explico como eles fizeram a curadoria do dataset e um pouco dos resultados.