
194: Desenvolvendo o Gigaverbo, o maior banco de dados em português para IA, com Nicholas Kluge
IA Sob Controle - Inteligência Artificial
00:00
Ferramentas e referências para processar Common Crawl
Nicholas recomenda a biblioteca DataTrove e fala sobre filtros usados em datasets famosos como The Pile e Fine Web.
Transcript
Play full episode


