

186: Combatendo estereótipos no treinamento de LLMs, com Tiago Torrent
Oct 1, 2025
Tiago Torrent, professor de linguística computacional na UFJF e especialista em vieses em LLMs, traz uma conversa instigante. Ele discute como o projeto SHADES combate estereótipos, cobrindo temas como gênero e nacionalidade. Tiago explora a comparação entre o desempenho de modelos em português e inglês, revelando que modelos treinados em português tendem a replicar menos estereótipos. Ele também fala sobre a importância da revisão multilíngue e os desafios de garantir precisão cultural nas IAs.
AI Snips
Chapters
Transcript
Episode notes
Dataset Multilíngue Contra Estereótipos
- Shades nasceu para avaliar estereótipos em LLMs além do inglês e de gênero, cobrindo 16 línguas.
- O objetivo foi criar um benchmark sistemático compatível com pipelines de avaliação de modelos.
Cobertura Ampla de Domínios
- Shades avalia múltiplos domínios: gênero, idade, nacionalidade, profissão, status econômico e saúde mental.
- O dataset permite combinar categorias para testar estereótipos interseccionais.
Validação Cross‑linguística e Sentenças Controle
- Metodologia foi colaborativa e emergente: equipes traduziram e validaram estereótipos entre línguas.
- Sentenças alternativas não-estereotipadas foram criadas para comparar respostas dos modelos.