IA Sob Controle - Inteligência Artificial

186: Combatendo estereótipos no treinamento de LLMs, com Tiago Torrent

Oct 1, 2025
Tiago Torrent, professor de linguística computacional na UFJF e especialista em vieses em LLMs, traz uma conversa instigante. Ele discute como o projeto SHADES combate estereótipos, cobrindo temas como gênero e nacionalidade. Tiago explora a comparação entre o desempenho de modelos em português e inglês, revelando que modelos treinados em português tendem a replicar menos estereótipos. Ele também fala sobre a importância da revisão multilíngue e os desafios de garantir precisão cultural nas IAs.
Ask episode
AI Snips
Chapters
Transcript
Episode notes
INSIGHT

Dataset Multilíngue Contra Estereótipos

  • Shades nasceu para avaliar estereótipos em LLMs além do inglês e de gênero, cobrindo 16 línguas.
  • O objetivo foi criar um benchmark sistemático compatível com pipelines de avaliação de modelos.
INSIGHT

Cobertura Ampla de Domínios

  • Shades avalia múltiplos domínios: gênero, idade, nacionalidade, profissão, status econômico e saúde mental.
  • O dataset permite combinar categorias para testar estereótipos interseccionais.
INSIGHT

Validação Cross‑linguística e Sentenças Controle

  • Metodologia foi colaborativa e emergente: equipes traduziram e validaram estereótipos entre línguas.
  • Sentenças alternativas não-estereotipadas foram criadas para comparar respostas dos modelos.
Get the Snipd Podcast app to discover more snips from this episode
Get the app