IA Sob Controle - Inteligência Artificial

186: Combatendo estereótipos no treinamento de LLMs, com Tiago Torrent

Oct 1, 2025

Tiago Torrent, professor de linguística computacional na UFJF e especialista em vieses em LLMs, traz uma conversa instigante. Ele discute como o projeto SHADES combate estereótipos, cobrindo temas como gênero e nacionalidade. Tiago explora a comparação entre o desempenho de modelos em português e inglês, revelando que modelos treinados em português tendem a replicar menos estereótipos. Ele também fala sobre a importância da revisão multilíngue e os desafios de garantir precisão cultural nas IAs.

Ask episode

AI Snips

Chapters

Transcript

Episode notes

INSIGHT

Dataset Multilíngue Contra Estereótipos

Shades nasceu para avaliar estereótipos em LLMs além do inglês e de gênero, cobrindo 16 línguas.
O objetivo foi criar um benchmark sistemático compatível com pipelines de avaliação de modelos.

INSIGHT

Cobertura Ampla de Domínios

Shades avalia múltiplos domínios: gênero, idade, nacionalidade, profissão, status econômico e saúde mental.
O dataset permite combinar categorias para testar estereótipos interseccionais.

INSIGHT

Validação Cross‑linguística e Sentenças Controle

Metodologia foi colaborativa e emergente: equipes traduziram e validaram estereótipos entre línguas.
Sentenças alternativas não-estereotipadas foram criadas para comparar respostas dos modelos.

Get the Snipd Podcast app to discover more snips from this episode

Get the app