IA Sob Controle - Inteligência Artificial

160: Dados sintéticos no treinamento do Microsoft Phi-4, com Marah Abdin

Jul 2, 2025
Marah Abdin, Pesquisadora Líder de Dados Sintéticos da Microsoft, embarca em uma conversa fascinante sobre o treinamento do modelo Phi-4. Ela discute a importância dos dados sintéticos e como eles impactam a eficiência das interações em IA. A análise da necessidade de filtrar dados prejudiciais e a comparação com o GPT-4 trazem à tona questões éticas cruciais. Além disso, Marah oferece insights sobre carreiras em IA, ressaltando a importância de habilidades contínuas em tecnologia.
Ask episode
AI Snips
Chapters
Transcript
Episode notes
INSIGHT

Open Source x Código Fechado

  • Modelos open source e fechados têm prós e contras relevantes. - Código aberto é útil para pesquisa e avanço, desde que o desempenho seja adequado.
INSIGHT

Modelos Open Source como ponto de partida

  • Modelos open source são ponto de partida para empresas criarem seus próprios modelos. - A popularização técnico-científica dos LLMs vai melhorar com acesso aberto.
INSIGHT

Fase Fine-tuning e Aprendizado por Reforço

  • O Fine-tuning supervisionado prepara o modelo base para aprendizado por reforço. - Reforço ativa o raciocínio já existente, não ensina o modelo do zero.
Get the Snipd Podcast app to discover more snips from this episode
Get the app