

#111- Llama4: Fogo no parquinho e alguns detalhes tecnicos.
Apr 10, 2025
Neste episódio, a nova família de modelos Lhama 4 é discutida em meio a polêmicas e debates técnicos. O lançamento suscita críticas da comunidade, enquanto inovações como a ampliação da janela de contexto são destacadas. Além disso, há atualizações sobre um curso que já conta com mais de 100 participantes, com feedback positivo e uma mudança do conteúdo teórico para o prático. Os ouvintes são incentivados a se inscreverem e a seguir o conteúdo nas redes sociais para continuar por dentro das novidades.
AI Snips
Chapters
Transcript
Episode notes
Lançamento Conturbado do Llama 4
- O lançamento do Llama 4 foi inesperado e em ritmo acelerado, causando críticas e controvérsias.
- Rumores de pressão interna para melhorar benchmarks foram negados pela Meta.
Arquitetura Mixture of Experts
- O Llama 4 consiste de três modelos principais e usa arquitetura Mixture of Experts para maior eficiência.
- Modelos variam de 109 bilhões a 2 trilhões de parâmetros, otimizando uso de GPU e escalabilidade.
Pré-treinamento Extenso e Multilíngue
- O Llama 4 foi pré-treinado com 30 trilhões de tokens e suporta mais de 200 línguas.
- O suporte multilíngue reflete a necessidade de atender a ampla base global de usuários dos produtos Meta.