

Vida com IA
Filipe Lauar
Um podcast sobre inteligência artificial de uma forma simples. Explicando algoritmos e mostrando como ela está presente no nosso dia a dia.
Episodes
Mentioned books

Apr 18, 2024 • 15min
#80- Layer pruning e Mixture of Depths.
Fala galera, continuando a serie de episódios sobre PEFT, nesse episoódio eu falo sobre tecnicas de otimização de inferência em LLMs.
Eu falo de layer pruning, onde a gente corta algumas camadas consecutivas da rede sem perder quase nada de qualidade do modelo.
Eu falo também sobre Mixture of Depths, uma tecnica semelhante ao Mixture of Experts, onde a gente usa um routing pra escolher quais tokens vão ser processados em qual camada da rede.
Paper MoD: https://arxiv.org/pdf/2404.02258.pdf
Paper layer pruning: https://arxiv.org/pdf/2403.17887v1.pdf
Instagram do podcast: https://www.instagram.com/podcast.lifewithai
Linkedin do podcast: https://www.linkedin.com/company/life-with-ai

Apr 11, 2024 • 15min
#79- LoRA e QLoRA.
Fala galera, esse é um primeiro episódio de uma série de episódios sobre PEFT, Parameter Efficient Fine Tuning. Nele eu falo sobre LoRA e QLoRA, que são 2 métodos muito importantes e amplamente utilizados que possibilitam o treinamento de LLMs bem mais rápido com o uso de apenas 1 GPU sem perder perfomance.
Video sobre QLoRA: https://www.youtube.com/watch?v=6l8GZDPbFn8
LoRA paper: https://arxiv.org/pdf/2106.09685.pdf
QLoRA paper: https://arxiv.org/pdf/2305.14314.pdf
Instagram do podcast: https://www.instagram.com/podcast.lifewithai
Linkedin do podcast: https://www.linkedin.com/company/life-with-ai

Mar 21, 2024 • 10min
#78- RAFT: Unindo RAG com fine tuning.
Fala galera, nesse expiódio eu falo sobre Retrieval Aware Fine Tuning (RAFT), um paper que propos uma nova técnica que utiliza tanto domain specific fine tuning quanto RAG pra melhorar a capacidade de recuperação da informação dos LLMs.
Nesse epiódio eu também falo sobre um outro paper que também tem o nome de RAFT, mas dessa vez Reward rAnking Fine Tuning, que propoe uma nova técnica para fazer RLHF mas sem os problemas de convergencia de Reinforcement Learning.
Retrieval Aware Fine Tuning: https://arxiv.org/abs/2403.10131v1
Reward rAnking Fine Tuning: https://arxiv.org/pdf/2304.06767.pdf
Instagram do podcast: https://www.instagram.com/podcast.lifewithai
Linkedin do podcast: https://www.linkedin.com/company/life-with-ai

Mar 7, 2024 • 17min
#77- Ring Attention e janelas de contexto de 1M, o RAG está morto?
Fala galera, nesse episódio eu explico como a gente consegue escalar a janela de contexto de um LLM pra mais de 1 milhão de tokens usando Ring Attention. Além disso eu discuto se a abordagem usando RAG está morta com esses avanços na janela de contexto.
Paper Lost in the Middle: https://arxiv.org/pdf/2307.03172.pdf
Gemini technical report: https://storage.googleapis.com/deepmind-media/gemini/gemini_v1_5_report.pdf
Paper Ring Attention: https://arxiv.org/pdf/2310.01889.pdf
Instagram do podcast: https://www.instagram.com/podcast.lifewithai
Linkedin do podcast: https://www.linkedin.com/company/life-with-ai

Feb 22, 2024 • 47min
#76- Resolvendo problemas usando IA com André Lopes.
Fala galera, nesse episódio eu recebi o André, ele é AI expert na IBM e a gente falou bastante sobre como usar IA pra resolver diversos problemas na industria.
Site da Brains: https://brains.dev/
Linkedin do Andre: https://www.linkedin.com/in/andrefelipelopes/
Linkedin da Brains: https://www.linkedin.com/company/brains-brazilian-ai-networks/
Instagram do podcast: https://www.instagram.com/podcast.lifewithai
Linkedin do podcast: https://www.linkedin.com/company/life-with-ai

Jan 18, 2024 • 13min
#75- Mixtral e Mixture Of Experts.
Fala galera, nesse episódio eu falo sobre Mixture Of Experts e mais espeicificamente sobre o Mixtral, que hoje é o melhor LLM open source disponível e ele também é melhor que ChatGPT 3.5 e o Gemini Pro.
Mixtral paper: https://arxiv.org/pdf/2401.04088.pdf
Mixtral model: https://huggingface.co/mistralai/Mixtral-8x7B-v0.1
Mixtral YouTube: https://www.youtube.com/watch?v=mwO6v4BlgZQ
Instagram: https://www.instagram.com/podcast.lifewithai
Linkedin: https://www.linkedin.com/company/life-with-ai

Dec 7, 2023 • 13min
#74- Named Entity Recognition e NLP com Sergei Bogdanov.
Fala galera, na versão em ingles do podcast eu entrevistei o Sergei e a gente falou bastante sobre NLP e mais especificamente o problem de Named Entity Recognition (NER). O Sergei e o time dele na NuMind publicaram um artigo sobre o modelo fundamental de NER deles que bateu e muito o estado da arte e a gente conversou sobre esse modelo na entrevista.
Modelo em ingles: https://huggingface.co/numind/generic-entity_recognition_NER-v1
Modelo multi-language: https://huggingface.co/numind/generic-entity_recognition_NER-multilingual-v1
Linkedin do Sergei: https://www.linkedin.com/in/svbogdanov/
Instagram: https://www.instagram.com/podcast.lifewithai/
Linkedin: https://www.linkedin.com/company/life-with-ai

Nov 30, 2023 • 34min
#73- Transformers.
Fala galera, nesse episódio eu explico tudo que sei sobre Transformers. Falo da arquitetura, explico a formula de atenção, encoder, decoder, self-supervised learning, positional encoding, tokenisation, inductive bias, Vision-Transformers, receiptive fields...
Foi o episódio mais tecnico que eu ja gravei e eu espero que voces gostem! Vale a pena escutar esse episódio com o paper do transformer aberto.
Paper Transformers: https://arxiv.org/pdf/1706.03762.pdf
Link do video explicando Next Token Prediction: https://www.linkedin.com/posts/zainhas_the-most-clearest-and-crisp-explanation-ugcPost-7132561633280692224-63AX?utm_source=share&utm_medium=member_desktop
Instagram: https://www.instagram.com/podcast.lifewithai/
Linkedin: https://www.linkedin.com/company/life-with-ai

Nov 16, 2023 • 12min
#72- RAG e agentes.
Fala galera, nesse episódio eu explico o que é RAG (Retrieval Augmented Generation) e o conceito de agentes que executam tarefas.
Instagram: https://www.instagram.com/podcast.lifewithai/
Linkedin: https://www.linkedin.com/company/life-with-ai

Nov 2, 2023 • 30min
#71- IA em chat bots com Daniel da WeClever.
Fala galera, nesse episódio eu entrevistei o Daniel, CTO da WeClever, e a gente conversou sobre como eles estão usando IA para melhorar a experiência dos chat bots. Durante a conversa a gente falou sobre fine tuning do ChatGPT, LoRA, RAG… foi uma conversa muito massa e eu espero que voces gostem!
WeClever: https://www.linkedin.com/company/wecleverco/
Daniel Linkedin: https://www.linkedin.com/in/dmerlimorais/
Instagram: https://www.instagram.com/podcast.lifewithai/
Linkedin: https://www.linkedin.com/company/life-with-ai