Vida com IA

Filipe Lauar
undefined
Apr 18, 2024 • 15min

#80- Layer pruning e Mixture of Depths.

Fala galera, continuando a serie de episódios sobre PEFT, nesse episoódio eu falo sobre tecnicas de otimização de inferência em LLMs. Eu falo de layer pruning, onde a gente corta algumas camadas consecutivas da rede sem perder quase nada de qualidade do modelo. Eu falo também sobre Mixture of Depths, uma tecnica semelhante ao Mixture of Experts, onde a gente usa um routing pra escolher quais tokens vão ser processados em qual camada da rede. Paper MoD: https://arxiv.org/pdf/2404.02258.pdf Paper layer pruning: https://arxiv.org/pdf/2403.17887v1.pdf Instagram do podcast: https://www.instagram.com/podcast.lifewithai Linkedin do podcast: https://www.linkedin.com/company/life-with-ai
undefined
Apr 11, 2024 • 15min

#79- LoRA e QLoRA.

Fala galera, esse é um primeiro episódio de uma série de episódios sobre PEFT, Parameter Efficient Fine Tuning. Nele eu falo sobre LoRA e QLoRA, que são 2 métodos muito importantes e amplamente utilizados que possibilitam o treinamento de LLMs bem mais rápido com o uso de apenas 1 GPU sem perder perfomance. Video sobre QLoRA: https://www.youtube.com/watch?v=6l8GZDPbFn8 LoRA paper: https://arxiv.org/pdf/2106.09685.pdf QLoRA paper: https://arxiv.org/pdf/2305.14314.pdf Instagram do podcast: https://www.instagram.com/podcast.lifewithai Linkedin do podcast: https://www.linkedin.com/company/life-with-ai
undefined
Mar 21, 2024 • 10min

#78- RAFT: Unindo RAG com fine tuning.

Fala galera, nesse expiódio eu falo sobre Retrieval Aware Fine Tuning (RAFT), um paper que propos uma nova técnica que utiliza tanto domain specific fine tuning quanto RAG pra melhorar a capacidade de recuperação da informação dos LLMs. Nesse epiódio eu também falo sobre um outro paper que também tem o nome de RAFT, mas dessa vez Reward rAnking Fine Tuning, que propoe uma nova técnica para fazer RLHF mas sem os problemas de convergencia de Reinforcement Learning. Retrieval Aware Fine Tuning: https://arxiv.org/abs/2403.10131v1 Reward rAnking Fine Tuning: https://arxiv.org/pdf/2304.06767.pdf Instagram do podcast: https://www.instagram.com/podcast.lifewithai Linkedin do podcast: https://www.linkedin.com/company/life-with-ai
undefined
Mar 7, 2024 • 17min

#77- Ring Attention e janelas de contexto de 1M, o RAG está morto?

Fala galera, nesse episódio eu explico como a gente consegue escalar a janela de contexto de um LLM pra mais de 1 milhão de tokens usando Ring Attention. Além disso eu discuto se a abordagem usando RAG está morta com esses avanços na janela de contexto. Paper Lost in the Middle: https://arxiv.org/pdf/2307.03172.pdf Gemini technical report: https://storage.googleapis.com/deepmind-media/gemini/gemini_v1_5_report.pdf Paper Ring Attention: https://arxiv.org/pdf/2310.01889.pdf Instagram do podcast: https://www.instagram.com/podcast.lifewithai Linkedin do podcast: https://www.linkedin.com/company/life-with-ai
undefined
Feb 22, 2024 • 47min

#76- Resolvendo problemas usando IA com André Lopes.

Fala galera, nesse episódio eu recebi o André, ele é AI expert na IBM e a gente falou bastante sobre como usar IA pra resolver diversos problemas na industria. Site da Brains: https://brains.dev/ Linkedin do Andre: https://www.linkedin.com/in/andrefelipelopes/ Linkedin da Brains: https://www.linkedin.com/company/brains-brazilian-ai-networks/ Instagram do podcast: https://www.instagram.com/podcast.lifewithai Linkedin do podcast: https://www.linkedin.com/company/life-with-ai
undefined
Jan 18, 2024 • 13min

#75- Mixtral e Mixture Of Experts.

Fala galera, nesse episódio eu falo sobre Mixture Of Experts e mais espeicificamente sobre o Mixtral, que hoje é o melhor LLM open source disponível e ele também é melhor que ChatGPT 3.5 e o Gemini Pro. Mixtral paper: https://arxiv.org/pdf/2401.04088.pdf Mixtral model: https://huggingface.co/mistralai/Mixtral-8x7B-v0.1 Mixtral YouTube: https://www.youtube.com/watch?v=mwO6v4BlgZQ Instagram: https://www.instagram.com/podcast.lifewithai Linkedin: https://www.linkedin.com/company/life-with-ai
undefined
Dec 7, 2023 • 13min

#74- Named Entity Recognition e NLP com Sergei Bogdanov.

Fala galera, na versão em ingles do podcast eu entrevistei o Sergei e a gente falou bastante sobre NLP e mais especificamente o problem de Named Entity Recognition (NER). O Sergei e o time dele na NuMind publicaram um artigo sobre o modelo fundamental de NER deles que bateu e muito o estado da arte e a gente conversou sobre esse modelo na entrevista. Modelo em ingles: https://huggingface.co/numind/generic-entity_recognition_NER-v1 Modelo multi-language: https://huggingface.co/numind/generic-entity_recognition_NER-multilingual-v1 Linkedin do Sergei: https://www.linkedin.com/in/svbogdanov/ Instagram: https://www.instagram.com/podcast.lifewithai/   Linkedin: https://www.linkedin.com/company/life-with-ai
undefined
Nov 30, 2023 • 34min

#73- Transformers.

Fala galera, nesse episódio eu explico tudo que sei sobre Transformers. Falo da arquitetura, explico a formula de atenção, encoder, decoder, self-supervised learning, positional encoding, tokenisation, inductive bias, Vision-Transformers, receiptive fields... Foi o episódio mais tecnico que eu ja gravei e eu espero que voces gostem! Vale a pena escutar esse episódio com o paper do transformer aberto. Paper Transformers: https://arxiv.org/pdf/1706.03762.pdf Link do video explicando Next Token Prediction: https://www.linkedin.com/posts/zainhas_the-most-clearest-and-crisp-explanation-ugcPost-7132561633280692224-63AX?utm_source=share&utm_medium=member_desktop Instagram: https://www.instagram.com/podcast.lifewithai/   Linkedin: https://www.linkedin.com/company/life-with-ai
undefined
Nov 16, 2023 • 12min

#72- RAG e agentes.

Fala galera, nesse episódio eu explico o que é RAG (Retrieval Augmented Generation) e o conceito de agentes que executam tarefas. Instagram: https://www.instagram.com/podcast.lifewithai/  Linkedin: https://www.linkedin.com/company/life-with-ai
undefined
Nov 2, 2023 • 30min

#71- IA em chat bots com Daniel da WeClever.

Fala galera, nesse episódio eu entrevistei o Daniel, CTO da WeClever, e a gente conversou sobre como eles estão usando IA para melhorar a experiência dos chat bots. Durante a conversa a gente falou sobre fine tuning do ChatGPT, LoRA, RAG… foi uma conversa muito massa e eu espero que voces gostem! WeClever: https://www.linkedin.com/company/wecleverco/ Daniel Linkedin: https://www.linkedin.com/in/dmerlimorais/ Instagram: https://www.instagram.com/podcast.lifewithai/  Linkedin: https://www.linkedin.com/company/life-with-ai

The AI-powered Podcast Player

Save insights by tapping your headphones, chat with episodes, discover the best highlights - and more!
App store bannerPlay store banner
Get the app