IA Sob Controle - Inteligência Artificial

198: Visão computacional e agentes de IA para documentos, com Hugo Honda da LandingAI

16 snips
Nov 12, 2025
Hugo Honda, Engenheiro de Machine Learning na LandingAI, compartilha insights sobre a revolução da visão computacional e a extração de dados de documentos. Ele detalha o Vision Agent e sua capacidade de planejar e executar soluções complexas. A discussão aborda a novidade do Agent Document Extraction, que transforma documentos em informações úteis, e como ele supera limites do OCR tradicional. Hugo também explora o dia a dia remoto na LandingAI e traça paralelos entre modelos open source e proprietários. O futuro parece promissor com a especialização e segurança operacional em foco.
Ask episode
AI Snips
Chapters
Transcript
Episode notes
INSIGHT

Vision Agent Como Copiloto

  • O Vision Agent atua como um copiloto agêntico que planeja, codifica e executa soluções de visão computacional a partir de prompts e imagens.
  • Ele combina modelos clássicos, open source e modelos customizados para criar pipelines completas de desenvolvimento e deploy.
ADVICE

Priorize Dados De Qualidade

  • Priorize dados de qualidade e itere rápido em vez de colecionar enormes datasets.
  • Foque em curar datasets e refinar soluções específicas para obter resultados com menos amostras.
INSIGHT

Extração Agêntica Supera OCR Tradicional

  • O Agent Document Extraction quebra a tarefa em subtarefas e usa visual reasoning com localização espacial fina para melhorar a acurácia.
  • Essa abordagem supera OCR tradicional ao interpretar layouts feitos para leitura humana e não só extrair texto bruto.
Get the Snipd Podcast app to discover more snips from this episode
Get the app