
IA Sob Controle - Inteligência Artificial 198: Visão computacional e agentes de IA para documentos, com Hugo Honda da LandingAI
16 snips
Nov 12, 2025 Hugo Honda, Engenheiro de Machine Learning na LandingAI, compartilha insights sobre a revolução da visão computacional e a extração de dados de documentos. Ele detalha o Vision Agent e sua capacidade de planejar e executar soluções complexas. A discussão aborda a novidade do Agent Document Extraction, que transforma documentos em informações úteis, e como ele supera limites do OCR tradicional. Hugo também explora o dia a dia remoto na LandingAI e traça paralelos entre modelos open source e proprietários. O futuro parece promissor com a especialização e segurança operacional em foco.
AI Snips
Chapters
Transcript
Episode notes
Vision Agent Como Copiloto
- O Vision Agent atua como um copiloto agêntico que planeja, codifica e executa soluções de visão computacional a partir de prompts e imagens.
- Ele combina modelos clássicos, open source e modelos customizados para criar pipelines completas de desenvolvimento e deploy.
Priorize Dados De Qualidade
- Priorize dados de qualidade e itere rápido em vez de colecionar enormes datasets.
- Foque em curar datasets e refinar soluções específicas para obter resultados com menos amostras.
Extração Agêntica Supera OCR Tradicional
- O Agent Document Extraction quebra a tarefa em subtarefas e usa visual reasoning com localização espacial fina para melhorar a acurácia.
- Essa abordagem supera OCR tradicional ao interpretar layouts feitos para leitura humana e não só extrair texto bruto.
