

#116- Document AI pré e pós LLMs.
May 22, 2025
Neste podcast, o palestrante discute a evolução do Document AI, destacando as transformações significativas que ocorreram com a chegada dos LLMs. Ele aborda os desafios enfrentados na extração de informações antes dessa nova tecnologia. Além disso, explora como a multimodalidade trouxe eficiência e avanços relevantes para o campo. Uma conversa envolvente que revela o futuro promissor da inteligência artificial na manipulação de documentos.
AI Snips
Chapters
Transcript
Episode notes
Document AI não é só OCR
- Document AI vai muito além do OCR, que é só a transcrição dos caracteres.
- O verdadeiro desafio é extrair e entender as informações relevantes automaticamente.
Importância da multimodalidade espacial
- Multimodalidade é essencial em Document AI, combinando visual, texto e a posição dos elementos.
- A modalidade espacial ajuda a diferenciar significados de informações iguais dependendo da localização.
O passado do Document AI
- Pré-2014, Document AI usava OCR básico (Tesseract) e regras manuais para extrair dados.
- Métodos tradicionais são frágeis e quebram facilmente com pequenas mudanças no documento.