Content Classification
A rota Content Classification foi desenvolvida para facilitar a identificação e classificação de documentos em arquivos de imagem, sejam eles mono ou multipáginas. Ideal para diversos setores que lidam com grande volume de documentos, essa API é capaz de processar e retornar resultados precisos sobre os tipos de documentos presentes em cada arquivo enviado.
O que esta rota faz?
A rota Content Classification recebe arquivos contendo um ou mais documentos e realiza um processamento avançado para determinar os tipos de documentos presentes. Para cada documento identificado, a API retorna:
- Tipo(s) e subtipo(s) de Documento(s): Identificação clara e precisa do tipo e subtipo do(s) documento(s) presente(s) em cada página ou seção do arquivo enviado.
- Score: Um indicador numérico que representa a confiabilidade e precisão da classificação realizada, permitindo aos usuários avaliar rapidamente a exatidão dos resultados.
- Tags: Um conjunto de identificadores que caracterizam o documento classificado, incluindo país, idioma, assunto, entre outras características.
- Página: Página em que o documento classificado se encontra no arquivo original.
- Recorte das Imagens Classificadas (Opcional): Se solicitado pelo cliente, a API também pode retornar os recortes binários das imagens dos documentos classificados, com a perspectiva corrigida para facilitar a visualização e utilização posterior.
Comparação com a rota Content Extraction
A rota Content Extraction é uma solução robusta que oferece não apenas a classificação dos documentos, mas também a extração completa de todo o conteúdo textual. No entanto, se seu processo requer apenas a tipificação ou classificação do documento, sem a necessidade de extração completa, a nova rota Content Classification é ideal. Ela preenche a necessidade de uma classificação prévia, permitindo uma abordagem mais econômica e eficiente.
Por que usar a rota Content Classification?
Esta nova rota foi projetada para oferecer:
- Precisão e Eficiência: Utilize a tecnologia de ponta para garantir a máxima precisão na classificação dos documentos.
- Flexibilidade: Capacidade de lidar com arquivos mono ou multipáginas, adequando-se às diversas necessidades do seu negócio.
- Comodidade: Obtenha resultados detalhados e confiáveis sem a necessidade de intervenções manuais, otimizando os fluxos de trabalho.
- Versatilidade: A opção de obter recortes de imagens classificadas permite uma manipulação e análise mais detalhada dos documentos processados.
Ao utilizar a rota Content Classification, você pode:
- Reduzir Custos: Identifique previamente os documentos que precisam ser processados mais detalhadamente, evitando os custos associados à extração completa de documentos desnecessários.
- Otimizar Processos: Avalie quais documentos devem ser enviados para a rota de extração de conteúdo com base nos resultados da classificação, melhorando a eficiência operacional.
- Melhorar a Qualidade dos Dados: Garanta que apenas os documentos relevantes e corretos sejam enviados para a extração, aumentando a precisão e a utilidade dos dados extraídos.
Caso de Uso
Imagine um processo cadastral onde o cliente final precisa enviar dois documentos: um documento de identificação (RG ou CNH) e um comprovante de residência. Utilizando diretamente a rota de extração, você obterá o tipo de documento classificado junto com a extração de dados. No entanto, se o cliente enviar um documento não solicitado (por exemplo, uma certidão de nascimento em vez de um documento de identificação), você processará um documento que não será aceito no seu processo.
Com a nova rota de classificação, você pode primeiro classificar os documentos recebidos. Se os documentos não forem do tipo desejado, você pode recusar o documento e solicitar um novo envio sem incorrer no custo da extração completa. Somente quando receber os documentos corretos, você utilizará a rota de Content Extraction. Este é um exemplo de um dos diversos casos de uso da rota de Content Classification.
Exemplo de Fluxo de Trabalho:
O seu cliente final envia um documento de identificação e um comprovante de residência.
Você utiliza a rota Content Classification para identificar os tipos de documentos recebidos.
Se os documentos forem classificados como os tipos desejados (RG, CNH, comprovante de residência), eles são enviados para a rota Content Extraction para a extração completa do conteúdo.
Se um documento for identificado como um tipo não desejado (ex.: certidão de nascimento), você pode recusar o documento e solicitar um novo envio, evitando os custos de extração desnecessários.
Processamento Final: Somente os documentos corretos são processados na rota Content Extraction, otimizando os custos e a eficiência da operação.
Este fluxo de trabalho demonstra como a rota Content Classification pode ser utilizada para melhorar significativamente a eficiência do processo de tratamento de documentos.