Au-delà du formulaire imprimé : extraire des données à partir de documents à l'aide de Form Recognizer

Publié le 3 septembre, 2019

Principal Program Manager, Azure AI

La technologie permettant d'extraire des données à partir de formulaires imprimés est désormais éprouvée. Form Recognizer extrait des paires clé-valeur, des tableaux et du texte à partir de documents tels que des déclarations fiscales, des rapports de forage de pétrole et de gaz, des rapports de fin de travaux, des factures et des bons de commande. Mais pour répondre à leurs besoins quotidiens, les entreprises utilisent souvent toutes sortes de documents qui ne sont pas toujours bien dactylographiés.

Nous avons le plaisir de vous annoncer que les documents manuscrits et les documents mixtes (contenant une combinaison de texte imprimé et manuscrit) sont désormais pris en charge. Dorénavant, le traitement de formulaires manuscrits et mixtes sera la norme.

Extraire des données à partir de documents manuscrits et mixtes à l'aide de Form Recognizer

Des données qui étaient jusqu'à présent inaccessibles en raison des limites de la technologie d'extraction sont maintenant disponibles. La fonctionnalité d'extraction de textes manuscrits et mixtes de Form Recognizer est disponible en préversion et vous permet d'extraire des données structurées à partir de textes manuscrits entrés dans les types de formulaires suivants :

  • Formulaires médicaux : informations relatives à un nouveau patient, notes du médecin.
  • Formulaires financiers : formulaires d'ouverture de compte, demandes de carte de crédit.
  • Assurance : formulaires de déclaration de sinistre, formulaires de responsabilité.
  • Industrie : bordereaux d'expédition, formulaires de test, formulaires qualité.
  • Et plus encore.

Forts de notre expérience en matière de reconnaissance optique de caractères (OCR) et d'apprentissage automatique pour l'analyse de formulaires, nos experts ont créé une solution de pointe qui va au-delà des formulaires imprimés. La technologie OCR sur laquelle repose le service prend en charge les documents manuscrits et imprimés. L'élargissement du champ d'application de Form Recognizer vous permet d'accéder à des territoires jusque-là inexplorés, en mettant de nouvelles sources de données à votre disposition. Vous pouvez extraire de précieuses informations commerciales à partir de données encore inaccessibles il y a peu, ce qui vous permet de prendre une longueur d'avance sur vos concurrents.

Que vous utilisiez Form Recognizer pour la première fois ou que vous l'ayez déjà intégré au sein de votre organisation, vous avez désormais la possibilité de créer de nouvelles applications métier :

  • Accédez à de nouvelles données : si vous n'extrayez actuellement des données qu'à partir de formulaires dactylographiés, vous allez désormais pouvoir accéder à des données issues de formulaires mixtes et manuscrits.
  • Créez une application unique pour utiliser une combinaison de documents : si vous utilisez une combinaison de formulaires manuscrits et imprimés, vous pouvez créer une application unique qui s'appliquera à toutes vos données.
  • Évitez la numérisation manuelle des formulaires manuscrits : les formulaires originaux peuvent être introduits dans Form Recognizer sans aucun traitement préalable, en extrayant les mêmes paires clé-valeur et les mêmes données de tableau que celles que vous obtiendriez à partir d'un formulaire dactylographié, afin de réduire les coûts, d'éviter les erreurs et de gagner du temps.

Notre client : Avanade

Avanade considère ses collaborateurs comme ses principaux atouts. L'organisation est toujours à la recherche de professionnels talentueux et passionnés pour se développer. Et pour mettre la main sur ces perles rares, elle n'hésite pas à participer à des événements externes, comme des expo-carrières d'universités, des salons professionnels ou des conférences techniques, pour n'en nommer que quelques-uns. 

Au cours de ces événements, les personnes qui souhaitent en savoir plus sur Avanade sont souvent invitées à fournir leurs coordonnées et à accepter d'être recontactées. En général, elles complètent un formulaire numérique sur une tablette. Mais lorsque le stand est particulièrement fréquenté, un bref formulaire papier est remis aux participants afin qu'ils y inscrivent leurs coordonnées à la main. Et jusqu'à présent, ces formulaires devaient malheureusement être saisis manuellement dans la base de données marketing, ce qui nécessitait beaucoup de temps et de ressources. Le volume de nouveaux contacts potentiels que génèrent ces événements, multiplié par le nombre d'événements auxquels Avanade participe, peut rendre cette tâche très fastidieuse.

La nouvelle prise en charge des documents manuscrits d'Azure Form Recognizer simplifie ce processus en offrant à Avanade la certitude qu'aucun contact ne sera perdu et que les informations seront immédiatement accessibles.

En outre, Avanade a intégré le service Form Recognizer en tant que qualification dans sa solution de recherche cognitive, ce qui lui permet d'y avoir rapidement accès sur sa plateforme existante et de suivre de nouvelles pistes pendant que ses concurrents passent peut-être du temps à numériser leurs formulaires manuscrits.

Illustration d'un formulaire manuscrit et des données extraites via Form Recognizer.

« Azure Form Recognizer nous facilite considérablement la tâche, en remplaçant le travail de saisie par une simple validation des données. Grâce à l'intégration de Form Recognizer au service Recherche Azure, nous y avons immédiatement accès sur nos plateformes existantes. Si nous avons besoin de rechercher et de vérifier un formulaire pour une raison quelconque, par exemple pour trouver une signature valide, il nous suffit d'effectuer une recherche sur un champ, comme le champ Nom ou le champ Poste, pour accéder directement au formulaire. Les premiers tests que nous avons réalisés ont montré que Form Recognizer permettait de réduire de 35 % le temps nécessaire à la numérisation des formulaires et à la double vérification des entrées, chiffre que nous nous espérons améliorer à mesure que nous optimiserons nos outils pour travailler de concert avec le service, et que nous ajouterons plus d'automatisation. » - Fergus Kidd, ingénieur en technologies émergentes, Avanade

Bien démarrer

Pour en savoir plus sur Form Recognizer et le reste de l’écosystème Azure AI, rendez-vous sur notre site web et consultez la documentation.

Commencez par nous contacter.

Pour toute question supplémentaire, veuillez nous contacter à l'adresse formrecog_contact@microsoft.com