Azure Cognitive Services pour la création de solutions d’IA évolutives prêtes à l’emploi

Publié le 6 novembre, 2019

Group Product Manager, Azure AI

Ce billet a été co-écrit par Tina Coll, responsable principale du marketing produit, Azure Cognitive Services, et Anny Dow, responsable du marketing produit, Azure Cognitive Services.

Azure Cognitive Services met l’intelligence artificielle (IA) à la portée de chaque développeur sans que celui-ci doive disposer d’une expertise en Machine Learning. Tout ce qu’il faut, c’est un appel API pour incorporer la possibilité de voir, d’entendre, de parler, de comprendre et d’accélérer la prise de décision dans vos applications. Des entreprises ont utilisé ces fonctionnalités d’IA prédéfinies et personnalisées pour offrir des expériences intelligentes plus attrayantes et personnalisées. Nous poursuivons sur la lancée de Microsoft Build 2019 en rendant Personalizer généralement disponible et en introduisant des fonctionnalités avancées supplémentaires dans les catégories Vision, Speech et Langage. Comme nous avons de nombreuses avancées à partager, entrons dans le vif du sujet.

Personalizer : Permettre des expériences utilisateur riches

Lauréat du prix «Produit le plus innovant» de cette année lors de la conférence O’Reilly’s Strata, Personalizer est le seul service d’intelligence artificielle du marché à rendre l’apprentissage par renforcement disponible à grande échelle au travers d’API faciles à utiliser. Personalizer s’appuie sur l’apprentissage par renforcement et offre aux développeurs un moyen de créer des expériences riches et personnalisées pour les utilisateurs, même s’ils ne possèdent pas d’expertise approfondie en Machine Learning.

Donner aux clients ce qu’ils veulent à un moment donné est l’un des plus grands défis auxquels sont confrontées les entreprises de distribution, de médias et de commerce électronique d’aujourd’hui. Qu’il s’agisse d’appliquer des tests A/B aléatoires ou d’effectuer du Machine Learning supervisé, les entreprises ont du mal à fournir des expériences uniques et pertinentes à chaque utilisateur. C’est ici qu’intervient Personalizer, qui explore de nouvelles options pour rester à la pointe d’influences inédites sur le comportement des utilisateurs grâce à une technique de Machine Learning d’avant-garde appelée apprentissage par renforcement. Cette technique permet à Personalizer de tirer des enseignements de ce qui se passe dans le monde en temps réel et de mettre à jour l’algorithme sous-jacent toutes les quelques minutes. Le résultat est une amélioration significative de l’ergonomie de votre application et de la satisfaction de vos utilisateurs. Lorsque l’équipe XBOX a implémenté Personalizer sur sa page d’accueil, ils ont constaté une augmentation de 40 % de l’engagement des utilisateurs. Illustration d’un scientifique des données et d’un cycle d’apprentissage par renforcement des informaticiens qui mène à la personnalisation

Form Recognizer : Augmentez l’efficacité avec une extraction de texte automatisée et une boucle de rétroaction

Les entreprises s’appuient souvent sur une série de documents parfois difficiles à lire. Ceux-ci ne sont pas toujours correctement imprimés et beaucoup incluent du texte manuscrit. Des entreprises telles que Chevron utilisent Form Recognizer pour accélérer le traitement des documents grâce à une extraction automatique d’informations de formulaires imprimés. Cela permet à leurs employés de se concentrer sur des tâches plus difficiles et de plus grande valeur.

Form Recognizer extrait des paires clé-valeur, des tableaux et du de documents tels que des déclarations fiscales, des rapports de forage de pétrole et de gaz, des rapports de fin de travaux, des factures et des bons de commande. Aujourd’hui, nous annonçons la possibilité de fournir des formulaires étiquetés par des humains et de former un modèle personnalisé afin de permettre une extraction encore plus précise des données. Les utilisateurs peuvent étiqueter les formulaires afin d’extraire les valeurs présentant un intérêt. Cette fonctionnalité permet à Form Recognizer de prendre en charge tout type de formulaire, dont des valeurs sans clé, des clés sous des valeurs, des formulaires inclinés, des photos de formulaires, etc. À partir de cinq formulaires seulement, les utilisateurs peuvent former un modèle adapté à leur cas d’utilisation avec des résultats de grande qualité. Une nouvelle expérience utilisateur vous permet de démarrer rapidement, sélectionne des valeurs présentant un intérêt, étiquète et forme votre modèle personnalisé.

Exemple d’outil d’expérience utilisateur présentant l’expérience d’étiquetage de formulaire

De plus, Form Recognizer peut désormais former un modèle unique sans étiquettes pour tous les types de formulaires, et prend en charge l’apprentissage sur des jeux de données volumineux, ainsi que l’analyse de documents volumineux avec la nouvelle AsyncAPI. Cet avantage permet aux clients de former un modèle unique pour les différents types de factures, bons de commandes, et autres documents sans avoir à classer ceux-ci à l’avance.

Nous avons également enrichi nos fonctionnalités de reçus prédéfinies avec des améliorations sur le plan de la précision, de nouveaux champs pour les pourboires, des types de reçus (détaillés, bordereau de carte de crédit, essence, stationnement, autres), et l’extraction de lignes détaillant les différents postes du reçu. Enfin, nous avons également amélioré la précision de la reconnaissance de texte, permettant l’extraction de texte de haute qualité à partir de formulaires et l’extraction de tableaux.

Sogeti, qui fait partie de Capgemeni, exploite ces nouvelles fonctionnalités de Form Recognizer. Comme le note Arun Kumar Sahu, responsable du ML par IA pour Sogeti :

« Nous travaillons sur une solution prédictive et de classification des documents pour l’une des plus grandes sociétés de vente aux enchères d’automobiles aux États-Unis. Nous avions besoin d’un moyen efficace d’extraire des informations de divers documents relatifs à l’automobile (PDF ou image). Form Recognizer était rapide et facile à former et à héberger, était rentable, gérait différents formats de document et produisait des résultats étonnants. Les nouvelles fonctions d’étiquetage ont rendu très efficace la personnalisation de l’extraction de paires clé valeur. »

Speech : Permet des interactions plus naturelles et accélère la productivité avec des capacités vocales avancées

Les entreprises veulent pouvoir se moderniser et permettre des interactions plus fluides et naturelles avec leurs clients. Nos dernières avancées en matière de traitement de la voix permettent aux clients de le faire.

Dans le cadre Microsoft Ignite 2018, nous avons introduit notre fonctionnalité de synthèse vocale neuronale, qui utilise des réseaux neuronaux profonds pour permettre une parole naturelle et réduire la fatigue d’écoute des utilisateurs interagissant avec des systèmes d’intelligence artificielle. La synthèse vocale neuronale peut être utilisée pour rendre les interactions avec les bots conversationnels et les assistants virtuels plus naturelles et agréables, convertir des textes numériques comme les livres électroniques en livres audio et améliorer les systèmes de navigation embarqués. Nous sommes ravis de tirer parti de ces avancées avec la fonctionnalité de voix neuronale personnalisée, qui permet aux clients de créer une voix unique à partir de quelques minutes de formation. La fonctionnalité de voix neuronale personnalisée permet de mettre en place divers scénarios tels que l’assistance clientèle fournie par un personnage incarnant l’entreprise, des plans de cours interactifs, des visites guidées de musées, et des technologies d’assistance vocale. La fonctionnalité prend également en charge la génération de contenu long, y compris de livres audio.

Le Centre d’échange pour l’éducation et la culture Hongdandan à Pékin a pour vocation d’utiliser l’audio pour créer des produits destinés aux malvoyants et d’améliorer la vie de ceux-ci en fournissant des aides telles que des livres audio. Le centre Hongdandan utilise la fonctionnalité de voix neuronale personnalisée pour produire des livres audio basés sur la voix de Lina, qui a perdu la vue à l’âge de 10 ans. Lina est maintenant formatrice au centre de services de Hongdandan, où elle utilise sa voix pour enseigner à d’autres malvoyants à bien communiquer.

Compte tenu du rythme rapide auquel les affaires évoluent aujourd’hui, se souvenir de tous les détails de votre dernière réunion importante, et suivre les étapes et échéances clés peut constituer un véritable défi. La transcription rapide et précise des appels peut aider les différents intervenants à rester sur la même longueur d’onde en capturant des détails critiques et en facilitant la recherche et la révision des sujets abordés. Dans des scénarios de support client, la capacité d’entendre et de comprendre vos clients, ainsi que de conserver un enregistrement précis des informations est essentielle pour suivre les besoins du client et permettre une analyse plus large.

Cependant, la transcription exacte de termes spécifiques d’une organisation, tels que des noms de produits, des termes techniques et des noms de personnes, constitue un autre obstacle. Le service Custom Speech vous permet de personnaliser les modèles de reconnaissance vocale en fonction de vos propres données afin que vos propos spécifiques soient capturés avec précision. Chargez simplement votre audio pour former un modèle personnalisé. Désormais, vous pouvez optimiser la reconnaissance vocale pour des termes spécifiques de votre organisation en générant automatiquement des modèles personnalisés à l’aide de vos données Office 365 de façon sécurisée et conforme. Grâce à cette fonctionnalité, les entreprises qui utilisent Office 365 peuvent transcrire plus précisément la terminologie de l’entreprise, que ce soit lors de réunions internes ou d’appels client. Le modèle linguistique à l’échelle de l’organisation est construit uniquement à l’aide de conversations et de documents de groupes publics accessibles à tous les membres de l’organisation.

De nouvelles fonctionnalités, telles que les Commandes personnalisées, Custom Speech et les conteneurs vocaux, la Traduction vocale avec identification automatique de la langue et l’intégration du Canal Direct Line Speech avec Bot Framework facilitent l’incorporation rapide de fonctionnalités vocales avancées dans vos applications. Pour plus d’informations, consultez la page sur la tarification d’Azure.

Language: Extrayez des insights plus approfondis de commentaires des clients et de documents texte

Aujourd’hui, une multitude d’informations précieuses sur les clients sont recueillies, que ce soit dans les médias sociaux, les avis de clients ou des forums de discussion. Le défi consiste à extraire des insights de ces données, afin que les entreprises puissent agir rapidement pour améliorer le service à la clientèle et répondre aux besoins du marché. Grâce à la fonctionnalité Analyse des sentiments d’Analyse de texte, les entreprises peuvent facilement détecter les sentiments positifs, neutres, négatifs et mitigés, ce qui leur permet de mesurer en permanence la satisfaction de la clientèle, de mieux impliquer les clients et de les fidéliser. La dernière version de la fonctionnalité Analyse des sentiments offre une plus grande précision dans la notation des sentiments, ainsi que la capacité de détecter des sentiments tant pour un document entier que pour des phrases individuelles.

Un autre défi lié à l’extraction d’informations de vos données est de pouvoir identifier à partir de texte en langage naturel non structuré des occurrences d’entités telles que des personnes, des lieux, des organisations, et bien plus. L’Analyse de texte étend la prise en charge du type d’entité à plus de 100 types d’entités nommées, facilitant ainsi comme jamais l’extraction d’informations significatives et l’analyse de relations à partir de texte brut et entre des termes. De plus, les utilisateurs pourront désormais détecter et extraire plus de 80 types d’informations d’identification personnelle dans les documents texte en langue anglaise.

Nous ajoutons également plusieurs nouvelles fonctionnalités à LUIS (Language Understanding Intelligent Service), qui permettent aux développeurs de créer des modèles sophistiqués de type conversationnel. Les nouvelles fonctionnalités permettent de traiter des demandes plus complexes d’utilisateurs (par exemple, si vous souhaitez permettre aux clients d’utiliser réellement le langage naturel, ils peuvent commander « Deux hamburgers sans oignons et remplacer les petits pains par de la laitue»). Cela offre aux clients la possibilité avancée d’utiliser des entités hiérarchiques et une décomposition de modèle, pour créer des modèles de langage plus sophistiqués qui reflètent le langage humain parlé. Nous ajoutons en outre des régions et étoffons les langues humaines prises en charge dans LUIS avec l’ajout de l’hindi et de l’arabe.

Service adapté aux entreprises : Réseau virtuel Azure pour une sécurité accrue des données

L’une des considérations majeures lors du choix d’un service d’IA est la sécurité et la conformité aux réglementations. Pouvez-vous croire que l’IA est traitée dans le respect des normes et précautions que vous attendez de systèmes logiciels renforcés et durables ? Azure Cognitive Services bénéficie plus de 70 certifications. Aujourd’hui, nous proposons la prise en charge des réseaux virtuels dans le cadre de Cognitive Services afin de garantir une sécurité maximale des données sensibles. Ce service est également mis à disposition dans un conteneur pouvant s’exécuter dans un abonnement Azure de client ou localement.

Commencer aujourd'hui

Nous continuons à activer pour nos clients de nouveaux scénarios puissants et intelligents qui améliorent leur productivité et les expériences utilisateur. L’incroyable diversité des services disponibles au travers d’Azure Cognitive Services vous permet d’extraire des informations de toutes vos données. Sur la base de ces nouvelles annonces, vous pouvez extraire avec précision du texte de formulaires en utilisant Form Recognizer, analyser et comprendre ce texte à l’aide de l’API Analyse de texte et de LUIS, et enfin fournir ces informations à vos utilisateurs via une interface conversationnelle avec nos services vocaux.

Ces progrès illustrent ’hui notre volonté d’adapter la plateforme Azure AI à tous les scénarios opérationnels, avec des outils de classe entreprise simplifiant le développement d’applications, et une sécurité et une conformité de pointe pour la protection des données des clients.

Commencez dès aujourd’hui en créant votre première application intelligente à l’aide d’un compte gratuit Azure, et apprenez-en davantage sur Cognitive Services.


Azure. Inventez en ayant un but.