Azure-KI: Neue Cognitive Services-Funktionen für unternehmenskritische KI-Apps

Veröffentlicht am 8 Juli, 2020

Corporate Vice President, Azure AI

Wir erleben zurzeit einen tiefgreifenden Wandel – nicht nur in der Arbeitswelt, sondern auch in der Art, wie wir Kontakte pflegen. Microsoft unterstützt Organisationen dabei, diese Veränderungen zu meistern, und hat sich der Aufgabe verschrieben, mit Azure KI Unternehmenslösungen zu entwickeln, die zukunftsweisende Innovationen beflügeln.

Es ist unsere Vision, dass die KI bald die Arbeit eines jeden Entwicklers bereichert. Daher freuen wir uns heute, neue erweiterte Funktionen für Azure Cognitive Services ankündigen zu können. Zum Beispiel:

  • Textanalyse für Gesundheitsdaten (Vorschauversion)
  • Formularerkennung (allgemein verfügbar)
  • Benutzerdefinierte Befehle (allgemein verfügbar)
  • Neue neuronale Text-to-Speech-Stimmen

Unternehmen aus dem Gesundheitswesen, dem Versicherungswesen, der nachhaltigen Landwirtschaft und vielen weiteren Branchen vertrauen seit Langem auf Azure KI, wenn es darum geht, richtungsweisende KI-Anwendungen zu erstellen und bereitzustellen. Laut der International Data Corporation1 werden 75 % der Unternehmen bis zum Jahr 2022 auf KI-basierte Lösungen setzen, um die betriebliche Effizienz zu verbessern und Kunden bessere Produkte zu bieten.

Die heute vorgestellten Produktupdates tragen dazu bei, diese wachsende Nachfrage zu decken. Sie erweitern vorhandene Sprach- und Sehfunktionen in Azure Cognitive Services, damit Entwickler unternehmenskritische KI-Apps erstellen können, die umfangreichere Einblicke ermöglichen, Zeit sparen und Kosten senken sowie den Kundendialog verbessern.

Umfassende Einblicke mit leistungsstarken NLP-Features

Eine der Strategien, mit der Organisationen auf die Veränderungen reagieren, sind Technologien, die ihnen die Möglichkeit bieten, Daten schnell zu verarbeiten und neue Einblicke daraus zu generieren. COVID-19 hat den dringenden Bedarf an diesen Lösungen gesteigert, insbesondere in der Gesundheitsbranche. Da jährlich eine überwältigende Menge von Gesundheitsdaten erzeugt werden2, wird es für Anbieter immer wichtiger, diese Informationen schnell auswerten zu können, um neue Lösungen zu finden, die die Behandlungsergebnisse verbessern.

Einblicke in medizinische Daten mit der Textanalyse für Gesundheitsdaten

Wir freuen uns, die Textanalyse für Gesundheitsdaten vorzustellen: ein neues Feature der Textanalyse, mit dem Pflegeanbieter, Forscher und Unternehmen unstrukturierten medizinischen Daten umfangreiche Erkenntnisse und Beziehungen entnehmen können. Das zugrunde liegende Modell wurde mit einer Vielzahl von medizinischen Daten trainiert, zu denen beispielsweise verschiedene Formate von klinischen Notizen und Protokolle von klinischen Tests zählen. Aus diesem Grund ist das Textanalysefeature in der Lage, eine Vielzahl von Datentypen und Tasks zu verarbeiten, ohne dass Kunden eigene Modelle unter hohem Zeitaufwand selbst erstellen müssen.

Als Reaktion auf die COVID-19-Pandemie hat sich Microsoft mit dem Allen Institute for AI und führenden Forschungsgruppen zusammengeschlossen, um gemeinsam das offene Forschungsdataset zu COVID-19 zusammenzustellen. Auf Grundlage von mehr als 47.000 wissenschaftlichen Artikeln haben wir eine COVID-19-Suchmaschine entwickelt, die auf der Textanalyse für Gesundheitsdaten und Cognitive Search basiert. Sie unterstützt Forscher im Kampf gegen die Krankheit, indem sie ihnen neue Einblicke ermöglicht.

Zudem haben wir weitere Verbesserungen im Bereich Natural Language Processing (NLP) vorgenommen, damit Entwickler schneller Apps erstellen können, die Einblicke in die in einem Text ausgedrückte Stimmung möglich machen. Das Textanalysefeature Opinion Mining weist bestimmten Features oder Themen Stimmungen zu, sodass Benutzer das Kundenfeedback aus sozialen Medien, Bewertungswebsites und anderen Quellen besser verstehen können.

Zeiteinsparung und Kostensenkung dank verwendbarer Daten aus Formularen

Viele unstrukturierte Daten liegen in Formularen vor, die Tabellen, Objekte und weitere Elemente enthalten. Üblicherweise ist bei diesen Arten von Dokument manuelles Labelling nach Dokumenttyp oder umfangreiche Programmierarbeit erforderlich, um Einblicke daraus zu gewinnen.

Mit der Formularerkennung machen wir ein Feature allgemein verfügbar, das es Entwicklern ermöglicht, effizient und exakt Informationen aus Millionen von Dokumenten zu extrahieren – ganz ohne Fachkenntnisse in Data Science.

Mit der Formularerkennung schnell Text und Struktur aus Dokumenten extrahieren

Unternehmen wie Sogeti (Teil der Capgemini-Gruppe) ermöglichen ihren Kunden mithilfe der Formularerkennung eine schnellere Verarbeitung von großen Mengen digitaler Dokumente.

„Sogeti ist kontinuierlich auf der Suche nach neuen Wegen, wie wir unsere Kunden beim digitalen Wandel unterstützen können. Dabei setzen wir auf innovativste KI-Lösungen und maschinelles Lernen. Dank unserer Plattform „Cognitive Document Processing“ (CDP) können unseren Kunden unstrukturierte Dokumente verarbeiten und klassifizieren, um Daten mit hoher Genauigkeit zu extrahieren. Dies führt zu geringeren Betriebskosten und Verarbeitungszeiten. CDP basiert auf den leistungsstarken kognitiven Funktionen und Taggingfunktionen der Formularerkennung, mit denen sich mühelos schlüssellos gekoppelte Daten und andere relevante Informationen aus gescannten/digitalen unstrukturierten Dokumenten extrahieren lassen, was wiederum zu Zeiteinsparungen führt.“ – Mark Oost, Chief Technology Officer bei Sogeti, Artificial Intelligence and Machine Learning

Wilson Allen, ein führender Anbieter für Beratungs- und Analyselösungen, unterstützt Rechtsunternehmen und andere Professional Service Firms mithilfe der Formularerkennung dabei, Dokumente wie PDFs und Bilder, einschließlich Finanzformularen und Kreditanträgen, zu verarbeiten und auszuwerten. Anschließend werden benutzerdefinierte Modelle trainiert, um exakte Werte aus komplexen Formularen zu extrahieren.

„Die Formularerkennung ist eine große Bereicherung für unser Toolkit. Sie hilft uns, große Mengen von unstrukturierten Daten in wertvolle Informationen zu verwandeln. So konnten wir mehr als 400 Stunden manueller Dateneingabearbeit sparen, was unseren Mitarbeitern die Zeit gab, sich strategischeren Aufgaben zu widmen.“ – Norm Mullock, VP of Strategy bei Wilson Allen

Besserer Kundendialog dank sprachfähiger Apps

Viele Organisationen sehen sich der Herausforderung gegenüber, den Kundenservice zu optimieren und gleichzeitig den Wandel zu einem digitalen, kontaktlosen Angebot zu meistern.2 Verbesserungen bei der Sprachtechnologie ermöglichen es Entwicklern, nahtlosere, natürlichere, sprachfähige Lösungen zu schaffen, über die Kunden mit Marken interagieren können.

Eine dieser Verbesserungen sind die benutzerdefinierten Befehle. Diese Speech-Funktion aus Cognitive Services ist nun allgemein verfügbar. Mit benutzerdefinierten Befehlen können Entwickler einfacher taskorientierte Sprachanwendungen für Befehl- und Kontrollszenarios erstellen, deren Komponenten vorab klar definiert werden können. Ein Beispiel sind sprachgesteuerte smarte Thermostate. Die Funktion vereint die Spracherkennung und den Dienst Language Understanding, mit dem Geräte gesprochene Sprache erfassen können, mit Sprachantworten dank Text-to-Speech. So können Sie Ihren Apps einfacher Sprachfunktionen hinzufügen, ohne viel Code schreiben zu müssen.

Außerdem wird die Sprachunterstützung für das neuronale Text-to-Speech-Feature auf 15 neue, natürlich klingende Stimmen erweitert. Diese basieren auf hochmodernen neuronalen Sprachsynthesemodellen: Salma für Arabisch (Ägypten), Zariyah für Arabisch (Saudi-Arabien), Alba für Katalanisch (Spanien), Christel für Dänisch (Dänemark), Neerja für Englisch (Indien), Noora für Finnisch (Finnland), Swara für Hindi (Indien), Colette für Niederländisch (Niederlande), Zofia für Polnisch (Polen), Fernanda für Portugiesisch (Portugal), Dariya für Russisch (Russland), Hillevi für Schwedisch (Schweden), Achara für Thai (Thailand), HiuGaai für Chinesisch (Kantonesisch, traditionell) und HsiaoYu für Chinesisch (taiwanesisches Mandarin).

Viele Kunden nutzen schon heute Sprachfunktionen in ihren Apps, um den Kundendialog zu verbessern. Mit Cognitive Services und Bot Service hat BBC beispielsweise den KI-fähigen Sprachassistenten Beeb erschaffen, der den verschiedenen Zielgruppen eine ansprechendere und personalisierte Interaktion bietet.

Wir freuen uns sehr, diese Produktinnovationen vorstellen zu können, die alle Entwickler in die Lage versetzen, unternehmenskritische KI-Apps zu erstellen. Weitere Informationen finden Sie unten in unseren Ressourcen.

Jetzt einsteigen

Informieren Sie sich in den unten aufgeführten Ressourcen, und probieren Sie Azure Cognitive Services mit einem kostenlosen Azure-Konto aus.


1 Worldwide Artificial Intelligence Predictions (IDC FutureScape 2020)

2 Adapting customer experience in the time of coronavirus (McKinsey 2020).