• 7 min read

Azure Cognitive Services zum Erstellen unternehmensfähiger und skalierbarer KI-Lösungen

Azure Cognitive Services macht KI jedem Entwickler zugänglich – auch ohne Kenntnisse vom maschinellen Lernen. Alles, was Sie benötigen, ist ein API-Aufruf zum Einbetten von Funktionen zum Sehen, Hören, Sprechen, Verstehen und Beschleunigen von Entscheidungen in Ihre Apps.

Dieser Beitrag wurde von Tina Coll, Senior Product Marketing Manager, Azure Cognitive Services, und Anny Dow, Product Marketing Manager, Azure Cognitive Services, gemeinsam verfasst.

Azure Cognitive Services macht künstliche Intelligenz (KI) jedem Entwickler zugänglich – auch ohne Kenntnisse vom maschinellen Lernen. Alles, was Sie benötigen, ist ein API-Aufruf zum Einbetten von Funktionen zum Sehen, Hören, Sprechen, Verstehen und Beschleunigen von Entscheidungen in Ihre Apps. Viele Unternehmen nutzen bereits vorkonfigurierte und benutzerdefinierte KI-Funktionen, um ihre Angebote noch ansprechender und intelligenter zu machen und zu personalisieren. Wir haben unseren Enthusiasmus von der Microsoft Build 2019 mitgenommen und die Personalisierung allgemein verfügbar gemacht – und noch weitere Funktionen aus den Kategorien Sehen, Sprechen und Sprache hinzugefügt. Bei so vielen Neuerungen sollten wir direkt anfangen.

Personalisierung: Für umfassende Benutzererfahrungen

Als Gewinner des diesjährigen Most Innovative Product-Awards auf der Strata Conference von O’Reilly ist die Personalisierung der einzige KI-Dienst auf dem Markt, der bestärkendes Lernen im großen Maßstab über einfach anzuwendende APIs verfügbar macht. Bestärkendes Lernen ist die Grundlage der Personalisierung. Sie bietet Entwicklern eine Möglichkeit, umfassende und personalisierte Umgebungen für Benutzer zu schaffen, auch wenn sie nicht über tief greifende Kenntnisse vom maschinellen Lernen verfügen.

Dass Kunden jederzeit genau das bekommen, was sie sich wünschen, stellt eine der größten Herausforderungen für Einzelhandels-, Medien- und E-Commerce-Unternehmen dar. Egal ob es die Anwendung zufallsbasierter A/B-Tests oder das Überwachen des maschinellen Lernens ist – für viele Unternehmen ist es einfach schwierig, jedem Benutzer eine einzigartige und dabei relevante Umgebung zu bieten. Und genau hier kommt die Personalisierung ins Spiel, da sie über die modernsten Techniken des maschinellen Lernens, die als bestärkendes Lernen bezeichnet werden, neue Optionen bietet, mit denen Sie zuvor nicht ersichtliche Einflüsse auf das Benutzerverhalten aufdecken können. Mithilfe dieser Technik kann die Personalisierung in Echtzeit von allen Ereignissen in der Welt lernen und die zugrunde liegenden Algorithmen innerhalb von Minuten anpassen. Im Ergebnis wird die Benutzerfreundlichkeit Ihrer App und damit die Zufriedenheit Ihrer Benutzer erheblich gesteigert. Als auf der Startseite der Xbox die Personalisierung eingeführt wurde, konnte das Team eine Steigerung der Kundenbindung um 40 % feststellen.  Darstellung eines Data Scientists und des Kreislaufs beim bestärkenden Lernen für die Personalisierung

Formularerkennung: Mehr Effizienz bei der automatisierten Textextraktion und bei Feedbackschleifen

Für Unternehmen spielen häufig verschiedene Dokumente eine wichtige Rolle, die nur schwierig zu lesen sind. Oftmals sind solche Dokumente nicht sauber gedruckt oder enthalten handschriftlichen Text. Chevron ist eines der Unternehmen, die mithilfe von Formularerkennung die Dokumentverarbeitung beschleunigen, indem Informationen automatisch aus gedruckten Formularen extrahiert werden. Damit werden Mitarbeiter frei, die sich dann um schwierigere und gewinnbringendere Aufgaben kümmern können.

Die Formularerkennung extrahiert Schlüssel-Wert-Paare, Tabellen und Text aus Dokumenten wie W2-Steuerformularen, Berichten zu Quellbohrungen, Abschlussberichten, Rechnungen und Bestellungen. Heute können wir die Fähigkeit bekannt geben, Formulare zu verarbeiten, die von Menschen ausgefüllt wurden, und ein benutzerdefiniertes Modell zu trainieren, das eine noch präzisere Datenextraktion ermöglicht. Die Benutzer können Bezeichnungen in Formulare einfügen, um nur die relevanten Werte zu extrahieren. Durch dieses Feature kann die Formularerkennung beliebige Formulartypen verarbeiten, einschließlich solchen mit Werten ohne Schlüssel, Schlüsseln unter Werten, geneigter Formulare, Fotos von Formularen u. a. Benutzer können mit anfänglich nur wenigen Formularen bereits beginnen, ein Modell zu trainieren, das speziell auf ihren Anwendungsfall zugeschnitten ist und direkt gute Ergebnisse liefert. Durch eine neue Benutzeroberfläche finden Sie noch schneller einen Einstieg, da wichtige Werte und Bezeichnungen automatisch ausgewählt werden, um damit Ihr benutzerdefiniertes Modell zu trainieren.

Beispiel eines Benutzeroberflächentools zur Formularbezeichnung

Darüber hinaus kann die Formularerkennung nun ein einzelnes Modell auch ohne Bezeichnungen für all die unterschiedlichen Formulartypen trainieren, und sie unterstützt das Training mit großen Datasets und das Analysieren großer Dokumente mit der neuen AsyncAPI. Mit diesem Vorteil können Kunden ein einzelnes Modell für unterschiedliche Arten von Rechnungen, Bestellungen und mehr trainieren, ohne die Dokumente vorab klassifizieren zu müssen.

Wir haben aber auch unsere vorkonfigurierten Funktionen für Belege präziser gemacht, neue Felder für Trinkgelder und den Belegtyp (Artikel, Kreditkartenbon, Tanken, Parken, andere) hinzugefügt, und das Extrahieren der verschiedenen Posten auf dem Beleg ergänzt. Schließlich haben wir auch die Genauigkeit der Tabellenextraktion und der Texterkennung verbessert, damit Texte aus Formularen noch besser extrahiert werden können.

Sogeti, ein Unternehmen von Capgemeni, nutzt diese neuen Funktionen der Formularerkennung, wie Arun Kumar Sahu, Manager von KI und ML für Sogeti anmerkt:

„Wir arbeiten an einer Dokumentklassifizierung und einer Vorhersagelösung für eines der größten Auktionsunternehmen für Fahrzeuge in den USA und benötigen dazu ein effizientes Verfahren zum Extrahieren von Informationen auf unterschiedlichen Fahrzeugdokumenten (PDF- oder Bilddatei). Die Formularerkennung konnte ganz einfach und schnell trainiert und gehostet werden, und sie ist darüber hinaus kostengünstig, sie kann unterschiedliche Dokumentformate verarbeiten und liefert einen unglaublichen Output. Mit der neuen Funktion für Bezeichnungen konnten wir die Extraktion von Schlüssel-Wert-Paaren effektiv anpassen.“

Spracheingabe/-ausgabe: Noch natürlichere Interaktionen und mehr Produktivität mit erweiterten Sprachfunktionen

Viele Unternehmen haben den Wunsch, moderner und ansprechender bei der Interaktion mit den eigenen Kunden zu werden. Unsere neuesten Entwicklungen bei der Spracherkennung ermöglichen Kunden genau das.

Auf der Microsoft Ignite 2018 haben wir unsere neuronale Sprachsynthesefunktion (Text-zu-Sprache) eingeführt, die mithilfe von Deep Neural Networks eine natürlich klingende Sprache erzeugt und damit die Hörermüdung bei Benutzern reduziert, die mit KI-Systemen interagieren. Gestalten Sie mit neuronaler Sprachsynthese Interaktionen mit Chatbots und virtuellen Helfern noch natürlicher und einladender, wandeln Sie digitale Texte wie E-Books in Audiobooks um, und verpassen Sie Ihrem Navigationssystem im Auto ein Upgrade. Wir freuen uns sehr, diese Funktion noch mit der Funktion Benutzerdefinierte neuronale Stimme erweitern zu können, mit der Kunden eine für ihre Marke einzigartige Stimme entwickeln können, indem sie mit nur wenigen Minuten Trainingsaudiomaterial beginnen. Die Funktion Benutzerdefinierte neuronale Stimme ermöglicht Szenarien wie Kundendienst durch einen Charakter, der auf das eigene Unternehmen abgestimmt ist, interaktive Lektionspläne oder geführte Museumstouren sowie Technologien mit Sprachassistenten. Darüber hinaus unterstützt die Funktion auch das Generieren von langen Inhalten wie Audiobooks.

Das Beijing Hongdandan Education and Culture Exchange Center nutzt seit jeher Audioinhalte, um hilfreiche Produkte für Menschen mit Sehbehinderungen zu entwickeln und deren Leben z. B. durch Audiobooks einfacher zu machen. Hongdandan nutzt die Funktion Benutzerdefinierte neuronale Stimme für das Erstellen von Audiobooks mit der Stimme von Lina, die im Alter von 10 Jahren erblindete. Lina ist heute Dozentin im Hongdandan Service Center und unterrichtet mit ihrer Stimme andere Menschen mit Sehbehinderungen in guter Kommunikation.

Bei der Geschwindigkeit, mit der Geschäfte im Moment ablaufen, kann es schwierig werden, sich alle Details vom letzten wichtigen Meeting zu merken und die nächsten Schritte und Termine im Auge zu behalten. Durch das schnelle und akkurate Transkribieren von Anrufen bleiben alle Beteiligten auf demselben Stand, da die wichtigsten Informationen aufgezeichnet werden. So können Sie hinterher die besprochenen Themen durchsuchen und in Erinnerung rufen. Im Kundendienst ist es besonders wichtig, die Kunden zu hören und zu verstehen und alle Informationen zu behalten – nur so können Kundenwünsche nachverfolgt und genauer analysiert werden.

Die präzise Transkription organisationsspezifischer Begriffe wie Produktnamen, technische Bezeichnungen und Personennamen stellt häufig ein Hindernis dar. Mit Custom Speech können Sie Spracherkennungsmodelle an Ihre eigenen Daten anpassen, damit bestimmte Begriffe auch richtig erfasst werden. Laden Sie einfach eigenes Audiomaterial hoch, um ein benutzerdefiniertes Modell zu trainieren. Sie können die Spracherkennung spezieller Begriffe aus Ihrer Organisation jetzt noch weiter optimieren, indem Sie automatisch und unter Einhaltung von Sicherheits- und Complianceanforderungen benutzerdefinierte Modelle aus Ihren Office 365-Daten generieren. Mit diesem optionalen Feature können Organisationen, die Office 365 einsetzen, Unternehmensterminologie noch präziser transkribieren, und zwar sowohl bei internen Meetings als auch bei Kundenanrufen. Das organisationsweite Sprachmodell wird ausschließlich anhand von Konversationen und Dokumenten in öffentlichen Gruppen erstellt, auf die alle Personen in der Organisation Zugriff haben.

Weitere neue Features wie benutzerdefinierte Befehle, benutzerdefinierte Sprach- und Stimmcontainer, Sprachübersetzung mit automatischer Spracherkennung und Integration des Kanals „Direct Line Speech“ mit Bot Framework vereinfachen das schnelle Einbetten erweiterter Sprachfunktionen in Ihre Apps. Weitere Informationen finden Sie auf der Seite Azure-Sprachdienste.

Sprache: Tiefere Einblicke in Kundenfeedback und Textdokumente

Heutzutage wird eine unglaubliche Menge an Kundenerkenntnissen erfasst – in den sozialen Medien, über Kundenbewertungen oder in Diskussionsforen. Die Herausforderung besteht aber darin, Erkenntnisse aus diesen Daten zu ziehen, damit Unternehmen schnell reagieren, den Kundendienst verbessern und die Marktanforderungen erfüllen können. Mit der Funktion Standpunktanalyse bei der Textanalyse können Unternehmen ganz einfach erkennen, ob ein Inhalt eine positive, neutrale, negative oder gemischte Stimmung transportiert, sodass sie immer auf der Höhe der Kundenwünsche bleiben und damit die Kundenbindung erhöhen. Das neueste Release der Standpunktanalyse bietet noch mehr Genauigkeit beim Stimmungsscore und ermöglicht die Erkennung der Stimmung eines gesamten Dokuments ebenso wie von einzelnen Sätzen.

Eine weitere Herausforderung bei der Datenextraktion ist die Ermittlung von Vorkommen von Entitäten in unstrukturiertem natürlichem Text, etwa Personen, Standorte, Organisationen u. a. Die Textanalyse bietet Unterstützung für eine noch breitere Palette an Entitätstypen mit bis zu 100 benannten Entitätstypen. Damit wird das Extrahieren aussagekräftiger Informationen und das Analysieren der Beziehungen im Ausgangstext und zwischen Einzelbegriffen noch einfacher. Darüber hinaus können Kunden nun mehr als 80 Arten von personenbezogenen Daten in englischsprachigen Textdokumenten erkennen und daraus extrahieren.

Wir führen daneben noch eine ganze Reihe neuer Funktionen in Language Understanding Intelligent Service (LUIS) ein, mit denen Entwickler komplexe und konversationsfähige Modelle erstellen können. Diese neuen Funktionen bieten die Möglichkeit, noch komplexere Anforderungen von Benutzern zu verarbeiten. (Wenn Sie beispielsweise Kunden Bestellungen in natürlicher Sprache erlauben, sind Bestellungen wie „Zwei Burger ohne Zwiebeln und statt Brötchen Salatblätter“ denkbar.) Damit stehen Kunden die erweiterte Funktion hierarchischer Entitäten und die Modellaufschlüsselung zur Verfügung, um damit noch ausgereiftere Sprachmodelle zu entwickeln, die tatsächlich die menschliche Sprache widerspiegeln. Außerdem fügen wir neue Regionen hinzu und erweitern die Sprachunterstützung in LUIS um Hindi und Arabisch.

Bereit für den Einsatz in Unternehmen: Azure Virtual Network für mehr Datensicherheit

Zu den wichtigsten Überlegungen bei der Auswahl eines KI-Diensts gehören die Sicherheit und die Einhaltung gesetzlicher Bestimmungen. Können Sie darauf vertrauen, dass die KI mit den hohen Standards und Sicherheitsmaßnahmen verarbeitet wird, die Sie bei gehärteten und langlebigen Softwaresystemen erwarten? Azure Cognitive Services bietet mehr als 70 Zertifizierungen. Wir bieten Virtual Network-Unterstützung im Rahmen von Cognitive Services an, um maximale Sicherheit für vertrauliche Daten bieten zu können. Dieser Dienst wird auch in einem Container bereitgestellt, der in einem Azure-Abonnement des Kunden oder lokal ausgeführt werden kann.

Jetzt einsteigen

Wir werden in Zukunft noch weitere leistungsstarke und intelligente Szenarien für unsere Kunden möglich machen, damit diese ihre Produktivität und Benutzerfreundlichkeit verbessern können. Die unglaubliche Bandbreite von Diensten, die über Azure Cognitive Services verfügbar gemacht werden, ermöglicht Ihnen die Extraktion wichtiger Erkenntnisse aus all Ihren Daten. Mithilfe der neuen hier bekannt gegebenen Technologien können Sie Text sehr präzise mit der Formularerkennung aus Formularen extrahieren und mit der Textanalyse und LUIS analysieren und verstehen. Schließlich können Sie die Erkenntnisse zudem mithilfe von Speech Services über eine Konversationsschnittstelle mit gesprochener Sprache für Ihre Benutzer bereitstellen.

Diese Meilensteine untermauern unsere Zusage, mit der Azure KI-Plattform für jedes Szenario das passende Angebot bereitzustellen. Wir bieten Tools auf Enterpriseniveau, die die Anwendungsentwicklung erleichtern, sowie marktführende Sicherheits- und Complianceoptionen für den Schutz von Kundendaten.

Beginnen Sie noch heute mit der Erstellung Ihrer ersten intelligenten Anwendung mit einem kostenlosen Azure-Konto, und erfahren Sie mehr über Cognitive Services.


Azure. Erfinden mit dem Ziel im Blick.