Wir erleben zurzeit einen tiefgreifenden Wandel – nicht nur in der Arbeitswelt, sondern auch in der Art, wie wir Kontakte pflegen. Microsoft unterstützt Organisationen dabei, diese Veränderungen zu meistern, und hat sich der Aufgabe verschrieben, mit Azure KI Unternehmenslösungen zu entwickeln, die zukunftsweisende Innovationen beflügeln.
Es ist unsere Vision, dass die KI bald die Arbeit eines jeden Entwicklers bereichert. Daher freuen wir uns heute, neue erweiterte Funktionen für Azure Cognitive Services ankündigen zu können. Zum Beispiel:
- Textanalyse für Gesundheitsdaten (Vorschauversion)
- Formularerkennung (allgemein verfügbar)
- Benutzerdefinierte Befehle (allgemein verfügbar)
- Neue neuronale Text-to-Speech-Stimmen
Unternehmen aus dem Gesundheitswesen, dem Versicherungswesen, der nachhaltigen Landwirtschaft und vielen weiteren Branchen vertrauen seit Langem auf Azure KI, wenn es darum geht, richtungsweisende KI-Anwendungen zu erstellen und bereitzustellen. Laut der International Data Corporation1 werden 75 % der Unternehmen bis zum Jahr 2022 auf KI-basierte Lösungen setzen, um die betriebliche Effizienz zu verbessern und Kunden bessere Produkte zu bieten.
Die heute vorgestellten Produktupdates tragen dazu bei, diese wachsende Nachfrage zu decken. Sie erweitern vorhandene Sprach- und Sehfunktionen in Azure Cognitive Services, damit Entwickler unternehmenskritische KI-Apps erstellen können, die umfangreichere Einblicke ermöglichen, Zeit sparen und Kosten senken sowie den Kundendialog verbessern.
Umfassende Einblicke mit leistungsstarken NLP-Features
Eine der Strategien, mit der Organisationen auf die Veränderungen reagieren, sind Technologien, die ihnen die Möglichkeit bieten, Daten schnell zu verarbeiten und neue Einblicke daraus zu generieren. COVID-19 hat den dringenden Bedarf an diesen Lösungen gesteigert, insbesondere in der Gesundheitsbranche. Da jährlich eine überwältigende Menge von Gesundheitsdaten erzeugt werden2, wird es für Anbieter immer wichtiger, diese Informationen schnell auswerten zu können, um neue Lösungen zu finden, die die Behandlungsergebnisse verbessern.
Wir freuen uns, die Textanalyse für Gesundheitsdaten vorzustellen: ein neues Feature der Textanalyse, mit dem Pflegeanbieter, Forscher und Unternehmen unstrukturierten medizinischen Daten umfangreiche Erkenntnisse und Beziehungen entnehmen können. Das zugrunde liegende Modell wurde mit einer Vielzahl von medizinischen Daten trainiert, zu denen beispielsweise verschiedene Formate von klinischen Notizen und Protokolle von klinischen Tests zählen. Aus diesem Grund ist das Textanalysefeature in der Lage, eine Vielzahl von Datentypen und Tasks zu verarbeiten, ohne dass Kunden eigene Modelle unter hohem Zeitaufwand selbst erstellen müssen.
Als Reaktion auf die COVID-19-Pandemie hat sich Microsoft mit dem Allen Institute for AI und führenden Forschungsgruppen zusammengeschlossen, um gemeinsam das offene Forschungsdataset zu COVID-19 zusammenzustellen. Auf Grundlage von mehr als 47.000 wissenschaftlichen Artikeln haben wir eine COVID-19-Suchmaschine entwickelt, die auf der Textanalyse für Gesundheitsdaten und Cognitive Search basiert. Sie unterstützt Forscher im Kampf gegen die Krankheit, indem sie ihnen neue Einblicke ermöglicht.
Zudem haben wir weitere Verbesserungen im Bereich Natural Language Processing (NLP) vorgenommen, damit Entwickler schneller Apps erstellen können, die Einblicke in die in einem Text ausgedrückte Stimmung möglich machen. Das Textanalysefeature Opinion Mining weist bestimmten Features oder Themen Stimmungen zu, sodass Benutzer das Kundenfeedback aus sozialen Medien, Bewertungswebsites und anderen Quellen besser verstehen können.
Zeiteinsparung und Kostensenkung dank verwendbarer Daten aus Formularen
Viele unstrukturierte Daten liegen in Formularen vor, die Tabellen, Objekte und weitere Elemente enthalten. Üblicherweise ist bei diesen Arten von Dokument manuelles Labelling nach Dokumenttyp oder umfangreiche Programmierarbeit erforderlich, um Einblicke daraus zu gewinnen.
Mit der Formularerkennung machen wir ein Feature allgemein verfügbar, das es Entwicklern ermöglicht, effizient und exakt Informationen aus Millionen von Dokumenten zu extrahieren – ganz ohne Fachkenntnisse in Data Science.
Unternehmen wie Sogeti (Teil der Capgemini-Gruppe) ermöglichen ihren Kunden mithilfe der Formularerkennung eine schnellere Verarbeitung von großen Mengen digitaler Dokumente.
„Sogeti ist kontinuierlich auf der Suche nach neuen Wegen, wie wir unsere Kunden beim digitalen Wandel unterstützen können. Dabei setzen wir auf innovativste KI-Lösungen und maschinelles Lernen. Dank unserer Plattform „Cognitive Document Processing“ (CDP) können unseren Kunden unstrukturierte Dokumente verarbeiten und klassifizieren, um Daten mit hoher Genauigkeit zu extrahieren. Dies führt zu geringeren Betriebskosten und Verarbeitungszeiten. CDP basiert auf den leistungsstarken kognitiven Funktionen und Taggingfunktionen der Formularerkennung, mit denen sich mühelos schlüssellos gekoppelte Daten und andere relevante Informationen aus gescannten/digitalen unstrukturierten Dokumenten extrahieren lassen, was wiederum zu Zeiteinsparungen führt.“ – Mark Oost, Chief Technology Officer bei Sogeti, Artificial Intelligence and Machine Learning
Wilson Allen, ein führender Anbieter für Beratungs- und Analyselösungen, unterstützt Rechtsunternehmen und andere Professional Service Firms mithilfe der Formularerkennung dabei, Dokumente wie PDFs und Bilder, einschließlich Finanzformularen und Kreditanträgen, zu verarbeiten und auszuwerten. Anschließend werden benutzerdefinierte Modelle trainiert, um exakte Werte aus komplexen Formularen zu extrahieren.
„Die Formularerkennung ist eine große Bereicherung für unser Toolkit. Sie hilft uns, große Mengen von unstrukturierten Daten in wertvolle Informationen zu verwandeln. So konnten wir mehr als 400 Stunden manueller Dateneingabearbeit sparen, was unseren Mitarbeitern die Zeit gab, sich strategischeren Aufgaben zu widmen.“ – Norm Mullock, VP of Strategy bei Wilson Allen
Besserer Kundendialog dank sprachfähiger Apps
Viele Organisationen sehen sich der Herausforderung gegenüber, den Kundenservice zu optimieren und gleichzeitig den Wandel zu einem digitalen, kontaktlosen Angebot zu meistern.2 Verbesserungen bei der Sprachtechnologie ermöglichen es Entwicklern, nahtlosere, natürlichere, sprachfähige Lösungen zu schaffen, über die Kunden mit Marken interagieren können.
Eine dieser Verbesserungen sind die benutzerdefinierten Befehle. Diese Speech-Funktion aus Cognitive Services ist nun allgemein verfügbar. Mit benutzerdefinierten Befehlen können Entwickler einfacher taskorientierte Sprachanwendungen für Befehl- und Kontrollszenarios erstellen, deren Komponenten vorab klar definiert werden können. Ein Beispiel sind sprachgesteuerte smarte Thermostate. Die Funktion vereint die Spracherkennung und den Dienst Language Understanding, mit dem Geräte gesprochene Sprache erfassen können, mit Sprachantworten dank Text-to-Speech. So können Sie Ihren Apps einfacher Sprachfunktionen hinzufügen, ohne viel Code schreiben zu müssen.
Außerdem wird die Sprachunterstützung für das neuronale Text-to-Speech-Feature auf 15 neue, natürlich klingende Stimmen erweitert. Diese basieren auf hochmodernen neuronalen Sprachsynthesemodellen: Salma für Arabisch (Ägypten), Zariyah für Arabisch (Saudi-Arabien), Alba für Katalanisch (Spanien), Christel für Dänisch (Dänemark), Neerja für Englisch (Indien), Noora für Finnisch (Finnland), Swara für Hindi (Indien), Colette für Niederländisch (Niederlande), Zofia für Polnisch (Polen), Fernanda für Portugiesisch (Portugal), Dariya für Russisch (Russland), Hillevi für Schwedisch (Schweden), Achara für Thai (Thailand), HiuGaai für Chinesisch (Kantonesisch, traditionell) und HsiaoYu für Chinesisch (taiwanesisches Mandarin).
Viele Kunden nutzen schon heute Sprachfunktionen in ihren Apps, um den Kundendialog zu verbessern. Mit Cognitive Services und Bot Service hat BBC beispielsweise den KI-fähigen Sprachassistenten Beeb erschaffen, der den verschiedenen Zielgruppen eine ansprechendere und personalisierte Interaktion bietet.
Wir freuen uns sehr, diese Produktinnovationen vorstellen zu können, die alle Entwickler in die Lage versetzen, unternehmenskritische KI-Apps zu erstellen. Weitere Informationen finden Sie unten in unseren Ressourcen.
Jetzt einsteigen
Informieren Sie sich in den unten aufgeführten Ressourcen, und probieren Sie Azure Cognitive Services mit einem kostenlosen Azure-Konto aus.
- Textanalyse für Gesundheitsdaten: Weitere Informationen erhalten Sie im Blogbeitrag der Microsoft Tech Community. In der Demoversion der COVID-19-Suchmaschine können Sie das Feature live ausprobieren. Geben Sie einfach einen medizinischen Begriff wie „Ibuprofen“ in die Suchleiste ein, und experimentieren Sie etwas mit den Beziehungen im Graphen.
- Formularerkennung: Weitere Informationen erhalten Sie im Blogbeitrag der Microsoft Tech Community. In der Demo der Formularerkennung können Sie das Feature live in Aktion erleben und Informationen aus verschiedenen Formulartypen extrahieren. Hier finden Sie die Codebeispiele.
- Benutzerdefinierte Befehle: Weitere Informationen erhalten Sie im Blogbeitrag der Microsoft Tech Community. Probieren Sie das Feature in den Demos zur Inventarverwaltung, Hotelbranche und Automobilindustrie aus. Wählen Sie zunächst ein Szenario aus, und sagen Sie einen Sprachbefehl, wenn Sie dazu aufgefordert werden. Hier finden Sie die Codebeispiele.
- Neuronale Text-to-Speech-Funktionen: Weitere Informationen erhalten Sie im Blogbeitrag der Microsoft Tech Community. Hier finden Sie eine Demo. Verwenden Sie den vorhandenen Text, oder fügen Sie einen eigenen ein, und versuchen Sie, die Audioausgabe optimieren. Hier finden Sie die Codebeispiele.
1 Worldwide Artificial Intelligence Predictions (IDC FutureScape 2020)
2 Adapting customer experience in the time of coronavirus (McKinsey 2020).