Trace Id is missing
Zu Hauptinhalt springen
Azure

Azure KI Vision

Entdecken Sie Erkenntnisse zum maschinellen Sehen aus der Bild- und Videoanalyse mit OCR und KI.

Verbessern Sie Ihre Projekte für maschinelles Sehen

Azure KI Vision ist ein einheitlicher Dienst, der innovative Funktionen für maschinelles Sehen bietet. Bieten Sie Ihren Apps die Möglichkeit, Bilder zu analysieren, Text zu lesen und Gesichter mit vordefinierten Bildmarkierung, Textextraktion mit optischer Zeichenerkennung (OCR) und verantwortungsvoller Gesichtserkennung zu erkennen. Integrieren Sie Vision-Funktionen in Ihre Projekte, ohne dass Machine Learning-Erfahrung erforderlich ist.

Probieren Sie es in Vision Studio aus

Ankündigung der neuesten Funktionen für maschinelles Sehen für Entwickler
Bildanalyse, die aus mehr als 10.000 Konzepten und Objekten abruft, um Erkenntnisse zu erkennen, zu klassifizieren, zu beschriften und zu generieren.
Räumliche Analyse, um die Anwesenheit und Bewegungen von Personen in physischen Bereichen in Echtzeit zu verstehen.
Optische Zeichenerkennung (OCR), um gedruckten und handschriftlichen Text aus Bildern mit verschiedenen Sprachen und Schreibstilen zu extrahieren.
Gesichtserkennung, um intelligente Anwendungen zu erstellen, die menschliche Identitäten erkennen und überprüfen.

Verbessern der Auffindbarkeit von Inhalten mit der Bildanalyse

Automatische Untertitelung von Bildern in natürlicher Sprache, Intelligentes Zuschneiden und Klassifizieren von Bildern (in der Vorschau).

Video container

Streamen von Videos in Echtzeit mit räumlicher Analyse

Nachverfolgen von Bewegungen und Analysieren von Umgebungen in Echtzeit mithilfe von maschinellem Sehen mit Bildanalyse und Objekterkennung.

Lesen von Text aus Bildern mithilfe der optischen Zeichenerkennung (OCR)

Extrahieren Sie gedruckten und handschriftlichen Text aus Bildern mit verschiedenen Sprachen und Schreibstilen mithilfe der OCR-Technologie.

Optische Zeichenerkennung für nährwertbezogene Angaben auf einem Etikett
Video container

Identitäten mit Gesichtserkennung bestätigen

Erstellen Sie Apps mit Gesichtserkennung, um ihre Leistung zu optimieren und sie noch besser zu sichern.

Trainieren benutzerdefinierter Modellen für maschinelles Sehen

Passen Sie die Bildklassifizierung und Objekterkennung mit nur wenigen Bildern und ohne Beeinträchtigung der Genauigkeit (in der Vorschau) an Ihre Anforderungen an.

Übersicht über ein benutzerdefiniertes Modell in Vision Studio

Wenden Sie KI verantwortungsvoll an

Erhalten Sie klare Anleitungen dazu, wie Sie Computer KI Vision verantwortungsbewusst einsetzen, um Ihre Ziele zu erreichen und genaue Ergebnisse zu erzielen.

IDC MarketScape Worldwide General-Purpose Computer Vision AI Software Platforms Grafik mit führenden Unternehmen wie Microsoft, Google, AWS, Clarifai und anderen.

Microsoft wird im IDC MarketScape als Leader (führender Anbieter) bezeichnet: Worldwide General-Purpose Computer Vision AI Software Platform 2022 – Herstellerbewertung

Im IDC MarketScape-Bericht wurden die Strategien und Funktionen von Microsoft bewertet und Microsoft in der Kategorie "Leaders" (führende Anbieter) positioniert. Wir glauben, dass diese Anerkennung das Engagement von Microsoft unterstreicht, innovative, verantwortungsvolle und kundenorientierte KI-Produkte für Organisationen aller Größen und branchenübergreifend bereitzustellen.

Buchdeckblatt zum Entwerfen verteilter Systeme

Vorantreiben von App-Innovationen mithilfe von KI-Clouddiensten

Lesen Sie diese von Forrester Consulting durchgeführte Auftragsstudie aus dem Jahr 2022, um zu erfahren, wie Sie Entwicklern jeder Qualifikationsstufe in Ihrer Organisation helfen können, KI-Lösungen schnell mithilfe vorgefertigter, produktionsbereiter Cloud-KI-Dienste bereitzustellen.

Integrierte umfassende Sicherheit und Compliance

  • ISO/IEC

  • CSA/CCM

  • ITAR

  • CJIS

  • HIPAA

  • IRS 1075

Erste Schritte mit einem kostenlosen Azure-Konto

1

Kostenlos starten. Sie erhalten ein Guthaben von 200 USD, das Sie innerhalb von 30 Tagen verwenden können. Solange Sie über Ihr Guthaben verfügen, können Sie viele unserer beliebtesten Dienste kostenlos nutzen. Außerdem erhalten Sie mehr als 55 weitere Dienste stets kostenlos.

2

Nachdem Ihr Guthaben aufgebraucht ist, wechseln Sie zur nutzungsbasierten Zahlung, um Ihr Wachstum mit den gleichen kostenlosen Dienstleistungen voranzutreiben. Es fallen nur Gebühren an, wenn Sie die kostenlosen monatlichen Kontingente überschreiten.

3

Nach 12 Monaten erhalten Sie weiterhin über 55 dauerhaft kostenlose Dienste und zahlen weiterhin nur für das, was Sie über Ihre kostenlosen monatlichen Beträge hinaus nutzen.

Die bewährte Lösung für Unternehmen jeder Größe und in jeder Branche

USA Surfing tritt der KI-Welle bei

“Trainer sehen sich diese Elemente an. Sie betrachten die Komprimierung des Texts. Sie betrachten verschiedene dynamische Faktoren. Diese Machine Learning-Modelle können durch die Messung der Winkel zwischen den Gelenken des Körpers bei der Ausführung von Surfmanövern den Trainern tatsächlich helfen, Feedback zu geben.“ 

Kevin Schulz: Flugphänomen und Surfer, Team USA

Ein Surfer beim Wellenreiten

KPMG unterstützt Bankkunden bei der Identifizierung finanzieller Risiken

Mit AI Vision findet und analysiert KPMG Bilder und Videos und verwendet OCR-APIs (Optical Character Recognition), um Risiken zu identifizieren.

Drei Personen, die sich unterhalten und einen Flur entlang gehen

H&R Block verwendet Azure KI, um Steuererklärungen zu transformieren

„Geben Sie uns einen Schuhkarton mit Steuerdokumenten, und wir nutzen KI und maschinelles Lernen, um die Daten an den richtigen Stellen zu platzieren.”

Sameer Agarwal: IT Director, H&R Block

Eine Person, die an ihrem Schreibtisch mit einem Laptop arbeitet und die H&R Block-Website anzeigt

Reddit verbessert Barrierefreiheit und SEO mit Bild- und Untertitelgenerierung

"Die neu erstellten Bildbeschriftungen machen Reddit barrierefreier und bieten Redditoren mehr Möglichkeiten, unsere Bilder zu erkunden, an Unterhaltungen teilzunehmen und schließlich Verbindungen und eine Community aufzubauen."

Tiffany Ong: Produktmanager – Guest Experience & SEO, Reddit

Drei Personen, die in Schreibtischsesseln zwischen Schreibtischen sitzen und eine Unterhaltung führen
Zurück zu Registerkarten

Dokumentation und Ressourcen

Erste Schritte

Lesen Sie die Dokumentation

Microsoft Learn-Kurse absolvieren

Beispiele anzeigen

Häufig gestellte Fragen zu Azure KI Vision

  • Informieren Sie sich über die Verfügbarkeit nach Region.

  • Azure KI Vision und andere Azure KI Services-Angebote bieten eine Verfügbarkeit von 99,9 %. Für den Free-Tarif wird keine SLA bereitgestellt. Siehe SLA-Details.

  • Nein, Microsoft löscht Ihre Bilder und Videos nach der Verarbeitung automatisch. Ihre Daten werden nicht zum Trainieren der zugrunde liegenden Modelle verwendet. Die Videodaten verlassen Ihre lokalen Ressourcen nicht und werden nicht im Edge gespeichert, in dem der Container ausgeführt wird. Erfahren Sie mehr über den Datenschutz und die Nutzungsbedingungen.

  • Nein, die räumliche Analyse erkennt und ortet Menschen in Videoaufnahmen und -ausgaben mithilfe eines Begrenzungsrahmens um jede erkannte Person. Die KI-Modelle erkennen keine Gesichter und bestimmen auch nicht die Identität oder demografische Angaben zu einzelnen Personen.

  • Die KI-Modelle der räumlichen Analyse erkennen und verfolgen Bewegungen im Videofeed auf Grundlage von Algorithmen, die Menschen anhand eines Begrenzungsrahmens für den Körper erkennen. Für jede Person und jeden Begrenzungsrahmen in einem Bereich der Kameraaufnahme geben die KI-Modelle Ereignisdaten aus, einschließlich der Begrenzungsrahmenkoordinaten für den Körper einer Person, des Ereignistyps (z. B. Betreten oder Verlassen des Bereichs, Überschreitung einer direktionalen Linie), der pseudonymen Bezeichner zur Nachverfolgung des Begrenzungsrahmens und einer Zuverlässigkeitsbewertung für die Erkennung. Diese Ereignisdaten werden an Ihre eigene Instanz von Azure IoT Hub gesendet.

  • Ja. Da die Modellanpassung für Ihr Szenario optimiert ist, müssen Sie die bezeichneten Daten bereitstellen, um Ihr Modell zu trainieren.

  • Die Modellanpassungsfunktion des Diensts ist für die schnelle Erkennung wesentlicher Unterschiede zwischen Bildern optimiert, sodass Sie schon mit einer kleinen Datenmenge mit der Prototyperstellung für Ihr Modell beginnen können. Sie können mit nur einem Bild pro Bezeichnung beginnen. Wenn Sie mehr beschriftete Bilder haben, können Sie weitere hinzufügen. Abhängig von der Komplexität des Problems und dem erforderlichen Genauigkeitsgrad können Sie weiterhin zusätzliche Bilder pro Bezeichnung hinzufügen, um Ihr Modell zu verbessern.

  • Beides trifft zu. Sie können die Website verwenden, um auf eine grafische Benutzeroberfläche für die Verwaltung von Datasets, das Training und die Auswertung von Modellen ohne Code zuzugreifen. Alternativ können Sie auch die maschinelles Sehen-APIs verwenden.

  • Sie können die Bilder in Azure Machine Learning Studio bezeichnen, das in Vision Studio integriert ist, um beschriftete Daten einfach exportieren zu können. Sie können die Daten auch im COCO-Dateiformat bezeichnen und die COCO-Datei direkt in Vision Studio importieren. Ausführliche Informationen zu diesem Thema finden Sie in der Dokumentation.

  • Das Modellanpassungsfeature für Azure KI Vision ist die nächste Generation von Custom Vision, mit verbesserter Genauigkeit und wenigen Lernfunktionen. Sie können weiterhin Custom Vision verwenden, oder Sie können Ihre Trainingsdaten migrieren, um Ihr Modell mit der Modellanpassung von Azure KI Vision erneut zu trainieren. Ausführliche Informationen zu diesem Thema finden Sie in der Dokumentation.

  • Nachdem Sie Azure KI Vision zum Extrahieren von Erkenntnissen und Text aus Bildern und Videos verwendet haben, können Sie Textanalyse verwenden, um Stimmungen zu analysieren, Translator, um Text in Ihre gewünschte Sprache zu übersetzen, oder Plastischer Reader, um den Text laut vorlesen zu lassen, und somit die Barrierefreiheit verbessern. Zu den zugehörigen Diensten und Funktionen gehören Azure KI Dokument Intelligenz zum Extrahieren von Schlüssel-Wert-Paaren und Tabellen aus Dokumenten, Azure KI Video Indexer zum Extrahieren erweiterter Metadaten aus Audio- und Videodateien sowie Content Moderator zum Erkennen unerwünschter Texte oder Bilder.

Sind Sie bereit? Richten Sie Ihr kostenloses Azure-Konto ein

Azure kostenlos testen