Maschinelles Sehen-API

Extrahieren Sie Informationen aus Bildern, um visuelle Daten zu kategorisieren und zu verarbeiten – die computergestützte Moderation von Bildern unterstützt Sie dabei, Ihre Dienste zu kuratieren.

Bilder analysieren

Dieses Feature gibt Informationen zu visuellen Inhalten in einem Bild zurück. Nutzen Sie Tagging, Beschreibungen und bereichspezifische Modelle, um Inhalte zu identifizieren und zuverlässig zu kennzeichnen. Wenden Sie Einstellungen für nicht jugendfreie oder anzügliche Inhalte an, um eine automatische Einschränkung dieser Inhalte zu ermöglichen. Bestimmen Sie Bildtypen und Farbschemas in Bildern.

Demo anzeigen

Name des Merkmals: Wert
Beschreibung { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "yellow", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.8331026 } ] }
Tags [ { "name": "train", "confidence": 0.9975446 }, { "name": "platform", "confidence": 0.995543063 }, { "name": "station", "confidence": 0.9798007 }, { "name": "indoor", "confidence": 0.927719653 }, { "name": "subway", "confidence": 0.838939846 }, { "name": "pulling", "confidence": 0.431715637 } ]
Bildformat "Jpeg"
Bildmaße 462 x 600
ClipArt-Typ 0
Liniengrafiktyp 0
Schwarzweiß false
Nicht jugendfreier Inhalt false
Bewertung für nicht jugendfreien Inhalt 0.0147124995
Freizügigkeit false
Bewertung für Freizügigkeit 0.0162802152
Kategorien [ { "name": "trans_trainstation", "score": 0.98828125 } ]
Gesichter []
Vorherrschende Hintergrundfarbe
"Black"
Vorherrschende Vordergrundfarbe
"Black"
Akzentfarbe
#484C83

Möchten Sie dies erstellen?

Text in Bildern lesen

Optische Zeichenerkennung (OCR) erkennt Text in einem Bild und extrahiert die erkannten Zeichen in eine computerlesbare Zeichenfolge. Analysieren Sie Bilder, um eingebetteten Text zu erkennen, Zeichenfolgen zu generieren und eine Suche zu ermöglichen. Fotografieren Sie Text, anstatt ihn zu kopieren – und sparen Sie damit viel Zeit.

Demo anzeigen

  1. Vorschau
  2. JSON

IF WE DID

ALL

THE THINGS

WE ARE

CAPABLÉ•

OF DOING,

WE WOULD

LITERALLY

ASTOUND

QURSELV*S.

{
  "textAngle": 0.0,
  "orientation": "NotDetected",
  "language": "en",
  "regions": [
    {
      "boundingBox": "316,47,284,340",
      "lines": [
        {
          "boundingBox": "319,47,182,24",
          "words": [
            {
              "boundingBox": "319,47,42,24",
              "text": "IF"
            },
            {
              "boundingBox": "375,47,44,24",
              "text": "WE"
            },
            {
              "boundingBox": "435,47,66,23",
              "text": "DID"
            }
          ]
        },
        {
          "boundingBox": "316,74,204,69",
          "words": [
            {
              "boundingBox": "316,74,204,69",
              "text": "ALL"
            }
          ]
        },
        {
          "boundingBox": "318,147,207,24",
          "words": [
            {
              "boundingBox": "318,147,63,24",
              "text": "THE"
            },
            {
              "boundingBox": "397,147,128,24",
              "text": "THINGS"
            }
          ]
        },
        {
          "boundingBox": "316,176,125,23",
          "words": [
            {
              "boundingBox": "316,176,44,23",
              "text": "WE"
            },
            {
              "boundingBox": "375,176,66,23",
              "text": "ARE"
            }
          ]
        },
        {
          "boundingBox": "319,194,281,44",
          "words": [
            {
              "boundingBox": "319,194,281,44",
              "text": "CAPABLÉ•"
            }
          ]
        },
        {
          "boundingBox": "318,243,181,29",
          "words": [
            {
              "boundingBox": "318,243,43,23",
              "text": "OF"
            },
            {
              "boundingBox": "376,243,123,29",
              "text": "DOING,"
            }
          ]
        },
        {
          "boundingBox": "316,271,170,24",
          "words": [
            {
              "boundingBox": "316,272,44,23",
              "text": "WE"
            },
            {
              "boundingBox": "375,271,111,24",
              "text": "WOULD"
            }
          ]
        },
        {
          "boundingBox": "317,300,200,24",
          "words": [
            {
              "boundingBox": "317,300,200,24",
              "text": "LITERALLY"
            }
          ]
        },
        {
          "boundingBox": "316,328,157,24",
          "words": [
            {
              "boundingBox": "316,328,157,24",
              "text": "ASTOUND"
            }
          ]
        },
        {
          "boundingBox": "318,357,214,30",
          "words": [
            {
              "boundingBox": "318,357,214,30",
              "text": "QURSELV*S."
            }
          ]
        }
      ]
    }
  ]
}

Durch Hochladen von Daten für diese Demoversion stimmen Sie zu, dass Microsoft diese Daten speichern und zur Verbesserung von Microsoft-Diensten wie z.B. dieser API verwenden darf. Zum Schutz Ihrer Privatsphäre ergreifen wir Maßnahmen, um Ihre Daten zu anonymisieren und sicher zu speichern. Wir werden Ihre Daten nicht veröffentlichen oder anderen Personen die Nutzung Ihrer Daten gestatten.

Möchten Sie dies erstellen?

Vorschau: Handschriftlichen Text aus Bildern lesen

Diese Technologie (Handschrift-OCR) ermöglicht Ihnen, handschriftlichen Text in Notizen, Briefen, Abhandlungen, Tafelbildern, Formularen usw. zu erkennen und zu extrahieren. Sie funktioniert mit verschiedenen Oberflächen und Hintergründen, z.B. weißem Papier, gelben Haftnotizen oder Tafeln.

Die Erkennung von handschriftlichem Text spart Zeit und Mühe und kann Ihre Produktivität steigern, indem Sie Bilder von Text aufnehmen können, anstatt diesen übertragen zu müssen. Sie macht es möglich, Notizen zu digitalisieren, sodass Sie sie schnell und einfach durchsuchen können. Außerdem wird die Papiermenge reduziert.

Hinweis: Diese Technologie befindet sich derzeit in der Vorschau und ist nur für englischsprachigen Text verfügbar.

Um diese Demo der optischen Zeichenerkennung auszuprobieren, laden Sie ein lokal gespeichertes Bild hoch oder geben eine Bild-URL an. Wir speichern die für diese Demo bereitgestellten Bilder nicht, sofern wir keine Berechtigung dazu von Ihnen erhalten.

Demo anzeigen

  1. Vorschau
  2. JSON

OUR greatest glory is not

i never failing ,

but in rising every

time we fall

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResult": {
    "lines": [
      {
        "boundingBox": [
          67,
          204,
          668,
          210,
          667,
          272,
          66,
          267
        ],
        "text": "OUR greatest glory is not",
        "words": [
          {
            "boundingBox": [
              69,
              206,
              159,
              205,
              155,
              274,
              65,
              275
            ],
            "text": "OUR"
          },
          {
            "boundingBox": [
              192,
              205,
              350,
              204,
              346,
              273,
              188,
              274
            ],
            "text": "greatest"
          },
          {
            "boundingBox": [
              393,
              204,
              509,
              203,
              505,
              272,
              389,
              273
            ],
            "text": "glory"
          },
          {
            "boundingBox": [
              539,
              203,
              588,
              203,
              584,
              272,
              534,
              272
            ],
            "text": "is"
          },
          {
            "boundingBox": [
              601,
              202,
              680,
              202,
              676,
              271,
              597,
              271
            ],
            "text": "not"
          }
        ]
      },
      {
        "boundingBox": [
          540,
          289,
          900,
          302,
          897,
          374,
          538,
          360
        ],
        "text": "i never failing ,",
        "words": [
          {
            "boundingBox": [
              534,
              300,
              558,
              300,
              568,
              376,
              545,
              376
            ],
            "text": "i"
          },
          {
            "boundingBox": [
              589,
              300,
              694,
              300,
              705,
              376,
              600,
              376
            ],
            "text": "never"
          },
          {
            "boundingBox": [
              720,
              300,
              874,
              300,
              885,
              376,
              731,
              376
            ],
            "text": "failing"
          },
          {
            "boundingBox": [
              877,
              300,
              905,
              300,
              916,
              376,
              888,
              376
            ],
            "text": ","
          }
        ]
      },
      {
        "boundingBox": [
          139,
          416,
          572,
          433,
          570,
          491,
          136,
          474
        ],
        "text": "but in rising every",
        "words": [
          {
            "boundingBox": [
              145,
              418,
              215,
              418,
              202,
              491,
              132,
              491
            ],
            "text": "but"
          },
          {
            "boundingBox": [
              227,
              418,
              275,
              418,
              262,
              491,
              214,
              491
            ],
            "text": "in"
          },
          {
            "boundingBox": [
              308,
              418,
              428,
              419,
              415,
              492,
              295,
              491
            ],
            "text": "rising"
          },
          {
            "boundingBox": [
              476,
              419,
              581,
              419,
              568,
              492,
              463,
              492
            ],
            "text": "every"
          }
        ]
      },
      {
        "boundingBox": [
          622,
          413,
          967,
          410,
          968,
          470,
          623,
          472
        ],
        "text": "time we fall",
        "words": [
          {
            "boundingBox": [
              627,
              408,
              722,
              409,
              713,
              470,
              618,
              468
            ],
            "text": "time"
          },
          {
            "boundingBox": [
              765,
              409,
              828,
              410,
              818,
              471,
              756,
              470
            ],
            "text": "we"
          },
          {
            "boundingBox": [
              873,
              410,
              976,
              412,
              967,
              472,
              864,
              471
            ],
            "text": "fall"
          }
        ]
      }
    ]
  }
}

Möchten Sie dies erstellen?

Berühmte Personen und Orientierungspunkte erkennen

Die Modelle für berühmte Personen und Orientierungspunkte sind Beispiele des Features Domain Specific Models. Mit unserem Modell zur Erkennung berühmter Personen können 200.000 Prominente aus Wirtschaft, Politik, Sport und Unterhaltung erkannt werden. Unser Modell zur Erkennung von Orientierungspunkten erkennt 9000 natürliche und von Menschenhand erschaffene Orientierungspunkte aus der ganzen Welt. Domain Specific Models ist ein Feature, das kontinuierlich in der Maschinelles Sehen-API weiterentwickelt wird.

Demo anzeigen

{
  "categories": [
    {
      "name": "people_",
      "score": 0.86328125,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 239,
              "top": 293,
              "width": 138,
              "height": 138
            },
            "confidence": 0.9999974
          }
        ],
        "landmarks": null
      }
    }
  ],
  "adult": null,
  "tags": [
    {
      "name": "person",
      "confidence": 0.99956613779067993
    },
    {
      "name": "suit",
      "confidence": 0.98934584856033325
    },
    {
      "name": "man",
      "confidence": 0.98844343423843384
    },
    {
      "name": "outdoor",
      "confidence": 0.860062301158905
    }
  ],
  "description": {
    "tags": [
      "person",
      "suit",
      "man",
      "necktie",
      "outdoor",
      "building",
      "clothing",
      "standing",
      "wearing",
      "business",
      "looking",
      "holding",
      "black",
      "front",
      "hand",
      "dressed",
      "phone",
      "field"
    ],
    "captions": [
      {
        "text": "Satya Nadella wearing a suit and tie",
        "confidence": 0.99033389849736619
      }
    ]
  },
  "requestId": "6a146374-0050-41b1-a089-66a25b7bbbe7",
  "metadata": {
    "width": 600,
    "height": 900,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 49,
      "gender": "Male",
      "faceRectangle": {
        "left": 239,
        "top": 293,
        "width": 138,
        "height": 138
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "dominantColors": [
      "Black",
      "Grey"
    ],
    "accentColor": "7B5E50",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  }
}

Möchten Sie dies erstellen?

Videos nahezu in Echtzeit analysieren

Videos nahezu in Echtzeit analysieren: Verwenden Sie eine der Maschinelles Sehen-APIs mit Ihren Videodateien, indem Sie Frames des Videos von Ihrem Gerät extrahieren und diese an die API-Aufrufe Ihrer Wahl senden. Erzielen Sie schneller Ergebnisse aus Ihren Videos.

Verwenden Sie unser Beispiel auf GitHub, um loszulegen und Ihre eigene App zu erstellen.

Weitere Informationen

Demo anzeigen

Möchten Sie dies erstellen?

Miniaturansichten generieren

Generieren Sie basierend auf beliebigen Eingabebildern speichereffiziente Miniaturansichten mit hoher Qualität. Nutzen Sie die Generierung von Miniaturansichten, um Bilder an Ihre Anforderungen im Hinblick auf Größe, Form und Stil anzupassen. Wenden Sie intelligente Zuschneidefunktionen an, um Miniaturansichten mit einem anderen Seitenverhältnis zu generieren als das Originalbild, während gleichzeitig der Fokus beibehalten wird.

Demo anzeigen

Durch Hochladen von Daten für diese Demoversion stimmen Sie zu, dass Microsoft diese Daten speichern und zur Verbesserung von Microsoft-Diensten wie z.B. dieser API verwenden darf. Zum Schutz Ihrer Privatsphäre ergreifen wir Maßnahmen, um Ihre Daten zu anonymisieren und sicher zu speichern. Wir werden Ihre Daten nicht veröffentlichen oder anderen Personen die Nutzung Ihrer Daten gestatten.

Möchten Sie dies erstellen?

Cognitive Services-APIs erkunden

Maschinelles Sehen-API

Nützliche Informationen aus Bildern herausfiltern

Gesichtserkennungs-API

Gesichter auf Fotos erkennen, analysieren, organisieren und markieren

Content Moderator

Automatisierte Bild-, Text- und Videomoderation

Emotionen-API VORSCHAU

Personalisieren Sie das Benutzererlebnis mithilfe von Funktionen zur Erkennung von Emotionen

Benutzerdefinierter Dienst für maschinelles Sehen VORSCHAU

Passen Sie Ihre eigenen hochmodernen Modelle für maschinelles Sehen ganz einfach an Ihre speziellen Anforderungen an.

Videoindizierung VORSCHAU

Informationen aus Videos erschließen

Language Understanding Intelligent Service VORSCHAU

Bringen Sie Ihren Apps bei, Befehle Ihrer Benutzer zu verstehen

Textanalyse-API

Werten Sie ganz einfach Stimmungen und Themen aus, um zu verstehen, was sich Ihre Benutzer wünschen

Bing-Rechtschreibprüfungs-API

Ermitteln und korrigieren Sie Rechtschreibfehler in Ihrer App

Textübersetzungs-API

Einfach durchzuführende maschinelle Übersetzung mit einem einfachen REST-API-Aufruf

Web Language Model API VORSCHAU

Nutzen Sie die Möglichkeiten von Vorhersagesprachmodellen, die mit Daten aus dem gesamten Web trainiert wurden

API für linguistische Analyse VORSCHAU

Vereinfachen Sie komplexe Sprachkonzepte, und analysieren Sie Texte mit der API für linguistische Analyse.

Sprachübersetzungs-API

Sprachübersetzungen in Echtzeit mit einem einfachen REST-API-Aufruf

Sprechererkennungs-API VORSCHAU

Identifizieren und authentifizieren Sie Sprecher anhand Ihrer Stimme

Bing-Spracheingabe-API

Wandeln Sie Sprache in Text um und umgekehrt, um die Absicht Ihrer Benutzer zu verstehen

Benutzerdefinierter Spracherkennungsdienst VORSCHAU

Grenzen der Spracherkennung wie z.B. Sprachstil, Hintergrundgeräusche und Vokabular überwinden

Empfehlungs-API VORSCHAU

Sagen Sie voraus, für welche Artikel sich Ihre Kunden interessieren, und empfehlen Sie diese

Academic Knowledge-API VORSCHAU

Greifen Sie auf die umfangreichen akademischen Inhalte von Microsoft Academic Graph zu

Knowledge Exploration Service VORSCHAU

Ermöglichen Sie die interaktive Suche in strukturierten Daten per Eingabe in natürlicher Sprache

QnA Maker-API VORSCHAU

Verwandeln Sie Informationen in einfach zu findende Antworten.

Entity Linking Intelligence Service-API VORSCHAU

Erweitern Sie die Datenlinks Ihrer App um die Erkennung und Unterscheidung benannter Entitäten.

Benutzerdefinierter Entscheidungsdienst VORSCHAU

Eine cloudbasierte, kontextbasierte API für das Treffen von Entscheidungen, die aus Erfahrungen lernt und sich selbst optimiert.

Projekt Prague

Gestenbasierte Steuerungen

Projekt Cuzco

Mit Wikipedia-Einträgen verknüpftes Ereignis

Projekt Nanjing

Isochronenberechnungen

Projekt Abu Dhabi

Entfernungsmatrix

Projekt Johannesburg

Routenlogistik

Projekt Wollongong

Informationen zu Standorten

Bereit, Ihrer App neuen Schwung zu verleihen?