Computer Vision API の詳細
画像の分析
この機能では、画像内にあるビジュアル コンテンツに関する情報が返されます。タグ付け、説明、ドメイン固有モデルを使用してコンテンツを特定し、確実にラベル付けします。成人向け/わいせつな描写に対する設定を適用すれば、アダルト コンテンツの自動制限を有効にできます。画像の種類や写真内の配色を特定します。
アクションからご覧ください
使ってみたいですか?
画像内のテキストの読み取り
光学式文字認識 (OCR) により画像内のテキストを検出し、認識した語句をマシンに抽出して、判読可能な文字ストリームに変換します。画像を分析して埋め込みテキストを検出し、文字ストリームを生成し、検索を有効にします。テキストをコピーする代わりに写真を撮ることで、時間と労力を節約します。
アクションからご覧ください
このデモにデータをアップロードすることにより、Microsoft がお客様のデータを保存し、本 API などの Microsoft サービスの品質向上に役立てることに同意するものとします。お客様のプライバシーを保護するため、お客様のデータは匿名化され、セキュリティで保護されます。お客様のデータを第三者に開示または提供することはありません。
使ってみたいですか?
プレビュー: 画像からの手書き文字の読み取り
このテクノロジ (手書き文字認識) では、メモ、手紙、レポート、ホワイトボード、用紙などから手書きの文字を検出し抽出することができます。白色の紙や黄色い付箋紙、ホワイトボードなど、さまざまな表面や下地に対応可能です。
手書き文字認識を使用すれば、テキストを書き写すのではなく撮影するだけでよくなるため、時間と手間が抑えられ、生産性を向上させることができます。メモをデジタル化することで、素早く簡単に検索できるようになります。また、書類が散乱する事態も防ぐことができます。
注: 本テクノロジは現在プレビュー段階であり、アルファベットにのみ対応しています。
下にあるデモ版の光学文字認識を試すには、ローカルに保存している画像をアップロードするか、画像の URL を入力してください。お客様からの許可がない限り、このデモで提供された画像は保存されません。
アクションからご覧ください
使ってみたいですか?
著名人およびランドマークの認識
ドメイン固有モデルの例として、著名人モデルおよびランドマーク モデルがあります。著名人認識モデルでは、ビジネス、政治、スポーツ、エンターテイメント分野での 200,000 人の著名人を認識できます。ランドマーク認識モデルでは、世界中の 9000 種類の自然物や人工物のランドマークを認識できます。ドメイン固有モデルは Computer Vision API で継続的に進化を遂げている機能です。
アクションからご覧ください
使ってみたいですか?
ほぼリアルタイムでビデオを分析
ほぼリアルタイムでビデオを分析。ご使用のデバイスでビデオのフレームを抽出し、それらのフレームをお好きな API 呼び出しに送信することで、任意の Computer Vision API をビデオ ファイルに使用できます。ビデオの結果はすぐに返ってきます。
まず GitHub のサンプルを使用して、アプリを構築しましょう。
詳細情報アクションからご覧ください
使ってみたいですか?
サムネイルの生成
あらゆる入力画像に基づいて、高品質でストレージ効率の高いサムネイルを生成します。サムネイル生成機能を使用して、サイズ、形、スタイルのニーズに最も適したものに画像を変更できます。スマート トリミングを適用すれば、元の画像とは異なる縦横比であるものの、関心領域を維持したサムネイルを生成できます。
アクションからご覧ください
このデモにデータをアップロードすることにより、Microsoft がお客様のデータを保存し、本 API などの Microsoft サービスの品質向上に役立てることに同意するものとします。お客様のプライバシーを保護するため、お客様のデータは匿名化され、セキュリティで保護されます。お客様のデータを第三者に開示または提供することはありません。
使ってみたいですか?

「Computer Vision API を使うと、クライアントにデータの信頼性を示すことができるため、クライアントはその情報に基づいて自信を持って重要なビジネス上の意思決定を行うことができます」
Leendert de Voogd 氏: CEO | Vigiglobe

「Microsoft Cognitive Services はコンピュータービジョンや人工知能などのパワフルなツール群を提供するものであり、これらのツールを使えばわずか数時間で優れたアプリと顧客向けの新しい機能を作成できるだろう、ということを理解するのに長くはかかりませんでした」
John Fan 氏: 共同創立者兼 CEO | Cardinal Blue Software

「Cognitive Services APIs は機械学習の力を利用するため、データ サイエンティストのチームを社内で作らなくても、高度なインテリジェンスを製品に組み込むことができました」
Aaron Edell 氏: 最高製造経営者 | GrayMeta

「Cognitive Services は解けなかった問題に欠けていた部品なのだと理解しています。このソリューションを市場に出し、人々がビデオを見る方法を大きく変えるために必要だった部品です」
Katie McCann 氏: 製造およびエンジニアリング担当部長 | Prism Skylabs

「Microsoft Cognitive Services は、実に幅広いチャンスを当社に与えてくれます。今のところ当社に完全にマッチしていますが、将来必要あればより多くの機能をアプリに追加します」
Jaan Apajalahti 氏: CEO | Blucup

「Cognitive Services API を利用したところ、3 か月で、テキストとイメージの音声変換、感情の識別、言葉による風景の説明が可能な眼鏡の試作品を開発できました。終日働き続けていたら、2 週間で開発できたでしょう」
Benoit Chirouter 氏: R&D ディレクター | Pivothead
Cognitive Services APIs を詳しく見る
Computer Vision API
画像から意思決定に役立つ情報を抽出
Content Moderator
画像、テキスト、ビデオを自動モデレート
Emotion API プレビュー
感情認識を使用してユーザー エクスペリエンスをパーソナライズ
Face API
写真に含まれる顔の検出、識別、分析、グループ化、タグ付け
Video Indexer プレビュー
動画の洞察を解放
Custom Vision Service プレビュー
貴社の最先端のコンピューター ビジョン モデルを、独自の用途向けに簡単にカスタマイズできます
Text Analytics API
センチメントとトピックを簡単に評価して、ユーザーが求めるものを理解
Web Language Model API プレビュー
Web 規模のデータで学習した予測言語モデルを活用
Language Understanding (LUIS)
ユーザーが入力したコマンドをアプリケーションが理解できるようにします。
Bing Spell Check API
アプリでのスペル ミスを検出して修正
Translator Text API
シンプルな REST API 呼び出しで機械翻訳を簡単に実行
Linguistic Analysis API プレビュー
Linguistic Analysis API で複雑な言語概念を単純化しテキストを解析しましょう
Bing Speech API
音声をテキストへ、またそのテキストを再び音声に変換し、ユーザーの意図を理解
Speaker Recognition API プレビュー
音声を使用して個々の話者を識別および認証
Custom Speech Service プレビュー
話し方、背景ノイズ、ボキャブラリといった音声認識の障壁を打開
Translator Speech API
シンプルな REST API 呼び出しでリアルタイムの音声翻訳を簡単に実行
Bing Autosuggest API
アプリにインテリジェントな自動提案機能を追加
Bing Custom Search API
簡単に使用できる、広告なしの商用グレード検索ツールで、お好みの検索結果を得ることができます
Bing Entity Search API
Web からエンティティ情報を特定して追加することで、優れたエクスペリエンスを提供します
Bing Web Search API
何十億もの Web ドキュメントから、より優れた検索結果を得る
Bing Video Search API
ビデオを検索してさまざまな情報を手に入れましょう
Bing Image Search API
画像を検索してさまざまな情報を手に入れましょう
Bing News Search API
ニュースを検索して詳しい情報を手に入れましょう
QnA Maker API
情報から会話形式のナビゲーションしやすい回答を抽出
Custom Decision Service
クラウドべースの文脈に応じた意思決定 API。学習により精度が高まります
Project Gesture
ジェスチャー ベースの制御
Project Knowledge Exploration
旧称 Knowledge Exploration Service API
Project Event Tracking
Wikipedia エントリーに関連付けられたイベント
Project Academic Knowledge
旧称 Academic Knowledge
Project Local Insights
場所に関する洞察
Project Entity Linking
旧称 Entity Linking Intelligence Service API