Azure Cognitive Services でエンタープライズ対応のスケーラブルな AI ソリューションを構築する

2019年11月6日 に投稿済み

Group Product Manager, Azure AI

この記事は、Azure Cognitive Services のシニア プロダクト マーケティング マネージャーの Tina Coll とプロダクト マーケティング マネージャーの Anny Dow が共同執筆したものです。

Azure Cognitive Services に人工知能 (AI) が導入され、機械学習の専門知識がなくても、すべての開発者が利用することができます。必要なのは、見る、聞く、話す、理解する、そして意思決定を加速させるための機能をアプリに埋め込む API 呼び出しです。企業はこの事前構築されたカスタム AI 機能を利用して、個人向けに設定された、より魅力あるインテリジェントなユーザー エクスペリエンスを実現します。Microsoft は、Personalizer を一般提供し、視覚、音声、言語の各カテゴリに拡張機能を追加導入することで、Microsoft Build 2019 による勢いを継続しています。ご紹介すべき新機能が数多くありますが、それぞれを詳しく見ていきましょう。

Personalizer:充実したユーザー エクスペリエンスの実現

O’Reilly の Strata カンファレンスで今年度の "最もイノベーティブな製品" アワードを受賞した Personalizer は、使いやすい API を駆使して強化学習を広く利用できるようにした、市場における唯一の AI サービスです。Personalizer は強化学習を採用し、機械学習の深い知識がない開発者でも、個人用に設定され、充実したユーザー エクスペリエンスを作成できるようにします。

顧客が求めるコンテンツをいつでも提供できるようにすることは、今日の小売、メディア、eコマース業界が直面する最大の課題の 1 つです。ランダムな A/B テスト、教師あり機械学習のどちらを適用する場合でも、企業は各ユーザーに合った独自のエクスペリエンスを提供し続けるために苦戦しています。ここで役立つのが Personalizer です。強化学習と呼ばれる最新の機械学習手法を駆使して、ユーザーの行動にかつてない影響力を及ぼす新しい選択肢を探します。Personalizer はこの手法を利用して、世界でリアルタイムに起こっている事象を学習し、数分ごとの短い単位で基礎にあるアルゴリズムを更新できます。この結果、アプリの使いやすさとユーザーの満足度が大幅に向上します。XBOX でそのホームページに Personalizer が実装されると、ユーザー エンゲージメントが 40% 上昇したことが確認されました。データ サイエンティストと、個人用の設定を促進する強化学習サイクルの図

Form Recognizer:テキスト抽出の自動化とフィードバック ループによる効率の向上

多くの場合、企業は読みにくいさまざまなドキュメントを使用しています。こうしたドキュメントは必ずしもきれいに印刷されているとは限らず、手書きのテキストを含むものも多く存在します。Chevron などの企業は Form Recognizer を使用して、印刷されたフォームから自動的に情報を抽出してドキュメント処理を迅速化しています。これによって従業員に時間の余裕ができ、より重要性の高い、難しい業務に集中できるようになります。

Form Recognizer では、W2 納税証明書、石油・ガス掘削井戸報告書、完了報告書、請求書、発注書などのドキュメントからキーと値のペア、テーブル、テキストを抽出します。 この記事では、人間による入力を用意し、フォームにラベルを付け、カスタム モデルをトレーニングすることで、さらに正確なデータ抽出を可能にする機能についてお知らせします。 ユーザーはフォームにラベルを付けて、対象となる値を抽出します。 この機能を使用すると、Form Recognizer で、キーのない値、値の下にあるキー、タイトル付きのフォーム、フォームの写真など、どのような種類のフォームにも対応できます。5 つのフォームから始めて、ユーザーは質の高い結果をもたらすユーザー自身のユース ケースに合わせて調整しながらモデルをトレーニングできます。新たなユーザー エクスペリエンスを駆使してすばやく作業を開始し、必要な値を選択し、ラベル付けをし、カスタム モデルをトレーニングできます。

フォームへのラベル付けの様子を示す UX ツールのサンプル

さらに、Form Recognizer では、あらゆる種類のフォームでラベルなしで単一のモデルをトレーニングできるようになり、新しい AsyncAPI を使用して大規模なデータセットでのトレーニングや大規模なドキュメントの分析が可能になりました。こうしたメリットが得られたことで、ユーザーは前もってドキュメントを分類しなくても、各種の請求書、注文書などで単一のモデルをトレーニングできるようになりました。

さらに、事前構築済みの領収書機能も強化し、正確性の向上、ヒントや領収の種類 (項目別、クレジット カードの伝票、ガソリン、駐車場など) のための新規フィールドの追加、領収書内のすべての項目を詳しく示す品目名の抽出を実現しました。最後に、テキスト認識の正確性も向上し、フォームからの質の高いテキストの抽出とテーブルの抽出を可能にしました。

Capgemeni 傘下の Sogeti 社は、Form Recognizer のこうした新機能を利用しています。Sogeti 社の AI ML マネージャー Arun Kumar Sahu 氏は次のように述べています。

"当社は、ある米国最大手の自動車オークション会社のためにドキュメントの分類および予測ソリューションに取り組んでおり、さまざまな自動車関連ドキュメント (PDF やイメージ) から情報を効率的に抽出する方法が必要でした。Form Recognizer ではトレーニングとホストが簡単かつ迅速にでき、コスト効率が高く、さまざまなドキュメント形式を処理でき、得られた出力は素晴らしいものでした。新しいラベリング機能によって、キーと値のペアの抽出を非常に効率的にカスタマイズできました。"

音声:高度な音声機能により、自然な対話と生産性の加速を実現

企業は、顧客との対話を最新化し、よりシームレスで自然な対話ができることを求めています。Microsoft の音声に関する最新機能を使用すると、その要望がかなえられます。

Microsoft Ignite 2018 で Microsoft は、ディープ ニューラル ネットワークを駆使して、自然に聞こえる音声を可能にし、AI システムと対話するユーザーが AI の音声を聞き取るときの疲労感を軽減する、ニューラル テキスト読み上げ機能を紹介しました。ニューラル テキスト読み上げ機能を使用すると、チャットボットや仮想アシスタントとの対話をより自然で魅力的なものにできます。また、電子書籍などのデジタル テキストをオーディオブックに変換したり、カーナビゲーション システムを強化したりすることもできます。これらの新機能がカスタム ニューラル音声機能でさらに進化します。この機能を使用すると、音声を数分トレーニングすることから開始して、独自のブランド音声を作成できます。カスタム ニューラル音声機能を使用すると、会社のブランド化されたキャラクターによって提供されるカスタマー サポート、対話式レッスン計画や美術館のガイド付きツアー、音声支援テクノロジといったシナリオが可能になります。この機能は、オーディオブックなどの長文式コンテンツの生成にも対応します。

Beijing Hongdandan Education and Culture Exchange Center は、音声を使用して、視覚に障碍がある人向けのアクセシビリティ製品を制作したり、オーディオブックなどの支援機能を提供して視覚に障碍のある人の生活を向上したりすることに専門的に取り組んでいます。Hongdandan はカスタム ニューラル音声機能を使用して、10 歳で視力を失った Lina の声を基にオーディオブックを制作しています。Lina は、現在 Hongdandan Service Center のトレーナーであり、彼女自身の声を使用して、視覚に障碍のある人に十分にコミュニケーションする方法を教えています。

ビジネスが急速に進展する今日において、最後に出席した重要なミーティングの詳細をすべて覚えておくことや、次に行う手順と重要な期限を追うことは至難の業です。電話の内容を迅速かつ正確に文字起こしすることで、重要な詳細を取り込んで、話し合ったトピックを簡単に検索したり確認したりできるため、さまざまな関係者が同じ内容を共有できます。カスタマー サポートのシナリオでは、お客様の話を聞いて理解し、情報を正確に記録できることは、お客様の要望を追跡し、幅広い分析を可能にするために不可欠です。

ただし、製品名、技術用語、人名など、組織固有の用語を正確に文字起こしすることも新たな障壁となっています。カスタム音声を使用すると、ユーザー独自のデータに基づいて音声認識モデルを調整できるので、ユーザー固有の用語が正確に取り込まれます。カスタム モデルをトレーニングする場合は、単に音声をアップロードするだけです。さらに、Office 365 のデータを安全かつ準拠性のある方法で使用してカスタム モデルを自動生成することで、組織固有の用語に基づいて音声認識を最適化できるようになりました。このオプトイン機能を利用すると、Office 365 を使用する組織は、社内ミーティングでもお客様からの電話でも、会社の用語をより正確に文字起こしできます。組織全体の言語モデルを作成するには、組織内の全員がアクセスできるパブリック グループの会話とドキュメントだけを使用します。

カスタム コマンド、カスタム音声および音声コンテナー、自動言語識別による音声翻訳、Bot Framework との Direct Line Speech チャネルの統合などの追加の新機能によって、高度な音声機能を簡単にアプリに組み込むことができます。詳細については、Azure Speech Services に関するページをご覧ください。

言語:お客様のフィードバックとテキスト ドキュメントからより詳細な分析情報を抽出

今日では、ソーシャル メディア、お客様によるレビュー、ディスカッション フォーラムを問わず、多くの貴重なお客様分析情報が収集されています。課題は、そのデータから分析情報を抽出し、企業がお客様サービスの向上と市場のニーズを満たすために迅速に行動できるようにすることです。Text Analytics の感情分析機能を使用すると、企業はコンテンツ内の肯定的、中立的、否定的な感情やこれらを混合した感情を簡単に検出できるため、顧客満足度を継続的に把握し、お客様を惹きつけ、顧客ロイヤルティを構築できます。感情分析機能の最新リリースでは、感情のスコアリングの正確性が大幅に向上するとともに、ドキュメント全体と個々の文章の両方の感情を検出できるようになりました。

データから情報を抽出する際のもう 1 つの課題は、非構造化自然言語のテキストに出現する人、場所、組織などのエンティティを特定できるようにすることです。Text Analytics では、名前付きエンティティ型のサポート対象を 100 を超える数にまで拡大し、意味のある情報の抽出と、未加工テキストから取得した関係や用語間の関係の分析が簡単に実施できるようになりました。さらに、ユーザーは英語のテキスト ドキュメントで 80 種類以上の個人を特定できる情報を検出および抽出できるようになります。

さらに、Language Understanding Intelligent Service (LUIS) に、開発者が会話的な洗練されたモデルを作成できるようにする新機能を複数追加しています。この新機能では、ユーザーからの複雑な要求を処理できます (たとえば、ユーザーが実際に自然言語を使用できるようにする場合、ユーザーは "たまねぎ抜きのハンバーガー 2 個をパンの代わりにレタスで巻いて" のように注文できます)。これにより、ユーザーは階層型エンティティとモデル分解のための拡張機能を使用できるようになり、人間の話し方を反映した、洗練された言語モデルを構築できます。さらに、ヒンディー語とアラビア語を加えて、地域を追加し、LUIS でサポートされている既存の言語をより一層強化しています。

エンタープライズ対応: データ セキュリティを強化するための Azure 仮想ネットワーク

AI サービスの選定において最も懸念される項目が、セキュリティとコンプライアンスです。厳格な標準への準拠や行き届いた保証に対する期待に応え、耐障害性に優れた堅牢なソフトウェア システムを提供できるかどうかが、AI 運用環境としての信頼性に大きく左右します。Azure Cognitive Services には 70 以上の認定資格があります。機密データへのセキュリティを最大限に確保するために、現在、Cognitive Services の一部として Virtual Network のサポートを提供しています。このサービスは、ユーザーの Azure サブスクリプションまたはオンプレミスで実行できるコンテナーとしても提供されています。

今すぐご利用ください

Microsoft は引き続き、生産性とユーザー エクスペリエンスを向上する高機能でインテリジェントな新しいユーザー向けシナリオを実現していきます。Azure Cognitive Services に用意されている多彩なサービスを使用して、ユーザーのあらゆるデータから分析情報を抽出できます。今回の新しいお知らせを参考に、Form Recognizer を使用してフォームからテキストを正確に抽出し、Text Analytics と LUIS を使用してそのテキストを分析、理解し、最終的には、Microsoft の音声サービスを使用して、音声による会話型のインターフェイスからユーザーにその分析情報を提供できます。

これらのマイルストーンは、アプリケーション開発を簡素化するエンタープライズ グレードのツールや、顧客データの保護に関する業界トップクラスのセキュリティとコンプライアンスによって、Azure AI プラットフォームをあらゆるビジネス シナリオに適したものにするという Microsoft のコミットメントを示すものです。

Azure の無料アカウントを使用して初めてのインテリジェント アプリケーションの作成を今すぐ始めてください。Cognitive Services の詳細をご覧ください


Azure。目的を持って創造する。