Form Recognizer の新機能が提供開始

2020年3月17日 に投稿済み

Principal Program Manager, Azure AI

ドキュメントからのテキストおよび構造情報の抽出は、ロボティック プロセス オートメーションやワークフロー自動化を可能にするコア テクノロジです。2019 年 5 月のプレビュー リリース以来、Azure Form Recognizer は数千名のお客様の関心を引き付け、ドキュメントからのテキスト、キー バリュー ペア、表の抽出によって、それらのお客様の業務プロセスを加速してきました。

このたび、マイクロソフトは Form Recognizer の新機能の提供開始についてお知らせします。

Azure Form Recognizer の更新内容

Form Recognizer の 3 月版リリースは大規模な更新であり、お客様からご要望のあった、以下をはじめとする新機能を多数含んでいます。

  • カスタマイズ: このサービスでは、ラベルを使用したトレーニングと、ラベルを使用しないトレーニングがサポートされるようになりました。これによってお客様にはさらに容易に、フォームから有益な情報を確実に抽出していただけるようになりました。API も長時間の実行を前提に再設計し、お客様の大規模なデータ セットへの対応を強化しました。キー バリュー ペアの自動検出と表の抽出も強化および改良されました。新しいラベリング ツールのサンプルの UX コンテナーは、データのラベル付けを効率化し、関心のある値を抽出していただくために役立ちます。

Form Recognizer のカスタマイズ: ラベルを使ったトレーニング、Form Recognizer のラベリング ツールのサンプル

Form Recognizer のカスタマイズ: ラベルを使ったトレーニング、Form Recognizer のラベリング ツールのサンプル。

さらに、Form Recognizer のラベリング ツールのサンプルが、オープン ソース プロジェクトとしてこちら (英語) より利用可能となりました。お客様には、このツールを自社ソリューションに統合し、ご自身のニーズに合わせて顧客ごとの変更を行うことができます。

  • レイアウト: マイクロソフトはドキュメントからテキストや表を抽出できる、新しいレイアウト API をリリースしました。この API では小さなテキストに対しても、高精度の光学式文字認識 (OCR) 結果を得られます。また任意のドキュメントから表を抽出できるため、ドキュメント抽出の非常に人気の高い適用シナリオを実現することが可能です。

レイアウトされたテキストと表の抽出によって 5 列 と 30 行の表が抽出されている様子

レイアウトされたテキストと表の抽出: 抽出された 5 列 と 30 行の表。

  • 既成のレシート: 今回の新バージョンは、大幅に向上した精度を特徴としています。販売者名、電話番号、取引日時、小計といった特定のフィールドのエラー率は 30% 以上低下しました。またチップ、レシートの種類、品目の認識にも対応可能となったほか、信頼度も提供されるようになりました。

既成のレシート。アイテム化された販売レシートから主なフィールドが抽出されている様子

既成のレシート: アイテム化された販売レシートから抽出された主なフィールド

Form Recognizer の新機能について、詳しくはこちらをご覧ください。

お客様事例

Acumatica と Zelros は Azure Form Recognizer をご利用中のお客様であり、自社の経験をマイクロソフトと共有してくださっています。

「Form Recognizer で経費報告を自動化すると、当社のほぼすべてのヒューマン エラーを排除できます。これは会計チームが承認と払い戻しを合理化するうえで非常に役立ちます。」Ajoy Krishnamoorthy 氏、プラットフォーム & テクノロジ担当ヴァイス プレジデント、Acumatica

Acumatica のお客様事例について、詳しくはこちら (英語) をご覧ください。

「Zelros Documents2Insights は Form Recognizer を活用して、保険会社や保険を販売する銀行の契約査定プロセスを迅速化します。ID カード、居住証明、車両登録証、運転免許などを扱う、この業務プロセスの迅速化と簡素化は、保険契約者様のエクスペリエンス向上の鍵となります。Zelros Documents2Insights は契約査定プロセスを自動化します。Cognitive Services の Computer Vision API をベースとし、Form Recognizer の機能を用いて構築されたこのソリューションは、文書を自動的に読み込んで分析します。また補正とエラー率低減のために情報を相互参照し、規制要件も順守します。以上によって、当社は文書と保険引受の処理を迅速化していきます。」  Fabien Vauchelles 氏、CTO、Zelros

さあ始めましょう

利用を始めるには、Azure Portal にログインして、Form Recognizer のリソースを作成してください。リソースの作成が済んだら、以下のクイックスタート テンプレートのいずれかに従うことで、データの抽出を実行していただけます。

カスタム: 自身のフォームに向けたカスタム モデルをトレーニングして、テキスト、キー バリュー ペア、表を抽出します。

既成のレシート: 米国の販売レシートからデータを抽出します。

レイアウト: テキストと表の構造 (行番号や列番号) を抽出します。