印刷されたフォーム以外にも対応: Form Recognizer を使用してドキュメントから分析情報を引き出す

2019年9月3日 に投稿済み

Principal Program Manager, Azure AI

印刷されたフォームからのデータ抽出は、今では実証済みのテクノロジとなっています。Form Recognizer では、W2 納税証明書、石油・ガス掘削井戸報告書、完了報告書、請求書、発注書などのドキュメントからキーと値のペア、テーブル、テキストを抽出します。ただし、実際のビジネスでは、多くの場合、日常的なニーズに対応するさまざまなドキュメントを利用しており、これらは必ずしもきれいに印刷されているわけではありません。

Microsoft は、手書きおよび混合モード (印刷と手書き) のサポートの追加を発表しました。今後は、手書きフォームと混合モードのフォームの処理が新しい標準となります。

Form Recognizer を使用した手書きおよび混合モードのコンテンツからのデータの抽出

抽出技術の制約によってこれまでアクセスできなかったデータ セット全体を使用できるようになりました。Form Recognizer の手書きおよび混合モード機能はプレビューで利用できます。この機能により、次のようなフォームに記入された手書きのテキストから構造化データを抽出できます。

  • 医療フォーム:  初診患者情報、医師の診断書。
  • 財務フォーム:  口座開設フォーム、クレジット カード申込書。
  • 保険:  請求フォーム、責任フォーム。
  • 製造フォーム:  梱包票、テスト フォーム、品質フォーム。
  • その他

光学式文字認識 (OCR) と機械学習における Microsoft の幅広い経験をフォーム分析に生かして、Microsoft のエキスパートは印刷されたフォームの範囲を超えた最先端のソリューションを作成しました。サービスの背後にある OCR テクノロジでは、手書きと印刷の両方がサポートされています。Form Recognizer のスコープの拡大により、新しいデータ ソースを利用できるようになるため、未知の領域を活用できます。新たに利用可能なデータから有益なビジネス情報を抽出することで、常に競合他社の先を行くことができます。

Form Recognizer を初めて使用する場合も、組織に既に組み込まれている場合も、新しいビジネス アプリケーションを作成できるようになります。

  • 使用可能なデータセットを拡張する: 機械で印刷されたフォームからのみデータを抽出する場合は、データ セット全体を混合モード フォームと過去の手書きフォームに拡張します。
  • ドキュメントの組み合わせに対応する 1 つのアプリケーションを作成する: 手書きフォームと印刷されたフォームを組み合わせて使用​​する場合は、すべてのデータに適用される 1 つのアプリケーションを作成できます。
  • 手書きフォームの手動でのデジタル化を回避する: 元のフォームを前処理なしで Form Recognizer に送信し、機械で印刷されたフォームから取得するものと同じキーと値のペアやテーブル データを抽出することで、コスト、エラー、時間を削減できます。

顧客: Avanade

Avanade では、人材を最も重要な資産と評価しています。同社は、組織を成長させるために有能で意欲的なプロフェッショナルを常に探しています。このような人材を見つける 1 つの方法は、大学の就職フェア、展示会、技術カンファレンスなどの外部イベントに参加することです。 

これらのイベントでは、多くの場合、Avanade の詳細に関心がある人々の詳細情報を入手し、後日彼らに連絡する許可を得ます。通常、これは一連のタブレットを使用したデジタル形式で行われています。ただし、ブースが特に混雑しているときには、参加者が手書きで詳細を記入できる紙の簡単なフォームを使用しています。残念ながら、これらのフォームはマーケティング データベースに手動で入力する必要があるため、かなりの時間とリソースが必要でした。これらのイベントでの潜在的な新規連絡先の量に、Avanade が参加するイベントの数を乗算すると、このタスクは困難になる可能性があります。

Azure Form Recognizer の新しい手書きサポートにより、このプロセスが簡素化されます。連絡先が失われず、情報をすぐに利用できるので、Avanade は安心感が得られます。

さらに、Avanade はコグニティブ検索ソリューション内の 1 つのスキルとして Form Recognizer を統合しました。これにより、競合他社が手書きフォームのデジタル化に時間を費やしているときに、既存のプラットフォームでこのサービスを速やかに使用し、新しいリードをフォローアップできます。

手書きフォームと Form Recognizer によって抽出されたデータの画像。

「Azure Form Recognizer により、プロセスから多大な労力が排除され、タスクがデータ入力からデータ検証に変わります。Form Recognizer を Azure Search と統合することで、既存のプラットフォームでこのサービスをすぐに使用することもできます。フォームに有効な署名があるかどうかを確認する場合など、何らかの理由でフォームを見つけて確認する必要がある場合は、名前や役職などのフィールドで検索するだけで、そのフォームを参照できます。初期テストでは、Form Recognizer を使用することで、フォームのデジタル化とエントリの再確認に要する時間が 35% 削減されました。このサービスと連携し、自動化を進めるためにツールの最適化に取り組んでいるので、私たちが期待しているのは、この数値がさらに改善されることだけです」- Avanade、エマージング テクノロジ部門エンジニア、Fergus Kidd 氏

使用を開始するには

Form Recognizer およびその他の Azure AI エコシステムの詳細については、Microsoft の Web サイトドキュメントをご覧ください。

使用を開始するには、こちらからご連絡ください

その他のご質問については、formrecog_contact@microsoft.com 宛てにメールでお問い合わせください