Cognitive Services Text Analytics の名前付きエンティティの認識が利用可能になりました
公開日: 6月 06, 2019
Cognitive Services Text Analytics の名前付きエンティティの認識が利用可能になりました
Azure Cognitive Services Text Analytics API の一部として、英語とスペイン語をサポートする名前付きエンティティの認識が一般提供されたことを発表いたします。名前付きエンティティの認識 (NER) は、自由形式のテキストを取得し、人、場所、組織などのエンティティの出現箇所を特定する機能です。単純な API 呼び出しにより、Text Analytics の NER は信頼性の高い機械学習モデルを使用し、任意のテキスト ドキュメント内で 20 タイプを超える名前付きエンティティを探し、分類します。
19 の新しい言語モデルもパブリック プレビュー版でリリースされたため、NER の自然言語の範囲は 21 に増加します。 英語とスペイン語に加え、パブリック プレビューの 3 言語 (フランス語、ドイツ語、簡体中国語) でも、全タイプのセットのサポートが有効になりました。
次に挙げるタイプと、それに対応する言語がサポートされるようになりました。
タイプ |
サブタイプ |
例 |
サポートされている言語 |
人 |
該当なし* |
"Jeff"、"Paul G. Allen" |
|
場所 |
該当なし* |
"Redmond, Washington"、"Paris" |
|
組織 |
該当なし* |
"Microsoft" |
|
数量 |
Number |
"6"、"six" |
英語、スペイン語、ドイツ語、フランス語、簡体中国語 |
数量 |
割合 |
"50%"、"fifty percent" |
英語、スペイン語、ドイツ語、フランス語、簡体中国語 |
数量 |
序数 |
"2nd"、"second" |
英語、スペイン語、ドイツ語、フランス語、簡体中国語 |
数量 |
数値範囲 |
"4 to 8" |
英語、スペイン語、ドイツ語、フランス語、簡体中国語 |
数量 |
年齢 |
"90 days old"、"thirty years old" |
英語、スペイン語、ドイツ語、フランス語、簡体中国語 |
数量 |
通貨 |
"$10.99" |
英語、スペイン語、ドイツ語、フランス語、簡体中国語 |
数量 |
寸法 |
"10 miles"、"40 cm" |
英語、スペイン語、ドイツ語、フランス語、簡体中国語 |
数量 |
気温 |
"32 degrees" |
英語、スペイン語、ドイツ語、フランス語、簡体中国語 |
日時 |
該当なし* |
"6:30PM February 4, 2012" |
英語、スペイン語、ドイツ語、フランス語、簡体中国語 |
日時 |
Date |
"May 2nd, 2017"、"05/02/2017" |
英語、スペイン語、ドイツ語、フランス語、簡体中国語 |
日時 |
時間 |
"8AM"、"8:00" |
英語、スペイン語、ドイツ語、フランス語、簡体中国語 |
日時 |
日付範囲 |
"May 2nd to May 5th" |
英語、スペイン語、ドイツ語、フランス語、簡体中国語 |
日時 |
時間範囲 |
"6pm to 7pm" |
英語、スペイン語、ドイツ語、フランス語、簡体中国語 |
日時 |
時間 |
"1 minute and 45 seconds" |
英語、スペイン語、ドイツ語、フランス語、簡体中国語 |
日時 |
セット |
"every Tuesday" |
英語、スペイン語、ドイツ語、フランス語、簡体中国語 |
日時 |
タイムゾーン |
“UTC-7”、“CST” |
英語、スペイン語、ドイツ語、フランス語、簡体中国語 |
URL |
該当なし* |
"https://www.bing.com" |
英語、スペイン語、ドイツ語、フランス語、簡体中国語 |
メール |
該当なし* |
"support@microsoft.com" |
英語、スペイン語、ドイツ語、フランス語、簡体中国語 |
*入力および抽出されたエンティティによっては、一部エンティティでサブタイプが省略されることがあります。