認知服務文字分析的具名實體辨識現已推出
發佈日期: 六月 06, 2019
認知服務文字分析的具名實體辨識現已推出
很高興在此宣布 Azure 認知服務文字分析 API 中已正式推出支援英文和西班牙文語言的具名實體辨識。具名實體辨識 (NER) 是擷取自由格式文字,然後識別人物、地點和組織等實體出現位置的功能。透過簡易的 API 呼叫,文字分析中的 NER 可使用強大的機器學習模型在文字文件中尋找並分類二十種以上的具名實體。
我們還以公開預覽形式發行了 19 個新的語言模型,將 NER 人類語言涵蓋範圍擴充到 21 個。 除了英文和西班牙文外,我們也以公開預覽形式,為另外 3 種語言提供了全套的支援類型:法文、德文和簡體中文。
現在支援下列類型及其相對應的語言。
類型 |
子類型 |
範例 |
支援的語言 |
人物 |
N/A* |
"Jeff"、"Paul G. Allen" |
|
位置 |
N/A* |
「華盛頓州雷德蒙德」、「巴黎」 |
|
組織 |
N/A* |
Microsoft |
|
數量 |
數字 |
「6」、「六」 |
英文、西班牙文、德文、法文、簡體中文 |
數量 |
百分比 |
「50%」、「百分之五十」 |
英文、西班牙文、德文、法文、簡體中文 |
數量 |
序號 |
「第 2」、「第二」 |
英文、西班牙文、德文、法文、簡體中文 |
數量 |
數字範圍 |
「4 到 8」 |
英文、西班牙文、德文、法文、簡體中文 |
數量 |
年齡 |
「90 歲」、「三十歲」 |
英文、西班牙文、德文、法文、簡體中文 |
數量 |
貨幣 |
「美金 $10.99 元」 |
英文、西班牙文、德文、法文、簡體中文 |
數量 |
維度 |
「10 英哩」、「40 公分」 |
英文、西班牙文、德文、法文、簡體中文 |
數量 |
溫度 |
「32 度」 |
英文、西班牙文、德文、法文、簡體中文 |
日期時間 |
N/A* |
「2012 年 2 月 4 日下午 6:30」 |
英文、西班牙文、德文、法文、簡體中文 |
日期時間 |
日期 |
「2017 年 5 月 2 日」、「05/02/2017」 |
英文、西班牙文、德文、法文、簡體中文 |
日期時間 |
時間 |
「上午 8 點」、「8:00」 |
英文、西班牙文、德文、法文、簡體中文 |
日期時間 |
日期範圍 |
「5 月 2 日到 5 月 5 日」 |
英文、西班牙文、德文、法文、簡體中文 |
日期時間 |
時間範圍 |
「下午 6 點到下午 7 點」 |
英文、西班牙文、德文、法文、簡體中文 |
日期時間 |
課程時間 |
「1 分鐘又 45 秒」 |
英文、西班牙文、德文、法文、簡體中文 |
日期時間 |
設定 |
「每個星期二」 |
英文、西班牙文、德文、法文、簡體中文 |
日期時間 |
時區 |
"UTC-7”、“CST” |
英文、西班牙文、德文、法文、簡體中文 |
URL |
N/A* |
"https://www.bing.com" |
英文、西班牙文、德文、法文、簡體中文 |
電子郵件 |
N/A* |
"support@microsoft.com" |
英文、西班牙文、德文、法文、簡體中文 |
*依輸入和擷取的實體而定,某些實體可能會省略子類型。