Microsoft 认知服务文本分析命名实体识别服务现已推出
发布日期:六月 06, 2019
Microsoft 认知服务文本分析命名实体识别服务现已推出
我们很高兴地宣布正式推出作为 Microsoft 认知服务文本分析 API 一部分的命名实体识别服务,该服务支持英语和西班牙语。命名实体识别 (NER) 能够获取自由格式文本,并识别出现的人员、位置和组织等实体。只需通过一次 API 调用,文本分析中的 NER 便可使用可靠的机器学习模型在任何文本文档中查找并归类出超过 20 种类型的命名实体。
我们还为公共预览版发布了 19 种新的语言模型,将 NER 语言覆盖范围扩展到 21 种。 除了英语和西班牙语,公共预览版中还为另外三种语言:法语、德语和简体汉语提供了完整的类型支持。
现在支持以下类型及对应语言。
类型 |
子类型 |
示例 |
支持的语言 |
人员 |
不适用 |
“Jeff”、“Paul G. Allen” |
|
位置 |
不适用 |
“Redmond, Washington”、“Paris” |
|
组织 |
不适用 |
“Microsoft” |
|
数量 |
Number |
“6”、“six” |
英语、西班牙语、德语、法语、汉语(简体) |
数量 |
百分比 |
“50%”、“fifty percent” |
英语、西班牙语、德语、法语、汉语(简体) |
数量 |
序号 |
“2nd”、“second” |
英语、西班牙语、德语、法语、汉语(简体) |
数量 |
数字范围 |
“4 to 8” |
英语、西班牙语、德语、法语、汉语(简体) |
数量 |
年龄 |
“90 days old”、“thirty years old” |
英语、西班牙语、德语、法语、汉语(简体) |
数量 |
货币 |
“$10.99” |
英语、西班牙语、德语、法语、汉语(简体) |
数量 |
维度 |
“10 miles”、“40 cm” |
英语、西班牙语、德语、法语、汉语(简体) |
数量 |
温度 |
“32 degrees” |
英语、西班牙语、德语、法语、汉语(简体) |
日期/时间 |
不适用 |
“6:30PM February 4, 2012” |
英语、西班牙语、德语、法语、汉语(简体) |
日期/时间 |
Date |
“May 2nd, 2017”、“05/02/2017” |
英语、西班牙语、德语、法语、汉语(简体) |
日期/时间 |
时间 |
“8AM”、“8:00” |
英语、西班牙语、德语、法语、汉语(简体) |
日期/时间 |
日期范围 |
“May 2nd to May 5th” |
英语、西班牙语、德语、法语、汉语(简体) |
日期/时间 |
时间范围 |
“6pm to 7pm” |
英语、西班牙语、德语、法语、汉语(简体) |
日期/时间 |
持续时间 |
“1 minute and 45 seconds” |
英语、西班牙语、德语、法语、汉语(简体) |
日期/时间 |
设置 |
“every Tuesday” |
英语、西班牙语、德语、法语、汉语(简体) |
日期/时间 |
时区 |
“UTC-7”、“CST” |
英语、西班牙语、德语、法语、汉语(简体) |
URL |
不适用 |
“https://www.bing.com” |
英语、西班牙语、德语、法语、汉语(简体) |
电子邮件 |
不适用 |
“support@microsoft.com” |
英语、西班牙语、德语、法语、汉语(简体) |
*一些实体可能会省略子类型,具体视输入和已提取的实体而定。