现已推出

Microsoft 认知服务文本分析命名实体识别服务现已推出

发布日期:六月 06, 2019

Microsoft 认知服务文本分析命名实体识别服务现已推出

我们很高兴地宣布正式推出作为 Microsoft 认知服务文本分析 API 一部分的命名实体识别服务,该服务支持英语和西班牙语。命名实体识别 (NER) 能够获取自由格式文本,并识别出现的人员、位置和组织等实体。只需通过一次 API 调用,文本分析中的 NER 便可使用可靠的机器学习模型在任何文本文档中查找并归类出超过 20 种类型的命名实体。 

我们还为公共预览版发布了 19 种新的语言模型,将 NER 语言覆盖范围扩展到 21 种。  除了英语和西班牙语,公共预览版中还为另外三种语言:法语、德语和简体汉语提供了完整的类型支持。  

现在支持以下类型及对应语言。 

类型 

子类型 

示例 

支持的语言 

人员 

不适用 

“Jeff”、“Paul G. Allen” 

位置 

不适用 

“Redmond, Washington”、“Paris” 

组织 

不适用 

“Microsoft” 

数量 

Number 

“6”、“six” 

英语、西班牙语、德语、法语、汉语(简体) 

数量 

百分比 

“50%”、“fifty percent” 

英语、西班牙语、德语、法语、汉语(简体) 

数量 

序号 

“2nd”、“second” 

英语、西班牙语、德语、法语、汉语(简体) 

数量 

数字范围 

“4 to 8” 

英语、西班牙语、德语、法语、汉语(简体) 

数量 

年龄 

“90 days old”、“thirty years old” 

英语、西班牙语、德语、法语、汉语(简体) 

数量 

货币 

“$10.99” 

英语、西班牙语、德语、法语、汉语(简体) 

数量 

维度 

“10 miles”、“40 cm” 

英语、西班牙语、德语、法语、汉语(简体) 

数量 

温度 

“32 degrees” 

英语、西班牙语、德语、法语、汉语(简体) 

日期/时间 

不适用 

“6:30PM February 4, 2012” 

英语、西班牙语、德语、法语、汉语(简体) 

日期/时间 

Date 

“May 2nd, 2017”、“05/02/2017” 

英语、西班牙语、德语、法语、汉语(简体) 

日期/时间 

时间 

“8AM”、“8:00” 

英语、西班牙语、德语、法语、汉语(简体) 

日期/时间 

日期范围 

“May 2nd to May 5th” 

英语、西班牙语、德语、法语、汉语(简体) 

日期/时间 

时间范围 

“6pm to 7pm” 

英语、西班牙语、德语、法语、汉语(简体) 

日期/时间 

持续时间 

“1 minute and 45 seconds” 

英语、西班牙语、德语、法语、汉语(简体) 

日期/时间 

设置 

“every Tuesday” 

英语、西班牙语、德语、法语、汉语(简体) 

日期/时间 

时区 

“UTC-7”、“CST” 

英语、西班牙语、德语、法语、汉语(简体) 

URL 

不适用 

“https://www.bing.com” 

英语、西班牙语、德语、法语、汉语(简体) 

电子邮件 

不适用 

“support@microsoft.com” 

英语、西班牙语、德语、法语、汉语(简体) 

*一些实体可能会省略子类型,具体视输入和已提取的实体而定。 

 

 

 

  • 文本分析
  • Azure 认知服务
  • Services