Пропустить и перейти к основному содержимому
УЖЕ ДОСТУПНО

Распознавание именованных сущностей в API "Анализ текста" служб Cognitive Services уже доступно

Дата публикации: 06 июня, 2019

Распознавание именованных сущностей в API "Анализ текста" служб Cognitive Services уже доступно

Мы рады сообщить о выходе общедоступной версии функции распознавания именованных сущностей с поддержкой английского и испанского языков для API "Анализ текста" в Azure Cognitive Services. Распознавание именованных сущностей (NER) позволяет среди прочего идентифицировать упоминания сущностей, например людей, мест и организаций, в тексте произвольной формы. Один простой вызов API позволяет применить NER при анализе текста с задействованием эффективных моделей машинного обучения для поиска и классификации более чем двадцати типов именованных сущностей в любом текстовом документе. 

Мы также выпустили в общедоступной предварительной версии 19 новых языковых моделей, и теперь NER поддерживает 21 естественный язык.  Кроме того, помимо английского и испанского, мы включили полный набор поддерживаемых типов еще для трех языков: французского, немецкого и китайского (упрощенное письмо).  

Сейчас поддерживаются указанные ниже типы и соответствующие языки. 

ТИП 

ПОДТИП 

ПРИМЕР 

Поддерживаемые языки 

Лицо 

Н/Д* 

"Джефф", "Пол Дж. Аллен" 

Расположение 

Н/Д* 

"Редмонд, штат Вашингтон", "Париж" 

Организация 

Н/Д* 

"Майкрософт" 

Количество 

Число 

"6", "шесть" 

английский, испанский, китайский (упрощенное письмо), немецкий, французский 

Количество 

Процент 

"50 %", "пятьдесят процентов" 

английский, испанский, китайский (упрощенное письмо), немецкий, французский 

Количество 

Порядковый номер 

"2-й", "второй" 

английский, испанский, китайский (упрощенное письмо), немецкий, французский 

Количество 

Диапазон чисел 

"4–8" 

английский, испанский, китайский (упрощенное письмо), немецкий, французский 

Количество 

Возраст 

"90 дней", "тридцать лет" 

английский, испанский, китайский (упрощенное письмо), немецкий, французский 

Количество 

Валюта 

"10,99 долл. США" 

английский, испанский, китайский (упрощенное письмо), немецкий, французский 

Количество 

Измерение 

"10 км", "40 см" 

английский, испанский, китайский (упрощенное письмо), немецкий, французский 

Количество 

Температура 

"32 градуса" 

английский, испанский, китайский (упрощенное письмо), немецкий, французский 

Дата и время 

Н/Д* 

"18:30 4 февраля 2012 г." 

английский, испанский, китайский (упрощенное письмо), немецкий, французский 

Дата и время 

Дата 

"2 мая 2017 г.", "02.05.2017" 

английский, испанский, китайский (упрощенное письмо), немецкий, французский 

Дата и время 

Время 

"8 утра", "8:00" 

английский, испанский, китайский (упрощенное письмо), немецкий, французский 

Дата и время 

Диапазон дат 

"со 2 по 5 мая" 

английский, испанский, китайский (упрощенное письмо), немецкий, французский 

Дата и время 

Диапазон времени 

"18:00–19:00" 

английский, испанский, китайский (упрощенное письмо), немецкий, французский 

Дата и время 

Длительность 

"1 минута 45 секунд" 

английский, испанский, китайский (упрощенное письмо), немецкий, французский 

Дата и время 

Набор 

"каждый вторник" 

английский, испанский, китайский (упрощенное письмо), немецкий, французский 

Дата и время 

Часовой пояс 

"UTC-7", "CST" 

английский, испанский, китайский (упрощенное письмо), немецкий, французский 

URL-адрес 

Н/Д* 

"https://www.bing.com" 

английский, испанский, китайский (упрощенное письмо), немецкий, французский 

Электронная почта 

Н/Д* 

"support@microsoft.com" 

английский, испанский, китайский (упрощенное письмо), немецкий, французский 

* В зависимости от входных и извлеченных сущностей в некоторых сущностях подтип может отсутствовать. 

 

 

 

  • Анализ текста
  • Сервисы ИИ Azure
  • Services

Связанные продукты