Распознавание именованных сущностей в API "Анализ текста" служб Cognitive Services уже доступно
Дата публикации: 06 июня, 2019
Распознавание именованных сущностей в API "Анализ текста" служб Cognitive Services уже доступно
Мы рады сообщить о выходе общедоступной версии функции распознавания именованных сущностей с поддержкой английского и испанского языков для API "Анализ текста" в Azure Cognitive Services. Распознавание именованных сущностей (NER) позволяет среди прочего идентифицировать упоминания сущностей, например людей, мест и организаций, в тексте произвольной формы. Один простой вызов API позволяет применить NER при анализе текста с задействованием эффективных моделей машинного обучения для поиска и классификации более чем двадцати типов именованных сущностей в любом текстовом документе.
Мы также выпустили в общедоступной предварительной версии 19 новых языковых моделей, и теперь NER поддерживает 21 естественный язык. Кроме того, помимо английского и испанского, мы включили полный набор поддерживаемых типов еще для трех языков: французского, немецкого и китайского (упрощенное письмо).
Сейчас поддерживаются указанные ниже типы и соответствующие языки.
ТИП |
ПОДТИП |
ПРИМЕР |
Поддерживаемые языки |
Лицо |
Н/Д* |
"Джефф", "Пол Дж. Аллен" |
|
Расположение |
Н/Д* |
"Редмонд, штат Вашингтон", "Париж" |
|
Организация |
Н/Д* |
"Майкрософт" |
|
Количество |
Число |
"6", "шесть" |
английский, испанский, китайский (упрощенное письмо), немецкий, французский |
Количество |
Процент |
"50 %", "пятьдесят процентов" |
английский, испанский, китайский (упрощенное письмо), немецкий, французский |
Количество |
Порядковый номер |
"2-й", "второй" |
английский, испанский, китайский (упрощенное письмо), немецкий, французский |
Количество |
Диапазон чисел |
"4–8" |
английский, испанский, китайский (упрощенное письмо), немецкий, французский |
Количество |
Возраст |
"90 дней", "тридцать лет" |
английский, испанский, китайский (упрощенное письмо), немецкий, французский |
Количество |
Валюта |
"10,99 долл. США" |
английский, испанский, китайский (упрощенное письмо), немецкий, французский |
Количество |
Измерение |
"10 км", "40 см" |
английский, испанский, китайский (упрощенное письмо), немецкий, французский |
Количество |
Температура |
"32 градуса" |
английский, испанский, китайский (упрощенное письмо), немецкий, французский |
Дата и время |
Н/Д* |
"18:30 4 февраля 2012 г." |
английский, испанский, китайский (упрощенное письмо), немецкий, французский |
Дата и время |
Дата |
"2 мая 2017 г.", "02.05.2017" |
английский, испанский, китайский (упрощенное письмо), немецкий, французский |
Дата и время |
Время |
"8 утра", "8:00" |
английский, испанский, китайский (упрощенное письмо), немецкий, французский |
Дата и время |
Диапазон дат |
"со 2 по 5 мая" |
английский, испанский, китайский (упрощенное письмо), немецкий, французский |
Дата и время |
Диапазон времени |
"18:00–19:00" |
английский, испанский, китайский (упрощенное письмо), немецкий, французский |
Дата и время |
Длительность |
"1 минута 45 секунд" |
английский, испанский, китайский (упрощенное письмо), немецкий, французский |
Дата и время |
Набор |
"каждый вторник" |
английский, испанский, китайский (упрощенное письмо), немецкий, французский |
Дата и время |
Часовой пояс |
"UTC-7", "CST" |
английский, испанский, китайский (упрощенное письмо), немецкий, французский |
URL-адрес |
Н/Д* |
"https://www.bing.com" |
английский, испанский, китайский (упрощенное письмо), немецкий, французский |
Электронная почта |
Н/Д* |
"support@microsoft.com" |
английский, испанский, китайский (упрощенное письмо), немецкий, французский |
* В зависимости от входных и извлеченных сущностей в некоторых сущностях подтип может отсутствовать.