Пропустить навигацию

Искусственный интеллект Azure: создание критически важных приложений ИИ с помощью новых возможностей Cognitive Services

Опубликовано 8 июля, 2020

Corporate Vice President, AI Platform

По мере того как мир переходит на новые способы работы и поддержания связи, мы продолжаем предоставлять решения ИИ Azure, которые помогут организациям создавать инновации для выполнения конкретных задач.

Мы стремимся помочь разработчикам достигать более высоких результатов с помощью ИИ и сегодня с радостью сообщаем о новых возможностях Azure Cognitive Services, в числе которых:

  • предварительная версия Анализа текста для отрасли здравоохранения;
  • общедоступная версия Распознавателя документов;
  • общедоступная версия Пользовательских голосовых команд;
  • новые голоса для Нейронного преобразования текста в речь.

Компании в отраслях здравоохранения, страхования, устойчивого земледелия и других сферах продолжают выбирать ИИ Azure для создания и развертывания приложений искусственного интеллекта с целью преобразования своих предприятий. Согласно IDC1 к 2022 г. 75 % предприятий будут развертывать решения на основе ИИ для повышения эффективности работы и предоставления расширенных возможностей клиентам.

Чтобы удовлетворить растущий спрос, в современные обновления продуктов Azure Cognitive Services добавляются новые возможности в области языков, компьютерного зрения и речи. Это поможет разработчикам создавать критически важные приложения ИИ, которые предоставляют более подробные аналитические сведения, позволяют экономить время и средства, а также повышают уровень вовлеченности клиентов.

Получение подробных аналитических сведений с помощью мощных средств обработки естественного языка

Один из способов адаптации организаций — масштабирование возможности быстрой обработки данных и создания новых аналитических сведений на их основе. Из-за пандемии COVID-19 усилилась необходимость в ускорении обработки данных, особенно для отрасли здравоохранения. Учитывая огромные объемы медицинских данных, поступающих ежегодно2, поставщикам очень важно как можно быстрее предоставлять к ним доступ, чтобы специалисты могли найти новые решения, которые улучшат результаты лечения пациентов.

Получение аналитических сведений на основе медицинских данных с помощью Анализа текста для отрасли здравоохранения.

Рады представить Анализ текста для отрасли здравоохранения. Это новая функция Анализа текста, которая позволяет поставщикам услуг, исследователям и компаниям в отрасли здравоохранения извлекать подробные сведения и связи из неструктурированных медицинских данных. Функция обучена на основе разнообразных медицинских данных: клинических комментариев различных форматов, протоколов пробных клинических испытаний и многих других материалов. Решение может обрабатывать широкий спектр типов данных и задач, не требуя длительной разработки пользовательских моделей вручную для извлечения аналитических сведений на основе данных.

В рамках борьбы с пандемией COVID-19 Майкрософт в партнерстве с Allen Institute of AI и ведущими исследовательскими группами подготовили открытый набор данных исследований в области COVID-19. Основываясь на ресурсах, включающих более 47 000 научных статей, мы разработали поисковую систему по данным COVID-19, используя Анализ текста для отрасли здравоохранения и Когнитивный поиск. Система позволяет исследователям создавать новые аналитические сведения, которые помогут противостоять заболеванию.

Кроме того, мы продолжаем вносить улучшения в обработку естественного языка (NLP), чтобы разработчики могли быстрее создавать приложения, генерирующие аналитические сведения о тональности в тексте. Функция интеллектуального анализа мнений в Анализе текста назначает тональность конкретным функциям или статьям, чтобы пользователи могли лучше понимать отзывы клиентов из социальных сетей, с сайтов проверки и из других источников.

Экономия времени и средств благодаря преобразованию форм в пригодные для использования данные

Множество неструктурированных данных содержится в формах, включающих таблицы, объекты и другие элементы. Чтобы извлечь аналитические сведения из таких документов, обычно нужно маркировать их вручную по типу или писать большой объем кода.

Мы выпускаем общедоступную версию Распознавателя документов, чтобы помочь разработчикам эффективно извлекать информацию из миллионов документов. При этом не требуется опыт в области обработки и анализа данных.

Извлекайте текст и структуру из документов с помощью Распознавателя документов.

Такие клиенты, как компания Sogeti, входящая в Capgemini Group, используют Распознаватель документов, чтобы ускорить для клиентов обработку больших объемов цифровых документов.

"Sogeti постоянно ищет новые способы помочь клиентам в цифровой трансформации, предоставляя новейшие решения в области ИИ и машинного обучения. С помощью нашего предложения когнитивной обработки документов (CDP) клиенты могут обрабатывать и классифицировать неструктурированные документы, а также извлекать данные с высокой точностью. Это позволяет сократить эксплуатационные затраты и время обработки. CDP использует мощные когнитивные возможности и функции добавления тегов Распознавателя документов, помогающие без труда извлекать связанные данные без ключевых фраз, а также другие актуальные сведения из отсканированных или цифровых неструктурированных документов, что делает процесс еще быстрее". — Марк Оост (Mark Oost), технический директор в Sogeti, подразделение искусственного интеллекта и машинного обучения

В Wilson Allen, ведущей компании, поставляющей консалтинговые и аналитические решения, используют Распознаватель документов, чтобы помочь юридическим и другим фирмам, занимающимся предоставлением профессиональных услуг, обрабатывать и оценивать документы (PDF-файлы и изображения, включая финансовые формы, заявки на кредит и др.), а также обучать пользовательские модели для точного извлечения значений из сложных форм.

"Добавив Распознаватель документов в свой набор средств, мы можем превратить большие объемы неструктурированных данных в ценные сведения. При этом мы экономим более 400 часов, которые требовались для ввода данных вручную, и освобождаем время для работы сотрудников над более стратегически важными задачами". — Норм Маллок (Norm Mullock), вице-президент по стратегии в Wilson Allen

Улучшение вовлеченности клиентов благодаря приложениям с поддержкой голосового взаимодействия

Люди и организации продолжают искать способы расширения возможностей клиентов, при этом обеспечив переход на цифровые бесконтактные операции2. Достижения в области технологий голосового взаимодействия позволяют разработчикам создавать более простые и естественные интерфейсы с поддержкой голосового взаимодействия между клиентами и компаниями.

Одно из таких достижений — Пользовательские голосовые команды. Эта возможность службы "Речь" в Cognitive Services теперь общедоступна. Решение "Пользовательские голосовые команды" упрощает для разработчиков создание ориентированных на задачи приложений голосового взаимодействия для сценариев использования команд и элементов управления с четко определенным набором переменных, например для терморегуляторов с голосовым управлением в умных домах. Этот набор средств объединяет Преобразование речи в текст для распознавания речи, Language Understanding для записи произнесенных фрагментов и Преобразование текста в речь для формирования голосового ответа. С помощью решения вы можете ускорить добавление голосовых возможностей в свои приложения, используя интерфейс разработки с минимальным написанием кода.

Кроме того, Нейронное преобразование текста в речь пополняет поддержку языков 15 новыми естественно звучащими голосами на базе современных нейронных моделей синтеза речи: Salma для арабского (Египет), Zariyah для арабского (Саудовская Аравия), Alba для каталанского (Испания), Christel для датского (Дания), Neerja для английского (Индия) и Noora для финского (Финляндия), Colette для нидерландского (Netherland), Zofia для польского (Польша), Fernanda для португальского (Португалия), Dariya для русского (Россия), Hillevi для шведского (Швеция), Achara для тайского (Таиланд), HiuGaai для китайского (кантонский, традиционное письмо) и HsiaoYu для китайского (тайваньский мандаринский диалект) языков, а также Swara для хинди (Индия).

Клиенты уже добавляют возможности обработки речи в свои приложения, чтобы повысить уровень вовлеченности клиентов. С помощью Cognitive Services и Службы Bot в BBC был создан голосовой помощник Beeb с поддержкой ИИ, который обеспечивает более интересные и персонализированные возможности для различных аудиторий.

Мы рады представить эти инновационные продукты, которые позволят всем разработчикам создавать критически важные приложения ИИ. Чтобы узнать больше, ознакомьтесь с указанными ниже ресурсами.

Начните уже сегодня!

Получите дополнительные сведения из приведенных ниже ресурсов и приступайте к работе с использованием Azure Cognitive Services и бесплатной учетной записи Azure.


1 Мировые прогнозы в отношении искусственного интеллекта (IDC FutureScape 2020).

2 Адаптация взаимодействия с клиентами во время пандемии коронавируса (McKinsey 2020).