Распознаватель документов Azure
Ускоренное извлечение информации из документов
Быстро извлекайте текст и структуру из документов
Распознаватель документов — это ИИ-служба, применяющая расширенное машинное обучение для автоматического и точного извлечения текста, пар "ключ-значение", таблиц и структур из документов. Превращайте документы в полезные данные, которые позволят действовать, а не копить информацию. Начните с предварительно созданных моделей или создавайте свои собственные специально для ваших документов как локально, так и в облаке с помощью Form Recognizer studio или пакета SDK.
Простое извлечение текста
Легко извлекайте и упорядочивайте данные с помощью предварительно созданных и настраиваемых функций, не применяя метки вручную.
Настраиваемые результаты
Получайте выходные данные, адаптированные к вашим макетам, с помощью автоматической настраиваемой функции извлечения и совершенствуйте их на основе отзывов пользователей.
Гибкое развертывание
Принимайте данные в любых средах — от облака до пограничных устройств — и применяйте их к индексам поиска, автоматическим рабочим бизнес-процессам и т. д.
Встроенная безопасность
Положитесь на средства обеспечения безопасности и конфиденциальности корпоративного уровня, применяемые как к данным, так и к обученным моделям.
Использование ИИ для создания рабочих процессов обработки документов
Узнайте, как ускорить бизнес-процессы путем автоматизации извлечения текста с помощью Распознавателя документов. Этот вебинар содержит практические демонстрации для ключевых вариантов использования, таких как обработка документов, интеллектуальный анализ знаний и настройка модели ИИ для конкретной отрасли.
Легко извлекайте текст и структуру с помощью простого REST API
Извлекайте текст, пары "ключ-значение" и таблицы из документов, форм, накладных, счетов на оплату и различных карточек с высокой точностью, не помечая тип документа вручную. Вам также не потребуется трудоемкое программирование и обслуживание. Применяйте пользовательские формы Распознавателя документов, предварительно созданные модели и API-интерфейсы макетов для упорядоченного извлечения информации из документов.
См. следующие примеры
Пользовательские примеры были извлечены с помощью настраиваемой модели, обученной с использованием пяти PDF-файлов каждого типа формы.
Макет
Обнаруживает и извлекает текст и макеты документов (например, таблицы, флажки, объекты и т. д.).
ПодробнееГотовые
Это предварительно обученные модели для распространенных сценариев (например, удостоверения личности, квитанции, счета), которые извлекают из документов текст, пары "ключ-значение" и строки.
ПодробнееПользовательские
Эта пользовательская служба обработки форм позволяет обучить модель на основе собственных данных, чтобы она могла интеллектуально изучать структуру ваших документов.
Подробнее
Настройка извлечения текстовых данных в формы
При работе с документами необычного формата, например с материалами для конкретной отрасли, часто требуется создать собственное решение. Настраиваемые возможности извлечения в Распознавателе документов помогут вам решить эту задачу путем обучения на ваших собственных данных на основе всего пяти документов. Первый выходной результат не только является надежным и подходящим под ваши потребности, но также позволяет использовать человеческий ввод для создания высокоточной модели, настроенной для ваших форм.
Применяйте Распознаватель документов где угодно — в облаке или на периферии
Распознавайте формы на пограничных устройствах, в локальной среде и облаке благодаря поддержке контейнеров в Службах прикладного ИИ Azure. Переносимую архитектуру можно развертывать непосредственно в Службе Azure Kubernetes (AKS), в Экземплярах контейнеров Azure или в кластере Kubernetes, развернутом в Azure Stack. Затем с помощью интерфейса REST API Распознавателя документов можно интегрировать ее в поисковые индексы Служб прикладного ИИ Azure, автоматизировать бизнес-процессы и создавать пользовательские рабочие процессы для вашей организации.

Анализ форм и документов
Принимайте решения на основе данных, извлекая данные из документов и помещая их в свою службу визуализации для анализа.
Создание интеллектуальных индексов поиска
Без труда находите в своих документах и формах определенную информацию (например, общую сумму, подлежащую выплате), интегрировав Распознаватель документов с поисковыми сервисами прикладного ИИ Azure.
Автоматизация коммерческих рабочих процессов
Извлекайте текст, пары "ключ-значение" и структуры из документов. Отправляйте их в серверные системы для выполнения таких задач, как обработка заявок, счетов и квитанций.
Развитие инноваций в приложениях с помощью облачных служб ИИ
Узнайте пять ключевых способов, с помощью которых ваша организация сможет приступить к работе с ИИ, чтобы быстро реализовать его потенциал.
Конфиденциальность и безопасность

- Распознаватель документов обеспечивает конфиденциальность данных. Результаты пользовательского обучения на основе ваших документов не используются корпорацией Майкрософт для улучшения модели Распознавателя документов.
- Ваши данные находятся под вашим контролем. Благодаря контейнерам вы выбираете, где Распознаватель документов обрабатывает ваши данные. Таким образом в гибридной среде обеспечивается согласованность данных, управления, идентификации и безопасности.
- Распознаватель документов входит в Службы прикладного ИИ Azure и основан на инфраструктуре Azure, предоставляющей функции защиты, доступности, соответствия требованиям и управления корпоративного уровня.
Экономичная обработка документов
Доступны две ценовые категории: ''Бесплатный'' и ''Стандартный''. Обе они позволяют извлекать ценную информацию из документов с гораздо меньшими расходами, чем при обработке вручную.
Три шага для начала работы
Используйте Распознаватель документов со своей учетной записью Azure.
Распознаватель документов обнаруживает ключи, значения и таблицы.
Используйте простые REST API для извлечения из документов.
Документация и ресурсы
Изучите примеры кода
Ознакомиться с примерами кода
Клиенты и партнеры, использующие Распознаватель документов
Автоматизация процессов для счетов и контрактов
EY помогает клиентам извлекать данные из контрактов и счетов с помощью Распознавателя документов, экономя сотни тысяч часов ручной работы.

Упрощение приема пациентов
HCA Healthcare использует Распознаватель документов для упрощения и улучшения процесса приема пациентов, а также для уменьшения времени администрирования, затрачиваемого на ввод повторяющихся данных в систему центра по уходу за пациентами.

Ускорение времени анализа
Chevron использует Распознаватель документов с платформой роботизированной автоматизации процессов UiPath для автоматизации извлечения неструктурированных данных, позволяя сотрудникам сосредоточиться на полезном анализе.

Предоставление 5-звездочной программы лояльности
Emaar использует Распознаватель документов для сканирования квитанций и вознаграждения участников программы лояльности, предлагая дифференцированное взаимодействие с клиентами и сокращая ежемесячные затраты на обработку более чем на 50 процентов.

Экономия времени на каждой транзакции
Standard Bank из ЮАР использует Распознаватель документов для автоматизации обработки сложных трансграничных транзакций, что улучшает обслуживание клиентов и значительно сокращает время обработки и операционные расходы.

Вопросы и ответы о службе "Распознавание документов"
-
Проверьте доступность Распознавателя документов Azure.
-
Решение поддерживает распознавание печатных и рукописных форм, PDF-файлов и изображений.
-
Распознаватель документов Azure поддерживает множество языков, в частности английский, французский, немецкий, итальянский, испанский, португальский, нидерландский, китайский, японский и корейский. Полный список см. здесь.
-
Настраиваемая функция использует пять примеров, чтобы изучить структуру документов и интеллектуально извлекать текст и другие данные в зависимости от типа документов. В предварительно созданных функциях примеры не используются. Модель уже обучена и готова к использованию для извлечения основных полей из документов определенного типа.
-
Функция макета позволяет извлекать текст с помощью метода оптического распознавания символов (OCR), предназначенного для документов. Она также извлекает структуры таблиц (число строк и столбцов), отметки выбора и другие данные.