Функции поиска ИИ Azure

Поиск по искусственному интеллекту Azure предоставляет получение сведений и использует дополнительную интеграцию СИ для извлечения дополнительных текстовых и структурированных содержимого.

В следующей таблице эти возможности представлены по категориям. Дополнительные сведения о сравнении поиска ИИ Azure с другими технологиями поиска см. в разделе "Сравнение параметров поиска".

Существует четность функций во всех общедоступных, частных и национальных облаках Azure, но некоторые функции не поддерживаются в определенных регионах. Дополнительные сведения см. в разделе о доступности продуктов по регионам.

Примечание.

Ищете предварительные версии функций? См. список функций предварительной версии.

Функции индексирования

Категория Функции
Источники данных Индексы поиска могут принимать текст из любого источника, если он отправляется в виде документа JSON.

Индексаторы — функция, которая автоматизирует импорт данных из поддерживаемых источников данных для извлечения доступного для поиска содержимого в первичных хранилищах данных. Индексаторы обрабатывают сериализацию JSON для вас и чаще всего поддерживают некоторую форму обнаружения изменений и удаления. Вы можете подключиться к различным источникам данных, включая База данных SQL Azure, Azure Cosmos DB или хранилище BLOB-объектов Azure.
Иерархическая и вложенная структуры данных Сложные типы и коллекции позволяют смоделировать практически любой тип структуры JSON в пределах индекса поиска. Кратность "один ко многим" и "многие ко многим" можно выразить в собственном коде с помощью коллекций, сложных типов и коллекций сложных типов.
Лингвистический анализ Анализаторы — это компоненты, используемые для обработки текста во время выполнения операций индексирования и поиска. По умолчанию вы можете использовать анализатор общего назначения Lucene уровня "Стандартный" или переопределить его с помощью анализатора языка, пользовательского настраиваемого анализатора или другого предварительно определенного анализатора, который производит необходимые для вас токены.

Анализаторы языка от Lucene или Microsoft можно использовать для интеллектуальной обработки лингвистики конкретного языка, включая времена глагола, пол, нестандартное изменение существительных во множественном числе (например, "человек" и "люди"), отмену объединения слов, разбиение на слова (для языков без пробелов) и многое другое.

Пользовательские лексические анализаторы используются для сложных форм запросов с использованием фонетического сопоставления и регулярных выражений.

Категория Функции
Индексация вектора В индексе поиска добавьте векторные поля для поддержки сценариев поиска векторов. Поля векторов могут совместно существовать с невекторными полями в том же документе поиска.
Векторные запросы Сформулировать одиночные и несколько векторных запросов.
Алгоритмы поиска векторов Используйте иерархический навигационируемый малый мир (HNSW) или исчерпывающий K-Ближайший соседей (KNN), чтобы найти аналогичные векторы в индексе поиска.
Векторные фильтры Примените фильтры до или после выполнения запроса для повышения точности во время получения информации.
Получение гибридных сведений Выполните поиск концепций и ключевое слово в одном гибридном запросе запроса.

Гибридный поиск объединяет векторный и текстовый поиск с необязательной семантической ранжированием и настройкой релевантности для наилучших результатов.
Интегрированные блоки данных и векторизация (предварительная версия) Фрагментирование собственных данных с помощью навыка разделения текста и векторизации с помощью векторизаторов и навыка AzureOpenAIEmbeddingModel.

Встроенная векторизация (предварительная версия) предоставляет сквозной конвейер индексации из исходных файлов в запросы.
Встроенное сжатие векторов и квантизация Используйте встроенную скалярную квантизацию , чтобы уменьшить размер векторного индекса в памяти и на диске. Вы также можете использовать хранилище векторов, которые вам не нужны, или назначать узкие типы данных полям векторов для снижения требований к хранилищу.
Импорт и векторизация данных (предварительная версия) Новый мастер в портал Azure, который создает полный конвейер индексирования, включающий блоки данных и векторизацию. Мастер создает все объекты и параметры конфигурации.

Обогащение с помощью ИИ и интеллектуального анализа знаний

Категория Функции
Обработка искусственного интеллекта во время индексации Обогащение искусственного интеллекта относится к внедренному изображению и обработке естественного языка в конвейере индексатора, который извлекает текст и информацию из содержимого, которое не может быть индексировано для полнотекстового поиска. Обработка ИИ достигается путем добавления и объединения навыков в набор навыков, который затем присоединяется к индексатору. ИИ может быть встроенным навыком от Корпорации Майкрософт, например переводом текста или оптического распознавания символов (OCR), или пользовательскими навыками , предоставляемыми вами.
Хранение обогащенного содержимого для анализа и потребления в сценариях без поиска Хранилище знаний — это постоянное хранилище обогащенного содержимого, предназначенное для сценариев, не относящихся к поиску, таких как интеллектуальный анализ знаний и обработка обработки и анализа данных. Хранилище знаний определяется в наборе навыков, но создается в служба хранилища Azure как объекты или табличные наборы строк.
Кэшированные обогащения Добавочное обогащение (предварительная версия) относится к кэшируемым обогащениям, которые можно повторно использовать во время выполнения набора навыков. Кэширование особенно ценно в наборах навыков, которые включают анализ OCR и изображения, которые являются дорогостоящими для обработки.

Запросы и взаимодействие с пользователем

Категория Функции
Текстовый поиск со свободной формой записи Полнотекстовый поиск — это основной вариант использования для большинства приложений на основе поиска. Запросы можно создавать с помощью поддерживаемого синтаксиса.

Простой синтаксис запросов службы поиска Azure включает в себя логические операторы, операторы поиска фраз, постфиксные операторы и операторы приоритета.

Полный синтаксис запросов Lucene включает в себя все операции простого синтаксиса с дополнительными возможностями нечеткого поиска, поиска по сходству, повышения приоритета слов и регулярных выражений.
С сортировкой по релевантности Простая оценка — это ключевое преимущество поиска ИИ Azure. Профили повышения позволяют моделировать релевантность как функцию значений в самих документах. Например, можно на высокие позиции в результатах поиска вывести более новые товары или товары со скидкой. Профили оценки можно также формировать с помощью тегов, позволяющих персонализировать ранжирование в соответствии с предпочтениями клиентов, которые отслеживаются и хранятся отдельно.

Семантический рангер — это функция уровня "Премиум", которая повторно выполняет результаты на основе семантической релевантности запроса. В зависимости от содержимого и сценария он может значительно повысить релевантность поиска с почти минимальной конфигурацией или усилиями.
Геопространственный поиск Геопространственные функции фильтруют и соответствуют географическим координатам. Можно сопоставить расстояние или включить в фигуру многоугольника.
Фильтры и аспекты Фасетная навигация работает при использовании параметра одиночного запроса. Поиск azure AI возвращает фасетную структуру навигации, которую можно использовать в качестве кода в списке категорий для самостоятельной фильтрации (например, для фильтрации элементов каталога по ценовому диапазону или бренду).

Фильтры позволяют внедрять фасетную навигацию в интерфейс приложения, улучшать формулировку запроса и выполнять фильтрацию на основе указанных пользователем или разработчиком критериев. Создавайте фильтры с помощью синтаксиса OData.
Взаимодействие с пользователем Можно включить автозавершение для упреждающего ввода запросов в поле поиска.

Варианты также работают при частичном вводе текста в строке поиска, но результатами являются фактические документы в индексе, а не условия запроса.

Функция Синонимы связывает эквивалентные термины, которые неявно расширяют область запроса, даже если пользователь не указал их.

При выделении совпадений применяется форматирование текста к совпадающему ключевому слову в результатах поиска. Вы можете выбирать поля, которые возвращают выделенные фрагменты.

Сортировка для нескольких полей выполняется с помощью схемы индексирования. Затем во время выполнения поискового запроса применяется единый параметр поиска.

Разбиение по страницам и регулирование результатов поиска просто с помощью точно настроенного элемента управления, которое служба "Поиск ИИ Azure" предлагает в результатах поиска.

Функции безопасности

Категория Функции
Шифрование данных Функция шифрования неактивных данных под управлением Майкрософт встроена в слой внутреннего хранилища, и ее нельзя отключить.

Управляемые клиентом ключи шифрования, создаваемые и администрируемые в Azure Key Vault, можно использовать для дополнительного шифрования индексов и сопоставления синонимов. Для служб, созданных после 1 августа 2020 года, шифрование CMK распространяется на данные на временных дисках для полного двойного шифрования индексированного содержимого.
Защита конечных точек Правила IP-адресов для поддержки брандмауэра для входящих соединений позволяют настроить диапазоны IP-адресов, по которым служба поиска будет принимать запросы.

Создайте частную конечную точку с помощью Приватного канала Azure, чтобы принудительно выполнить все запросы через виртуальную сеть.
Входящий доступ Управление доступом на основе ролей Azure назначает роли пользователям и группам в идентификаторе Microsoft Entra для управляемого доступа к содержимому и операциям поиска. Вы также можете использовать проверку подлинности на основе ключей, если у вас нет клиента Azure.
Безопасность исходящего трафика (индексаторы) Доступ к данным через частные конечные точки позволяет индексатору подключаться к ресурсам Azure, защищенным с помощью Приватного канала Azure.

Доступ к данным с помощью доверенного удостоверения означает, что строки подключения к внешним источникам данных могут опускать имена пользователей и пароли. Когда индексатор будет подключаться к источнику данных, ресурс разрешит соединение, если служба поиска была ранее зарегистрирована как доверенная.

Функции портала

Категория Функции
Средства для создания прототипов и проверки Средство добавления индексов — это конструктор индексов, который вы можете использовать для создания базовой схемы, состоящей из атрибутивных полей и нескольких других параметров. Сохранив индекс, его можно заполнить данными с помощью пакета SDK или REST API.

Мастер импорта данных создает индексы, индексаторы, наборы навыков и определения источников данных. Если ваши данные хранятся в Azure, этот мастер поможет вам сэкономить время и усилия, особенно что касается экспериментов и исследований.

Обозреватель поиска используется для проверки запросов и уточнения профилей повышения.

Средство создания демонстрационного приложения позволяет создать HTML-страницу, которую можно использовать для проверки возможностей поиска.

Сеансы отладки — это визуальный редактор, который позволяет выполнять интерактивную отладку набора навыков. В нем показаны зависимости, выходные данные и преобразования.
Мониторинг и диагностика Включите функции мониторинга, чтобы получать более подробные метрики, помимо основных, которые всегда отображаются на портале. Метрики запросов в секунду, задержки и регулирование записываются и передаются на страницах портала без дополнительной настройки.

Программируемость

Категория Функции
REST REST API службы предназначены для операций с плоскостью данных, включая все операции, связанные с индексацией, поисковыми запросами и обогащением с помощью ИИ. Эту клиентскую библиотеку также можно использовать для извлечения сведений о системе и статистике.

REST API управления предназначен для создания и подготовки служб с помощью Azure Resource Manager. Этот API также можно использовать для управления ключами и емкостью.
Пакет Azure SDK для .NET Azure.Search.Documents предназначена для операций с плоскостью данных, включая все операции, связанные с индексацией, поисковыми запросами и обогащением с помощью ИИ. Эту клиентскую библиотеку также можно использовать для извлечения сведений о системе и статистике.

Microsoft.Azure.Management.Search предназначен для создания и подготовки служб с помощью Azure Resource Manager. Этот API также можно использовать для управления ключами и емкостью.
Пакет Azure SDK для Java com.azure.search.documents предназначена для операций с плоскостью данных, включая все операции, связанные с индексацией, поисковыми запросами и обогащением с помощью ИИ. Эту клиентскую библиотеку также можно использовать для извлечения сведений о системе и статистике.

com.microsoft.azure.management.search — создание и подготовка служб с помощью Azure Resource Manager. Этот API также можно использовать для управления ключами и емкостью.
Пакет SDK для Azure для Python azure-search-documents предназначена для операций с плоскостью данных, включая все операции, связанные с индексацией, поисковыми запросами и обогащением с помощью ИИ. Эту клиентскую библиотеку также можно использовать для извлечения сведений о системе и статистике.

Azure-mgmt-search — создание и подготовка служб с помощью Azure Resource Manager. Этот API также можно использовать для управления ключами и емкостью.
Пакет Azure SDK для JavaScript/TypeScript azure/search-documents предназначена для операций с плоскостью данных, включая все операции, связанные с индексацией, поисковыми запросами и обогащением с помощью ИИ. Эту клиентскую библиотеку также можно использовать для извлечения сведений о системе и статистике.

Azure/arm-search — создание и подготовка служб с помощью Azure Resource Manager. Этот API также можно использовать для управления ключами и емкостью.

См. также