Создание конечных точек для развернутых веб-служб Студии машинного обучения (классическая)

ОБЛАСТЬ ПРИМЕНЕНИЯ:Применимо к продукту.Студия машинного обучения (классическая) Неприменимо к продукту.Машинное обучение Azure

Важно!

Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.

Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.

Прекращается поддержка документации по Студии машинного обучения (классическая версия). В будущем она может не обновляться.

После развертывания веб-службы для нее создается конечная точка по умолчанию. Эту конечную точку можно вызвать, используя ключ API. На портале веб-служб вы можете добавить больше конечных точек с их собственными ключами. Каждая конечная точка в веб-службе адресуется, регулируется и управляется независимо. Каждая конечная точка представляет собой уникальный URL-адрес с ключом авторизации, который вы можете передавать своим клиентам.

Добавление конечных точек в веб-службу

Вы можете добавить конечную точку в веб-службу с помощью портала веб-служб Машинного обучения. После создания конечную точку можно использовать в синхронных API, API пакетов и на листах Excel.

Примечание

Если в веб-службу добавлены дополнительные конечные точки, вы не можете удалить конечную точку.

  1. В Студии машинного обучения в левой области навигации щелкните "Web Services" (Веб-службы).
  2. В нижней части панели мониторинга веб-служб щелкните Manage endpoints (Управление конечными точками). Портал веб-служб Машинного обучения откроется на странице конечных точек для веб-службы.
  3. Нажмите кнопку Создать.
  4. Введите имя и описание новой конечной точки. Имена конечных точек должны и состоять из строчных букв или цифр и не могут содержать более 24 символов. Выберите уровень ведения журнала и укажите, включать ли образцы данных. Дополнительные сведения о ведении журнала см. в статье Включение функции ведения журналов для веб-служб машинного обучения.

Масштабирование веб-службы путем добавления дополнительных конечных точек

По умолчанию каждая опубликованная веб-служба настраивается для поддержки 20 параллельных запросов, а максимальное число параллельных запросов может доходить до 200. Студия машинного обучения (классическая) автоматически оптимизирует этот параметр, обеспечивая максимальную производительность веб-службы. Значение, указанное на портале, при этом игнорируется.

Если для API планируется более высокая нагрузка, чем максимальное поддерживаемое значение в 200 одновременных вызовов, следует создать для такой веб-службы несколько конечных точек. Это позволит случайным образом распределять нагрузку между ними.

Масштабирование веб-службы — достаточно распространенная задача. Например, масштабирование будет полезным для поддержки более 200 одновременных запросов, для повышения доступности путем использования нескольких конечных точек или для разделения конечных точек веб-службы. Вы можете увеличить масштаб, добавляя дополнительные конечные точки для той же веб-службы с помощью портала веб-службы Машинного обучения.

Помните, что высокие значения для количества одновременных событий могут неблагоприятно влиять на работу API, если для него не создается достаточно высокой нагрузки. При создании достаточно низкой нагрузки на API, настроенный на высокую нагрузку, периодически случайно могут возникать периоды ожидания или резкое повышение значений задержки.

Синхронные API обычно используются в ситуациях, когда требуется низкий уровень задержки. Под задержкой здесь подразумевается время, необходимое для того, чтобы API завершил один запрос, и в ней не учитывается время сетевой задержки. Предположим, что имеется API с задержкой в 50 мс. Чтобы полностью задействовать доступный объем с использованием высокого уровня ускорения и максимальным количеством одновременных вызовов = 20, необходимо вызывать этот API 20 * 1000 / 50 = 400 раз в секунду. Аналогично, при максимальном количестве одновременных вызовов в 200 и задержке в 50 мс этот API можно вызывать 4000 раз в секунду.

Дальнейшие действия

Потребление веб-службы Машинного обучения.