Автомасштабирование

Статья
07/11/2023

Автомасштабированием называется процесс динамического выделения ресурсов в соответствии с требованиями к производительности. При увеличении объема работ приложению требуются дополнительные ресурсы, чтобы поддерживать необходимый уровень производительности и удовлетворять требования соглашений об уровне обслуживания (SLA). При снижении нагрузки исчезает и потребность в дополнительных ресурсах, а значит их можно освободить для экономии средств.

Автоматическое масштабирование использует преимущества эластичности облачной среды и сокращает издержки на управление, так как оператору не нужно отслеживать производительность системы и принимать решения о добавлении или удалении ресурсов.

Масштабировать приложение можно двумя способами:

Вертикальное масштабирование (увеличение или уменьшение масштаба), означает изменение производительности ресурса. Например, вы можете перенести приложение на виртуальную машину большего размера. Вертикальное масштабирование обычно сопряжено с временной неработоспособностью системы на период изменений в развертывании. По этой причине вертикальное масштабирование редко выполняется автоматически.
Горизонтальное масштабирование (развертывание и свертывание), означает добавление или удаление экземпляров ресурса. При подготовке новых ресурсов приложение будет работать без перерывов. Когда процесс подготовки завершится, решение будет развернуто на новых дополнительных ресурсах. Если нагрузка снижается, дополнительные ресурсы можно выключить и отключить штатным образом.

Многие облачные системы, включая Microsoft Azure, поддерживают автоматизацию горизонтального масштабирования. Оставшаяся часть этой статьи посвящена именно горизонтальному масштабированию.

Примечание.

Автоматическое масштабирование относится в основном к вычислительным ресурсам. Базу данных или очередь сообщений также можно масштабировать горизонтально, но обычно это подразумевает секционирование данных, которое не так просто автоматизировать.

Компоненты автомасштабирования

Стратегия автомасштабирования обычно включает следующие компоненты:

Системы инструментирования и мониторинга на уровне приложения, службы и инфраструктуры. Эти системы фиксируют такие ключевые метрики, как время ответа, длина очередей, использование ЦП и памяти.
Логика принятия решений, которая сравнивает метрики с предопределенными пороговыми значениями или расписаниями и принимает решения о масштабировании.
Компоненты, которые масштабируют систему.
Тестирование, мониторинг и настройка стратегии автоматического масштабирования, чтобы убедиться в том, что она работает ожидаемым образом.

Azure предлагает встроенные механизмы для автомасштабирования, разработанные для многих распространенных сценариев. Если какая-то служба или технология не имеет встроенных средств автомасштабирования или если ваши требования не соответствуют их возможностям, вы можете создать пользовательскую реализацию. Ваша система может собирать рабочие и системные метрики, анализировать их и выполнять масштабирование ресурсов соответствующим образом.

Автоматическое масштабирование в решении Azure

Azure поддерживает встроенное автомасштабирование для большинства вычислительных технологий.

Azure Виртуальные машины автомасштабирование с помощью масштабируемых наборов виртуальных машин, которые управляют набором виртуальных машин в качестве группы. См. статью Как использовать автомасштабирование и масштабируемые наборы виртуальных машин.
Service Fabric также поддерживает автоматическое масштабирование с помощью масштабируемых наборов виртуальных машин. Каждый тип узла в кластере Service Fabric настроен как отдельный набор масштабирования виртуальных машин. Это позволяет свертывать и развертывать каждый тип узла независимо от других типов. См. статью Масштабирование кластера Service Fabric с помощью правил автомасштабирования.
В службе приложений Azure реализован встроенный механизм автомасштабирования. Параметры автомасштабирования применяются ко всем приложениям в службе приложений. См. сведения о количестве экземпляров масштабирования вручную или автоматически и масштабировании приложения в службе приложение Azure.

Все эти вычислительные системы используют функцию автомасштабирования Azure Monitor, которая включает стандартный набор возможностей для автомасштабирования.

Решение Функции Azure отличается от предыдущих вариантов тем, что для него не нужно настраивать правила автомасштабирования. Вместо этого оно автоматически распределяет вычислительную мощность при выполнении кода, при необходимости развертывая ресурсы в соответствии с нагрузкой. Дополнительные сведения см. в статье Выбор подходящего плана размещения для Функций Azure.

И наконец, иногда есть смысл создать пользовательское решение для автомасштабирования. Например, можно использовать Диагностика Azure и метрики на основе приложений, а также пользовательский код для мониторинга и экспорта метрик приложения. На основе этих метрик можно определять пользовательские правила, которые с помощью API REST диспетчера ресурсов будут запускать автомасштабирование. Однако пользовательское решение не так просто реализовать, и его следует рассматривать только в том случае, если ни один из предыдущих подходов вас не устраивает.

Используйте встроенные возможности платформы для автомасштабирования, если они отвечают вашим требованиям. Если же вы планируете применять более сложные функции масштабирования, оцените их целесообразность. Примеры дополнительных требований могут включать более подробную степень управления, различные способы обнаружения событий триггера для масштабирования, масштабирования между подписками и масштабирования других типов ресурсов.

Использование автомасштабирования Azure Monitor

Автомасштабирование Azure Monitor предоставляет стандартный набор функций для автоматического масштабирования масштабируемых наборов виртуальных машин, Службы приложений Azure и облачной службы Azure. Масштабирование можно выполнять по расписанию или на основе метрик среды выполнения, таких как загрузка ЦП или использование памяти.

Примеры:

Горизонтальное увеличения масштаба до 10 экземпляров в рабочие дни и свертывание до 4 экземпляров в субботу и воскресенье.
Горизонтальное увеличение масштаба одного дополнительного экземпляра, если средняя загрузка ЦП превышает 70 %, и свертывание одного экземпляра, если загрузка ЦП опускается ниже 50 %.
Горизонтальное увеличение масштаба одного экземпляра, если число сообщений в очереди превышает определенный порог.

Увеличивайте масштаб ресурсов при увеличении нагрузки, чтобы обеспечить доступность. Аналогичным образом, в периоды низкой нагрузки уменьшайте масштаб, чтобы сэкономить средства. Всегда используйте сочетание правил для горизонтального увеличения и уменьшения масштаба. В противном случае автомасштабирование выполняется только в одном направлении до порогового значения (максимального или минимального количества экземпляров), заданного в профиле.

Выберите число экземпляров по умолчанию, являющееся безопасным для рабочей нагрузки. Если максимальное или минимальное число экземпляров не задано, масштабирование выполняется с учетом этого значения.

Список встроенных метрик см. в статье Общие метрики автомасштабирования Azure Monitor. Вы можете создать собственные метрики с помощью Application Insights.

Автомасштабирование можно настроить с помощью PowerShell, Azure CLI, шаблонов Azure Resource Manager или портала Azure. Для более точного управления используйте REST API Azure Resource Manager. Библиотека управления службами мониторинга Azure и библиотека аналитики Microsoft (в предварительной версии) — это пакеты SDK, которые позволяют собирать показатели различных ресурсов и выполнять автоматическое масштабирование, используя интерфейсы REST API. Для ресурсов, которые не поддерживают Azure Resource Manager, или при использовании облачных служб Azure для автоматического масштабирования можно воспользоваться REST API управления службами. Во всех остальных случаях для автоматического масштабирования рекомендуется применять Azure Resource Manager.

При использовании автомасштабирования учитывайте следующие аспекты.

Определите, есть ли у вас возможность прогнозировать нагрузку на приложение с достаточной точностью, чтобы использовать автомасштабирование по расписанию, заранее добавляя и удаляя экземпляры в соответствии с ожидаемыми всплесками нагрузки. Если это невозможно, используйте автомасштабирование на основе метрик среды выполнения, чтобы оперативно реагировать на непредсказуемые изменения спроса. Но обычно мы советуем объединить эти подходы. Например, можно создать стратегию, которая по расписанию добавляет ресурсы перед известными периодами максимальной загрузки приложения. Так вы обеспечите достаточную производительность в нужный момент без задержек, связанных с запуском новых экземпляров. В дополнение к каждому запланированному правилу определите метрики для оперативного автомасштабирования на период действия этого правила, чтобы приложение могло обрабатывать длительные и непредсказуемые всплески нагрузки.
Зачастую сложно понять связь между метриками и требованиями к мощности, особенно в случае, если приложение изначально развернуто. Для начала выделите мощность с некоторым запасом, а затем наблюдайте и корректируйте работу правил автомасштабирования, чтобы выделяемая мощность как можно точнее соответствовала реальной нагрузке.
Настройте правила автомасштабирования, а затем отслеживайте изменения в производительности приложения. Используйте результаты такого отслеживания для настройки способа масштабирования системы при необходимости. Однако помните, что автоматическое масштабирование не выполняется мгновенно. Требуется время, чтобы среагировать на метрики, такие как средняя загрузка ЦП, превышающая указанное пороговое значение (или находящаяся ниже него).
Правила автоматического масштабирования, использующие механизм обнаружения на основе измеренного атрибута триггера (например, загрузка ЦП или длина очереди), применяют агрегированное значение по времени, а не конкретное значение, чтобы запустить действие автоматического масштабирования. По умолчанию агрегированное значение — это среднее значение. Это позволяет предотвратить слишком быстрое реагирование системы или появление быстрых колебаний. При этом новым экземплярам, которые запускаются автоматически, также предоставляется время на переход в режим выполнения, что предотвращает выполнение дополнительных действий автоматического масштабирования в то время, когда происходит запуск новых экземпляров. Для облачных служб и виртуальных машин Azure период агрегирования по умолчанию составляет 45 минут, поэтому для запуска метрикой автоматического масштабирования в ответ на пиковую нагрузку может потребоваться как раз такое время. Можно изменить период статистической обработки с помощью пакета SDK, но периоды длительностью менее 25 минут могут привести к непредсказуемым результатам. Для веб-приложений средний период намного меньше, благодаря чему новые экземпляры доступны приблизительно в течение пяти минут после изменения среднего показателя триггера.
Избегайте нестабильности, при которой действия уменьшения и увеличения масштаба постоянно колеблются. Предположим, что имеется два экземпляра, верхний предел нагрузки ЦП составляет 80 %, а нижний — 60 %. Когда нагрузка достигает 85 %, добавляется еще один экземпляр. Через некоторое время нагрузка снижается до 60 %. Перед уменьшением масштаба служба автомасштабирования оценивает распределение общей нагрузки (на три экземпляра) после удаления одного из экземпляров и определяет, что оно составит 90 %. Это означает, что потребуется снова увеличить масштаб немедленно. Поэтому изменение масштаба пропускается, и вы не увидите его результатов.

Чтобы избежать нестабильности, следует выбрать достаточный интервал между пороговыми значениями увеличения и уменьшения масштаба.
Значения максимального и минимального количества экземпляров, используемых для автоматического масштабирования, имеют приоритет над масштабированием вручную. Если вы вручную изменяете количество экземпляров на значение, которое больше максимального или меньше минимального, подсистема автомасштабирования автоматически увеличивает его до минимального (если оно было меньше) или уменьшает до максимального (если оно было больше). Например, вы задаете диапазон от 3 до 6. При наличии одного запущенного экземпляра при следующем запуске параметр автомасштабирования развернет количество экземпляров до трех. Аналогичным образом, если вручную задать масштабирование до восьми экземпляров, при следующем запуске будет выполнено обратное автомасштабирование до шести экземпляров. Если не сбросить также правила автомасштабирования, то масштабирование вручную будет временным.
Подсистема автомасштабирования обрабатывает только один профиль за раз. Если условие не выполняется, проверяется следующий профиль. Не включайте основные метрики в профиль по умолчанию, так как он проверяется последним. В профиле может быть несколько правил. Для запуска горизонтального увеличения масштаба подсистеме автомасштабирования достаточно, чтобы выполнялось любое из правил. Для запуска свертывания службе автомасштабирования требуется, чтобы выполнялись все правила.

Дополнительные сведения о масштабировании Azure Monitor см. в статье Рекомендации по автомасштабированию.

Если вы настраиваете автомасштабирование с помощью пакета SDK, а не на портале, вы можете указать более подробное расписание для использования правил. Можно также создать свои собственные метрики и использовать их как отдельно, так и в сочетании с любыми метриками, существующими в правилах автоматического масштабирования. Например, можно использовать альтернативные счетчики (числа запросов в секунду, объема доступной памяти и т. д.), либо настраиваемые счетчики, измеряющие определенные бизнес-процессы.
Если вы настраиваете автомасштабирование для Service Fabric, учтите, что типы узлов в кластере соответствуют масштабируемым наборам виртуальных машин в серверной части. Это значит, что правила автомасштабирования нужно настраивать отдельно для каждого типа узлов. Перед настройкой автомасштабирования обратите внимание на необходимое количество узлов. Минимальное количество узлов, необходимое для основного типа узлов, зависит от выбранного уровня надежности. Дополнительные сведения см. в статье Масштабирование кластера Service Fabric с помощью правил автомасштабирования.
С помощью портала вы можете связать ресурсы (такие как экземпляры базы данных SQL и очереди) с экземпляром облачной службы. Это позволяет упростить доступ к отдельным вариантам конфигурации масштабирования вручную и автоматически для всех связанных ресурсов. Дополнительные сведения см. в статье Управление облачными службами.
При настройке нескольких политик и правил существует вероятность, что они могут конфликтовать друг с другом. Функция автоматического масштабирования использует следующие правила разрешения конфликтов, чтобы гарантировать, что всегда будет достаточное количество экземпляров.
- Операции горизонтального увеличения масштаба всегда имеют приоритет над операциями горизонтального уменьшения масштаба.
- При возникновении конфликта операций горизонтального увеличения масштаба приоритет имеет правило, которое инициирует наибольшее увеличение числа экземпляров.
- При возникновении конфликта операций горизонтального уменьшения масштаба приоритет имеет правило, которое инициирует уменьшение числа экземпляров на наименьшую величину.
Чтобы определить правила автомасштабирования в Среде службы приложений, можно использовать любые метрики рабочего пула или внешнего интерфейса. Дополнительные сведения см. в статье Автомасштабирование и среда службы приложений версии 1.

Автомасштабирование

Компоненты автомасштабирования

Автоматическое масштабирование в решении Azure

Использование автомасштабирования Azure Monitor

Рекомендации по проектированию приложений

Обратная связь

Обратная связь

Дополнительные ресурсы

Автомасштабирование

Компоненты автомасштабирования

Автоматическое масштабирование в решении Azure

Использование автомасштабирования Azure Monitor

Рекомендации по проектированию приложений

Связанные ресурсы

Обратная связь

Обратная связь

Дополнительные ресурсы