ИТ-подразделения борются за оптимальное использование ресурсов. При их избытке они не могут искусственно повысить загрузку, а если ресурсов не хватает, то не в состоянии быстро создать новые мощности. Хотя при перегрузке ИТ-систем существует потенциальная возможность переложить часть задач на общедоступную “облачную” инфраструктуру, этому зачастую мешают различные факторы, связанные с качеством обслуживания, доверием к поставщику соответствующих услуг и выполнением функций контроля.
ИТ позволяют до определенной степени учесть будущий спрос, но не могут создать его, если ресурсы простаивают. Если вы пристраиваете к своему дому ветряк, то можете рассчитать среднюю силу ветра на протяжении года. Но когда ветра нет, вы уже ничего с этим не поделаете. С другой стороны, если вы производите больше энергии, чем вам необходимо, то можете продать ее электрическим сетям. В идеале энергию можно динамически перераспределять между всеми нуждающимися в ней ресурсами.
Кто-то, наверное, возразит, что если вы проведете инвентаризацию всех имеется у вас средств или, например, будете ходить в супермаркет с собственной сумкой, то уже добьетесь некоторой экономии. Лично я не думал, как оптимизировать использование пакетов в магазинах, но, конечно, много размышлял о том, как наиболее полно использовать инфраструктуру ИТ. Ниже приведены три необходимых для этого шага.
Шаги к наиболее полному использованию ИТ-инфраструктуры
Шаг первый. Путь к эффективности должен начинаться со сбора сведений о том, что есть в вашем распоряжении. Если вам известны все доступные ресурсы, вы можете разработать стратегию их наиболее полного использования.
Шаг второй. Дальше необходимо разобраться, как все эти ресурсы связаны друг с другом. Зная это, вы можете выбрать наиболее эффективный способ управления взаимосвязями, не нарушая работы приложений или уровня обслуживания. Понимание и документирование ожидаемых пороговых значений уровня обслуживания в вашей вычислительной среде имеет ключевое значение для максимального использования и формулирования предельных требований к вашим ресурсам.
Шаг третий. Создать таблицу с детальными сведениями о возможностях каждого компонента вашей инфраструктуры, чтобы определить отправную точку. Например, раздельный учет потенциала процессоров, памяти, систем хранения и сети в качестве изначальных метрик поможет вам получить точные сведения о реальном использовании этих элементов за определенный период (скажем, за сорок часов). Этот период должен быть выбран таким образом, чтобы перерывы на обслуживание оборудования и интервалы его невысокой загрузки не могли существенно повлиять на результаты анализа.
Сбор данных об использовании оборудования
Тем не менее сбор сведений о загрузке ИТ-систем может оказаться нелегкой задачей. Установка на виртуальные машины (ВМ) программ-агентов системного управления, созданных для физических серверов прошлого поколения, приведет к искажению данных в результате перегрузки гипервизоров дополнительными процессорами и сетевыми устройствами.
Но и сбор метрик без использования программных агентов также может вызвать сложности, если вы работаете с несколькими сотнями ВМ. Создание таблицы загрузки, в которой для сравнения будут указываться уже выделенные вами ресурсы, позволит прийти к достаточно точным выводам относительно эффективности каждой ВМ.
Вы сразу заметите имеющиеся несоответствия. Те ВМ, которые используются значительно меньше, чем было определено в часы пиковой нагрузки, могут стать идеальными кандидатами на отключение, а их ресурсы можно перераспределить между другими ВМ. От этого выиграют перегруженные машины. Или же, если что-то идет не так, анализ первопричин позволит выявить, что ошибку вызывают изменения в настройках относительно исходного шаблона.
Вооружившись знанием диапазона нагрузки для каждой ВМ при заданной для нее производительности, вы легко определите верхний и нижний пороги нагрузки. В идеале не следует выделять для ВМ ни избыточные, ни слишком скудные ресурсы, и уж тем более позволять ей простаивать, потребляя драгоценные ресурсы. Обычная нагрузка для ВМ, обеспечивающих работу веб-сервера, должна лежать в пределах 65—80%. Если ВМ загружена в среднем на 20%, наверное, настало время подумать о перераспределении ресурсов.
Учет пожеланий клиентов
В действительности вопрос заключается в том, чего ожидают клиенты, устанавливая те или иные пороговые значения. Этот тот вопрос, относительно которого в конечном счете придется с ними договариваться. Большинство владельцев приложений предпочли бы иметь в своем распоряжении избыточные ресурсы на случай непредвиденных обстоятельств, а это приводит к постоянной растрате ресурсов памяти и хранения. Установление равновесия между ресурсами и их использованием позволит клиентам и владельцам приложений получить в свое распоряжение самые дешевые ВМ, продлить срок эксплуатации имеющихся серверов, сетей хранения и сетевой инфраструктуры.
Наконец, в результате переговоров будет выявлено несколько оптимизированных ВМ, которым выделены ресурсы в согласованных с владельцами приложений пределах. Эти ВМ можно использовать в качестве шаблонов при распределении ресурсов в будущем.
Понятно, что всю эту осуществляемую вручную работу значительно упростит автоматический учет динамических изменений в вашей вычислительной среде и активности пользователей. Но пока не появились продукты для ведения такого учета, вы с помощью описанного подхода можете снизить потребности в ресурсах для наиболее оптимизированных ВМ, использовать одни и те же ресурсы для решения различных задач и повторно использовать высвобождающиеся мощности.