Конфиденциальность, целостность и доступность данных — вот основные принципы, которые лежат в основе любого проекта центра обработки данных. Эти принципы применяются ко всем данным не одинаково, а в порядке приоритетности. Основной параметр, по которому определяется приоритет данных для защиты, — их ценность.
Сколько стоят данные?
Именно исходя из ценности выходных данных информационной системы, а также расчета финансовых потерь в случае недоступности этих данных за час и проектируется ЦОД. Отдельно принимаются во внимание требования регуляторов, в том числе к шифрованию, но основная классификация строится на основе влияния данных на бизнес компании.
Данные могут быть недоступны вследствие аварии или утратить конфиденциальность, поэтому задача администраторов на этапе до проектирования ЦОД — выяснить, какие потери понесет компания в этих случаях и будут ли они выше, чем расходы на защиту этой информации.
Если эти взаимосвязи не будут установлены, то архитектуру можно считать не соответствующей потребностям компании и неспособной выполнять свои задачи в полной мере. Еще один важный аргумент в пользу детального расчета системы — финансовое обоснование расходов на то или иное оборудование и программное обеспечение. Например, именно от ценности данных зависит выбор систем резервного копирования и уровня защиты.
Поскольку решение по защите может достигать стоимости потери данных, то RTO (Recovery Time Objection) и RPO (Recovery Point Objection) необходимо рассчитывать «в деньгах».
RPO — объем данных, который был потерян из-за аварии. Зависит от регулярности резервного копирования или наличия системы послеаварийного восстановления.
RTO — количество времени, которое будет затрачено на то, чтобы восстановить сервис после аварии. Опираясь на заданное значение RTO, можно рассчитать потребности резервного копирования и восстановления данных.
Формирование пулов ресурсов
Информационные системы объединяются в пулы по схожести требований. Пулы могут быть с полным или неполным разделением. Поскольку информационные системы имеют требования по вычислительной мощности и отдельно по хранению и передаче данных, то можно поделить виртуальную ферму на несколько пулов по вычислительным ресурсам, которые будут существовать на одной системе хранения данных.
Оперативная память
Вычислить необходимое общее количество оперативной памяти получится, если просто суммировать все потребности.
Мощность процессоров
Необходимость центра обработки данных в процессорной мощности измеряется путем суммирования количества виртуальных процессоров всех ресурсных пулов с учетом их индивидуальных коэффициентов консолидации, рассчитываемых эмпирически. Принято считать таким коэффициентом физическое ядро процессора без учета HyperThreading. Средним значением считаются 4:1, 8:1.
Ресурсы для хранения
Чтобы получить параметры требований для ресурсов хранения, необходимо суммировать производительность и объем всех пулов. При этом именно IOPS выражает требования к производительности. Аналогично с сетями передачи данных — требования можно получить, если просто суммировать все пулы пропускной способности.
Как выбрать архитектуру
Основной задачей выбора будет определиться между классической и гиперконвергентной архитектурой.
В классической архитектуре серверы составляют в общем пуле физического ресурса исключительно оперативную память и процессорную мощность, а хранение и передача данных осуществляется через внешние интеллектуальные подсистемы. В отдельных случаях серверы могут не иметь даже системный идентификатор, что вместе с отсутствием собственных дисков делает их полностью анонимными. Тогда гипервизор или операционная система загружаются с внешних систем хранения или со встроенных накопителей.
Выбор серверов для классической архитектуры между blade и rack вариантами основывается в первую очередь на экономической эффективности. В таком случае стоимость стоечных серверов будет ниже. Однако лезвия дают более высокую вычислительную плотность. Не стоит забывать и о таких факторах, как масштабирование и возможности управления, потребление энергии и выделение тепла.
Выбор между серверами не требуется в конвергентной архитектуре, поскольку форм-фактор, присущий классическим лезвиям, недопустим при использовании локальных дисков серверов. А они необходимы, потому что в этом виде архитектуры предполагается совмещение функционала хранения и обработки данных. Поэтому в конвергентных системах частотно применение стоечных серверов или кластерных систем, где происходит совмещение в рамках одного корпуса локальных дисков и нескольких blade-серверов.
Как рассчитать конфигурацию сервера
Перед тем, как рассчитывать конфигурацию сервера, потребуется решить, как совместить или разделить различные вычислительные пулы для всех видов нагрузки по разным кластерам. После этого необходимо рассчитать, как будут соотноситься гигабайты и мегагерцы для каждого кластера из всех, что были определены при нагрузке, которая заранее была известна.
Чтобы понять, как поступать, если заранее не удалось получить данные по нагрузке, нужно обратиться к средним значениям коэффициента консолидации, чтобы с его помощью перевести требования пула в физические. Однако такой вариант подойдет только в случае, если имеется хотя бы приблизительное понимание, как будет загружена процессорная мощность.
Как рассчитать систему хранения
Производительность системы хранения данных в каждом случае должна быть рассчитана по худшем варианту развития. При этом то, как влияет кэш и оптимизация операций на систему — необходимо исключить.
Механическая производительность по диску выступает, как базовый показатель производительности систем хранения данных. Чтобы рассчитать, каким будет количество дисков для дискового пула, необходимо умножить сумму требуемой в дисковом пуле производительности на процентную долю операций чтения, прибавленную к разнице единицы и процентной доли операций чтения, умноженную на RAID penalty для выбранного уровня RAID, и разделить на суммарную производительность диска.
Варианты хранения, включая многоуровневое, можно рассчитать, ориентируясь на количество дисков, которое было получено по формуле выше.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.