пятница, 8 июня 2012 г.

IBM DS3500/DCS3700: радикальные изменения

Как многие вероятно уже слышали, у IBM в этот понедельник прозвучало множество анонсов в области систем хранения. В той или иной степени были затронуты практически все линейки. В этой заметке я коснусь только лишь младших систем – DS3500 и DCS3700.

Большинство новинок носит принципиальный характер. Итак, новинки:

дисковые пулы (Dynamic Disk Pooling, DDP);
выделение дискового пространство по мере необходимости (Thin provisioning);
новая технология мгновенных снимков;
поддержка VAAI;
поддержка ALUA;
временные лицензии.

В чем плюсы, как это работает и что с этим всем делать? Попробуем пройтись по всем новинкам.

Динамические дисковые пулы.
Вместо привычных RAID массивов (Array) и томов на них (Volumes, LUNs), мы объединяем диски в большой пул и уже на этом пуле “нарезаем” тома нужного нам размера. Мы больше не привязаны к размерам конкретного массива, поэтому нам не нужно планировать массив так, чтобы наиболее эффективно его заполнить – все равно черпаем из “общего” котла. Нет ни выделенных дисков четности, ни выделенных hot-spare дисков.

Ну хорошо, схожие технологии мы видели и у других производителей, а в чем же отличие? Давайте посмотрим, как работает DDP. Каждый диск разбивается на 512МБ “дольки” (D-Piece) – см. рисунок ниже. Когда нам требуется выделить место из дискового пула для конкретного тома, система выбирает 10 таких “долек” с разных дисков (выбирает она так, чтобы выровнять занятый объем). Выбранные дольки объединяются в RAID-6 (8D+P+Q) и уже этот страйп (D-Stripe) размером 4ГБ и становится частью нашего тома с данными. D-Stripe для одного тома располагаются по разным дискам, обеспечивая, таким образом, распределение данных по всему пулу:

DDP не становятся заменой какой-либо технологии – можно использовать только один пул, можно использовать несколько пулов в одной системе, можно использовать и классические RAID-группы, и пулы вместе. Так как пулы по производительности все-таки ближе к RAID-6 и максимальную эффективность показывают на дисках NL SAS, то данные для приложений, критичных к скорости можно вынести, например, на отдельные RAID10.

В случае сбоя одного из дисков в пуле, происходит восстановление данных на оставшиеся диски. За счет того, что в восстановлении участвует большое число шпинделей, оно происходит с большей скоростью и оказывает меньшее влияние на производительность массива. Вместо выделенных hot-spare дисков резервируется соответствующее свободное место в пуле (примерно так, как это реализовано в HP EVA). Можно зарезервировать до 10 дисков (или до 20% объема пула). Вот как изменяется время восстановления в зависимости от числа дисков в пуле по сравнению с перестроением классического RAID6:

На 192х дисках различие превышает 5 раз! А при временах порядка 10 часов это весьма заметно. Не стоит забывать, что при восстановлении классического массива деградация производительности также весьма велика:

Хорошо видно, что во время ребилда диска в большом пуле, производительность приложений будет страдать заметно меньше (особенно если не ставить целью провести перестроение максимально быстро).

Конечно, раз уж речь зашла о производительности, то хочется сразу уточнить, а насколько такая новая технология “портит нам жизнь” в плане этой самой производительности? Результаты показывают, что максимально “страдают” операции случайной записи и последовательного чтения(~15%); случайное чтение же ухудшается всего на 6%, а последовательная запись даже улучшается. Такие эффекты заметны в “синтетических” тестах на 192х дисках в пуле. Если же количество дисков меньше, то и различие в производительности приближается к нулю.

Еще один замечательный плюс от DDP – возможность добавления дисков в пулы. Вы скажете что в RAID тоже можно добавить дисков? А сколько “за один раз”? А чем это чревато с точки зрения производительности? Вот именно – лучше этого на обычном массиве не делать. При добавлении же в пул новых дисков, происходит миграция незначительного числа “D-Piece” на новые диски, что не оказывает, в свою очередь, существенного влияния на производительность системы.

Таким образом, динамические пулы дают нам отличную замену для RAID6, позволяя объединить большое количество дисков, обеспечивая высокую производительность, простоту управления и высокую защищенность.

Thin provisioning.
Данная технология уже хорошо всем известна, но теперь она появилась и в младших СХД IBM. Причем появится и у тех, кто год назад стал владельцем системы DS3500. Единственное “но” – thin provisioning работает только на динамических томах! Поэтому “поиграть” на системе, не создав заранее дисковый пул, увы, не получится. Плюсы у thin provisioning очевидны – не нужно задумываться о точности выделения дискового пространства. Можно выделить немного больше, а по факту на дисках будет занято ровно столько, сколько данных было записано. На самом деле, с шагом 4ГБ конечно – выделение дискового пространства осуществляется в терминах D-stripe. Экономия от использования технологии thin provisioning может быть колоссальна – проверьте на своих системах, сколько незанятого места теряется впустую?

Новые мгновенные снимки.
Еще одна давно ожидаемая возможность. Долгие годы владельцы систем IBM DS3000/4000/5000 вынуждены были мучиться с восстановлением данных из снапшота (невозможно сделать операцию rollback, вернее возможно, но очень “некрасиво”). И вот, новых снапшотов можно сделать не просто заметно больше, но и можно быстро “откатиться” из снапшота на исходном томе. Также появляется возможность использовать группы консистентности, а это очень полезно, когда данные одного приложения находятся на различных дисках:

Rollback в рамках группы консистентности также работает! Несомненным плюсом стала оптимизация операций копирования исходных блоков в рамках технологии Copy-on-Write. Если раньше для каждого снимка происходило копирование исходного блока данных, то сейчас копия делается только единожды. Это существенно снижает эффект от деградации производительности при использовании мгновенных снимков. Падение производительности для “классических” CoW снимков может составлять десятки процентов. Сейчас эта проблема должна быть решена, что позволит использовать снимки и в более нагруженных средах.

Поддержка технологии VAAI.
Многие рассматривают VAAI исключительно как средство повышения производительности в среде VMware, но я бы скорее делал бы упор не на скорость выполнения отдельных операций (хотя это, без сомнения, приятно), а на разгрузку хоста от “лишней” работы и разгрузку сети хранения. Клонирование виртуальной машины с использованием VAAI может быть закончится и не на много быстрее, но зато канал ввода-вывода между сервером и СХД будет загружен в разы меньше и наше клонирование не окажет пагубного влияния на остальную инфраструктуру (особенно если мы используем 1Gbit iSCSI). В рамках VAAI поддерживается – блокировка экстентов в VMFS, write zeroes (write same) и extended copy (клонирование VM, Storage vMotion). Время выполнения операций с VAAI и без оного (кликабельно):

Поддержка ALUA.
Наверное многим доставляли проблемы active/passive пути? А потом еще приходилось вручную возвращать диски на “свои” контроллеры после каждого сбоя. Благодаря ALUA (Asymmetric Logical Unit Access) об этих неприятностях можно спокойно забыть. Чтобы было более понятно, пара картинок. Вот как работает multipath в DS3500 сегодня:

А вот как он будет работать в новой прошивке:

Наибольшие преимущества от ALUA заметны в кластерной среде, когда время failover при проблемах на контроллере играет критичную роль. Поддержка ALUA есть во всех ключевых операционных системах.

Временные лицензии.
До настоящего момента было очень сложно оценить “полезность” дополнительного функционала систем DS3500. Если мгновенные снимки можно было попробовать, то репликацию проверить было фактически невозможно. Решение о покупке (с бюджетом, сопоставим со стоимостью контроллерного модуля) нужно было принимать на основе обещаний, книжек или еще чего-то там. Теперь можно будет установить временную лицензию на 90 дней и проверить работу в своей среде, со своими приложениями. Указанных 90 дней, в принципе, должно хватить не только чтобы проверить функционал, но и для того чтобы заказать постоянные ключи и дождаться их прихода.

Вот такие замечательные новинки были представлены IBM для систем начального уровня. Я, честно говоря, ожидал немного большего, но и это уже очень и очень хорошо. Развитие систем не останавливается – будут и другие новшества, но позднее. Все, о чем я написал, будет доступно в прошивке, которая анонсирована на 15 июня. По факту, скорее всего, скачать ее можно будет на несколько дней позднее, но шанс попробовать все возможности уже в этом месяце безусловно есть!

48 комментариев:

Mister Nobody8 июня 2012 г. в 08:25
Спасибо, Андрей.
Ваще вкусняшка получается, прадва, два года ждать пришлось с момента выхода.
Ты про Point-in-Time подробней расскажи. Я скрин из презентации выкладывал, но в детали не вдавался http://vmind.ru/2012/06/06/ibm-ds3500dcs3700-priobretayut-podderzhku-vaai-i-alua/
ОтветитьУдалить
Ответы
aboutnetapp9 июня 2012 г. в 07:26
Ну вот, не зря покупали Engenio, как видите ;)
ОтветитьУдалить
Ответы
Анонимный9 июня 2012 г. в 11:44
diz: А ALUA сообщает хосту, какой из путей - "прямой"?
ОтветитьУдалить
Ответы
Анонимный18 июня 2012 г. в 14:31
а как воспользоваться этими ништяками? обновил все фирмвари на DS3524, установил тип хостовой операционной системы VMWareTPGSALUA, установил все патчи на ESXi 4.1, и все-равно в vsphere-клиенте для хранилища указано Hardware acceleration Unknown!
Какие теперь политики Path Selection/Storage Array Type использовать для VMware 4.1?
Нашел только для последней версии всферы 5 - тип массива VMW_SATP_ALUA.
ОтветитьУдалить
Ответы
Keeper22 июня 2012 г. в 23:26
Прошил два массива, один DS3512, второй 3524. В итоге на DS3524 после удачной прошивки получили ошибку Insufficient Cache Backup Device Capacity и соответственно Write-Back Caching Disabled. На логических устройствах соответственно все перешло в состояние:
• Write cache: Enabled (currently suspended)
• Write cache with mirroring: Enabled (currently suspended)
Само интересное что с сайта IBM из загрузок новая прошивка убрана.

Это официальное:
http://www-947.ibm.com/support/entry/portal/docdisplay?brand=5000008&lndocid=MIGR-5090862

Вообщем думаем как все это дело исправлять
ОтветитьУдалить
Ответы
Keeper26 июня 2012 г. в 11:20
все конечно хорошо, поддержку VAAI добавили, а где брать драйвера для vSphere 4.1 ?
ОтветитьУдалить
Ответы
Анонимный28 июня 2012 г. в 09:29
Для DS5000 есть что-то новое?
ОтветитьУдалить
Ответы
Andrew Ivanov12 июля 2012 г. в 00:39
Тем временем, вышла прошивка версии 7.83.22.00, которая решает как возникавшие проблемы с обновлениями, так и еще некоторые исправления найденных проблем.
ОтветитьУдалить
Ответы
Анонимный31 июля 2012 г. в 15:27
При переходе на 7.83.22.00 уже нарезанные LUN с данными не теряются?Прочитал реадми к прошивке,там не увидел ответа.То что сначала backup - это понятно,но к чему готовится хотелось бы понять заранее.
ОтветитьУдалить
Ответы
Анонимный29 августа 2012 г. в 10:10
А если нужен том размером менее 2 Гб, как будет происходит выделеник D-piece-ов?
ОтветитьУдалить
Ответы
Анонимный29 августа 2012 г. в 13:36
т. е. доступное:)
ОтветитьУдалить
Ответы
Keeper3 сентября 2012 г. в 13:13
Добрый день. Хотелось бы узнать у тех кто уже стал использовать Dynamic Disk Pooling, насколько в реальности идет потеря производительности в сравнении с тем же 5м рейдом, проводил ли кто тестирование , да и вообще поделитесь своими впечатлениями

Спасибо.
ОтветитьУдалить
Ответы
Анонимный3 сентября 2012 г. в 13:33
diz: Андрей, а откуда данные по потере производительности в DDP? Особенно интересно, с чем (как) именно сравнивали 192х-дисковый DDP. Впрямую же нельзя сравнить с R6, т.к. его на 192 диска не сделать.
ОтветитьУдалить
Ответы
Борис7 сентября 2012 г. в 00:06
Я тут сравнил свободное пространство и такой вот сюрприз получил: array RAID6 24x2T (43TB чистого пространства) дал мне 40TB свободного, а DDP на тех же дисках только 31TB. Неужели DDP такой прожорливый как в свое время RAID5 на трех-четырех дисках. Как это понимать?
ОтветитьУдалить
Ответы
Дмитрий14 октября 2012 г. в 18:27
+ еще прошу пояснить по снэпшотам.

В чем была проблема восстановления на системах DS3000?

Я про роллбэк на IBM DS3000/4000/5000.

+ как работает группа консистенции на снэпшотах. Не очень понятно.

Заранее спасибо!
ОтветитьУдалить
Ответы
Дмитрий15 октября 2012 г. в 13:59
Спасибо , понял.

Т.е. в любом случаем ПО для консистенции и автоматизации необходимо.

ОтветитьУдалить
Ответы

Добавить комментарий

Примечание. Отправлять комментарии могут только участники этого блога.

ИТ-технологии для профессионалов

пятница, 8 июня 2012 г.

IBM DS3500/DCS3700: радикальные изменения

48 комментариев:

Компания "Тринити"

Поиск по этому блогу

Тэги

Архив блога

Продукты, услуги, решения Тринити

Популярные записи

Просмотров за всё время

ИТ-технологии для профессионалов

пятница, 8 июня 2012 г.

IBM DS3500/DCS3700: радикальные изменения

48 комментариев:

Компания "Тринити"

Подпишитесь на наш блог!

Поиск по этому блогу

Тэги

Архив блога

Продукты, услуги, решения Тринити

Популярные записи

Просмотров за всё время

пятница, 8 июня 2012 г.