IBM Spectrum Virtualize
Что такое IBM Spectrum Virtualize?
IBM Spectrum Virtualize это программное обеспечение (прошивка), устанавливаемое на системы хранения IBM Storwize и SAN Volume Controller (SVC).
ПО IBM Spectrum Virtualize обладает уникальный архитектурой, позволяющей виртуализировать сети хранения данных, что отличает системы хранения IBM от классических систем хранения.
Для чего нужна виртуализация Сетей хранения данных?
Обычные системы хранения работают следующем образом:
- для повышения скорости работы и надежности несколько дисков в системе хранения объединяются в RAID.
- далее из емкости RAID выделяется дисковое пространство, которе подключается к серверу:
Такая схема имеет ряд ограничений. Например нельзя создать диск с емкостью больше, чем емкость RAID. Также подобный диск будет иметь жесткие ограничения по скорости - сначала, увеличивая количество дисков в RAID скорость растет, однако по достижении определенного количества дисков в RAID рост производительности сначала замедляется, а затем производительность и вовсе деградирует. Это связано с особенностями SAS схемы подключения дисков к RAID контроллеру. Для разных производителей и разных RAID оптимальное число дисков отличается, однако порядки цифр похожие. Например для RAID 5 большинство производителей рекомендует использовать не больше 8-9 дисков на массив.
Да, действительно, в большинстве систем хранения рекомендуется собирать массивы не более чем из 8 дисков. Мы используем диски по 600 Gb, поэтому емкость наших RAID чуть более 4 Тб, а количество операций ввода-вывода 4 кб блоками не превышает 800 операций в секунду.
Но я не понимаю как работает IBM Spectrum Virtualize. Используются другие уровни RAID с большим количеством дисков или дело в другом?
Нет, RAID тут не при чем. IBM Spectrum Virtualize обладает уникальной функцией виртуализаци. Например в Storwize несколько RAID объединяются в группы (так называемый Pool, или Mdisk group). Дисковое пространство, выделяемое для серверов берется из Pool, т.е. сразу из нескольких RAID, объединенных в группу. Это позволяет с одной стороны получить большую емкость томов используя небольшие диски, с другой повысить скорость работы на операциях чтения/записи. Размер тома в IBM Spectrum Virtualize ограничен 256 Тб, что значительно превосходит возможности многих операционных систем.
Я слышал, что к Storwize можно подключать другие системы хранения. Я не совсем понимаю зачем это нужно. Это действительно так?
Да, это так. Системы IBM Spectrum Virtualize работают не только с внутренними дисками. Например некоторые модели SAN Volume Controller вообще не имееют своих дисков.
Главная особенность Spectrum Virtualize состоим в том, что вы можете подключить диски (LUN) из внешней системы хранения (не обязательно IBM) к Spectrum Virtualize по SAN, и из этих дисков собрать Pool внутри IBM Spectrum Virtualize. Вы можете создать несколько Pool, например один из быстрых (и дорогих дисков) а другой из медленных дисков, и выделять тома для ваших серверов, в зависимости от потребностей скорости.
Т.е. получается, что вы подключаете несколько LUN из других систем хранения к IBM Spectrum Virtualize, а он в свою очередь оптимизирует хранение на всех подключенных системах, увеличивая скорость работы и максимальные размеры дисков.
Есть ли у IBM Spectrum Virtualize поддержка тонких дисков и функций копирования?
Конечно, поддерживаются тонкие диски и функции моментального копирования дисков. Также внутри системы можно настроить зеркалирование и миграцию томов между разными Pool. Это дает потрясающие возможности - например вы можете хранить и записывать наиболее критически важные для вас данные сразу на две системы хранения. Или вы можете отключить диск старой системы хранения от хоста, подключить этот диск к IBM Spectrum Virtualize, затем пробросить этот диск обратно к хосту (это займет у инженера пару минут), а после запустить миграцию данных из этого диска на диски внутри IBM Spectrum Virtualize. Все это будет происходить прозрачно для хоста, т.е. простой при физическом переносе, к примеру, 15 Тб тома, займет 1-2 минуты.
Еще раз: после подключения диска от IBM Spectrum Virtualize к хосту все операации по его перемещению проходят прозрачно для хоста. Вы можете копировать, клонировать, зеркалировать, перемещать диски, хост будет работать с диском как и раньше.
Я слышал про функции оптимизации используя SSD диски, можете рассказать про них?
Например в вашем пуле содержится RAID массив из восьми SAS дисков и массив из двух SSD. Массив из двух SSD может выдать примерно в 10 раз больше операций ввода-вывода маленькими блоками (4-64 Кб) чем массив из 8 SAS дисков. Однако стоимость SSD значительно превосходит стоимость SAS дисков, и покупать много таких дисков это разорение. С включенной функцией Easy Tier система переносит "горячие" данные на SSD, в то время как "холодные" данные будет хранится на более дешевых дисках.
Т.е. если у вас, к примеру, есть том размером 100 Гб, на котором 5 Гб горячих данных (постоянные обращения маленькими блоками, например база данных) то IBM Spectrum Virtualize перенесет эти данные на SSD диски, в то время как "холодные" данные будет перенесены на более дешевые диски. Это потрясающая функция, которая позволяет в разы увеличить скорость дисков, не переплачивая при этом за покупку дорогих SSD.
Начиная с прошивки 7.3 поддерживается трехуровневая архитектура Easy Tier - SSD, SAS, SATA. Подробней о функции Easy Tier можно почитать тут: Easy Tier