Системы хранения данных
Система хранения данных (СХД) — это конгломерат специализированного оборудования и программного обеспечения, который предназначен для хранения и передачи больших массивов информации. Позволяет организовать хранение информации на дисковых площадках с оптимальным распределением ресурсов.
Почему возникла необходимость в СХД?
Из проведенного исследования IDC Perspectives следует, что хранение данных занимает второе место среди расходов на ИТ и составляет примерно 23% от всех расходов. По информации The InfoPro, Wave 11 «прирост расходов на СХД в средней компании Fortune 1000 превышает 50% в год».
По общему мнению аналитиков, в организациях по всему миру ежеминутно вырастают объемы хранимой и обрабатываемой информации. Уникальная информация становится все дороже, ее объём каждый год увеличивается многократно, а её хранение требует затрат. Ввиду этого организации стремятся не только формировать развитие инфраструктуры хранения данных, но и изыскивать возможности улучшения и повышения экономической эффективности СХД: снижения энергопотребления, расходов на сервис, общей стоимости владения и закупки систем резервного копирования и хранения.
Рост объемов данных, возросшие требования к надежности хранения и быстродействию доступа к данным делают необходимым выделение средств хранения в отдельную подсистему вычислительного комплекса (ВК). Возможность доступа к данным и управления ими является необходимым условием для выполнения бизнес-процессов. Безвозвратная потеря данных подвергает бизнес серьезной опасности. Утраченные вычислительные ресурсы можно восстановить, а утраченные данные, при отсутствии грамотно спроектированной и внедренной системы резервирования, уже не подлежат восстановлению.
Происходит заметное развитие потребности не только в приобретении СХД корпоративными клиентами, но и в строгом учете, аудите и мониторинге использования дорогостоящих ресурсов. Нет ничего хуже остановки бизнес-процессов из-за невозможности своевременно получить необходимые данные (или полной их утраты), а ведь это может повлечь за собой необратимые последствия.
Сферы применения СХД
Традиционные хранилища данных можно встретить повсеместно. Они предназначены для формирования отчетности, помогающей разобраться с тем, что произошло в компании. Однако это первый шаг, базис.
Людям становится недостаточно знать, что произошло, им хочется понять, почему это случилось. Для этого используются инструменты бизнес-аналитики, которые помогают понять то, что говорят данные.
Вслед за этим приходит использование прошлого для предсказания будущего, построение прогностических моделей: какие клиенты останутся, а какие уйдут; какие продукты ждет успех, а какие окажутся неудачными и т.д.
Некоторые организации уже находятся на стадии, когда хранилища данных начинают использовать для понимания того, что происходит в бизнесе в настоящее время. Поэтому следующий шаг — это «активация» фронтальных систем при помощи решений, основанных на анализе данных, зачастую в автоматическом режиме.
Объемы цифровой информации растут лавинообразно. В корпоративном секторе этот рост вызван, с одной стороны, ужесточением регулирования и требованием сохранять все больше информации, относящейся к ведению бизнеса. С другой стороны, ужесточение конкуренции требует все более точной и подробной информации о рынке, клиентах, их предпочтениях, заказах, действиях конкурентов и т.д
В государственном секторе рост объемов хранимых данных поддерживает повсеместный переход к межведомственному электронному документообороту и создание ведомственных аналитических ресурсов, основой которых являются разнообразные первичные данные.
Не менее мощную волну создают и обычные пользователи, которые выкладывают в интернет свои фотографии, видеоролики и активно обмениваются мультимедийным контентом в социальных сетях.
Из чего состоит СХД
Как правило, система хранения данных содержит следующие подсистемы и компоненты:
- устройства хранения (дисковые массивы, ленточные библиотеки)
- инфраструктуру доступа к устройствам хранения
- подсистему резервного копирования и архивирования данных
- программное обеспечение управления хранением
- систему управления и мониторинга
СХД часто предполагает монтаж в стандартный 19-дюймовый шкаф и содержит жёсткие диски, внешние интерфейсы для подключения хостов (серверов) и несколько блоков питания. Внутри располагаются процессорные блоки, контроллеры дисков, портов ввода-вывода, кэш-память и другие необходимые компоненты.
Ключевые требования к СХД
На практике к СХД подключается не один сервер, а многие десятки и сотни. Это диктует ряд ключевых требований к системам такого рода:
Надёжность и отказоустойчивость. В СХД предусмотрено полное или частичное резервирование всех компонент – блоков питания, путей доступа, процессорных модулей, дисков, кэша и т.д. Обязательно наличие системы мониторинга и оповещения о возможных и существующих проблемах.
Доступность данных. Обеспечивается продуманными функциями сохранения целостности данных (использование технологии RAID, создание полных и мгновенных копий данных внутри дисковой стойки, реплицирование данных на удаленную СХД и т.д.) и возможностью добавления (обновления) аппаратуры и программного обеспечения в горячем режиме без остановки комплекса;
Средства управления и контроля. Управление СХД осуществляется через web-интерфейс или командную строку, есть функции мониторинга и несколько вариантов оповещения администратора о неполадках. Доступны аппаратные технологии диагностики производительности.
Производительность. Определяется числом и типом накопителей, объёмом кэш-памяти, вычислительной мощностью процессорной подсистемы, числом и типом внутренних и внешних интерфейсов, а также возможностями гибкой настройки и конфигурирования.
Масштабируемость. В СХД обычно присутствует возможность наращивания числа жёстких дисков, объёма кэш-памяти, аппаратной модернизации и расширения функционала с помощью специального ПО. Все перечисленные операции производят без значительного переконфигурирования и потерь функциональности, что позволяет экономить и гибко подходить к проектированию ИТ-инфраструктуры.
Типы СХД
Дисковые СХД
Используют для оперативной работы с данными, а также для создания промежуточных резервных копий.
Существуют следующие виды дисковых СХД:
- СХД для рабочих данных (высокопроизводительное оборудование);
- СХД для резервных копий (дисковые библиотеки);
- СХД для долговременного хранения архивов (системы CAS).
Ленточные СХД
Предназначены для создания резервных копий и архивов.
Существуют следующие виды ленточных СХД:
- отдельные накопители;
- автозагрузчики (один накопитель и несколько слотов для лент);
- ленточные библиотеки (более одного накопителя, множество слотов для лент).
Варианты подключений СХД
Для подключения устройств и жестких дисков внутри одного хранилища используются различные внутренние интерфейсы:
- SCSI,
- Serial Attached SCSI (SAS),
- Serial ATA (SATA)
- Fibre Channel (FC).
Наиболее распространенные внешние интерфейсы подключения СХД:
- FC,
- Fibre Channel over Ethernet (FCoE),
- SCSI,
- iSCSI.
Популярный интерфейс межузлового кластерного взаимодействия Infiniband теперь также используется для доступа к СХД.
Варианты топологий СХД
Традиционный подход к хранилищам данных состоит в непосредственном подключении серверов к системе хранения DAS (Direct Attached Storage). Помимо DAS, существуют устройства хранения данных, подключаемые к сети, — NAS(Network Attached Storage), a также компоненты сетей хранения данных — SAN(Storage Area Networks). И NAS-, и SAN-системы появились в качестве альтернативы архитектуре DAS. Причем каждое решение разрабатывалось как ответ на растущие требования к системам хранения данных и основывалось на использовании доступных в то время технологиях.
Архитектуры сетевых систем хранения были разработаны в 1990-х гг., и их задачей было устранение основных недостатков систем DAS. В общем случае сетевые решения в области систем хранения должны были реализовать три задачи: снизить затраты и сложность управления данными, уменьшить трафик локальных сетей, повысить степень готовности данных и общую производительность. При этом архитектуры NAS и SAN решают различные аспекты общей проблемы. Результатом стало одновременное сосуществование двух сетевых архитектур, каждая из которых имеет свои преимущества и функциональные возможности.Системы хранения прямого подключения (DAS)
Устройства хранения DAS, также известные как SAS (Server Attached Storage), т. е. системы, подключаемые непосредственно к серверу, были разработаны много лет назад для расширения емкости хранения существующих серверов. В те времена при необходимости увеличения числа томов, связанных с приложениями, к серверу добавлялись новые диски либо приобретался новый сервер. Принимая во внимание технологические ограничения того времени (узкая полоса пропускания, медленные сети, дорогостоящие микропроцессоры) и относительно низкие требования к емкости и времени доступа, системы DAS были вполне адекватным решением.
DAS — это, по сути, расширение дисковой системы хранения отдельно взятого сервера. Клиенты получают доступ к данным, обращаясь к этому серверу через сеть. То есть сервер имеет блочный доступ к данным на СХД, а уже клиенты пользуются файловым доступом.
Устройства хранения данных, подключаемые к сети (NAS)
Основная задача систем NAS — упростить совместное использование файлов. На базовом уровне устройства NAS — это оборудование, которое подключается непосредственно к локальной сети. В этом состоит их основное отличие от систем с индивидуальными серверами с прямым подключением изолированных накопителей.
Сети хранения данных (SAN)
SAN — отдельная сеть хранения данных, которая обладает высокой производительностью и масштабируемостью, может расширяться как вертикально (путем добавления дополнительных дисков и полок расширения к единому дисковому хранилищу), так и горизонтально (с добавлением новых хранилищ в инфраструктуру сети). В этом случае серверы получают доступ к дисковым накопителям посредством сети SAN, и не нагружают локальную сеть. При необходимости можно организовать транспорт данных между сетями хранения.
Эти решения стали ответом не только на недостатки систем DAS и NAS, но, что более важно, на проблемы перегрузки каналов связи и задержки в локальных IP-сетях (10/100-Мбит/с). Впервые концепция SAN была предложена в 1998 г. Как и многие другие современные компьютерные технологии, она была заимствована из мира мэйнфреймов, где применялась, например, в центрах обработки данных для подключения компьютеров к системам хранения и распределенным сетям.
Программный и аппаратный RAID
Все существующие СХД делятся на использующие аппаратный RAID и специализированное ПО для расчета RAID – программный RAID. Последние системы являются более экономичными. Теперь многие задачи обработки и хранения данных значительно эффективнее решаются в рамках СХД с программным RAID. Например - резервирование системных дисков и виртуальных машин, хранение и обработка видео, работа с крупными файлами в системах документооборота.После лидерства программного RAID в начале девяностых годов на смену ему пришел аппаратный, и до недавнего времени именно он преобладал на рынке СХД. Программному RAID отводилась роль недорогих любительских и домашних систем хранения. Сейчас имеется класс задач, которым вполне достаточно программного RAID, предоставляемого непосредственно ОС Windows, Unix и другими. СХД с программным RAID из категории систем начального уровня вышли на корпоративный рынок.
Развитие направления СХД с программным RAID во многом определяют компании, выпускающие стандартные комплектующие: процессоры с новыми встроенными командами, коммутаторы и корзины, поддерживающие более производительные протоколы передачи данных. Серверные комплектующие нового поколения и их привлекательная цена, инновационные алгоритмы расчета, – все это позволило СХД с программным RAID превзойти по характеристикам аналоги с аппаратным RAID.
Производители СХД с программным RAID используют всю мощь нового поколения аппаратных комплектующих и на один-два года опережают производителей аппаратных RAID-массивов по срокам выпуска новых моделей. В то время как производителям аппаратного RAID необходимо модернизировать производственный процесс, для СХД с программным RAID достаточно протестировать новую корзину или процессор, - и новая модель готова к поставке.
Среди достоинств программного RAID можно отметить высокую производительность на платформе x86-64, недорогие, доступные и взаимозаменяемые серверные комплектующие, а также привлекательную стоимость обработки и хранения данных. При этом стоимость модернизации системы будет довольно низкой за счет покомпонентного обновления аппаратных и программных средств, а также их значительно больших функциональных возможностей. Программный RAID позволяет реализовать шифрование на уровне кода процессора, например, Intel Core i7). Подобные системы обладают повышенной отказоустойчивостью N+2 и даже N+3.
Об интересе российских потребителей к СХД на основе программного RAID свидетельствует ряд факторов. Крупные российские интеграторы включили в свои предложения системы хранения на основе программного RAID. В прайс-листах российских сборщиков серверов и систем хранения подобные системы занимают примерно 20-30%. Владельцы ЦОДов размещают ресурсы на программных RAID в соответствии с практиками многоуровневого хранения данных (см. далее).
Разработчики систем хранения данных
Условно всех производителей СХД можно разделить на мировых лидеров (бренды «А»), других крупных изготовителей (бренды «Б») и локальных (местных) сборщиков. До недавнего времени на российском рынке СХД был представлен ограниченный набор решений, базирующихся в основном на архитектурах DAS (Direct Access Storage) или SAN (Storage Area Networks) на основе протокола Fibre Channel.
Компании из первой группы завоевали наивысший авторитет на рынке. Они располагают широкой партнерской и сервисной сетью по всему миру, вкладывают огромные средства в разработку новой продукции и маркетинг, имеют миллиардные финансовые обороты (в частности, в секторе систем хранения данных)и т.д. На продукцию ведущих мировых производителей (А-бренды) приходится основная доля продаж внешних дисковых СХД, как в количественном, так и в денежном выражении.
Ведущие мировые разработчики СХД:
- Dell (PowerVault, EqualLogic, Compellent)
- ЕМС (Celerra, CLARiiON, Centera, Iomega, Symmetrix VMAX/VMAXe, VNX, VPLEX)
- Fujitsu (ETERNUS, FibreCAT, Quantum)
- Hitachi (SMS, WMS, AMS, CAP, USP, VTL)
- HP (StorageWorks, EVA, 3PAR)
- IBM (Storwize, System Storage D, System Storage T, System Storage N, SONAS)
- NetApp (FAS, VTL, V, E)
- Oracle (Sun ZFS Storage, Sun Flash, Pillar Axiom, StorageTek)
Рынок СХД переживает бурный подъем, и закономерно на нем продолжается череда поглощений независимых разработчиков крупными игроками. В частности,Dell приобрела Compellent Technologies, ранее HP поглотила компанию 3PAR (немало поторговавшись с той же Dell), EMC присоединила к своей линейке продуктов Kazeon и Isilon Systems.
Поскольку СХД неотделимы от вычислительных ресурсов, то неудивительно, что многие крупнейшие мировые производители систем хранения являются одновременно и лидерами на серверном рынке. Из перечисленных выше производителей только три занимаются исключительно СХД — это EMC, Hitachi иNetApp.
Из производителей СХД, представленных в нашей стране, отметим компании, которые относятся к упомянутому выше классу «Б».
- AXUS
- Buffalo
- Cisco (Linksys)
- D-Link
- Dot Hill
- Infortrend
- Intransa
- Maxtronic
- Nexsan
- Overland Storage
- Plasmon
- QNAP Systems
- SGI
- Thecus
Мы готовы предложить Вам как готовое решение системы хранения данных, так и отдельные компоненты.
Свяжитесь с нашими менеджерами или техническими специалистами и получите гарантированный результат!