Требования к корпоративным данным
Анализ требований к блочному, файловому и объектному хранению данных
При внедрении новых приложений важно понимать, какие данные хранятся, чтобы принять обоснованное решение о том, следует ли использовать блочное, файловое или объектное хранилище.
Блочное хранилище чаще всего используется в средах DAS и SAN. В случае DAS весь том RAID или физический диск представляется ОС как необработанный неформатированный том. В средах SAN весь LUN (состоящий из нескольких физических дисков) из массива хранения данных предоставляется ОС через высокоскоростную сеть и отображается как необработанный неформатированный том. Базовые уровни необработанного тома состоят из меньших областей памяти или секторов, которые обрабатывает операционная система. Затем базовая подсистема хранения данных может сопоставить эти логические блоки с конкретными физическими блоками на определенных дисках. Система хранения данных на блочном уровне является быстродействующей и надежной. Она идеально подходит для постоянно изменяющихся данных, таких как реляционные базы данных, базы данных оперативной обработки транзакций (OLTP), серверы электронной почты или инфраструктура виртуальных рабочих столов, где требуется высокая пропускная способность транзакций и низкая задержка.
Объектное хранилище хранит данные (и связанные с ним метаданные) в контейнерах с уникальными идентификаторами, без папок или подкаталогов, как в файловом хранилище. В нем используется концепция хранилищ «ключ-значение», где каждый ключ указывает на определенное «значение» или фрагмент данных и извлекается через API-интерфейсы.
Оно в основном используется для обработки больших объемов неструктурированных данных, таких как электронные письма, резервные образы, отснятый материал систем видеонаблюдения или, в Интернете вещей, для управления данными для машинного обучения и анализа данных. Объектное хранилище хорошо подходит для обработки очень больших объемов данных и может масштабироваться так быстро, как того требует сфера применения. Однако извлечение данных выполняется медленно, поэтому такой тип хранилища неэффективен для баз данных или высокопроизводительных вычислений. Примеры объектного хранилища — Amazon S3, Google Cloud и Azure Blob.
Файловое хранилище хранит данные в файлах, организованных в папки и подкаталоги, и совместно используется по сети с помощью SMB (Windows) или NFS (Linux). Оно хорошо подходит для централизованного хранения файлов, таких как видео, изображения или документы, но имеет ограниченную масштабируемость, поскольку объем данных продолжает расти. Это не самый подходящий вариант для обработки очень больших объемов неструктурированных данных или постоянно меняющихся данных, таких как базы данных OLTP.