Вимоги до корпоративних даних
Розуміння вимог до блоків, файлів і об’єктів
Під час освоєння нових програм важливо визначити тип даних, щоб прийняти обґрунтоване рішення про використання блокового, файлового або об’єктного сховища.
Блокове сховище найчастіше використовується в середовищах DAS і SAN. Якщо це DAS, увесь том RAID або фізичний диск надається операційній системі як чистий, неформатований простір. Якщо це SAN, увесь LUN (що складається з декількох фізичних дисків), наданий з дискового масиву, передається в операційну систему через високошвидкісну мережу та відображається як чистий, неформатований простір. Базові рівні такого чистого тому складаються з менших екстентів або секторів, які обробляються операційною системою, а потім базова підсистема сховища зіставляє ці логічні блоки з конкретними фізичними блоками на конкретному диску (дисках). Блокове сховище є швидким і надійним рішенням, яке ідеально підходить для зберігання даних, що постійно змінюються, як-от реляційні бази даних, бази даних для онлайнової обробки транзакцій (OLTP), сервери електронної пошти або інфраструктура віртуальних робочих столів, де потрібна висока пропускна здатність і низька затримка.
Об’єктне сховище зберігає дані (і пов’язані з ними метадані) в контейнерах з унікальними ідентифікаторами, без папок або підкаталогів, з якими асоціюється файлове сховище. Воно використовує концепцію сховищ типу ключ-значення, де кожен ключ вказує на конкретне «значення» або частину даних і витягається через API.
Таке сховище застосовується переважно для обробки великих обсягів неструктурованих даних, наприклад листів електронної пошти, резервних зображень, записів відеоспостереження, або для керування даними, машинного навчання та аналізу даних у системах Інтернету речей. Об’єктне сховище ідеально підходить для роботи з величезними обсягами даних і може дуже швидко масштабуватися відповідно до програмних потреб, але водночас воно повільно витягає дані, що робить його неефективним для обробки баз даних або здійснення високопродуктивних обчислень. Типовими прикладами об’єктного сховища є Amazon S3, об’єктне сховище Google Cloud або сховище Azure Blob.
Файлове сховище зберігає дані у файлах, які розміщуються в папках і підкаталогах, і спільно використовується в мережі за допомогою SMB (Windows) або NFS (Linux). Таке сховище призначено для централізованого зберігання файлів (наприклад, відеозаписів, зображень або документів), але має обмежену масштабованість, оскільки обсяг даних продовжує зростати. Воно не дуже підходить для обробки величезних обсягів неструктурованих даних або даних, що постійно змінюються, як бази даних для онлайнової обробки транзакцій.