Проти течії. Репатріація даних
У хмарі зручно – немає прив'язки до серверного обладнання, проблем його підбору, розміщення, супроводу. Хмарні обчислення знімають із ІТ-персоналу частину поточних завдань обслуговування та підтримки. Однак багато компаній хотіли б оптимізувати продуктивність. А ще повністю контролюватиме дані. І заощадити – у хмарі дорого. Достойні цілі у наш неритмічний час.
Зустрічна смуга
Привабливість хмари залежить від суті бізнесу. Поки одні йдуть у публічні хмари, інші повертають додатки та дані у свої дата-центри чи приватні хмари на ближніх майданчиках. Зазвичай наводять у приклад сервіс зберігання даних Dropbox, який до 2017 року переріс AWS - з більш ніж 500 мільйонами користувачів AWS став обтяжливим для нього. Після перенесення даних клієнтів у власну інфраструктуру лише за перші два роки Dropbox заощадив близько 75 мільйонів доларів.
Першопричина відходу з загальнодоступних сервісів - висока вартість хмари. Співвідношення витрат і вигод ідеальне для стартапів, розробників, еластичного бізнесу або компаній із багатоточковою присутністю. У зрілих підприємств із підготовленим персоналом та стабільними обчислювальними потребами інша мірка запитів.
Перші кандидати на репатріацію – додатки, які чутливі до затримок або працюють з великими наборами даних. Незадоволеність продуктивністю у хмарі зазвичай викликана низькою пропускною спроможністю мережі та мережними затримками – вони обмежують транспортування даних та спритність бізнесу. Якесь розумне місто або розгалужена система збору даних створюють величезні потоки інформації. Хоча хмарні обчислення забезпечують зручну платформу (обчислювальну потужність, зберігання, що масштабується), дешевше ставити локальні обчислювачі, ніж ганяти дані по глобальній мережі. Якщо програмам і базам даних потрібна висока доступність або надмірність, їм більше показані приватні (або гібридні) хмари.
Поїхали!
Опитування 451 Research шести сотень ІТ-керівників підприємств-мігрантів, проведене в 2021 році, показало, що 48% перенесли додатки або робочі навантаження від гіперскейлерів AWS, Microsoft Azure або Google Cloud Platform ближче до себе: 86% вирішили запускати додатки та робочі навантаження в своїх власних центрах обробки даних, 14% перемістили їх у колокейшен. 52% помiрних кочівників, що залишилися, обрали ізольовану приватну хмару, меншого постачальника загальнодоступної хмари або розміщення на сторонньому залозі.
Мережеві затримки та «гравітація даних»
Хмара забезпечує еластичність сховища та навантажень, але його робота залежить від підключення до Інтернету – тобто мережевих затримок. Такі програми як резервне копіювання та відновлення, електронна пошта та офісний серфінг не надто чутливі до затримок – на відміну від аналітики реального часу, баз даних, програм безпеки та збору даних.
Скорочують залежність від швидкості відгуку периферійні обчислення (edge computing) – первинна обробка даних за місцем створення, кешування та оптимізація мережі. Найпростіше рішення - повернення даних всередину компанії, зниження залежності від каналів зв'язку, налаштування сховища, обчислень та мережі під додатки та робочі навантаження, силами свого персоналу. При аналізі трафіку користуються терміном «гравітація даних»: якщо більшість даних перебуває у хмарі і обробка виконується теж у хмарі, те й підстав для міграції немає. Якщо дані постійно переміщаються між хмарами та локальним сховищем або обчислювальними ресурсами, треба їхати.
Об'ємне зберігання
Особливо дорого в хмарі коштує зберігання даних - не така сама вартість розміщення, як передача об'ємної інформації, плата за трафік. IDC прогнозує, що загальна кількість даних у світі збільшиться до 175 зетабайт до 2025 року, і що 80 відсотків цих даних будуть неструктурованими, будь вони згенеровані пристроями (відеоспостереження, реєстрація подій, телеметрія) або людьми (електронна пошта та мультимедійні телефонні повідомлення, аудіофайли, відеофайли, текстові файли, повідомлення у соціальних мережах).
Хмарна репатріація стала природною реакцією на зростання витрат, пов'язаних із переміщенням та зберіганням даних. Навіть при використанні оптоволоконних мереж для перенесення великих масивів даних кудись знадобляться місяці, якщо не роки. Так народився і зміцнів напрямок периферійних обчислень. Те саме відбувається з розвитком систем штучного інтелекту. Компанії все частіше переходять на гібридну інфраструктуру, частково із зберіганням у хмарі, із приземленням основних потоків даних додатків до локального господарства.
Продавець Teezily заощадив 400K євро на рік на інфраструктурі зберігання, коли перемістив 450 ТБ даних з AWS S3 повністю автономний кластер на основі SDS. За даними Альянсу активного архіву, відносна вартість зберігання одного петабайту архівних даних у системі флеш-пам'яті становить $3,5 млн, для мережевого сховища (NAS) – $2,6 млн, а для Amazon S3 – $1,5 млн. на стрічці коштує лише $107K.
Війна
А потім прилітають «чорні лебеді» та вносять виправлення у звичну логіку. Початок масштабних бойових дій у країні призвело до вимушеної еміграції персоналу, релокації компаній та транзиту їхньої ІТ-інфраструктури в «далекі хмари». Ситуативні рішення виправдовуються ризиками, але бізнес-те годує операційна діяльність, при всіх страхах. У своєму інтерв'ю «Не поспішайте на захід: чи все так однозначно з міграцією в закордонні хмари» Геннадій Карпов, директор з технологій De Novo, нашого хмарного оператора #1, зважує технологічні та поведінкові мотиви переселенців. Для тих, хто залишився в Україні, раціонально розміщувати ІТ-сервіси поряд, у поєднанні з «холодною» реплікою на Заході та можливістю самостійного відновлення даних.
Прильоти, віялові відключення електрики, свавілля податківців загрожують бізнесу незалежно від того, де знаходяться його дані. Навпаки, автономність інформаційних потоків від зовнішніх сервісів та обставин непереборної сили стає важливим фактором виживання. Компанії запасаються генераторами, переглядають показники RTO/RPO, правлять політики резервування та відновлення даних – змушують обставини. "Ніхто не хотів помирати".
Здоровий глузд
Хмара – сила в ІТ, а ринок публічних хмарних послуг продовжить розширюватись.
Залишається складним розрахунок реальної вартості перенесення будь-якого робочого навантаження в хмару і навпаки - витрати сильно відрізняються в залежності від типу сервера, кількості віртуальних машин і ядер CPU, обсягу оперативної пам'яті та вибору гіпервізора, ОС та ядра СУБД, типу сховища, витрат на міграцію, плати за консультації. Для точного порівняння з хмарним TCO потрібне глибоке розуміння наземного – як прямих (обладнання, ліцензії), так і непрямих витрат (електропостачання, кондиціювання, зарплати персоналу).
Зустрічний тренд на репатріацію даних свідчить, що немає правильного чи неправильного підходу до хостингу даних. Більшість підприємств виграє від балансу різних сервісів та інфраструктури, що відповідає конкретним робочим навантаженням (які можуть змінюватись згодом).
Гібридне розміщення, багатохмарні середовища, локальна інфраструктура - вибір хороший, коли власник бізнесу все зважив і приміряв "ефективність" на свої обставини. Поженешся за модою або натовпом, скажуть: «Яке їхало, таке здибало».