Против течения. Репатриация данных

30.12.2022 | Решения

В облаке удобно - нет привязки к серверному оборудованию, проблем его подбора, размещения, сопровождения. Облачные вычисления снимают с ИТ-персонала часть текущих задач обслуживания и поддержки. Однако же, многие компании хотели бы оптимизировать производительность. А еще полностью контролировать данные. И сэкономить – в облаке дорого.  Достойные цели в наше неритмичное время.

Встречная полоса

Привлекательность облака зависит от сути бизнеса. Пока одни уходят в публичные облака, другие возвращают приложения и данные в свои дата-центры или в частные облака на ближних площадках. Обычно приводят в пример сервис хранения данных Dropbox, который к 2017 году перерос AWS - с более чем 500 миллионами пользователей AWS стал для него обременителен. После переноса данных клиентов в собственную инфраструктуру только за первые два года Dropbox сэкономил около 75 миллионов долларов.

Первопричина исхода из общедоступных сервисов - высокая стоимость облака. Соотношение затрат и выгод идеально для стартапов, разработчиков, эластичного бизнеса или компаний с многоточечным присутствием. У зрелых предприятий с подготовленным персоналом и стабильными вычислительными потребностями другая мерка запросов.

Первые кандидаты на репатриацию - приложения, которые чувствительны к задержкам или работают с большими наборами данных. Неудовлетворенность производительностью в облаке обычно вызвана низкой пропускной способностью сети и сетевыми задержками – они ограничивают транспортировку данных и расторопность бизнеса.  Какой-нибудь умный город или разветвленная система сбора данных создают огромные потоки информации. Хотя облачные вычисления обеспечивают удобную платформу (вычислительную мощность, масштабируемое хранение), дешевле ставить локальные вычислители, чем гонять данные по глобальной сети. Если приложениям и базам данных требуется высокая доступность или избыточность, им тем более показаны частные (или гибридные) облака.

Поехали!

Опрос 451 Research шести сотен ИТ-руководителей предприятий-мигрантов, проведенный в 2021 году, показал, что 48% перенесли приложения или рабочие нагрузки от гиперскейлеров AWS, Microsoft Azure или Google Cloud Platform поближе к себе: 86% решили запускать приложения и рабочие нагрузки в своих собственных центрах обработки данных, 14% переместили их в колокейшен. Оставшиеся 52 % умеренных кочевников выбрали изолированное частное облако, меньшего поставщика общедоступного облака или размещение на стороннем железе.

Сетевые задержки и «гравитация данных»

Облако обеспечивает эластичность хранилища и нагрузок, но его работа зависит от подключения к Интернету – то есть, сетевых задержек. Такие приложения как резервное копирование и восстановление, электронная почта и офисный серфинг не слишком чувствительны к задержкам – в отличие от аналитики реального времени, баз данных, приложений безопасности и сбора данных.

 

Сокращают зависимость от скорости отклика периферийные вычисления (edge computing) – первичная обработка данных  по месту создания, кэширование и оптимизация сети. Самое простое решение - возврат данных внутрь компании, снижение зависимости от каналов связи,  настройка хранилища, вычислений и сети под приложения и рабочие нагрузки, силами своего персонала. При анализе трафика пользуются термином «гравитация данных»: если большая часть данных находится в облаке и обработка выполняется тоже в облаке, то и оснований для миграции нет. Если данные постоянно перемещаются между облаками и локальным хранилищем или вычислительными ресурсами, «надо ехать».

Объемное хранение

Особенно дорого в облаке обходится хранение данных - не так сама стоимость размещения, как передача объемной информации, плата за трафик. IDC прогнозирует, что общее количество данных в мире увеличится до 175 зетабайт к 2025 году, и что 80 процентов этих данных будут неструктурированными, будь они сгенерированы устройствами (видеонаблюдение, регистрация событий, телеметрия) или людьми (электронная почта и мультимедийные телефонные сообщения, аудиофайлы, видеофайлы, текстовые файлы, сообщения в социальных сетях).

Облачная репатриация стала естественной реакцией на рост расходов, связанных с перемещением и хранением данных. Даже при использовании оптоволоконных сетей для переноса больших массивов данных куда-нибудь потребуются месяцы, если не годы. Так родилось и окрепло направление периферийных вычислений. Это же происходит с развитием систем искусственного интеллекта. Компании все чаще переходят на гибридную инфраструктуру, частично с хранением в облаке, с приземлением основных потоков данных приложений в локальное хозяйство.

Продавец Teezily сэкономил 400K евро в год на инфраструктуре хранения, когда переместил 450 ТБ данных с AWS S3 в полностью автономный кластер на основе SDS. Согласно данным Альянса активного архива, относительная стоимость хранения одного петабайта архивных данных в системе флэш-памяти составляет $3,5 млн, для сетевого хранилища (NAS) - $2,6 млн, а для Amazon S3 - $1,5 млн. Хранение той же информации на ленте стоит всего $107K.

Война

А потом прилетают «черные лебеди» и вносят правки в привычную логику.  Начало масштабных боевых действий в стране привело к вынужденной эмиграции персонала, релокации компаний и транзиту их ИТ-инфрастрактуры в «дальние облака». Ситуативные решения оправдываются рисками, но бизнес-то кормит операционная деятельность, при всех страхах. В своем интервью «Не поспішайте на захід: чи все так однозначно з міграцією в закордонні хмари» Геннадий Карпов, директор по технологиям De Novo, нашего облачного оператора #1, взвешивает технологические и поведенческие мотивы переселенцев. Для тех, кто остался в Украине, рационально размещать ИТ-сервисы тут же, в сочетании с «холодной» репликой на Западе и возможностью самостоятельного восстановления данных.

Прилеты, веерные отключения электричества, произвол налоговиков гробят бизнес вне зависимости от того, где находятся его данные. Наоборот, автономность информационных потоков от внешних сервисов и обстоятельств неодолимой силы, становится важным фактором выживания. Компании запасаются генераторами, пересматривают показатели RTO/RPO, правят политики резервирования и восстановления данных - заставляют обстоятельства. «Никто не хотел умирать».

Здравый смысл

Облако - сила в ИТ, а рынок публичных облачных услуг продолжит расширяться.

Остается сложным расчет реальной стоимости переноса любой рабочей нагрузки в облако и наоборот - расходы сильно разнятся в зависимости от типа сервера, количества виртуальных машин и ядер CPU, объема оперативной памяти и выбора гипервизора, ОС и ядра СУБД, типа хранилища, затрат на миграцию, платы за консультации. Для точного сравнения с облачным TCO требуется глубокое понимание наземного – как прямых (оборудование, лицензии), так и косвенных расходов (электроснабжение, кондиционирование, зарплаты персонала).

Встречный тренд на репатриацию данных говорит о том, что нет правильного или неправильного подхода к хостингу данных. Большинство предприятий выиграет от баланса различных сервисов и инфраструктуры, отвечающей конкретным рабочим нагрузкам (которые могут меняться со временем).

Гибридное размещение, многооблачные среды, локальная инфраструктура – выбор хорош, когда владелец бизнеса все взвесил и примерил «эффективность» на свои обстоятельства. Погонишься за модой, скажут: «Яке їхало, таке здибало».