Как облачные технологии помогают побеждать рак и меняют мир
Расширенный доступ к вычислительным мощностям позволяет исследователям отвечать на огромное количество вопросов. Это, в свою очередь, приводит к новым прорывам и открытиям. Вкратце, ни одно другое технологическое нововведение не сделает для анализа данных больше, чем облачные вычисления. Они обеспечивают дешёвую и эффективную вычислительную мощность в беспрецедентных масштабах.
Публичные облака развиваются огромными темпами. Доступ к неограниченным вычислительным мощностям позволил компаниям разрабатывать такие решения, о которых раньше никто не мог и подумать. Отдельным примером является компания Compendia Biosciences. Она начала использовать облака для своей аналитической платформы по исследованию рака ещё в 2012-м году.
Compendia Bioscience
В 2011 году Compendia Biosciences (теперь часть ThermoFisher Scientific) разрабатывала платформу для анализа образцов РНК из The Cancer Genome Atlas (TCGA). TCGA является совместным с Национальным институтом здравоохранения (NIH) проектом, который использует секвенирование генома и биоинформатику для создания каталога вызывающих рак генетических мутаций. Compendia Bioscience, в свою очередь, разрабатывает комплексное решение для выявления признаков рака и общих факторов риска.
Проблема
К сожалению, масштабов вычислительной мощности для исследований компании было недостаточно. А если их и хватало, то оплатить подобное не представлялось возможным. Compendia Bioscience планировала проанализировать около 10000 образцов опухоли и заражённой РНК. Общий объём данных составлял порядка 600-а терабайт, а для их исследования на локальных серверах ушли бы годы. И это даже при условии, что машины обрабатывали бы данные постоянно и только для Compendia Bioscience.
Решение
Чтобы обойти вычислительные ограничения, компания задействовала общественное облако в 2012 году. Для управления облачной инфраструктурой использовалось ПО CycleCloud от Cycle Computing. Это помогло создать автоматически масштабируемый вычислительный кластер, который можно было расширять при необходимости. Компания выполняла абсолютно все вычисления на нём. А особенности облачной среды позволяли запустить анализ, приостановить его для записи определённых данных и перезапустить через некоторое время.
Оцените масштаб: на пике исследования алгоритм Compendia использовал более 8000 ядер и 2000 виртуальных машин одновременно. Данные постоянно забирались из хранилища The Cancer Genome Atlas, анализировались и преобразовывались. А когда подсчёты были закончены, выходные данные загрузились в среду Compendia. К концу 2012 года компания выполнила несколько групп подсчётов, которые охватывали 4178 образцов опухолей и 19 типов рака.
Наиболее важно то, что все аналитические активности были произведены за 20 дней. Без облачных технологий подобное заняло бы 15,6 лет. Подсчёты помогли Compendia Biosciences разработать более эффективные методы идентификации генов, а также охарактеризовать частоту и распределение 31-го слияния генов и 100-а ранее неизвестных пар генов... Ну и, конечно же, более тонко разобраться в особенностях раковых опухолей.
Что изменилось в сфере облачных вычислений?
В 2012-м году публичные облака уже выделялись на фоне остальных технологий своей простотой и относительной дешевизной. С тех пор способности public cloud значительно расширились. Положительные изменения происходят и сейчас.
Значительно улучшенная производительность. Провайдеры облачных решений продолжили адаптировать новейшие технологии под потребности публичных облаков. Современные процессоры, GPU-обработка и сети с малой задержкой - все они когда-то были недоступными для применения в индустрии облачных вычислений, но теперь их можно использовать в public cloud.
Масштабируемость. Все основные облачные провайдеры добавили вычислительные мощности, расширили системы хранения данных и увеличили пропускную способность сетей для предоставления услуг лучшего качества.
Но, пожалуй, ничто не иллюстрирует масштабы развития облачных технологий так хорошо, как завершённый в 2013-м году проект доктора Марка Томпсона из Университета Южной Калифорнии. Профессор и его сотрудники занимались поиском материала для создания нового поколения дешёвых и высокоэффективных солнечных панелей. Для осуществления подсчётов вручную требовалось 264 года. Но Томпсон использовал облачные вычисления и проанализировал 200000 видов разнообразных компаундов за 18 часов. А вот стоимость рассматриваемого исследования составила $33000, что совсем немного, если речь идёт о науке и вероятных тысячах часов подсчётов.
В заключение
Облачные технологии проникли во все сферы жизни человека. Если обычные юзеры подразумевают под облаками хранилища данных, то учёные считают их высокомощными системами. Действительно, совсем недавно анализ данных производился либо вручную, либо на локальных серверах. Процесс был настолько длительным, что такое простое для cloud computing явление, как расчёт полёта ракеты, считалось сверхъестественным. Облака же изменили мир. Они помогают делать его лучше и превращают «сверхзадачи» в обычный рабочий процесс. Мы считаем, что со временем все вычисления будут производиться в облаке. Ведь это не только дёшево, но и быстро, а также эффективно и точно.
Екатерина СУХОБОК,
облачный провайдер Tucha.ua
Специально для UAINFO
Повідомити про помилку - Виділіть орфографічну помилку мишею і натисніть Ctrl + Enter
Сподобався матеріал? Сміливо поділися
ним в соцмережах через ці кнопки