Наши специалисты — Максим Трегубов, ведущий системный инженер, и Роман Корешков, руководитель проектов дирекции развития технологий, — прокомментировали перспективы использования технологии больших данных в системе здравоохранения Московского региона для новостного портала РБК. Как можно оценить подобную инициативу госструктур? Какие задачи возможно решить с применением анализа больших данных? Каков оптимальный человеческий ресурс для решения этих задач? Ответы на эти вопросы — в материале «Использование технологий Big Data в системе здравоохранения Москвы».

РБК: Какие задачи можно было бы решать такими силами? Что нужно для того, чтобы решить такого рода проблемы и не многовато ли для этого 50 аналитиков? Оцените ресурсы и общую перспективность задачи в области анализа больших данных в здравоохранении.

Максим Трегубов: То, что государственные структуры всерьез заинтересовались использованием технологий Big Data, в том числе в сфере здравоохранения, можно оценивать только положительно. На Западе применение анализа больших данных в медицине уже несколько лет приносит хорошие результаты. Причем благодаря данной технологии решаются самые разные классы задач: можно создавать новые медицинские услуги, повышать адресность их оказания, делать работу медицинских учреждений и отдельных специалистов более прозрачной и результативной. На основе технологий больших данных уже сегодня создаются алгоритмы, помогающие врачам принимать более эффективные решения при диагностике и назначении лечения.

Одним из ярких примеров является медицинская система IBM Watson, служащая для назначения оптимального лечения рака легких. Программа действует на основе выявленных ранее закономерностей при анализе тысяч медицинских документов и учитывает самые мелкие детали в медицинских картах пациентов. Компания утверждает, что если в среднем точность назначения лечения после диагностирования рака в больницах США составляет около 50 %, то с помощью данной технологии этот показатель удалось увеличить до 90 %.

Технологии анализа больших данных также успешно применяются для предсказания эпидемий вирусных заболеваний, например гриппа, и последующей разработки более эффективных методов профилактики.

Что касается конкретного проекта Правительства Москвы, то сложно оценить соответствие заявленных привлекаемых ресурсов поставленным целям и задачам, поскольку эти самые цели и задачи пока не очень четко обозначены, что делает не очень ясным и масштаб этой работы. Для выстраивания эффективных бизнес-процессов в учреждениях здравоохранения Московского региона заявленные потребности в аналитиках кажутся соответствующими или даже завышенными, а для глобальных проектов типа IBM Watson такого числа специалистов было бы явно недостаточно.

Кроме того, учитывая, что в России уже есть компании, которые специализируются на анализе больших данных (в частности «Яндекс», с которым Правительство Москвы уже работает по другим проектам), то государственные структуры могли бы обратиться к ним за оказанием подобной услуги. Но Правительство Москвы набирает собственный штат таких специалистов, что наводит на мысль о существовании у этого проекта и другой долгосрочной цели — на примере задач здравоохранения нарастить компетенции по анализу больших данных в различных областях.

Роман Корешков: Адекватность размера команды, очевидно, зависит от поставленных задач. Медицинские аналитические задачи могут быть различных типов в зависимости от уровня зрелости (по возрастанию):

С ростом зрелости задач увеличивается и сложность аналитической системы и алгоритмов, а также количество необходимых источников данных — от простых сведений из историй болезни и данных биометрического мониторинга до геномных и семейных данных и даже до информации из социальных сетей. Если предположить, что команда собирается на длительную перспективу с целью создания зрелого решения, то 50 человек не представляется слишком большим ресурсом.