Применение Big Data в медицине

Аспирант МГУ, научный журналист Николай Козин разобрался, как работают большие данные (Big Data) в медицине.

Big Data

Впервые термин «большие данные» (Big Data) употребил в 2008 году британский журнал Nature, посвятивший специальный номер феномену взрывного роста объема и разнообразия обрабатываемых данных. 

В следующие годы большие данные стали одним из доминирующих направлений в развитии информационных технологий. Предполагается, что работа с колоссальными объемами неструктурированных данных окажет наибольшее влияние на производство, госуправление, торговлю и медицину.

Первая биомедицинская революция была связана с с появлением микроскопии и с внедрением научного подхода в клинические исследования. Эксперты предсказывают, что большие данные совершат «вторую революцию», и приведут в огромному качественному скачку в системе здравоохранения. 

Что же большие данные могут дать медицине? Станут ли они панацеей или не оправдают надежд, как универсальные анализаторы крови от Theranos?

Насколько велики большие данные

Массив информации оценивают как большие данные, только если он настолько объемен, что его становится затруднительно хранить, обрабатывать и анализировать.  

Производственные мощности компьютеров по-прежнему растут, но не так стремительно, как еще десять лет назад. А вот количество цифровой информации растет угрожающими темпами.

По прогнозам корпорации ЕМС, объем сгенерированных человечеством данных к 2020 году составит 40 зеттабайт. Сколько это? 

Количество песчинок на всех пляжах Земли составляет 700 500 000 000 000 000 000 (или семь квинтильонов пять квадриллионов). 40 зеттабайт - это в 57 раз больше байт, чем количество песчинок на всех пляжах планеты.

На самом деле, под термином Big Data специалисты подразумевают не какой-то конкретный огромный объем данных, а методы их обработки. 

Существуют десятки, если не сотни разнообразных методик анализа данных, в основе которых лежит инструментарий, заимствованный из информатики (например, машинное обучение), маркетинговых исследований (A/B-тестирование), статистики (регрессионный анализ). 

Не вдаваясь в дебри определений и схем, подробнее разберем практические результаты Big Data в медицине.

Зачем врачам и фармацевтам большие данные 

В будущем история всех медицинских «манипуляций» с рождения человека будет храниться в электронной базе. 

Алгоритмы машинного обучения, которые умеют находить статистические корреляции в огромном всемирном массиве медицинских данных, будут оперативно выдавать прогнозы и рекомендации для пациента и его лечащего врача.

Основные стратегии применения больших данных в медицине

  1. Создание реестров медицинских данных, в которых можно обмениваться информацией.
  2. Использование накопленной информации для прогнозирования возможных «волн» заболеваний.
  3. Внедрение электронной карты для пациента, которая будет доступна каждому врачу, который его лечит.


Big Data и медицинские прогнозы

Медицинский прогноз

Анализ всех известных историй болезни и диагностики позволит ввести в практику врачей системы поддержки принятия врачебных решений. Доктора получат доступ к опыту десятков тысяч коллег по всему миру.

1. Прогнозирование развития болезней

Данные электронных медкарт уже позволили врачам установить связь между, казалось бы, принципиально различными заболеваниями. Разработанная в 2013 году консорциумом Kaiser Permanente система оценки риска позволяет сделать прогноз о развитии слабоумия у пациентов с сахарным диабетом.

Используя такую же модель, американские военные пытаются уменьшить количество самоубийств среди ветеранов войн.

2. Выявление генетических маркеров в онкологии

Ученые из Университета Кейптауна UCT, проанализировав наиболее распространенные виды онкологических заболеваний, пришли к выводу, что каждый из этих видов рака характеризуется отчетливо выраженной комбинацией генов.  

Оказалось, что рака груди, кишечника, легких, яичников и мозга есть отчетливые генетические маркеры. По словам руководителя исследования, команда не смогла бы совершить открытие, если бы у нее не было доступа к массивам больших данных.

3. Прогнозирование состояния здоровья младенцев

Детская больница Торонто внедрила проект Project Artemis. Больничная информационная система собирает и анализирует данные по младенцам в реальном времени. Система может ежесекундно отслеживать 1260 показателей состояния каждого ребенка, позволяет прогнозировать нестабильное состояние, и вовремя начать профилактику заболеваний у детей.

4. Прогнозирование факторов риска в хирургии

Врачи Главного Массачусетского госпиталя используют аналитическую систему QPID, чтобы контролировать важную информацию о пациенте на протяжении курса лечения. Другое применение системы QPID в здравоохранении — прогнозирование хирургического риска. 

«Даже известные на весь мир хирурги без большого энтузиазма будут оперировать пациента, который с высокой долей вероятности может умереть на столе», — прокомментировал возможность делать хирургические прогнозы доктор Дэвид Тинг, заместитель директора по информационным системам Массачусетского главного госпиталя. 

Система QPID выполняет автоматический поиск протоколов лечения, после чего выводит на экран результаты с рассчитанным красным, желтым или зеленым индикатором риска.

Big Data и обработка медицинских данных

IBM Watson

Петабайты медицинской информации формируют массивы больших данных. Всю эту информацию можно «скормить» суперкомпьютеру IMB Watson. Проанализировав данные о лечении большого числа пациентов, суперкомпьютер помогает врачу подобрать наилучшее лечение для конкретного человека.

Весной 2015 года Apple и IBM анонсировали совместный проект по использованию больших данных в сфере здравоохранения. Две корпорации работают на единой платформе, которая позволяет владельцам iPhone и Apple Watch отправлять собранные в ходе использования сведения в Watson Health — сервис IBM по медицинской аналитике.

Big Data и фармация

Большие данные и искусственный интеллект уже сейчас широко применяются в фармацевтическом производстве и маркетинге лекрств. Как правило, говорят о чертырех основных сферах применения Big Data в фармации.

1. Создание новых лекарственных препаратов

Наибольший эффект от Big Data ожидается в моделировании новых лекарственных препаратов. Сегодня в этом направлении работает IT-компания Semantic Hub, которая занимается разработкой сервисов для оценки перспектив развития новых препаратов.

2. Сбор клинических данных о пациентах

Фармпроизводители стремятся получить доступ к медицинским данным пациентов и наперегонки заключают сделки с технологическими компаниями, сведущими в области анализа больших данных.  

Свежий пример  объявленная в феврале 2018 года сделка фармхолдинга Roche. В рамках этой сделки компания за $2 млрд приобретает все акции стартапа Flatiron Health, специализирующегося на сборе клинических данных онкологических пациентов.

3. Улучшение качества клинических испытаний

Используя технологии Big Data, компании могут сделать клинические испытания более эффективными. Из нескольких баз данных аналитические системы могут отбирать пациентов, которые наиболее полно отвечают предварительным требованиям испытания препарата. 

Благодаря достижениям телемедицины – гаджетам и носимым устройствам - исследователи смогут осуществлять мониторинг добровольцев в режиме реального времени. 

4. Выявление побочных эффектов от лекарств

Большие данные также применяются в прогнозировании побочных эффектов для конкретных соединений и компонентов еще до начала клинических испытаний. Ведь, когда начнутся испытания на людях, может быть слишком поздно. 

Используя аналитический метод, который включает проверку десятков различных характеристик лекарственных препаратов, компании могут сэкономить время, деньги и сохранить жизни пациентов.

Данные о реальной практике применения препаратов собираются вне рамок традиционных рандомизированных клинических испытаний, которые сегодня являются основой тестирования лекарств, и интерес к этой сфере стремительно растет. 

Число испытаний с анализом больших данных за 2017-й год перевалила 300, сообщает агентство Reuters (со ссылкой на сайт международных клинических исследований clinicaltrials.gov).

Критика концепции больших данных

Критика больших данных

Будет неправильно утверждать, что большие данные — ключ к абсолютно всем полезным знаниям. При извлечении из огромного массива данных нужной информации возникают несколько четыре существенных затруднения. 

1. Неструктурированные данные

Для текстовой информации можно использовать давно разработанные алгоритмы поиска. Но как быть, если это запись речи или видео? Если решать задачу «в лоб» — распознавать речь и превращать ее в текст, объемы данных получатся слишком большими. 

Как в такой лавине данных найти полезную информацию? Примерно 78% медицинских данных не структурированы, фильтровать и анализировать такие объемы информации слишком дорого.

2. Обилие лишней информации

Эксперты в области больших данных считают, что многие проекты по использованию Big Data, не только в медицине, оканчиваются неудачей именно из-за того, что среди данных очень много «шума». 

Сам сбор информации сегодня ничего не стоит: хранение данных обходится дешевле, чем уничтожение. Но обилие несущественных информации может привести аналитические системы к ложным выводам. Например, о ложной зависимости между возникновением заболевания и внешними факторами.

3. Отсутствие единого стандарта ведения истории болезни

Информационным компаниям необходимо создать единый протокол обмена медицинскими данными, которого пока нет. Чем больше будет доступной и стандартизованной медицинской информации из самых разных стран мира, тем точнее будет аналитическое описание болезней и прогнозы.

4. Высокий риск искажения информации

Некоторые критики даже полагают, что Big Data  один большой обман. Шквал негодования обрушился на большие данные после нашумевшего провала Google Flu Trends. 

Проект от Google пропустил эпидемию 2013 года в США и исказил информацию о ней на 140%. Тогда ученые из нескольких американских университетов выявили, что за последние два года работы анализ чаще показывал неправильные результаты. 

Одна из причин появление ошибок — изменение самого поискового инструмента Google, что привело к сбору разрозненных данных.

Перспективы развития больших данных за рубежом 

Перспективы больших данных

Несмотря на критику, внедрение больших данных в медицинскую практику в западных странах идет ускоренными темпами. Главным технологическим промотором этого процесса является повсеместный переход на электронные медицинские карты. 

Согласно исследованию HITECH, в США более 94% больниц использует электронные медкарты. Страны Европы немного отстают от заокеанских партнеров, но Еврокомиссия выпустила директиву, которая призвана в корне изменить ситуацию. 

Предполагается, что к 2020 году европейская централизованная система медицинских записей станет реальностью.

Консультанты Deloitte Centre считают, что уже к 2020 году большие данные полностью изменят медицину: благодаря гаджетам пациенты будут знать о своем здоровье практически все, и смогут лично участвовать в выборе оптимального лечения. 

С помощью больших данных и машинного обучения будет разработана обучающаяся система здравоохранения, прогнозирующая, к примеру, реакцию конкретного пациента на лучевую терапию.

Перспективы развития больших данных в России

Об успешном продвижении Big Data в российском здравоохранении говорить пока не приходится. На прошедшей в сентябре 2017 года конференции «Доступная медицина: время перемен. Инновации, тренды, перспективы» IT-предприниматели высказывали пессимизм по поводу развития технологии. 

Участники рынка говорили об отсутствии в законодательстве РФ мотивации для частных инвесторов вкладывать средства в обработку медицинских данных.

Заместитель директора Фонда развития интернет-инициатив Искандер Нурбеков полагает, что в итоге отечественный рынок займут иностранные IT-сервисы. 

Другие спикеры обращали внимание, что возможные риски для пациентов от не просчитаны, и необходимо решить очень многие юридические вопросы. Например, до сих пор не ясно, кому предъявлять претензии, если использование Big Data привело к негативным для здоровья результатам.

И тем не менее: существует положительная динамика в применении Big Data в медицине как в нашей стране, и во всем мире. Просто продолжаем наблюдать.

  • 723

Оставить комментарий

Читайте также