OpenTalks.AI: наука

7 февраля 2018 года открылась первая в России конференция по искусственному интеллекту OpenTalks.AI.

Редакция Medical Note подготовила краткий дайджест с первого дня конференции, посвященной искусственному интеллекту.

День  

У OpenTalks.AI сразу несколько особенностей. Во-первых, конференция построена по принципу сообщества - доклады выбирались на конкурсе. Во-вторых, OpenTalks.AI не зависит ни от бизнеса, ни от государства. В-третьих, конференция большая: 150 компаний, 88 спикеров, 11 стартапов - всего 550 участников!

Но самое важное - то, ради чего все затевалось. Организатор конференции Игорь Пивоваров поставил амбициозную цель - создать русский проект по искусственному интеллекту. Через 4 месяца после OpenTalks.AI откроется вторая, закрытая конференция, на которой 400 участников за 3 дня создадут научную группу (и разработают программу) по ИИ в России.  

Заставка

Редакции Medical Note удалось побывать на англоязычной презентации Рева Лебаредяна из NVIDIA, на секциях “Компьютерное зрение”, “Естественный язык и речь”, “Анализ данных и предиктивная аналитика”, и на специальном выступлении нейробиолога Константина Анохина.

Рев Лебаредян, вице-президент NVIDIA: Стратегия в области ИИ

Рев Лебаредян из компании NVIDIA занимается сверхпроизводительными вычислениями для 3D-графики. Основная область интересов NVIDIA - компьютерные игры.  

Рев Лебаредян и организатор конференции Игорь Пивоваров
Рев Лебаредян и организатор конференции Игорь Пивоваров

Рев рассказал, что главная цель создателей компьютерных игр - добиться максимальной реалистичности и правдоподобности виртуального мира. Но “сделать реалистичнее” на практике означает - сделать дороже. 

На помощь создателям игр приходит ИИ,  помогающий создать максимально правдоподобный мир без невероятных затрат. ИИ умеет:

  1. Объединять картинку и стиль графического изображения, создавая принципиально новое произведение - например, покрашенный в корпоративные цвета логотип;
  2. Масштабировать изображение по принципу 4k upscaling - то есть создавать большую картинку из маленькой;
  3. Изменять текстуры волн, скал или кожаных диванов - так, чтобы они были однородными, но всегда чуть-чуть различались;
  4. Моделировать сложное поведение персонажей компьютерной игры:
  • анимировать лица персонажей - для этого ИИ достаточно проанализировать изображения всего с одной видеокамеры, снимающей лицо актера;
  • совмещать запись голоса человека с движением губ персонажа - при этом один алгоритм ИИ обрабатывает движения губ, второй - выражение лица;
  • моделировать эмоции в зависимости от эмоциональной окраски аудиозаписи;
  • заставлять персонажа реагировать на изменения мира вокруг - прыгать по скалам и плавать в воде, изменяя его походку в зависимости от препятствий.

Современные технологии позволяют создателям компьютерных игр делать много копий ИИ, объединять их внутри одного игрового “движка” и обучать различным задачам. Один ИИ отвечает за текстуры, второй - за движения персонажа… И так - до тех пор, пока мир не станет полностью реалистичным! 

Мы постепенно движемся к слиянию виртуального и реального миров. Пожалуй, это хорошо. Рев Лебаредян считает, что жить в таком мире будет безопаснее - хотя бы потому, что искусственный интеллект может предотвратить столкновение автомобилей на дороге.

Компьютерное зрение

Участники конференции готовятся к секции “Компьютерное зрение”
Участники конференции готовятся к секции “Компьютерное зрение”

Computer Vision — наука о создании алгоритмов, которые создают изображения, анализируют их и ищут в них полезную информацию. Например, позволяют подобрать идеальный цвет волос или классифицировать товары в интернет-магазине по какому-то определенному признаку.

Сегодня технологии компьютерного зрения востребованы бизнесом: это и компьютерные игры, и 3D-моделирование, и “персональная мода”, и каталоги интернет- и офлайн-магазинов.

Виктор Лемпицкий, Skoltech: Почему сверточная нейронная сеть так хорошо создает реалистичные изображения

Виктор Лемпицкий рассказывает о создании реалистичных изображений
Виктор Лемпицкий рассказывает о создании реалистичных изображений

Виктор Лемпицкий из Сколковского института науки и технологий рассказал об алгоритмах работы сверточных нейронных сетей. Эти однонаправленные, принципиально многослойные нейронные сети умеют эффективно распознавать даже самые сложные изображения.

Обучаются сверточные нейросети несколько дней, а то и недель, поскольку для обучения используются огромные дата-сеты с миллионами параметров. После обучения сеть способна “достраивать” изображения с небольшим числом пикселей до больших и подробных картинок с огромным числом пикселей. Причем обученная на определенных фотографиях сеть способна увеличивать фотографии, которые “видит” впервые.

Правильно настроенной сверточной нейросети не страшен цифровой шум, “засветы” от вспышек, повреждения на архивных фотографиях и наложенный поверх изображений текст. Качество обработки изображения зависит от числа “подходов к снаряду”, которые сделает нейросеть. Наилучшего результата можно добиться за 2000 итераций.

В будущем нейросети объединятся с компьютерной графикой. Это позволит создавать все более и более совершенные программы и приложения для обработки иллюстраций и фотографий.

Михаил Беляев, CoBrain: Глубокое обучение для нейровизуализации

Михаил Беляев объясняет, как нейросеть работает с МРТ-изображениями
Михаил Беляев объясняет, как нейросеть работает с МРТ-изображениями

Михаил Беляев работает в проекте CoBrain по изучению работы головного мозга. Михаил - руководитель группы разработки алгоритмов обработки данных о головном мозге человека, полученных при помощи МРТ.

Михаил рассказал, как его группа учит ИИ распознавать патологии на медицинских МРТ-изображениях. Это не так просто, поскольку у медицинских изображений мозга есть ряд отличий от классических “картинок из интернета”.

Во-первых, все изображения строго стандартизированы - ориентированы в одном направлении и всегда одного размера (правда, довольно маленького, если судить по числу пикселей). Во-вторых, выборка таких изображений очень мала. По счастью, инсульт все-таки не настолько частое событие, чтобы накопился огромный дата-сет его изображений. 

Однако ИИ все-таки способен распознать опухоль или инсульт - в первую очередь благодаря стандартизации и одинаковой ориентации изображений. Однако перед тем, как передать данные в нейросеть, их следует правильно подготовить. Это самая сложная задача. 

На этапе подготовки изображений нужна помощь экспертов-рентгенологов, а их оценки могут заметно различаться. Поэтому, чтобы получать точные результаты, необходимо привлекать все больше и больше экспертов. Кроме того, нужно правильно фрагментировать и разметить данные - фактически подсказать ИИ, где и что надо искать на МРТ-изображении.

Тем не менее, использование ИИ в медицине - перспективное направление. ИИ уже активно помогает гистологам: точность определения патологии на снимках человеческих тканей у нейросети достигает 90%.

Ольга Перепелкина, Neurodata Lab: Автоматическое распознавание эмоций: мультимодальный подход

Ольга Перепелкина рассказывает об “эмоциональных” нейросетях
Ольга Перепелкина рассказывает об “эмоциональных” нейросетях

Ольга Перепелкина - главный научный сотрудник в Neurodata Lab - компании, которая занимается машинным обучением и распознаванием эмоций для масс-маркета, интернета вещей, индустрии развлечений и цифровой медицины. Сейчас там создают мультимодальный ИИ, который умеет распознавать эмоции по нескольким каналам - по выражению лица, “на слух” и по положению тела.

Ольга рассказала, что базовые работы по распознаванию эмоций машиной появились еще в 1995 и 2009 году. Именно тогда исследователи выяснили, что человек в принципе может распознать эмоцию только по голосу, или только по выражению лица. Однако если учитывать все каналы восприятия, распознавание происходит быстрее.

В большинстве исследований ИИ учат распознавать эмоции только по выражению лица. Реже работают с аудиозаписями, а еще реже - с распознаванием текста и языка тела. Мультимодальных систем, которые работают со всеми каналами, пока совсем мало.

Чтобы научить ИИ работать со всеми каналами выражения эмоций, нужно собрать данные для обучения нейросети. Для этого в Neurodata Lab создали портал Emotion Miner, на котором участники проекта просматривают видео и распознают эмоции людей по позе, выражению лица и речи. Затем участники проекта составляют отчеты, на основе которых ученые потом обучают нейросеть. 

Кроме того, на нейросеть “работают” профессиональные актеры, изображающие эмоции, и гаджеты, сигнализирующие об эмоциональном состоянии участников эксперимента по сбору данных в тот или иной момент.

В любом случае, в тренде сегодня работа с натуральными, в том числе со смешанными эмоциями - ведь мы редко испытываем только гнев без примеси страха или смущения. Это особенно важно при работе в колл-центре - например, если нейросети приходится иметь дело с недовольными клиентами.

Алексей Воропаев, Поиск@Mail.ru: Визуальный поиск по фотографиям одежды и не только

Алексей Воропаев объясняет, как ИИ помогает продавать одежду
Алексей Воропаев объясняет, как ИИ помогает продавать одежду

Алексей Воропаев - технический руководитель отдела ранжирования результатов поиска Mail.Ru Group. Одна из важных задач, которая стоит перед компанией сегодня - научить нейросеть автоматически добавлять мета-информацию к фотографиям одежды.

Алексей рассказал, что для того, чтобы научить нейросеть работать с фотографией, нужно сначала научить ее распознавать отдельные атрибуты одежды: рукава, воротник, форму выреза. Поэтому обучать нейросети приходится на специально подготовленных каталогах.

Обученные на “атрибутированных” каталогах нейросети хорошо справляются с поиском похожих моделей одежды в интернете, причем способны извлекать и добавлять мета-информацию к той модели, фотографией которой располагает. Такой сетке достаточно “предложить” фотографию блузки, сделанную в Европе - и ИИ найдет в местном магазине максимально похожую на исходное изображение модель. 

Впрочем, подход универсален. Например, нейросети хорошо справляются с поиском автомобилей, выбирая машину нужной марки из множества похожих моделей.

Естественный язык и речь

Участники конференции общаются перед секцией о естественном языке
Участники конференции общаются перед секцией о естественном языке

Естественными называют языки, которые люди используют в повседневном общении. В отличие от формальных языков и знаковых систем, которыми пользуются машины, естественный язык эмоционально окрашен и имеет сложную структуру. 

Научить ИИ понимать естественный язык - важнейшая задача, которая стоит перед наукой и бизнесом. Обученная “человеческому” языку нейросеть сможет отличать положительные отзывы от отрицательных, поможет обрабатывать звонки и делать покупки в интернете.

Константин Воронцов, МФТИ: Обработка естественного языка и понимание речи

Константин Воронцов: самое сложное - это поиск смысла
Константин Воронцов: самое сложное - это поиск смысла

Константин Воронцов - профессор РАН, заведующий лаборатории машинного интеллекта МФТИ. Профессор занимается самыми сложными вопросами естественного языка - работой со смыслом сообщения.

Константин рассказал, что при обучении ИИ работе с речью очень важно соблюдать принцип ДНК: располагать Данными, знать, что нужно Найти, и понимать критерии Качества работы. Без этих составляющих работа заранее обречена на провал.

Правильно обученный ИИ справляется с:

  • обработкой звонков в колл-центре (в этом случае важно правильно настроить отбор признаков для нейросети: ИИ должен понимать, что ему нужны слова, связанные по смыслу с ипотекой или автомобилями);
  • классификацией отзывов по категориям (при этом возникает проблема несбалансированности семантических классов - в одном и том же отзыве на фильм может содержаться негативная оценка сюжета и восхищение по поводу операторской работы);
  • поиском текстовых документов не по ключевым словам, а по смыслу информации.

Тестовый ИИ интеллект уже научился справляться со смысловым поиском лучше, чем стандартный интернет-поисковик, который ищет информацию по ключевым словам в сообщении. Однако для большинства практических задач пока все еще хватает классических текстовых алгоритмов.

Михаил Бурцев, МФТИ: iPavlov: проект по созданию “говорящего” искусственного интеллекта

Михаил Бурцев объясняет, как научить бота говорить
Михаил Бурцев объясняет, как научить бота говорить

Михаил Бурцев - заведующий лабораторией нейронных сетей и глубокого обучения МФТИ и руководитель проекта iPavlov. Основная цель проекта - наладить полноценный диалог между человеком и машиной.

Михаил рассказал, что научить ИИ (чат-бота) вести осмысленный диалог - решаемая, хоть и сложная задача. Причем под каждый тематический чат ИИ придется учить отдельно. Перед созданием чат-бота нужно будет произвести тематический фрейминг - то есть собрать запросы пользователей для этого чата.

Затем надо будет настроить диалог-менеджер - решить, как будет интегрироваться новая (только что поступившая к боту от пользователя) информация с теми данными, которые у бота уже были. Только после этого бот будет “способен” решить, как поступить: сделать запрос в базу данных (к примеру, выдать пользователю список фильмов, которые сегодня идут в кинотеатрах), или сгенерировать уточняющий вопрос на естественном языке (например, поинтересоваться, где пользователь сейчас находится).

Сейчас в проекте iPavlov работают над автоматизацией диалогов и разработкой ботов (DeepPavlov), и над проектом Сбербанка, который поможет автоматизировать взаимодействия с клиентами банка (DeepReply). Однако в перспективе участники проекта iPavlov стремятся сделать ИИ универсальным - таким, чтобы его можно было “натренировать” под любые задачи.

Сергей Шумский, IQmen: Масштабируемое понимание естественного языка

Сергей Шумский: почему ИИ сложно обучать естественной речи
Сергей Шумский: почему ИИ сложно обучать естественной речи

Сергей Шумский - специалист в области машинного обучения и искусственного интеллекта, вице-президент Российской ассоциации нейроинформатики. Сооснователь IQmen - российской компании-разработчика инновационных технологий сбора, хранения и обработки структурированной и неструктурированной информации на различных языках мира.

Сергей рассказал, что обучение ИИ плохо масштабируется, поскольку естественный язык подразумевает большое количество параметров. Однако, чем больше параметров может воспринимать нейросеть, тем дольше ее приходится учить (от 5 дней до нескольких недель).

Поскольку смысловое пространство языка избыточно, при обучении ИИ выгоднее использовать более простые способы кодирования информации. Если уменьшить пространство смыслов, то, избавившись от языковой избыточности (при помощи морфологического и семантического кодирования), можно будет поэтапно наращивать сложность модели и глубину словаря нейросети.

После того, как нейросеть получает возможность работать с естественным языком, время ее обучения резко сокращается. А уже обученную нейросеть можно подключать для автоматического поиска по смыслу слова к привычному поиску по словарю. 

Андрей Тарасов, Спутник: Анализ тональности текстов с использованием технологии deep leaning

Андрей Тарасов рассказывает, как ИИ определяет эмоции в тексте
Андрей Тарасов рассказывает, как ИИ определяет эмоции в тексте

Андрей Тарасов работает в команде разработки российского веб-браузера Спутник.  В сфере его интересов - определение тональности отзывов на фильмы и мероприятия.

Андрей рассказал, что анализ тональности текста ИИ основан на определении структуры предложения. Однако при работе с русским языком нейросети приходится тяжело: ведь в нашем языке нет четкой структуры предложения с обязательным подлежащим и сказуемым. 

В результате, чтобы научить нейросеть анализировать отзывы, приходится использовать два подхода. В первом слова и эмодзи переводятся в понятные ИИ число-буквенные символы. Во втором применяется аспектно-сентиментальный анализ, при котором специалисты выделяют аспектные термины в предложении: то есть определяют, куда что относится. Например, какая часть отзыва на фильм посвящена игре актеров, какая - музыке в фильме, а какая - сценарию. “Размеченный” по параметрам текст и предоставляется ИИ для анализа.

Совместное применение обоих подходов позволяет обучить ИИ, чтобы он быстро справлялся с лингвистическим анализом. Если для такого анализа использовать классические лингвистические процессоры, тот же анализ займет гораздо больше времени.

Анализ данных и предиктивная аналитика

Перерыв между докладами
Перерыв между докладами

Предиктивная, или предсказательная аналитика - набор методов анализа данных, который позволяет прогнозировать поведение людей, живых или неживых объектов. Поскольку анализ большого объема данных занимает много времени, использовать ИИ для ускорения расчетов и уменьшения ошибок в предсказании - актуальная задача.

Анализ данных для предсказательной аналитики востребован в банковском деле, медицине, фармацевтике и торговле.

Андрей Устюжанин, Яндекс: Машинное обучение в физике высоких энергий для анализа результатов экспериментов

Андрей Устюжанин рассказывает, как ИИ помогает ученым
Андрей Устюжанин рассказывает, как ИИ помогает ученым

Андрей Устюжанин - руководитель совместных проектов Яндекса и CERN. Занимается вопросами применения ИИ в фундаментальных науках.

Андрей рассказал, как нейросети помогают ученым решать специфические научные задачи: например, изучать “темную материю” космоса. Исследовать темную материю очень тяжело, потому что она не испускает электромагнитного излучения и не взаимодействует с ним. А это означает, что доступные ученые приборы не способны ее измерять. 

При этом темная материя все-таки оставляет след во вселенной. Если бы ее не было, внешние области галактики вращались бы гораздо медленнее, чем это можно наблюдать. Но чтобы наблюдать за такими огромными и удаленными галактиками, требуются особые астрономические методы - например, метод расчета сильного гравитационного линзирования, который основан на эффекте искривления лучей, проходящих вблизи массивных объектов.

ИИ помогает рассчитывать параметры гравитационных линз, моделировать физические явления, возникающие при столкновении частиц с темной материей, и обнаруживать частицы темной материи - нейтрино - в электромагнитных ливнях. 

Теоретически ИИ способен помочь в создании огромных наземных обсерваторий. Чтобы создать “всемирную обсерваторию”, достаточно поставить на мобильные телефоны добровольцев со всего мира приложение, которое способно фиксировать следы нейтрино. 

Проблема лишь в том, что на разных мобильных платформах след нейтрино будет фиксироваться по-разному. “Выровнять” данные о нейтрино, полученные с мобильных телефонов разных моделей, снова поможет ИИ.

Дмитрий Ветров, ВШЭ: Открытые проблемы в глубинном обучении: Байесовское решение

Дмитрий Ветров: как Байесовское решение помогает ИИ работать лучше
Дмитрий Ветров: как Байесовское решение помогает ИИ работать лучше

Дмитрий Ветров - руководитель исследовательской группы байесовских методов ВШЭ, сотрудник Яндекса. 

Дмитрий рассказал, что такое байесовские методы, и объяснил, как они помогают бороться с проблемами, возникающими при обучении ИИ. Главные проблемы ИИ на сегодня:

  1. Переобучение - нейросеть легко распознает предметы из базы данных, по которым ее учили, не не приобретает способности обобщать признаки. В результате, когда ей дают другую базу данных с другими примерами, она не может выделить в них общие признаки. Переобучение возникает из-за чрезмерной подгонки сети к обучающим примерам.
  2. Интерпретация - мы до сих пор не понимаем до конца, как именно нейросеть обобщает данные и формирует результат. Получается, мы не можем доверить нейросети ответственные процессы вроде пилотирования самолета или управления химическим заводом. Если эту проблему не решить, юристы начнут тормозить научный прогресс.
  3. Неуверенность - мы не понимаем, когда нейросеть не до конца уверена в своем решении.
  4. Проблема критической уязвимости - слегка изменив входящие данные, можно резко повлиять на результат, которые выдаст нейросеть. Это может породить массу злоупотреблений со стороны хакеров и мошенников.

Разобраться почти со всеми этими проблемами помогает байесовская статистика (Bayesian framework), основанная на теории вероятности. Байесовский метод помогает искать значение неизвестной величины по косвенным данным. Причем чем больше косвенных данных - тем точнее результат. 

Применение байесовской методики позволяет работать не только с отдельно взятой нейросетью, но со всеми нейросетями вместе. Это помогает не только избежать проблемы переобучения, но и снимает проблему критической уязвимости. Ведь можно обмануть одну нейросеть - но не все сразу.

Евгений Бурнаев, Skoltech: Машинное обучение в индустриальной предиктивной аналитике

Евгений Бурнаев: ИИ и моделирование свойств промышленных объектов
Евгений Бурнаев: ИИ и моделирование свойств промышленных объектов

Евгений Бурнаев - заведующий сектором интеллектуального анализа данных и моделирования Института проблем передачи информации РАН. Ведет успешные промышленные проекты совместно с Airbus, SAFT, IHI и Sahara Force India Formula 1.

Евгений рассказал, как ИИ применяют для моделирования свойств технических сооружений. Например, при помощи нейросети можно успешно оптимизировать вес обшивки или спрогнозировать поломку силовой установки самолета.

В целом, технические задачи поручить ИИ не сложно - ведь базы данных по техническим расчетам уже давно готовы. Однако с этим есть ряд проблем:

  • иногда данные поступают из разных источников, поэтому имеют разный формат;
  • данные сами могут быть сложным объектом - например, 3D-моделью крыла или машины;
  • данные порой неудобно извлекать из хранилищ - например, если это сведения о физических характеристиках скальной породы, которая залегает глубоко под землей.

Впрочем, все эти проблемы преодолимы. Если данные разобрать на составляющие, разбить по группам признаков и обучить на полученной базе данных ИИ, нейросеть успешно справится со сложными промышленными задачами.

Анна-Вероника Дорогуш, Яндекс: CatBoost - новое поколение градиентного бустинга

Анна-Вероника Дорогуш рассказывает о градиентном бустинге
Анна-Вероника Дорогуш рассказывает о градиентном бустинге

Анна-Вероника Дорогуш - руководитель бригады Matrixnet Яндекса. Главная особенность метода машинного обучения Матриксет состоит в том, что он устойчив к переобучению. 

Анна-Вероника рассказала о градиентном бустинге - процедуре последовательного построения композиции алгоритмов машинного обучения. При этом каждый следующий алгоритм стремится компенсировать недостатки всех предыдущих алгоритмов.

Сейчас Яндекс создает новую библиотеку градиентного бустинга с открытым кодом - CatBoost. Эта библиотека работает быстрее, чем ее предшественник Matrixnet. Но самое важное: для того, чтобы использовать библиотеку, не обязательно быть специалистом по градиентному бустингу. 

Доступность и простота использования библиотеки CatBoost - залог того, что технологии машинного обучения смогут использовать все, кому требуется быстро обучать модели на разнородных данных. Например, хозяева интернет-магазинов, в которых продается множество товаров с различными характеристиками.

Специальное выступление

Искусственный интеллект: на стыке IT и нейрофизиологии
Искусственный интеллект: на стыке IT и нейрофизиологии

Как и многие другие понятия, термин “нейросеть” пришел в IT из биологии. Ученые небезосновательно считают: чтобы окончательно разобраться с искусственными нейросетями, для начала придется выяснить, как работают “естественные” нейросети в мозге живых существ.

Константин Анохин, НИЦ “Курчатовский институт”: Нейрофизиология как ключ к сильному ИИ

К.В. Анохин рассказывает, как работает реальная нейронная сеть
К.В. Анохин рассказывает, как работает реальная нейронная сеть

Константин Владимирович Анохин - профессор, руководитель отдела нейронаук НИЦ “Курчатовский институт”. Автор понятия “когнитом” - совокупность познавательных способностей мозга.

Константин Владимирович рассказал, как функционируют “живые” нейросети - прототип нейросетей искусственных. Поскольку принципы организации нейронных сетей у всех живых существ очень консервативны, нейросети можно изучать на модельных организмах - мышах.

Работу нейросетей изучают уже очень долго, но только в наши дни у исследователей появилась возможность “вживую” наблюдать процесс “образования” памяти в отдельных нейронах. Это стало возможно благодаря введению флуоресцентных белков в отдельные нейроны. Когда нейрон начинает обрабатывать информацию и формировать память, флуоресцентные белки начинают светиться, и этот процесс можно описать в динамике.

Нейрофизиологам известно, что кора головного мозга состоит из вертикальных модулей-колонок, в каждый из которых входит примерно 100 нейронов. Эти колонки способны выполнять четкие алгоритмические процедуры - то есть, по факту, являются крохотными нейросетями в составе одной большой нейросети. 

Логическая архитектура нейронной колонки такова, что новую информацию запоминает только часть клеток. Остальные клетки либо делают прогноз, либо возбуждаются в ответ на новую информацию. Детально разобравшись, как именно нейронная колонка обрабатывает информацию, можно будет построить машинный алгоритм по тому же принципу.

Но даже это не самое главное. Разобравшись со структурой естественной нейронной сети, человечество наконец-то сможет понять, как работает психика и функционирует человеческая душа.

  • 1411

Оставить комментарий

Читайте также

Чем опасен дефицит йода

Как вовремя распознать йододефицит и как восполнить недостаток этого элемента в организме — читайте в новом материале Medical Note.