Эндрю Блейк: наша работа ― создавать новые идеи
Приезд крупнейшего мирового специалиста ― безусловное событие для представителей любой отрасли науки. Подобное произошло в августе этого года, когда в Москву приехал управляющий директор научно-исследовательского центра Microsoft Research в Великобритании, один из ведущих мировых специалистов в области компьютерного зрения - доктор Эндрю Блейк. Он был научным руководителем летней школы Microsoft Research, прошедшей на базе факультета Вычислительной математики и кибернетики МГУ им. М.В. Ломоносова.
Господин Блейк, расскажите пожалуйста, над решением каких задач сегодня работает Microsoft Research в Кембридже? Какие из них уже близки к решению и станут вскоре достоянием общественности?
Принципы работы нашей лаборатории основаны на фундаментальном характере исследований. Мы всегда открыты к различным результатам, которые мы можем получить. Мы не начинаем с того, что говорим: «Давайте изобретем новую ручку!». Нет, мы выбираем какую-то область информатики или смежные области, в которых ставим перед собой задачу продвинуться вперед. И только на основе полученных результатов приходим к интересным фактам. У нас есть 5 основных областей исследования.
Мы начали работу с традиционных областей информатики. Первой из них были языки программирования, принципы, на которых они были организованы. В частности, речь шла об автоматизированной системе верификации программного обеспечения.
Затем мы добавили еще две области исследований, которые входят в состав основ информатики. Одной из этих тем были вычислительные системы: компьютерные и операционные системы. Как лучше их создавать, как делать так, чтобы сети лучше работали, как решить проблему переполнения и перегрузки в сетях. Это очень похоже на решение задачи чрезмерной загруженности автомобильных дорог - темы, которая для вас здесь, очевидно, является очень актуальной.
Другой темой стало машиное обучение и восприятие. Мы изучаем то, как на основе вероятностных принципов создавать интеллектуальные системы, которые обладают «навыками» обучения. Это относится к разным областям деятельности вычислительных систем. Например, к теме компьютерного зрения, тех наработок, которые легли в основу приставки Kinect.
Есть и две более «авантюрные» темы, которые не найдешь в программах традиционных факультетов информатики. Первая из них касается взаимодействия человека и компьютера. Мы изучаем процесс проектирования вычислительных систем. Нам важно, чтобы они гармонично встраивались в среду, где живет человек, чтобы ему было удобно с ними взаимодействовать. Вторая - -- взаимосвязей между информатикой и биологией. Мы пытаемся взять те принципы, на которых строятся языки программирования, и применить их к такой области, как биология.
Такое достижение Microsoft Research, как Kinect, стало одним из самых продаваемых электронных устройств в истории компьютерной индустрии. Как бы Вы могли охарактеризовать степень изученности самой технологии? Станет ли Kinect одной из глобальных тем для научных исследований, или теперь этой разработке суждено перейти в разряд сугубо прикладных?
Существуют ли в исследовательском портфеле Microsoft Research программы, имеющие потенциал, аналогичный тому, который был реализован проектом Natal?
Всегда трудно указать тот объект исследований, который приведет к наибольшему успеху. Именно по этой причине мы стараемся работать над широким портфелем исследовательских задач, постольку мы уверены в том, что лучшие результаты и лучшие идеи рождаются людьми, которые чувствуют себя свободными в своих исследованиях. Это – один из главных принципов, на которых строится работа Microsoft Research.
Те области исследований, в которых мы работаем, имеют большой потенциал. Прежде всего ― более широкое применение методов машинного обучения. Могу сослаться на нашу систему infer.net, которая предназначена для того, чтобы помогать программистам использовать вероятностные методы для решения большого круга задач. Второе направление ― ДНК-вычисления. Я не могу сейчас вам назвать конкретный продукт, который появится в результате этих исследований, но мне представляется, что это очень интересная область, которая обладает огромным потенциалом для инновационного процесса.
В названии Microsoft Research в России очень часто воспринимается в первую очередь слово Microsoft. В этой связи не могу не задать Вам вопрос о том, насколько важна для Microsoft Research при перспективном планировании последующая монетизация разработок.
Расскажите пожалуйста о планах сотрудничества Microsoft Research в Кембридже с Факультетом Вычислительной Математики и Кибернетики МГУ им. М.В. Ломоносова.
Мы очень довольны тем замечательным сотрудничеством, которое у нас сложилось с факультетом, в частности, с лабораторией графики и мультимедиа, в которой работает группа компьютерного зрения под руководством Антона Конушина. Кстати, мы только что согласовали следующий контракт на 3 года с этой лабораторией, так что впереди нас ждут интересные совместные исследования.
Первая науная работа ученых факультета ВМК МГУ и Microsoft Research была опубликована в прошлом году в ходе крупнейшей конференции по компьютерному зрению и распознаванию образов, которую проводит международная организация IEEE (Institute of Electrical and Electronics Engineers). Работа посвящена теории распознавания образов и предметов, и это очень сложная проблема, хотя для многих является удивительным то, что та задача, которая решается мозгом человека очень легко, оказывается настолько трудной для компьютера. Легко забыть, что в нашей голове находится компьютер, который достиг своего нынешнего состояния в результате длительной эволюции.
Очень интересную работу в этом направлении провела Ольга Баринова – молодой ученый из МГУ. До сих пор большой прогресс был достигнут только в сфере распознавания отдельного образа или отдельного объекта. Но гораздо сложнее оказалось решить задачу, когда приходится распознавать сразу несколько образов или предметов. Решением этой задачи и занималась Ольга.
Хочу упомянуть о еще одной задаче, решением которой ученые будут заниматься в ближайшие годы. Речь идет о распознавании текста в изображениях природы и на фотографиях. Интерес к этой теме вызван тем, что мы сейчас очень много путешествуем, оказываемся в разных точках земного шара, имея в руках мобильный телефон. А мир полон информации, которую необходимо интерпретировать. Например, мы гуляем по Красной площади, перед Большим Кремлевским Дворцом, и, направив камеру на его фасад, хотим получить дополнительную информацию об этом месте. И нам, таким образом, необходимо научить компьютер различать разноплановую информацию, отделять текст от остальной части изображения. Это задача, которую человек, в силу своих органов чувств, решает без каких-либо затруднений. А для компьютера решить такую задачу оказывается очень тяжело.
Как далеко продвинулись ученые в этой области?
Спасибо за столь интересную и познавательную беседу.