Мультизадачная нейросеть от Google делает восемь вещей одновременно
Большинство систем глубокого обучения построены для решения определенных проблем, например, распознавать животных на фотографиях или заниматься переводом с одного языка на другой. Но если взять, к примеру, алгоритм распознавания изображений и поставить его на выполнение совершенно иной задачи, например, на распознавание речи, с работой он не справится.
У людей такой проблемы нет. Мы вполне естественно используем наше знание одной проблемы для решения других задач и обычно не забываем один навык, когда начинаем учить следующий. Нейросеть Google делает небольшой шаг в этом направлении, одновременно научившись решать целый спектр задач без специализации в какой-либо области.
Нейросеть от Google Brain — одной из лидирующих компаний по изучению навыков глубокого обучения — научилась выполнять восемь задач одновременно: распознавать изображения и речь, переводить, анализировать предложения и так далее. Система под названием MultiModel состоит из центральной нейросети, окруженной подсетями, которые специализируются на решении различных проблем.
MultiModel не поставила каких-либо рекордов, но ее производительность постоянно находится на высоком уровне. Ее способность по распознаванию изображений всего на 9% ниже лучших специализированных алгоритмов, созданных за последние пять лет.
Система показала и другие преимущества. Другие системы глубокого обучения необходимо обучать на большом количестве данных. MultiModel же обучается даже на информации, которая связана с совершенно иной задачей. К примеру, ее способность анализировать грамматику в предложениях улучшилась после обучения на базе данных с фотографиями, хотя в тех не было ни одного слова.
По сути, такая нейросеть — это шаг на пути к созданию полноценного искусственного интеллекта с когнитивными навыками, подобными человеческим.