Microsoft выложила на Github инструментарий CNTK для глубинного обучения
Microsoft выложила в открытый доступ исходный код инструментов, которые используются в компании для ускорения разработок в области искусственного интеллекта: набор Computational Network Toolkit опубликован на Github.
Как сообщается в официальном блоге, исследователям пришлось создать набор инструментов CNTK из необходимости. Ведущий специалист Microsoft по системам распознавания речи Сюэдун Хуан (Xuedong Huang) говорит, что разработчики в его группе были озабочены проблемой, как ускорить процесс распознавания речи компьютерами, а имеющиеся инструменты работали слишком медленно.
Поэтому группа добровольцев вызвалась решить проблему самостоятельно, используя собственное решение, которое ставило производительность на первое место.
Усилия окупились сполна.
Во внутренних тестах CNTK показал более высокую производительность, чем четыре других популярных вычислительных инструментария, которые разработчики используют для создания моделей глубинного обучения в задачах вроде распознавания речи и распознавания образов, за счёт лучших коммуникационных возможностей.
«Инструментарий CNTK просто невероятно более эффективен, чем всё, что нам доводилось видеть», — признаёт Сюэдун Хуан.
Прирост производительности такого рода исключительно важен для стремительно развивающейся области глубинного обучения, потому что некоторые из самых сложных задач глубинного обучения могут вычисляться неделями.
За последние несколько лет область глубинного обучения сделала большой шаг вперёд, поскольку всё больше исследователей запускают алгоритмы машинного обучения с использованием глубоких нейросетей. Многие считают, что глубинное обучение имеет потенциал для улучшений в области искусственного интеллекта, пишет Microsoft.
Достигнутый прогресс позволил создавать системы, которые точно распознают и даже переводят речь, а также системы распознавания изображений, способные даже отвечать на вопросы о них.
В компании Microsoft инструментарий CNTK используется на кластере мощных компьютеров с GPU. Оказалось, что GPU идеально подходят для обработки таких алгоритмов, благодаря им произошёл такой рывок в технологиях синтеза, распознавания и понимания речи, распознавания изображений и движения на видео.
Пользу от инструментов CNTK может извлечь каждый: от разработчика с ограниченным бюджетом и единственным компьютером до компании, способной поднять целый кластер серверов с GPU. Разработчики Microsoft утверждают, что CNTK масштабируется для параллельной работы на многих GPU-машинах гораздо лучше, чем другие публично доступные инструменты такого рода.
В апреле прошлого года Microsoft открыла CNTK для академических исследователей через Codeplex под более ограниченной свободной лицензией. Начиная с понедельника CNTK доступен абсолютно для всех.
Независимые разработчики выражают удовольствие такими положительными действиями Microsoft, но при этом не упускают возможности подколоть компанию: «Только Microsoft могла открыть документацию на гитхабе в формате docx», — пишет один из них.