Нейросеть Deep Photo Style Transfer переносит стиль на фотографиях

859a88f95c494f6c800422fb0869e6b3.jpg

Когда-нибудь в будущем мы сможем надеть очки — и ходить по городу, который рендерится в реальном времени в том стиле, какой нам нравится. Солнечный свет или лёгкая дымка, вечерний закат, что угодно. Независимо от того, насколько унылая архитектура — в очках она будет прекрасной. Такие возможности рендеринга с перенесением стилей открывает потрясающая программа Deep Photo Style Transfer, которая опубликована в открытом доступе, также как и научная работа, лежащая в её основе (arXiv:1703.07511).
Перенос стиля с одного изображения на другое — старая проблема, которую относительно успешно пытались решить разработчики в прошлом. Правильно подобрав образец для переноса стиля, можно красиво трансформировать свою фотографию — как будто она сделана в другое время суток, под иным освещением, в другую погоду или специальным образом художественно обработана. До настоящего времени техники переноса стилей с помощью нейросетей были относительно ограниченными — или они могли работать только с определёнными сценами, или страдала правдоподобность переноса стилей. Авторы новой программы Deep Photo Style Transfer постарались решить все эти проблемы.

Нейросеть Deep Photo Style Transfer построена в соответствии с техникой переноса стилей Neural Style, описанной в работе Гэтиса, но значительно переработана и улучшена. Главное улучшение заключается в фотореалистичности. У Гэтиса даже если исходное изображение и образец являются фотографиями, конечное изображение всё равно напоминает рисунок, где чёткие линии и границы становятся размытыми, а текстуры накладываются на соседние объекты. Выглядит красиво, но не очень реально.


Результат работы Deep Photo Style Transfer строго фотореалистичен. «Эффекты живописи» устранили за счёт запрета на пространственные искажения. Здесь перенос стилей ограничен только цветовым пространстве. Другими словами, формы объектов остаются точно такими же, как в оригинале. Именно по этой причине в будущем станут возможными «очки», о которых говорилось в начале статьи. Все объекты в окружающей реальности сохранят свои очертания, просто будут выглядеть в другом стиле.

Поставленной задачи авторы добились, использовав специфичный слой нейросети в духе матрицы Кирхгофа (Laplacian matrix) — представления графа в виде матрицы. Как показала проверка на фотографиях с различными сюжетами, такой подход успешно подавляет искажения, в то же время оказывая минимальное влияние на достоверность фотографий.

Наиболее наглядно описанный принцип проявляются в двух специально подобранных примерах.

66f7a4fbc44a42b585802373f7c9ddea.jpg

Как видим, границы объектов чётко сохраняются. Преобразование происходит только в цветовом пространстве. В первом случае стиль огня переносится на флакон с духами, а во втором случае меняется текстура яблок в соответствии с шаблоном.


Второе достижение авторов программы — решение проблемы с переносом стиля между неподходящими объектами на исходной фотографии и образце стиля. Это сделано за счёт семантической сегментации. Поэтому стили домов переносятся только между домами, и стиль неба влияет только на небо. Во многих случаях семантическая сегментация очень эффективно работает, если только на образце стиля есть те же семантические объекты, что на исходном изображении.

Два вышеупомянутых подхода обеспечили исключительно реалистичное преобразование фотографий.

Оригинал
3b6c6d59db9a01013a8da0bddacb5281.png

Образец стиля
927a311653b63ee7d7d0628284ebed5c.png

Итоговое изображение
09cb5e22d65ee6bc2f53bc5467777cd8.png

Вот ещё несколько примеров.

Оригинал
37d5a11def78044bea12cc93bbca0310.png

Образец стиля
0b9ec248e0ac0452575f037ce989d64c.png

Итоговое изображение
ba5e16d16172fce57095424abec877b9.png


Оригинал
aa50a5d55dd91398da8bd12f00f3f7c1.png

Образец стиля
99e2f773e31fe1f91178c519ad7f5566.png

Итоговое изображение
9b4dfc3102114c8e9101c163f05c5a7f.png


Оригинал
29978854fd4ceb0f2331cd68b0c0c9dc.png

Образец стиля
d3af04d6176d08562e7c278c03cb6cc5.png

Итоговое изображение
15705fce3934348e0e190092271734e5.png


Оригинал
d57993806db328815a256902a3caa90d.png

Образец стиля
9fddf47bfc85d97ebb3d9c6ae5df7ec4.png

Итоговое изображение
3336b2af4ab3f3ebb588a5555b66996f.png


Оригинал
69dd57ebfb7c7c6640cb9cde0006c2ed.png

Образец стиля
158a68333f6508c2bef06dd96122edc0.png

Итоговое изображение
eedad1a5774194c932c716a2d2cf440c.png


Оригинал
448654517e6d96f2bf179eae778d9a09.png

Образец стиля
0ac8548f11eaae85312e89483f1089ed.png

Итоговое изображение
b2619faa5285ab4bfa944ed33c090198.png


Оригинал
f2f923cf2d0113868a5b5fc5307663e3.png

Образец стиля
0aeb54a693c17fc75944b373c5725c94.png

Итоговое изображение
661149b8dc53d202bbf9891fd8d8b5e5.png


Оригинал
c8c8ba5c72de466dad90da3f15f738e9.png

Образец стиля
be30d858a0ca21d2b679699d36d6d61e.png

Итоговое изображение
84ff50d2e9e44cbc393be7c1f9944754.png


Оригинал
0d7f8243c6d43b07827ddfbdfe9cc7cd.png

Образец стиля
ca71af2714e95ac1eddd738ca068ba02.png

Итоговое изображение
4dc0a1e750d984a40a78f64b49be616d.png


Оригинал
3c145c373279ad55191b9c88c11a0636.png

Образец стиля
f82271ecb419238381b1e27573ca6d0b.png

Итоговое изображение
0a247c4f4847f36d9251a14f0ae91cfe.png


Оригинал
6d7ace90d2e0a7a7d1de176e3783066b.png

Образец стиля
c6149d7f0a5f2a8cc74ce5eb6c38d993.png

Итоговое изображение
4c31715919fe75f895b37daf6cebc32a.png
Качество работы такого алгоритма можно определить только по результатам опроса пользователей, которые оценивают фотореализм и достоверность передачи стиля. Такой опрос бы проведён. Он показал, что по уровню фотореализма Deep Photo Style Transfer значительно превосходит представленные ранее разработки Neural Style и CNNMRF, но уступает системе передаче цвета Пити. По достоверности передачи стиля Deep Photo Style Transfer намного лучше других методов.

f64f52cbdb5649b9b410920752af6fac.png

Авторы научной работы намерены продолжить исследования, чтобы преодолеть существующие ограничения сегментации изображений. Они также считают перспективным направление обработки фотографий в реальном времени с помощью предварительно обученной нейросети.

© Geektimes