[Перевод] Получит ли победитель всё в мире робомобилей?

image

На сегодня уже несколько десятков компаний пытаются создать технологию робомобилей — это OEM-производители, их традиционные поставщики, существующие крупные технокомпании и стартапы. Очевидно, успеха добиться суждено не всем, но у достаточно большого количества из них есть все шансы — поэтому любопытно будет задуматься на тем, каковы будут последствия эффекта «победитель получает всё» и какие в этой области могут быть рычаги влияния. Появится ли сетевой эффект, благодаря которому одна-две крупнейших компании выдавят всех остальных, как это произошло в мире смартфонов или операционок для ПК? Или же на рынке есть место для пяти-десяти компаний, которые будут соревноваться очень долго? И каким же этажам в этой пирамиде победа принесёт власть над другими слоями?

Такие вопросы довольно важны, ибо они указывают на баланс власти в автоиндустрии будущего. Мир, в котором автопроизводители могут закупить такой товар, как «автономность под ключ», у любой из пяти-шести компаний (или сделать его самостоятельно), так же, как сегодня они покупают технологию ABS, сильно отличаются от мира, в котором Waymo и, вероятно, Uber остались единственными реальными кандидатами, способными самостоятельно выстраивать бизнес модель, как это сделал Google с Android. Microsoft и Intel нашли болевые точки в мире ПК, а Google — в смартфонах; какими могут быть такие точки у робомобилей?
Сразу же ясно, что товарами будут оборудование и сенсоры для автономности. Инженерных усилий и научных изысканий в них довольно много, точно так же, как, допустим, в LCD-экранах, но нет причин для того, чтобы использовать один вместо другого только потому, что все остальные так делают. Эффекты экономии на масштабе довольно сильны, но не существует сетевого эффекта. Поэтому, допустим, LIDAR пройдёт путь от «вращающегося ведра из KFC» стоимостью в $50 тысяч, до небольшого виджета без движущихся частей стоимостью в несколько сотен долларов, и в этом сегменте появятся победители –, но сетевого эффекта не будет, ведь LIDAR-победитель даст вам не больше рычагов влияния на другие этажи пирамиды (если только вы не сможете захватить монополию), чем лучшие фотоматрицы от Sony (которые она продаёт Apple) дают ей в мире смартфонов. Точно так же батареи (и моторы и управление батарея/мотор) будут такими же товарами, каким сегодня служит RAM — экономия на масштабе, научные изыскания, и, вероятно, несколько победителей в каждой из категорий, но без особых рычагов влияния.

С другой стороны, вряд ли будут существовать непосредственные параллели с экосистемами сторонних разработчиков ПО, такими, какие сейчас существуют для ПК или смартфонов. Windows выдавила Mac, а затем iOS, а Android выдавил Windows Phone благодаря порочному кругу, завязанному на разработчиков, но вы же не будете покупать машину на основании того, сколько на ней можно запустить приложений. На всех на них будет работать Uber, Lyft и Didi, и у всех в экраны будет встроена Netflix, но остальные приложения будут работать на вашем телефоне (или часах, или очках).

Искать нужно не в самих автомобилях, а выше по пирамиде — в автономном ПО, позволяющем машине двигаться по дороге, ни во что не врезаясь, в оптимизации в масштабах города и в построении маршрутов, в процессе которых мы можем автоматизировать все машины в системе, а не только каждую отдельно — и на волне всего этого будут существовать парки из роботакси. Сетевые эффекты в области автомобилей по требованию очевидны, но с появлением автономности они будут сильно усложняться (автономность урежет стоимость любой поездки по требованию на три четверти, или даже больше). Парки роботакси будут динамически перераспределять свои автомобили, а также координировать между собой, а, вероятно, и совместно со всеми машинами сразу, свои маршруты в реальном времени для достижения наибольшей эффективности, чтобы избежать ситуаций, в которых все машины одновременно выбирают один маршрут. Это, в свою очередь, можно скомбинировать не только с колеблющимся ценообразованием, но и с ценообразованием на основе путей — возможно, вам нужно будет заплатить больше, чтобы быстрее добраться до места в часы пик, или же выбрать время прибытия в зависимости от стоимости.

С технической точки зрения три этих этажа (движение, прокладывание пути и оптимизация, выезд по запросу) довольно независимы друг от друга — предположительно, можно будет установить в робомобиль от GM приложение Lyft и позволить установленному в системе модулю от Waymo управлять автомобилем. Очевидно, кто-то надеется на появление рычагов давления на разные уровни, или, возможно, объединение их в один пакет — Tesla планирут запрещать людям использовать свои робомобили с другими сервисами поездки по запросу, кроме своего собственного. В другую сторону это не работает –Uber не будет настаивать на использовании только её автономной системы. Но хотя Microsoft использовала совместные рычаги давления при продвижении Office и Windows, обе эти позиции завоевали первые места на своих собственных рынках в рамках собственных сетевых эффектов: если небольшой OEM будет настаивать на использовании своего небольшого сервиса роботакси, это будет выглядеть так, как если бы в 1995 году Apple настаивала на покупке AppleWorks вместо Microsoft Office. Подозреваю, что в результате появится более нейтральный подход. Особенно если у нас появится междугородняя координация движения автомобилей, или даже прямое общение между автомобилями на перекрёстках — тут потребуется какой-то общий этаж пирамиды (хотя я испытываю предрасположенность к децентрализованным системам).

Всё это, конечно, сплошное теоретизирование, и выглядит как попытки предсказывать сегодняшние пробки на дорогах, живя в 1900-м. Единственная область, в которой мы можем рассуждать о ключевых сетевых эффектах — это сама автономность. В ней всё зависит от оборудования, сенсоров, ПО, но в первую очередь от данных. А в случае с автономией имеют значение два вида данных — карты и данные о вождении. Начнём с карт.

Наш мозг постоянно обрабатывает данные с органов чувств и строит трёхмерную модель мира вокруг нас, в реальном времени и на уровне подсознания — когда мы бежим через лес, мы обычно не спотыкаемся о корни и не бьёмся головой о ветви. В мире автономии это называется SLAM — Simultaneous Localization and Mapping (Метод одновременной локализации и построения карты). Мы занимаемся разметкой нашего окружения и локализацией нас самих внутри него. Это, очевидно, базовое требование к автономности — робомобиль должен понимать, где он находится на дороге, что может его окружать (ряды, повороты, тротуары, светофоры, и т.д.), и он должен понимать, где находятся другие средства передвижения и как быстро они движутся.

Пока что претворение в жизнь этой технологии на реальной дороге в реальном времени — довольно тяжёлая задача. Люди водят при помощи зрения (и звука), но построение достаточно точной трёхмерной модели вашего окружения на основе только одного изображения (особенно двумерного) остаётся нерешённой проблемой: машинное обучение делает это возможным, но пока ещё никто не достиг в этом деле точности, необходимой для вождения. Поэтому мы используем обходные пути. Поэтому почти во всех автономных проектах комбинируется обработка изображений с LIDAR на 360 градусов: у каждого из датчиков есть свои ограничения, но их комбинация («слияние датчиков») помогает вам построить полную картину. Построение окружающего вас мира при помощи одних только изображений наверняка станет возможным в какой-то момент будущего, но использование большого количества датчиков позволяет ускорить этот процесс, даже если вам приходится ждать, пока стоимость и форм-фактор этих датчиков понизятся до практичных. LIDAR — обходной путь для построения окружающего вас мира. Как только это получено, после этого часто используют машинное обучение, чтобы понять, что этот мир из себя представляет — является ли эта форма машиной, велосипедистом. Но в этом случае сетевого эффекта не наблюдается — можно насобирать довольно много изображений велосипедистов, даже не обладая парком автомобилей.

Если LIDAR — один из обходных путей к SLAM, то другой, более интересный — предварительно построенные карты, то есть, 3D-модели высокого разрешения. Вы заранее объезжаете дорогу, спокойно обрабатываете все данные, строите модели улиц, а затем помещаете их в любом автомобиле, который поедет по ним. Робомобилю тогда уже не нужно обрабатывать все эти данные, и выцеплять из них повороты или светфоры на фоне остального шума в реальном мире на скорости в 65 миль в час — вместо этого он знает, где расположен светофор, и может по ключевым вехам локализовать себя внутри модели дороги в любой момент. Поэтому ваш автомобиль использует камеры и LIDAR для определения своего положения на дороге, поиска светофоров и т.п., сравнивая то, что он может видеть с предварительно созданной картой, и ему не нужно заниматься этим самостоятельно и с нуля. Также он использует эти данные, чтобы распознавать другие средства передвижения в реальном времени.

У карт есть сетевой эффект. Когда любой робомобиль движется по предварительно размеченной дороге, он как сравнивает дорогу с картой, так и обновляет карту. Каждый робомобиль может одновременно быть и обзорным автомобилем. Если вы продали 500 000 робомобилей, а кто-то другой — 10 000, ваши карты будут обновляться чаще и будут точнее, поэтому шанс встретить что-то совершенно новое и неожиданное и запутаться у ваших машин будет меньше. Чем больше машин вы продаёте, тем лучше они себя ведут — сетевой эффект по определению.

Риск этого в том, что в долгосрочной перспективе все машины смогут осуществлять SLAM без LIDAR, и ездить без предустановленных карт — ведь люди с этим справляются. Произойдёт ли это вообще, и когда именно, пока непонятно, но сейчас кажется, что это произойдёт не сразу после появления в продаже первых робомобилей, и к тому времени всё поменяется.

Если карты — это первый сетевой эффект в данных, то второй получается из того, что делает машина после того, как поймёт своё окружение. Езда по пустой дороге или по дороге, заполненной другими робомобилями — это одна задача, но определение того, что другие люди собираются делать на дороге, и как с этим обходиться — это совершенно другая задача.

Один из прорывов, поддерживающих автономию, состоит в том, что для этого должно хорошо подойти машинное обучение: вместо того, чтобы пытаться записывать сложные правила, объясняющие, что вы думаете о том, как люди могут себя повести, МО будет использовать данные, и чем больше, тем лучше. Чем больше данных о поведении и реакциях реальных водителей в реальном мире вы сможете собрать (как о поведении других водителей, так и о поведении водителей ваших собственных обзорных автомобилей), тем лучше ваше ПО будет понимать, что происходит вокруг, и тем лучше оно будет планировать следующие шаги. Как и в случае с картами, до запуска ваши тестовые автомобили собирают эти данные, но после запуска, каждая продаваемая вами машина тоже собирает эти данные и отправляет их домой. Так что так же, как и в случае с картами, чем больше машин вы продадите, тем лучше они у вас будут — снова сетевой эффект по определению.

Данные о вождении можно использовать и ещё в одном месте — в симуляции. Это должно отвечать на вопросы «если случится Х, как поведёт себя наше автономное ПО?» Один из способов ответить на него — сделать робомобиль и отправить его в поездку по городу, чтобы посмотреть, как он реагирует на случайные действия остальных водителей. Проблема в том, что такой эксперимент не контролируем — нельзя вернуться к той же ситуации с новым ПО и посмотреть, что меняется, и исправлены ли проблемы. Соответственно, сейчас очень много усилий направлено на создание симуляций — помещаете своё ПО для робомобиля в Grand Theft Auto (почти буквально) и проверяете, как угодно. Это не обязательно поможет вам отловить все варианты событий («определит ли LIDAR присутствие на дороге этого грузовика?»), и некоторые сценарии симуляций будут зацикленными, но оно расскажет вам, как ваша система поведёт себя в определённых ситуациях, и эти ситуации вы сможете собрать из данных по поездкам в реальном мире. Так что тут работает непрямой сетевой эффект: чем больше у вас данных о поездках по реальному миру, тем точнее будут ваши симуляции, и, следовательно, тем лучше будет ваше ПО. Также в симуляциях просматриваются очевидные преимущества в зависимости от масштаба — сколько людей будет над этим работать, сколько компьютерных ресурсов вы сможете этому посвятить, и какой теоретический опыт есть у вас в работе над крупными вычислительными проектами. То, что Waymo является частью Google, однозначно даёт ей преимущество: её робомобили наматывают по 25 000 реальных миль каждую неделю, а в 2016 году в симуляциях за неделю они проезжали в среднем по 19 млн миль.

Можно сказать, что у Tesla есть преимущество как по картам, так и по данным о вождении: с конца 2016 года у тех автомобилей, чьи владельцы купили себе дополнение «автопилот», есть по восемь камер, дающих обзор на 360 градусов, поддерживаемых радаром, направленным вперёд (а также есть набор ультразвуковых сенсоров, работающих на довольно малом расстоянии и в основном используемых при парковке). Всё это может собирать как данные по картографии, так и по поведению водителя, и отправлять их в Tesla — и, судя по всему, недавно компания действительно начала собирать такие данные. Подвох в том, что, поскольку радар направлен только вперёд, Tesla придётся использовать только обработку изображений для построения моделей большей части окружающего мира, но, как я отметил, мы ещё не знаем, как делать это с достаточной точностью. Это значит, что Tesla, по сути, собирает данные, которые сегодня пока никто не в состоянии прочесть (или, по меньшей мере, прочесть достаточно хорошо для выработки законченного решения). Конечно, эту проблему необходимо будет решать как для сбора данных, так и для самого вождения автомобиля, поэтому Tesla делает нехарактерную ставку на быстрое развитие компьютерного зрения. Tesla экономит время, не ожидая появления дешёвых/практичных LIDAR (сегодня Tesla не смогла бы разместить их на всех своих автомобилях), но без LIDAR ПО для компьютерного зрения придётся решать более сложные задачи, поэтому это тоже может занять долгое время. А если все остальные части ПО, необходимые для автономности — части, решающие, что машина должна делать в определённой ситуации — появятся нескоро, за это время LIDAR могут подешеветь и стать более практичными, и обходной путь Tesla потеряет смысл. Посмотрим.

Так что, сетевые эффекты — победитель получает всё — заключаются в данных: в данных по вождению и в картах. Это вызывает два вопроса: кто получит эти данные, и сколько их нам необходимо?

Владение данными — интересный вопрос власти и ценности. Очевидно Tesla планирует самостоятельно создать все важные части технологии и реализовать её в собственных авто, чтобы ей принадлежали и данные. Но некоторые OEM утверждали, что если машина принадлежит им, и клиент их, то и данные тоже принадлежат им, а не каким-то другим технологическим партнёрам. Это довольно разумная позиция, которую стоит рассматривать в связи с производителями сенсоров: не уверен, что можно будет продавать GPU, камеры или лидары сами по себе, и не делиться ни с кем имеющимися данными. Но компании, производящей робомобили, необходимо обладать данными — без них ничего не получится. Если изменения данных не влияют на технологию в рамках обрятной связи, технология не будет улучшаться. Это значит, что OEM повышают сетевую ценность в пользу поставщика, а сами от этой ценности ничего не имеют, кроме как некое улучшение автономности –, но эта улучшенная автономность сама становится предметом потребления среди всех продуктов любого использующего её OEM. Это похоже на позицию ПК или Android: они создают сетевой эффект, соглашаясь использовать ПО в своих продуктах, благодаря чему они свои продукты и продают, но их продукт стал предметом потребления, и сетевая ценность уходит технокомпании. Это порочный круг, в котором ценность по большей части уходит к продавцу, а не к OEM. Поэтому большинство OEM сейчас хотят делать робомобили самостоятельно — они не хотят закончить так же, как Compaq.

И это приводит меня к финальному вопросу: сколько же данных вам может потребоваться? Может ли система бесконечно улучшаться при постоянном добавлении данных, или мы будем наблюдать S-образную кривую — будет ли некая точка, после которой добавление новых данных будет очень слабо влиять на улучшения?

То есть, насколько силён сетевой эффект?

Довольно очевидный вопрос для карт. Чтобы карты стали достаточно хорошими, какую плотность автомобилей и какая частота поездок вам нужна, и в какую наименьшую долю рынка это выливается? Сколько участников сможет вместить рынок? Может ли там быть десяток компаний, или же всего две? Сможет ли кучка второсортных OEM собраться и слить все свои данные в одну базу? Смогут ли грузовики продавать свои данные так, как сегодня они продают различную картографическую информацию? Ситуация отличается от потребительских экосистем ПО — RIM и Nokia не могли слить вместе базы пользователей Blackberry и S60, но карты можно объединять. Это барьер для вхождения или условие для вхождения на рынок?

Этот вопрос относится и к данным, необходимым для поездок, и вообще ко всем проектам, использующим МО: в какой момент улучшения становятся незначительными при добавлении новых данных, в какой момент эта кривая начинает распрямляться, и сколько людей нужно для получения такого количества данных? Допустим, для поисковых систем общего назначения эффект улучшения кажется бесконечным — ответ почти всегда может быть более релевантным. Но для автономности кажется необходимы существование потолка — если машина сможет ездить по Неаполю год и не запутаться, чего ещё там можно улучшить? В какой-то момент вы, по сути, закончите улучшения. Сетевой эффект означает, что продукт улучшается при увеличении количества пользователей –, но сколько пользователей потребуется, чтобы продукт перестал значительно улучшаться? Сколько машин надо продать, чтобы ваша автономность приблизилась к лучшей на рынке? Сколько компаний смогут этого достичь? А, тем временем, само МО быстро меняется — нельзя исключить возможность того, что количество необходимых данных, необходимое для достижения автономности, резко уменьшится.

Во всём этом скрывается предположение о самом существовании таких понятий, как лучшая или худшая автономность. Что означает «худшая» автономность? Чуть больше вероятность погибнуть в ДТП, или чуть больше вероятность того, что машина запутается, притормозит у обочины и соединится с центром поддержки, чтобы управление взял на себя оператор? Выскочат ли из консоли упакованные в полиэтилен рычаги ручного управления, и будет ли машина давать обнадёживающие комментарии?

— Компьютер, какой маневр мы можем предпринять?
— Боюсь, никакого, ребята, система управления кораблем парализована глушителями, — бодро объяснил компьютер. — Начинаю отсчет. До попадания сорок пять секунд. Зовите меня просто Эдди, если вам будет легче.
Зафод попытался решительно сбежать сразу в нескольких направлениях.
— Так! — вскричал он. — Э-э… Нужно взять управление на себя.
— А ты умеешь управлять кораблем? — вежливо поинтересовался Форд.
— Нет. А ты?
— Тоже нет.
— Триллиан?
— Не умею.
— Чудесно, — с видимым облегчением произнес Зафод. — Будем управлять сообща.
— И я не умею, — решил напомнить о себе Артур.
— Неудивительно, — едко заметил Зафод. — Компьютер! Включай систему ручного управления!
— Милости прошу, — сказал компьютер.
В стене откинулись панели, и из недр корабля появился огромный, неимоверно замысловатый пульт, рукоятки, кнопки, рычаги и переключатели которого были затянуты целлофаном. Ими явно еще ни разу не пользовались.
Глаза Зафода дико забегали.
— Хорошо, Форд, — твердо приказал он, — полный назад и десять градусов вправо! Или еще что-нибудь…
— Удачи вам, парни! — бодро вставил компьютер. — До попадания тридцать секунд.
Форд прыгнул к пульту и ухватился за первые попавшиеся рычаги. Корабль со страшным ревом встал на дыбы и судорожно задергался, когда маневровые двигатели потянули его в разные стороны. Форд отпустил половину рычагов: корабль сделал крутой вираж и помчался навстречу ракетам.


Ответ, судя по всему, в том, что пятый уровень автономности появится в виде эволюции четвёртого уровня — у каждой машины будут элементы ручного управления, но использоваться они будут всё меньше и меньше, и пятый уровень будет появляться пошагово, а элементы управления будут уменьшаться, потом прятаться, а потом и вовсе исчезнут — атрофируются. Возможно, сначала 5-й уровень появится в Германии, потом в Неаполе, потом в Москве [грязные инсинуации — прим. перев.]. Это будет означать, что данные собираются на сетевом масштабе и используются задолго до появления полной автономности.
[«Перестроение в Москве», — комментирует автор твита. Вряд ли этот вопиющий случай можно назвать нормой. Для сравнения, достаточно погуглить «usa road wars» — прим. перев.]

Ответы на эти вопросы нам пока неизвестны. Мало какие эксперты в этой области ожидают появления автономности пятого уровня в течение пяти лет, большинство из них склоняются к десяти годам. Однако они указывают на большой спектр результатов, способных привести к крайне различным вариантам влияния на автоиндустрию.

Одна из крайностей — сетевой эффект окажется слабым, в результате чего на рынке появятся 5–10 компаний с более или менее автономной платформой. В таком случае автопроизводителу будут покупать автономность как компонент, по цене схожий с ABS, подушками безопасности или спутниковой навигацией. Индустрия всё равно поменяется — автономность приведёт к падению стоимости поездок по запросу не менее, чем на три четверти от нынешней цены, в результате чего многие люди задумаются о необходимости владеть собственным автомобилем. При этом переход на электромобили будет уменьшать количество движущихся частей в автомобиле в 5–10 раз, что будет кардинально менять инженерную динамику, базу поставщиков и барьеры для выхода на рынок. Но до уровня Android ситуация не дойдёт.

Другая крайность — создать робомобиль получится только у Waymo, в каком случае индустрия будет выглядеть совершенно по-другому.

© Geektimes