Нейронки пошли не туда26.03.2025 22:01

Долго пытался сформулировать, почему мне нравится Claude и Gemini и умение рассуждать ChatGPT.

И наоборот, не нравится (точнее, кажется по большей части бесполезной на практике) умение ChatGPT написать точный, с первого раза работоспособный код. Или там, решить задачки из олимпиады по математике, выдавая потрясающий балл на экзаменах в MIT.

Интуиция не врёт.
(Юдковский перевернулся в гробу)

По ощущениям, чиселки в разных Аренах не особо связаны с реальным ощущением и эффектом от использования. По чиселкам, DeepSeek R1 должна рассуждать лучше OpenAI o3-mini, но на ряде практических задач это очевидно не так.

И вот сейчас, в голове щелкнуло и кусочки мозаики встала на место.

Как мы уже обсуждали вчера, после появления «точных» нейросетей мир, скорей всего, не пойдет по пути появления более крутых новых продуктов. Он пойдет по пути массовости.

Посмотрим на примере индустрии видеоигр, геймдева. В прошлом году было зарелизено 14310 игр в Steam. Это рекордный год по количеству новых игр, во всей истории геймдева и Человечества вообще. В этом 2025 году игр будет еще больше. В 2028 году их будет СИЛЬНО больше.

Если вы сейчас еще успеваете хотя бы посмотреть трейлеры новых качественных игр (в большинстве случаев, это ААА (А) проекты), то через несколько лет вам даже на это не хватит времени. Не говоря уж о том, чтобы во что-то из них поиграть. Не говоря уж о том, чтобы с кем-то это обсудить. Где вы найдете людей, которые выбрали те же самые тайтлы, что и вы сами?

В целом, такое перепроизводство игр излишне. Умение агента Мануса породить агента Ануса, которы напишет нам 33 Инстаграма в секунду — тоже излишне. На большей части этих кастомных Инстаграмов не будет ни одной фотки.

В свете этого, становятся существующие решения неинтересны. Вообще сами «решения» как концепция неинтересны. Большинство обыденных вещей скоро будет решено методом лошади Форда — методом, в котором двигатель внутреннего сгорания не изобрели, зато сделали огромное количество куда более лучших лошадей.

Это всё не то.

Интересны НОВЫЕ ШТУКИ.

К сожалению, нейросетки сейчас тренируются далеко не на создание новых штук. Они тренируются на точное выполнение каких-то экзаменов. Причем, зачем-то точное в том смысле, что нужно решить экзамен, как если бы это делал человек. Очень спорная предпосылка. Это стало каким-то культом.

Однажды я увидел в интернете исследование и тут же сконвертил в статью про то, насколько ChatGPT (тогда еще 4o) умеет умножать числа. Все активно смеялись и тыкали пальцами. Ха-ха, говорили они. Это же L L M, это про язык, а не про умножение! Какой исследователь глупый.

Тем гротескней были результаты этого исследования — нейронка отлично угадывала результаты умножения до огромнейших значений. На этом упрощенном примере люди видят, насколько это история из репертуара Франца Кафки — разрыв шаблона делает им смешно. Одновременно, те же люди смотрят на MATH-500 и такие — НИХЕРА СЕБЕ КАКАЯ ОНА УМНАЯ, МЫ ОБРЕЧЕНЫ. Вы там трусы и крестик сняли бы?

Глобально, это всё бессмысленная, бесполезная фигня. Этим будут заниматься уже сложившиеся компании типа OpenAI, и конечно, преуспеют в этом. И Бог с ними! Нужно двигаться дальше.

Имхо, следующий прорыв в нейронках должен быть в области генерации неожиданных вещей. Вещей, которые не являются рекомбинацией и перевзвешиванием известных фактов. Вещей, которые челленджат пределы человеческой логики и уходят в логику совершенно нечеловеческую. Возможно, вообще умонепостигаемую, но имеющую полезные эффекты.

В качестве затравки, предлагаю вот такое: загрузить в некую нейронку всю физику до момента изобретения теории относительности и квантовой механики. «До момента» — включая прямые события, которые мгновенно привели к созданию квантовой механики и теории относительности. Эйнштейн объяснил фотоэффект 1905. Квантовая гипотеза Макса Планка — 1900 год. Пусть это будут все события и знания до 1900 года.

Даем нейросетке доступ до Реального Мира, включая свежие технологии типа Большого Коллайдера. Пусть ни в чем себе не отказывает, проводит любые эксперименты любыми методами. И пусть эта нейросетка попробует порассуждать и вывести физику заново. Не на основе заготовленных шаблонов и рекомбинации, а на основе настоящих размышлений. Возможно, у нее выйдет то же самое, что у Эйнштейна, Планка и компании. ИЛИ ВЫЙДЕТ ЧТО-ТО ПРИНЦИПИАЛЬНО ДРУГОЕ.

Вы хотели бы на своей жизни увдиеть, что это будет?

Но для этого нужно специально тренировать сетку на задаче выхода за пределы возможного. Чего бы это ни значило. Тем не менее, сохраняя предсказательный эффект (мы все еще люди и мозг из мяса думает в терминах кадров времени). Это не то, что происходит, когда нейронку специально тренируют на решение экзаменационных задачек по математике.

Я бы даже сказал, что сама идея экзаменационных задачек по математике — тупая. Потому что это не «настоящая математика», а продвинутая бухгалтерия. Людей тоже нужно тренировать по-другому, с самого детства. Например, вместо информатики можно делать что-то типа Vibe Coding, в широком смысле слова. Об этом есть в классическом эссе Hackers and Painters Пола Грэма (сооснователя YCombinator/HackerNews, автора книг по Lisp и т.п.) , но это уже будет совершенно другая история…