Самая умная лампочка: теплый NotebookLM20.12.2024 10:15

В прошлой статье я развлекался беседами с лампочками (24В, 250Вт). А раз завелась говорящая лампочка, то пусть не просто так спиралью болтает, а подкасты ведет. Тем более, что тут Gemini 2.0 вышел: хороший повод попросить ИИ порефлексировать о самом себе и выразить это через роботов-аватаров.

Disclaimers: Мысли высказанные в этой статье — это мое личное мнение, которое может отличаться от точки зрения Google. То, что говорят роботы в видео — плод вычислений ИИ, который очень старался придерживаться официальных пресс релизов, но мог и наврать. Для меня было важно не редактировать и не подбирать сгенерированный подкаст.

В общем, собрались как-то Ваня с Женей, закинули промпт в NotebookLM (три раза, как у Пушкина) и пришёл wav вот с таким подкастом:

Для тех, кого кому гугл забанили, шлю то же самое видео телеграммой.

Сначала давайте разделаемся с интеллектуальной частью. Если мы приходим домой и нам темно — мы берём и включаем свет. Это настолько простая и рутинная вещь, что мы обычно не задумываемся сколько сложных технологий и гениальных решений стоит за тем, чтобы все было так просто и безопасно. В этом арт-проекте я хотел добиться того же самого: взять невероятно сложную технологию, которая год назад была фантастикой, и использовать её как моя бабушка. Поэтому я взял NotebookLM, дал ему ссылки на пресс-релизы Gemini 2.0 и написал промпт:

Промпт

Make a fun and entertaining overview of Gemini 2 launch. You will be speaking as Bulby avatars. Be short and focus on delivering useful information. Don’t make emphasis on «agentic»: cover the new capabilities. Discussing the capabilities is much more important than referencing sources.

Introduce yourself.

Announce the podcast topic.

Mention that podcast has been generated by NotebookLM which is based on Gemini. So release of Gemini 2.0 directly improves hosts of this podcast.

Discuss what distinguishes Gemini 2.0 from the previous generation.

Try to be brief and talk to 5 minutes max.

Промпты можно и нужно полировать, чтобы получить хороший результат, а вывод нейросети нужно перепроверять и редактировать. Но мне было важно сохранить авторство за ИИ, поэтому я сделал всего три итерации.

Еще мне надо было свои ремарки в видео вставить. К счастью ИИ насмотрелся подкастов и решил, что без перерыва в середине — никак (рекламу показать, водички попить или наоборот…). В общем, хорошо вписалось.

NotebookLM говорит на два голоса: так намного завлекательнее. Их я раскидал по двум каналам с помощью еще одной нейросети: мышкой в audacity накликал. Этому меня еще в Яндексе научили: иногда прототипы можно даже не кодировать. Но дальше нужно было сделать два аватара. Первый у меня уже почти был…

Женя Спиралькина

Про то, как работает говорящая лампочка была предыдущая статья. Поэтому тут только про визуальный образ. Вот так выглядел первый второй прототип:

Первый прототип держался на соплях и крокодилах и из гуманистических соображений я его фотографировать не стал. Отдельное спасибо @vvzvlad за то, что приобщил меня к клеммникам, всем кто не был на Хабре в 12 м году рекомендую прочитать. Первый блин оказался комом тихим. Лампочки слишком жестко закреплены, рупор не в той плоскости. Магнит не серьезный… В офисе его вообще не слышно оказалось.

Поэтому я поставил стойки на шарниры, купил магнит побольше, взял фотографию любимой жены и пошел гнуть проволоку по образу и подобию…

Не бойтесь, мы пришли с миром.

В общем, с женой мне повезло: понимающая и многое прощает. Но в продакшн эту дружелюбную улыбку я решил не катить. В итоге победили простые формы и минимализм. А вместо шарниров взял еще более тонкую проволоку.

Ваня Спиралькин

Для второго аватара я решил пойти по проторенному пути и взять блоки головок от жёстких дисков. Над тем, чтобы они быстро перемещались, долго и упорно работали инженеры. Поэтому им не нужен мощный усилитель, который мало того, что дорогой, так его еще и девать потом некуда. Ну и, в конце концов, если на жесткий диск можно орать, то почему бы ему не орать в ответ?

Головки очень похожи на руки, но только сколько я дисков не вскрывал — только левые. К счастью, блок почти одинаков с обеих сторон и после доработки напильником легко переворачивается. Получается правая рука. Получился вот такой железный дровосек.

Только смотреть на то, как он мелко дрожит довольно скучно. Поэтому выкручиваем басы на полную и добавляем субтон на несколько герц. Дровосека от этого сразу пробивает на эмоции. Остается еще голова-лампочка — ей я управлял вручную. Можно конечно автоматику прикрутить -, но тогда это будет инсталляция, а так — перформанс: только сегодня, только для Вас.