[Перевод] Инопланетная болтовня: на космической вечеринке разум будет слышно лучше всего15.07.2017 20:37

Применение теории информации к поиску сигналов внеземных цивилизаций

Если вы ищете сигналы инопланетных цивилизаций, то почему бы вначале не попрактиковаться на каких-нибудь системах передачи информации, не принадлежащих человеку, существующих на нашей планете? У китов глобальная коммуникационная система существует уже миллионы лет — дольше, чем вообще существуют Homo sapiens. Пчёлы, общающиеся друг с другом частично при помощи танцев устраивали демократические дебаты по поводу лучших мест для роения за миллионы лет до того, как люди придумали демократическую политическую систему. Полно и других примеров. Никто из моих знакомых, изучивших систему коммуникаций других животных, никогда после этого не делал заключения, что этот вид оказался тупее, чем он думал.

Изучая средства связи животных, мы с коллегами разработали новый тип детектора, фильтр «коммуникационного интеллекта», определяющий, принадлежит ли сигнал из космоса технологически продвинутой цивилизации. Большинство предыдущих попыток в проекте SETI искали радиопередачи в узком диапазоне частот или быстро мерцающие оптические сигналы. Судя по нашим знаниям в области астрофизики, такие сигналы были бы явно искусственными, и их открытие означало бы наличие технологий, способных передавать сигнал на межзвёздные расстояния. SETI обычно выбрасывают из рассмотрения широкополосные радиосигналы и медленные оптические импульсы, чьё происхождение менее очевидно. Хотя эти сигналы вполне могли быть посланы разумными существами, они могут исходить и из естественных источников радиоволн, например, межзвёздных газовых облаков, и у нас до сих пор не было хорошего способа различать их.

Проще говоря, мы уже могли получить сообщение от разумных существ и пренебречь им, поскольку оно не оправдало наших ожиданий по поводу того, как должен выглядеть такой сигнал. Именно это может быть причиной того, что за 50 лет поисков мы так и не обнаружили никаких межзвёздных коммуникаций.

За последние полтора десятилетия мы с коллегами придумали способ лучше. Мы применяли теорию информации к системам связи людей и животных, и теперь можем точно сказать, в каком случае определённые живые существа передают друг другу сложные идеи, даже не зная, что они говорят. Мы используем термин «система связи», чтобы не решать заранее, есть ли у других видов язык в человеческом понимании этого слова. Сложные коммуникации подчиняются общим правилам синтаксиса, из которых следует наличие того, что можно назвать «разумным содержимым». Если у нас есть достаточно большой кусок сообщения, мы можем оценить степень его сложности или структуру правил. В математике теории информации эта структура называется «условной информационной энтропией» и составляется из математических связей между элементарными единицами коммуникации, такими, как буквы и фонемы. В повседневной речи мы считаем такой структурой грамматику, а на более базовом уровне — составление слов и предложений из звуков. И впервые в SETI Institute в Маунтин-Вью в Калифорнии мы начали искать такие структуры в собранных SETI данных.

Мои коллеги, Бренда Маккован, Шон Хансер из Калифорнийского университета в Дэвисе, и я решили изучать существ, как социально сложных, так и сильно зависящих от акустической связи, и использующих звуковые сигналы, которые мы могли бы классифицировать. Поэтому нашими первыми тремя испытуемыми стали дельфины афалины (Tursiops truncatus), обыкновенные беличьи обезьяны (Saimiri sciureus) и горбатые киты (Megaptera novaeangliae).

Один аспект человеческой лингвистики, проявившийся в ранних исследованиях слов, букв и фонем, известен, как закон Ципфа, по имени гарвардского лингвиста Джорджа Ципфа. В английских текстах букв «e» больше, чем букв «t», букв «t» больше, чем букв «a», и так далее, вплоть до самой редко используемой «q». Если построить список букв от «e» до «q» по убыванию частоты, и построить частоту их использования на логарифмическом графике, то эти значения улягутся на наклонённой под 45 градусов прямой — то есть, на прямой с уклоном в -1 [Проще говоря, частота использования n-й буквы обратно пропорциональна её порядковому номеру n / прим. перев.]. Если сделать то же самое с текстом, составленным из китайских символов, получится такой же уклон. То же будет верным для букв, слов или фонем для разговоров на японском, немецком, хинди и десятках других языков. А младенческий лепет не подчиняется закону Ципфа. Его уклон меньше -1, поскольку он издаёт звуки почти случайно. Но по мере изучения языка уклон постепенно увеличивается и достигает -1 примерно к возрасту 24 месяцев.

Математические лингвисты утверждают, что этот уклон в -1 говорит о том, что в последовательности звуков или символов письменности содержится достаточно сложности, чтобы принадлежать к языку. Это необходимое, но не достаточное условие — то есть, это первая проверка на сложность, но не доказательство её наличия. Сам Ципф считал, что причина этого уклона в -1 кроется в компромиссе, который он называл «принципом наименьших усилий». Это баланс между передающим индивидом, пытающимся израсходовать поменьше энергии на отправку сигнала, и принимающим, желающим получить больше избыточности, чтобы убедиться в получении всего сообщения целиком.

Главное в применении теории информации — изоляция единиц сигнала. К примеру, если построить все точки и тире из азбуки Морзе на графике, мы получим уклон Ципфа порядка — 0,2. Но если принять за элементарные единицы последовательности точек и тире — точка точка, точка тире, тире точка и тире тире, а также более длинные вариации — то уклон будет меняться в сторону -1, отражая то, как в этой системе кодируются буквы алфавита. Таким способом можно при помощи обратной разработки распознать изначальные единицы смысла.

Большинство лингвистов предполагали, что закон Ципфа характеризует только человеческие языки. Мы с радостью узнали, построив частоту свистков взрослых афалин на графике, что и они также подчиняются закону Ципфа! Позже, когда в «Морском мире» в Калифорнии родилось два маленьких афалинчика, мы записали их младенческие посвисты и обнаружили, что для них наклон Ципфа соответствовал таковому для бормотания человеческих младенцев. Получается, что младенцы дельфинов бормочут и свистят, разучивая свою систему коммуникаций примерно так же, как человеческие младенцы изучают язык. Когда дельфинам исполнилось 12 месяцев, частота распределения звуков в их свисте достигла уклона в -1.

Хотя нам ещё предстоит расшифровать, что говорят дельфины, мы установили, что у них и китов есть коммуникационные системы с внутренней сложностью, приближающейся к человеческому языку. Эта сложность делает общение отказоустойчивым. Любое существо, обменивающееся информацией, должно иметь возможность делать это, несмотря на окружающий шум, препятствия и другие явления, вмешивающиеся в распространение сигнала. Человеческий язык структурирован так, чтобы обеспечить избыточность. На базовом уровне эта структура определяет вероятность появления заданной буквы. Если я скажу вам, что задумал слово, вы можете догадаться, что первой буквой этого слова будет «t», поскольку эта самая популярная первая буква для слов в английском языке. Ваша догадка будет наиболее вероятной, но мало информативной. Можно сказать, что вы выбрали самый лёгкий из вариантов. Если бы вы остановились на букве «q», и угадали, вы получили бы некую более точную информацию о задуманном мною слове, если оно и правда начинается на «q».

Пойдём дальше. Если бы я сказал, что я думаю о второй букве в слове, первой буквой которого будет «q», вы бы сразу угадали, что эта буква — «u». Почему? Потому, что вы [англоязычный читатель] знаете, что эти две буквы в английском встречаются вместе почти со 100% вероятностью. Чтобы догадаться о недостающей информации, вы воспользовались не только вероятностью появления букв, но и условной вероятностью, связанной с двумя буквами — вероятностью того, что в слове будет буква «u», если известно, что буква «q» уже есть. Наш мозг использует уловные вероятности, когда необходимо исправлять ошибки в передаче информации — нечёткий текст на распечатке с кончающимся картриджем, или плохо различимые слова в шумном телефонном звонке.

В английском языке условные вероятности можно задавать вплоть до девяти слов подряд. Если одно слово пропущено, можно догадаться, что это за слово. Если пропущено два слова подряд, всё ещё часто можно восстановить их из контекста. Короткий пример предложения без одного слова: «Как ___ чувствуете себя сегодня?». Легко можно догадаться, что пропущено «вы». Теперь рассмотрим предложение без двух слов: «Как ___ ___ себя сегодня?» Там может быть: «Как Иннокентий чувствует себя сегодня?» Могут быть и другие варианты. Очевидно, что чем больше слов пропущено, тем сложнее понять их из контекста, и тем меньше их условная вероятность. Для большинства письменных языков человечества условная вероятность исчезает, когда оказывается пропущено порядка девяти слов подряд. Если пропущено 10 слов, у вас не будет никакого представления о том, что это могли быть за слова. На языке теории информации это значит, энтропия человеческого слова достигает девятого порядка.

Мы обнаружили подобные условные вероятности и в системах общения животных. К примеру, мы записывали звуки общения горбатых китов в юго-восточной Аляске вместе с Фредом Шарпом из Фонда китов Аляски. Горбатые киты известны своими песнями, которые обычно записываются, когда они подходят к Гавайям для размножения. На Аляске их звуки очень отличаются: звуки, предназначенные для загона рыб в сети, состоят из бульканий и социальных криков, а не песен. Мы записали эти вокализации как в присутствии, так и в отсутствии шума от лодки. Мы подсчитали, до какой степени океан работает как статика в телефонной линии. Затем мы использовали теорию информации, чтобы оценить численно, насколько китам нужно было бы замедлять свою вокализацию, чтобы обеспечить приём сообщений без ошибок.

Как и ожидалось, в присутствии шума от лодки киты замедляли скорость вокализации, точно так же, как человек замедляет разговор по телефону при наличии шума. Но замедлялись они всего на 3/5 от той величины, которую они теоретически должны были бы достичь, чтобы обеспечить передачу сообщений без неверных толкований. Как же они сумели обойтись таким несильным замедлением, когда окружающий шум явно требовал большего? Мы некоторое время размышляли об этом, а потом поняли, что в их системе общения структура правил наверняка такова, что оставшиеся две пятых части сигнала можно восстановить. Горбатые киты использовали условные вероятности их звукового аналога слов. Им не нужно было получать всё сообщение целиком, чтобы иметь возможность заполнить пустые места.

Мы нашли внутреннюю структуру и в общении дельфинов. Разница была в том, что у дельфинов основных сигналов порядка 50, а у горбатых китов их сотни. Сейчас мы собираем информацию, чтобы определить, какова максимальная степень энтропии у системы коммуникаций горбатых китов.

Чтобы проверить возможность нашего подхода отделять астрофизику от разумных сигналов, мы перешли к примерам из радиоастрономии. Когда в 1967 году астрономы Джоселин Белл Бёрнел и Энтони Хьюиш открыли звёздные пульсары, их прозвали «МЗЧ», то есть «маленькие зелёные человечки» [LGM]. Из-за чёткой периодичности этих радиоисточников некоторые учёные начали рассуждать, что они могут быть маяками продвинутых внеземных цивилизаций. С помощью Саймона Джонстона из Австралийского национального радиоастрономического общества мы проанализировали импульсы пульсара в Парусах и получили наклон Ципфа в -0,3. Это не соответствует ни одному из известных языков. Кроме того, мы не нашли в сигналах пульсара практически никакой условно-вероятностной структуры. И в самом деле, сегодня известно, что пульсары — это естественные остатки сверхновых. Получается, что теория информации легко может различить мнимый разумный сигнал и естественный источник.

Сейчас мы анализируем микроволновые данные, полученные с Антенной решётки Аллена института SETI, состоящей из 42 телескопов, обозревающих в диапазоне от 1 до 10 ГГц. Кроме обычной схемы поиска радиоволн узкого диапазона мы начинаем применять меры из теории информации. Если мы, к примеру, найдём сигналы, подчиняющиеся закону Ципфа, это вдохновит нас на продолжение работы и на поиски синтаксической структуры в сигналах в попытке определить сложность потенциального сообщения.

Для передачи знаний даже очень продвинутой внеземной цивилизации нужно будет подчиняться правилам теории информации. Пусть мы, вероятно, и не сможем расшифровать такое сообщение из-за отсутствия общих символов (та же проблема есть у нас с горбатыми китами), мы сможем получить представление о сложности их системы связи –, а следовательно, и мыслительных процессах. Если, к примеру, условные вероятности сигнала, найденного в SETI, будут 20-го порядка, это будет означать не только искусственную природу сигнала, но и огромную сложность языка по сравнению с любым земным. У нас появится количественная мера сложности мыслительных процессов передающих информацию внеземных существ.

Лоуренс Дойл — директор Института метафизики в физике [Institute for the Metaphysics of Physics] из Колледжа Принципия, шт. Иллинойс, и организатор Группы квантовой астрофизики в Институте SETI. Он был членом миссии Кеплер в НАСА, и руководил командой, обнаружившей первую планету с кратной орбитой (прозванную Татуином).