Исследователи считают, что знаки препинания в текстах располагаются в соответствии с распределением Вейбулла

9f3174a9ef8272fdd3ffe2dc4281e396.jpg

Польские учёные проанализировали расстановку знаков препинания в самых популярных и сформировавшихся европейских языках и опубликовали работу, в которой утверждают, что наша пунктуация подчиняется распределению Вейбулла. 

Как пишет Forbes, для изучения были выбраны английский, испанский, итальянский, немецкий, польский, русский и французский языки. Критериями отбора стали: общая численность говорящих на этом языке — не менее 50 млн человек; Нобелевские премии, полученные литературными произведениями на этом языке — не менее 5. После этого исследователи выбирали книги: каждая должна была содержать не менее 1,5 тыс. слов, разделённых знаками препинания. В финальном списке оказалось 240 произведений, среди которых были «Анна Каренина» Льва Толстого и «Алиса в Стране чудес» Льюиса Кэрролла, «Жестяной барабан» Гюнтера Грасса и «Имя розы» Умберто Эко. 

Проанализировав все тексты, учёные обнаружили явно прослеживаемую последовательность в расположении знаков препинания во всех языках. Они воссоздали её модель и увидели, что она может быть описана одним из вариантов кривой Вейбулла.

Распределение Вейбулла в теории вероятностей — двухпараметрическое семейство абсолютно непрерывных распределений. Эта функция применяется во множестве отраслей науки: статистике, инженерии, электротехнике, метеорологии. Например, распределение Вейбулла может описывать время, которое люди проводят на сайте: большинство уходит через несколько секунд, и почти никто не остаётся в течение нескольких часов.

Когда учёные сравнили переведённые тексты одних и тех же литературных произведений, они получили подтверждение, что распределение пунктуации соответствует языку перевода, а не языку исходного текста. По их мнению, это может служить доказательством, что пунктуация — не просто выбор автора. Даже когда переводчики пытались сохранить оригинальную авторскую стилистику, они всё равно использовали знаки препинания в соответствии с правилами языка перевода.

Менее требовательными к пунктуации оказались английский и испанский языки. И одним из возможных объяснений этого может быть то, что в этих языках более формальные конструкции предложений, поэтому смысл понятен даже без использования всех необходимых знаков препинания. Наиболее зависимыми от знаков препинания оказались славянские языки: русский и польский. 

© Habrahabr.ru