Универсальная кириллица: возможна ли такая клавиатура?
Текст написан иностранным агентом — лицом, проживающим за пределами России (в Канаде)
За пару дней до Рождества на Хабре появился пост про транслитерацию польского языка кириллицей. Хотя идея на первый взгляд выглядит всего лишь как занимательное развлечение, на практике с задачами подобного рода периодически сталкиваются лингвисты. Когда лингвисту необходимо сравнить лексику родственных языков (особенно когда речь идёт о массовом сравнении в рамках корпусной лингвистики), сравниваемые языки нужно для начала «привести к общему знаменателю», то есть передать в единой графике, чаще всего латинице, чтобы облегчить сравнение. Даже с учётом неизбежных расхождений между орфографией и произношением (как в английском и французском языках) единая система письма сильно упрощает задачу сравнения. И не только сравнения, но и изучения. Скажем, если Вы начали учить язык с совершенно незнакомой системой письма (корейский, китайский, санскрит и т.п.), наверняка первые изученные Вами слова и фразы будут записаны в транслитерации латиницей (а то и кириллицей).
Ни кириллица, ни латиница не является единой унифицированной системой письма. В каждом языке, использующем кириллицу или латиницу, есть свои правила произношения того или иного знака, весьма отличные друг от друга. Но кроме того, существуют многочисленные дополнительные знаки для звуков, присутствующих в одном языке, но отсутствующих в другом. К примеру, звук «ш» существует во многих европейских языках, но создать единую букву для него в латинице так и не сподобились. Где-то обходятся сочетаниями (sh в английском и албанском, sch в немецком, ch во французском, sz в польском, sc в итальянском, sj в шведском, si или se — в ирландском), где-то под этот звук «переопределили» базовые буквы латиницы (x в португальском, старая знакомая s — в венгерском), где-то изобрели новые буквы путём добавления надстрочных или подстрочных значков к старым (š в чешском, словацком и балтийских, ş в турецком, ș в румынском — приглядевшись под микроскопом, увидите, что знак немного отличается от турецкого; и даже в искусственном языке эсперанто придумали свой знак ŝ). Некоторым языкам повезло — в них этого звука вообще нет, как не было его в латыни (отчего, собственно, и возникли эти проблемы с изобретением дополнительного символа).
Вопрос о том, почему в этих странах не хотят прийти к единым стандартам, отставим пока как риторический. Национальный суверенитет ещё никто не отменял, а насколько они страдают от такого разнообразия норм — это их проблема и их внутреннее дело.
Из языков, использующих латинский алфавит, только английский прекрасно обходится без дополнительных знаков. Формально, конечно, в английском они тоже есть (например, в словах типа fiancé, café), но в тех крайне редких случаях, когда они нужны, их услужливо вставляет автокорректор. Поэтому базовой английской раскладкой клавиатуры вполне обходятся англоязычные страны — США, Великобритания, Австралия, Новая Зеландия и другие (а «заточенный» под американцев Corel WordPerfect Office до сих пор ухитряется проблему неанглийской латиницы даже не игнорировать, а злобно троллить — кто знает, насколько по-садистски у них реализован Юникод, тот поймёт, о чём я).
Совсем другое дело — страны Европы и Латинской Америки. Практически в каждом из тамошних языков есть знаки, дополнительные к базовой латинице. Но мало того — в каждом языке они свои, абсолютно без оглядки на соседей.
Ну и что, скажете вы, велика печаль! Для большинства из нас-то это точно не проблема. Но это вполне актуальная проблема, например, для немалого количества европейцев, где территорию многих государств можно проехать на машине за несколько часов. Как бы ни хотело любое из этих государств обойтись только своим суверенным языком, в реальности бизнес требует использования в той или иной мере хотя бы одного из соседних языков, а нередко и нескольких. Но помимо бизнеса, есть бюрократия (работа с документами, выданными в других странах ЕС, где имена-фамилии пишутся с теми самыми странными значками), есть проблема движения студентов (получает школьное образование в одной стране, университетский диплом — в другой, магистратуру — в третьей, и т.п.)
Наконец, есть компании, обслуживающие клиентов во многих странах и на многих языках (от аэроперевозчиков до банальных веб-магазинов) — в таких нередко от агента требуют знания как минимум двух языков, иногда и больше. Не забудем и бюро переводов. В общем, количество людей, которым на клавиатуре периодически нужны символы, отсутствующие в родном языке, не так и мало. Меня разные клавиатуры интересуют тоже не просто так, а как профессионального переводчика со стажем.
Для решения проблемы дополнительных символов, как известно, существуют раскладки клавиатуры для разных языков. Но в этих раскладках есть свои подводные камни; ведь помимо дополнительных символов, они и основные-то не всегда располагают одинаково: где-то QWERTY, где-то AZERTY, и т.п.
Как разумная альтернатива дурной бесконечности разных раскладок, есть американская международная клавиатура. В ней можно набирать великое множество разных символов путём комбинации букв с акцентами. Например, комбинация «a превращается в á, а «o — в ö. Если нужны кавычки как таковые, то после них набирается пробел; для ряда особо хитрых символов правая клавиша Alt используется в комбинации с обычными латинскими буквами — так получаются ð, þ, å, ø, » и много чего другого. Я с интересом отметил, что некоторые комбинации не работают под Windows, но работают под Ubuntu — например, только в этой ОС комбинация 's позволяет набрать польский символ ś.
Недостаток американской международной клавиатуры — в том, что она включает лишь символы западноевропейских языков. Уже с восточноевропейскими (польскими, румынскими, венгерскими, турецкими) возникает проблема — их там нет (чуть-чуть есть под Ubuntu, но далеко не все).
Но тем не менее, для большого числа языков американская международная клавиатура решает проблему довольно эффективно. Мне, как переводчику и заодно сотруднику большого веб-магазина, вполне удобно, не переключаясь между клавиатурами, писать и по-английски, и по-немецки, и по-французски.
А вот для языков с кириллицей, например, русского и украинского — такой номер уже не пройдёт. Понадобятся две разных раскладки клавиатуры. Я сейчас не хочу писать об известных событиях в политике, потому что речь — не о российско-украинских отношениях, а о том, что для наборов символов, которые различаются всего несколькими знаками (и при этом с большой вероятностью могут использоваться на одних и тех же компьютерах), используются две разные раскладки клавиатуры. А почему нельзя использовать одну?
Для большей части жителей России проблема подобного рода не стоит вообще. Зато она существует в какой-то мере в национальных автономиях (Татарстан, Мордовия и другие), где хотя бы часть пользователей время от времени пишет в Интернете на родном языке. В ещё большей степени проблема существует в ряде стран Средней Азии, где наряду с родными языками в обиходе широко используется и русский (в Казахстане, правда, начался переход на латиницу, но сколько-то лет он ещё займёт;, а в Азербайджане, Узбекистане и Туркменистане кириллицу уже не вернуть). Наконец, в таких странах, как Украина, Беларусь, Болгария и в какой-то мере даже в Сербии и Македонии проблема переключения между разными кириллицами вполне существует. Добавлю ещё, что сербская раскладка кириллической клавиатуры кардинально отличается от постсоветской — там расположение клавиш примерно соответствует латинице.
Ниже — сравнительная таблица символов кириллицы в славянских языках. Как видим, большая часть символов совпадает, но некоторые — существуют только в отдельных языках. Вот пример: в сербском и македонском языках исчез мягкий знак Ь, зато возникли символы-лигатуры Љ и Њ — всё потому, что другие палатализованные (в просторечии «мягкие») согласные в этих языках довольно заметно отличаются по произношению от своих непалатализованных пар, в потому сохранять старинную букву кириллицы Ь только ради двух сочетаний создатель сербского алфавита Караджич счёл лишним.
Русский | Украинский | Белорусский | Болгарский | Македонский | Сербский |
А | А | А | А | А | А |
Б | Б | Б | Б | Б | Б |
В | В | В | В | В | В |
Г | Г | Г | Г | Г | Г |
Ґ | |||||
Ѓ | |||||
Д | Д | Д | Д | Д | Д |
Ђ | |||||
Е | Е | Е | Е | Е | Е |
Є | |||||
Ё | Ё | Ё | Ё | ||
Ж | Ж | Ж | Ж | Ж | Ж |
З | З | З | З | З | З |
Ѕ | |||||
И | И | И | И | И | И |
І | |||||
Ї | |||||
Й | Й | Й | Й | Й | Й |
Ј | Ј | ||||
К | К | К | К | К | К |
Ќ | |||||
Л | Л | Л | Л | Л | Л |
Љ | Љ | ||||
М | М | М | М | М | М |
Н | Н | Н | Н | Н | Н |
Њ | Њ | ||||
О | О | О | О | О | О |
П | П | П | П | П | П |
Р | Р | Р | Р | Р | Р |
С | С | С | С | С | С |
Т | Т | Т | Т | Т | Т |
Ћ | |||||
У | У | У | У | У | У |
Ў | |||||
Ф | Ф | Ф | Ф | Ф | Ф |
Х | Х | Х | Х | Х | Х |
Ц | Ц | Ц | Ц | Ц | Ц |
Ч | Ч | Ч | Ч | Ч | Ч |
Џ | Џ | ||||
Ш | Ш | Ш | Ш | Ш | Ш |
Щ | Щ | Щ | Щ | ||
Ъ | Ъ | ||||
Ы | Ы | Ы | Ы | ||
Ь | Ь | Ь | Ь | Ь | |
Э | Э | Э | Э | ||
Ю | Ю | Ю | Ю | Ю | Ю |
Я | Я | Я | Я | Я | Я |
Языки Средней Азии, автономий России, а также монгольский — отдельная интересная тема, там тоже есть дополнительные символы, которых нет в этой таблице. В некоторых языках, у меня впечатление, символы изобретали по принципу «лишь бы не так, как у соседей».
Тем не менее, несмотря на всё разнообразие, большую часть символов можно свести к принципу «базовый символ + дополнительный акцент, точка или штрих». Иными словами — тот же принцип, что и для дополнительных латинских символов американской международной клавиатуры.
Отсюда вопрос: почему нельзя создать подобную расширенную клавиатуру для кириллицы? Хотя по практическим соображениям, лучше, наверное, было бы всё-таки две разных: «славянскую кириллицу» и «восточную кириллицу» (для языков Средней Азии, Кавказа и автономий).
«Общеславянскую» кириллическую клавиатуру можно было бы построить на том принципе, что дополнительные буквы набираются с помощью правого Alt либо разных кавычек-акцентов (а если нужны кавычки как таковые, то можно, как и в английской международной — после них либо пробел, либо нажать кавычку два раза).
Стоп, но как решить, например, ту проблему, что в русском языке есть Ы, но нет І, в украинском — наоборот, а в белорусском, а также в русинском (этот язык официально изучается и преподаётся в ряде мест на востоке Словакии) — и та, и другая буквы?
Компромисс видится в том, чтобы зарезервировать на клавиатуре часть клавиш для символов, которых в русском языке в принципе нет, а некоторые редко используемые русские символы (в первую очередь Ъ) набирать с помощью правой Alt. Подобным образом давно уже поступают украинцы, набирая с помощью правой Alt редко, но всё же используемую букву Ґ. Букву Ы можно набирать как автозамену комбинации Ь+І.
На рисунке ниже — один из вариантов подобной раскладки. Синим обозначены символы, которые можно было бы набирать при помощи правой Alt, жёлтым закрашены примеры символов (их гораздо больше), которые можно набирать при помощи сочетания с кавычкой в качестве акцента.
На возражения о неудобстве подобной раскладки можно заметить, что большинство россиян без неё и так обойдётся (как большинство американцев и даже жителей англоязычных провинций официально двуязычной Канады обходятся без «американской международной»).
Как вариант, возможно создание нескольких локальных версий данной раскладки, с одним и тем же расположением символов, разница будет лишь в том, какой из символов первичен, а какой будет набираться с помощью правой Alt. В такой раскладке нашлось бы место даже для устаревших символов, вроде «ять» (на рисунке выше «ять» нет — есть отдалённо внешне схожие с ней сербские буквы «джь» и «чь»).
А вот для пользователей в соседних славянских странах, если её удачно продумать, эта раскладка вполне могла бы стать удобным стандартом де-факто. Потому что политика политикой, однако интересы потребителя над политикой всегда превалируют.