Адекватная латиница для русского языка

9bf71332005b28a30cd6a62e37033c1a.png

Кому и зачем нужно писать русские слова латинскими буквами?

Конечно, это нужно для русскоязычных людей. Очевидно, что идея об иностранцах, которые прочитают латинские буквы на уличной вывеске и сразу поймут, что они означают, является очень сильным преувеличением. Для иностранцев русскоязычная латиница не нужна. Она нужна нам — людям, которые говорят на русском.

В первую очередь адекватный стандарт нужен для конвертации названий и имен для международных документов. Очевидно, что паспорта, водительские удостоверения и даже визитки должны быть с нормальными именами, написанным по правилам русского языка, а не английского, немецкого или французского. Сейчас в России и Казахстане используется стандарт конвертации из Британского Географического общества, который был принят столетия назад и предназначался для населенных пунктов, а не имен. И цель была отличать их от английских названий, поэтому, например, вместо очевидной буквы H для русской Х там используется KH — две буквы, которые носители английского языка не умеют читать, поскольку в их языке такого нет. И в русском тоже нет. Этот стандарт не подходит для нормального использования. Он даже не всегда одинаково относится к тем же самым буквам: Ц может превратится в C или в TS. А буква Ё чаще всего становится буквой E.

Второй областью использования является интернет и любые программно-аппаратные системы, где принято использовать латинские буквы. Есть такое понятие — «Человекопонятный URL» — сокращенно ЧПУ. Он используется для удобства пользователя, который может понять содержимое страницы сайта из ее адреса. Сейчас этот формат не стандартизирован и появляется масса вариантов, которые, если быть честным, все-таки больше похожи на стандарты перевода русскоязычных имен для документов на латиницы. Для программистов иногда может быть удобно именовать функции, переменные, таблицы и др. с помощью русских слов, но приходится это делать латинскими буквами. Для этого тоже очень нужен единый адекватный стандарт, который передает особенности русского языка, а не какого-то другого, как происходит это сейчас.

Подойдет ли адекватная латиница для других языков с кириллическим алфавитом?

Кажется, что идея, которая используется для адекватной конвертации русских слов на латиницу не подойдет для большинства других языков с кириллическим алфавитом. Каждый язык нужно рассматривать отдельно, и особенности русского написания слов не похожи на другие языки, которые используют тот же алфавит, поэтому этот принцип конвертации использовать нельзя.

Можно ли использовать правила из других языков для конвертации русского на латиницу?

Конечно. Общий принцип прост: буквы, которые имеют похожее звучание должны быть использованы по прямому назначению. Но если какие-то буквы или их сочетания можно упросить, то нет смысла заимствовать сложные правила из других языков, которые не являются родственными русскому. Нет никакого смысла писать две или три буквы для описания одного звука только по причине того, что так сделано в другом языке (SH для звука Ш в английском или SCH для Ш в немецком).

Общее описание идеи конвертации русских слов в написание латинскими буквами

В русском языке есть важная особенность, которая для отображения на письме прибегает к использованию неочевидного (но всем привычного) способа: мягкость и твердость согласных букв регулируется последующей гласной буквой. В русском для гласных букв нет разделения на твердые и мягкие, хотя есть всегда мягкие и всегда твердые согласные, на которые не влияют последующие гласные: Й, Ч, Щ — всегда мягкие; Ж, Ц, Ш — всегда твердые.

Если отказаться от использования специальных гласных букв для обозначения мягкости согласных, то перевод на латиницу русского языка становится очень простым и вариативным. Основной проблемой латиницы является «недостаточное количество» гласных, которых вдвое меньше, чем в русском. Однако, если посчитать, что буквы E, Ё, И, Ю, Я являются составными (со звуком Й) и используют функцию смягчения согласной, то латинских гласных становится достаточно для безболезненного написания русских слов.

Поэтому остается только выбрать способ, как будет обозначаться мягкость согласной в слове. Есть два пути: использования вспомогательной буквы и использование надстрочных и подстрочных элементов. Кажется, что использование дополнительной буквы будет проще и удобней, но это может повлечь некоторые особенности, которые приводят к созданию дополнительных правил-исключений для такого написания. Поэтому первый способ, с дополнительными «точками» у мягких согласных.

Ļuboy șimvol nad iļi pod bukvoy oboznačayet yeyo m̭agkosţ

Совершенно неважно будет ли это точка, вертикальная или горизонтальная линия, хвостик, символ похожий на ударение из учебника, сверху или снизу — все они обозначают мягкость согласной буквы. Функция придания мягкости уходит от гласных и возвращается на свое законное место.

Гласные А, О, У, Ы, Э превращаются в очевидные A, O, U, I, E. Конечно, здесь появляются первые исключения:

  • В начале слова буква I всегда означает И, так как в русском нет слов, которые начинаются на Ы;

  • В начале слова буква E всегда означает Э, так как слова, которые начинаются на русскую E нужно писать с помощью двух букв: YE.

Буквы E, Ё, Ю, Я превращаются на письме в YE, YO, YU, YA, когда стоят в начале слова, после гласной, твёрдого или мягкого знака. Буква И остается I, без добавления Y, так как звук Й в ней отсутствует.

Таким способом мы автоматически исключаем необходимость использования твердого знака: podyezd. Мягкий знак в середине слова тоже исчезает: usṯye. Функцию разделительного мягкого и твердого знака выполняет буква Y. Сам по себе твердый знак сейчас существует только для того, чтобы «отменить» функцию смягчения, которую дают буквы E, Ё, И, Ю, Я. Поэтому такой способ с использованием Y убирает лишнее правило.

Буквы Е и Ё

Эти буквы на письме часто не различают. Это очень плохо для фамилий и имен. Конечно, чередование букв Е и Ё в однокоренных словах будет выглядеть при конвертации не очень «красиво», хотя в русском написании с ними все более менее в порядке: ёж, ежи —, но yoj, yeji. Это нельзя считать проблемой, поскольку чередование гласных в корнях слов вполне обычное явление: неприкасаемый, но прикосновение; изберу, но избирать; выдеру, но выдирать; замерли, но замирать и т.д.

Исключение исключений

При использовании таких правил конвертации в латиницу, с учетом знания, что часть согласных букв всегда мягкие, а часть — твердые, уже нет проблем с написанием слов: цирк, цинк, цифра, цыплёнок, цыган, циркуль и пр. Они всегда будут написаны с помощью латинских букв C и I.

То же самое касается правил ЖИ-ШИ, ЧА-ЩА, ЧУ-ЩУ. Конечно, там нет немотивированного выбора одной или другой буквы, но все же намного удобней, когда гласная одна — I, и другого варианта не может быть.

Слова жюри, брошюра, парашют становятся адекватными: они будут написаны именно так, как произносятся: juři, broxura, paraxut.

Буква Ш

Одна буквы лучше, чем две или три. Поэтому необходимо сократить все, что только возможно. Именно поэтому буква Ш должна превратится в одну букву. Если изучить вопрос, то оказывается, что после задействования всех очевидных согласных, совпадающих в русском и латинском алфавите, остаются несколько доступных для использования: Q, X, W (или V).

Сразу хочется отбросить W, которая может играть роль буквы V, если кто-то ошибся при написании. И пусть она визуально может быть схожа с Ш, но правильное прочтение неподготовленными пользователями практически невозможно.

С буквой Q и X ситуация менее очевидна: Q можно прочитать как К (а у нас уже такая есть). А вот букву X прочитать как ИКС сложней всего, так как она почти не используется языках на основе латиницы.

Именно этот факт кажется удобным для использования X в качестве буквы Ш. Тем более, как оказалось, символ X (греческая буква КСИ) в испанских переводах арабского заменял арабский звук Ш. И именно из этих переводов X попадает в латинский алфавит. В некоторых словах португальского и в мексиканском испанском буква X обозначает звук Ш. Конечно, исторические причины не являются аргументом, но вот использование редкой буквы, которая задействована очень мало, вместо двух или трех символов, кажется разумным использованием «свободного пространства».

Очевидно, что Щ является мягкой версией Ш, а значит дополняется «точкой»: kladovx̱ik, obx̣iy, yax̰ik, ẍuka, zapravx̌ik — и тут тоже подходит любой символ.

Буквы Ц и Ч

Буква Ц должна конвертироваться просто и очевидно — в C. Как в латинском алфавите. Заменять ее буквами TS нет никакого смысла. Это только запутывает и добавляет исключений.

Поскольку буква Ц всегда твердая, а Ч всегда мягкая, то логично сделать из них пару по аналогии с Ш и Щ. Конечно, они не похожи по звучанию, но «специальная C» выглядит более знакомо из-за влияния западно-славянских языков. Поэтому počta кажется достаточно логичным, и увидеть в слове почта, например Q — poqta — несколько сложнее.

Буквы Ж и Й

Поскольку в латинском алфавите буква J называется ЖИ, то нет смысла искать специальные сочетания букв (ZH — это вариант не из английского языка, а из Британского стандарта написания названий русских населенных пунктов). Возможно, что будут некоторые сложности, поскольку J во многих европейских языках используется для обозначения Й. Но, как было сказано выше, ориентироваться на какой-то конкретный язык, который не является русским нет никакого смысла, если это приносит неудобства и добавляет исключений.

При использовании J в качестве звука Ж, остается только один адекватный кандидат на букву Й — это Y. Кроме самой буквы Й латинская Y будет заменять «сложные» гласные, где это уместно. То есть в E станет YE, если стоит в начале слова или после твердого знака. С буквой Y все становится очень просто: yama, yenot, yolka, yula.

Буквы E и Э

Если слово начинается на Э, то там будет латинская E: eto, ekvator, ekzam̭en. В середине слова в русском языке не очень часто встречается звук Э, и его обычно обозначают русской буквой E, из-за чего случаются разночтения в произношении некоторых слов: рейтинг, сканер. А иногда и прямые исключения: шоссе, пенсне. При адекватном переводе этих слов на латиницу можно будет выбрать правильный вариант сразу, и не оставлять простора для фантазии: reyṭing (РЭЙТИНГ), skañer (СКАНЕР), xosse (ШОССЭ), p̌ensne (ПЕНСНЭ). Хотя, если бы эти слова появились в русском, имеющим латинскую алфавитную основу, то и проблемы бы не возникло: скорее всего слова остались бы в своем оригинальном написании.

А ведь можно добавить исключение? В русском языке буква Э очень редко встречается в середине слова, а значит латинская E почти всегда смягчает предыдущую согласную? Да, это действительно так. Но этот подход оставим для второго способа отображения, когда по какой-то причине «точки» использовать не хочется.

Можно ли остаться в рамках букв латинского алфавита и не использовать дополнительные элементы?

Конечно. Самое простое — использовать озвученные выше правила и просто не добавлять «точки». Этот текст останется читабельным, но будет менее удобен для полноценного использования. Но есть и другой вариант, который, однако, добавит новые исключения.

Самый простой вариант — использовать отдельную букву для смягчения согласных и ставить ее сразу после «стандартной» твердой гласной. Как было сказано выше, если адекватно переводить буквы из русского языка в латинский алфавит, то остается несколько букв: Q, W, X.

Но буква X уже используется для обозначения буквы Ш. Буква W слишком похожа на V по смыслу. Буква Q кажется несуразной и нелогичной. Что если посмотреть на другие языки? Буква H кажется подходящей: в немецком она не произносится, если стоит после гласной, в английском она почти не произносится в начале слова, так же и во французском, а в португальском она идеально регулирует L и N делая их мягкими!

Itak, budhem ispolhzovath H dlha smhagchenhiya soglasnih bukv

65650f64460766d6536671319ab486ac.png

Здесь у нас автоматически появляется CH обозначающая букву Ч (как мы все втайне хотели). Буква Щ становится почти элитной XH. А вот после J и Y букву H ставить уже не нужно — они не смягчаются.

Конечно, есть и проблемы. Слово СХОДИТЬ будет написано буквами shodhith, что можно рочитать, как СЁДИТЬ, если следовать правилам. Но если такого слова нет (а «сёдить» нет), то двойственности в понимании не будет. Вообще появляется довольно много исключений, но они не приводят к нечитаемому тексту. Более того, русская буква Х не является слишком распространённой в языке. Тем более, редкость, когда она идет сразу после согласной. Вот список слов, которые удалось быстро найти:

алхимия — alhimhiya — может быть прочитано: альимия
археолог — arheolog — ареолог
волхв — volhv — вольв
вход — vhod — вёд
колхоз — kolhoz — колёз
меланхолия — melanholhiya — меланёлия
мхи (мн.ч. мох) — mhi — ми
мхе (пр.п. мох) — mhe — ме
необходимость — nheobhodhimosth — необёдимость
обхват — obhvat — обьват
обхохотаться — obhohotaca— обёхотаться
синхронно — sinhronno — синьронно
спецхран — spechran — спечран
схема — shema — сема
шхуна — xhuna — щуна
начхать — nachhath — начать (но Ч всегда мягкая, поэтому, с учетом правил, такое слово должно быть прочитано правильно)

И ещё есть большое количество слов с корнем «ход». Очевидно, что неправильно прочитанные слова не являются существующими словами, кроме слова ми, означающего название ноты.

Но как смягчать саму H? Можно использовать двойную: HH. Но лучше ввести дополнительное правило:

  • HI, HE — всегда мягко;

  • HA, HO, HU — всегда твердо.

Конечно, есть исключения:
твердое HE будет в словах: двухэтажный, трёхэтажный, четырёхэтажный, сверхэлегантный, сверхэнтузиазм и слова со сверх-.

Если принять часть слов с русской буквой Х после согласных, как исключения, которые нужно запоминать, то кажется, что неоднозначность возникает только в слове mhi: это может быть нота ми, и может быть слово мхи (мн.ч. мох). Кажется, что контексты настолько далеки, что такое исключение можно допустить, поэтому ми и мхи пишется одинаково: mhi. Конечно же, слово мы превращается в mi.

Если же H идет после гласной, то читается, как русская Х. Ведь гласные не смягчаются. Вот примеры: vihod, zahod, moheroviy, na vdohe, v sumatohe.

Со словами xosse и phensne снова никаких проблем: в xosse нет смягчающей H, а значит это ШОССЭ, в phensne в первом слоге H смягчает звук П, а отсутствие H во втором слоге оставляет твердость русской буквы H, а значит это ПЕНСНЭ.

Можно добавить еще больше правил и исключений?

Конечно. Их легко придумывать. Новое правило почти всегда гарантирует новое исключение.

Как было сказано выше, в средине слова буква Э встречается нечасто. И даже там, где произносится Э (шоссе, пенсне) пишут русскую букву Е. Поэтому, можно принять, что латинская E в середине слова всегда смягчает предыдущую согласную, а исключения нужно будет запомнить. Конечно, буквы J, C, X (Ж, Ц, Ш) не смягчаются.

Буква Э в середине оказывается, в основном, в аббревиатурах, сложносокращенных и иностранных словах:

безэмоционально
безэнергетической
безе
вазэктомия
зэк
квинтэссенция
киберэволюция
кэш
флэшмоб
лэптоп
лэйбл
мэйнстрим
мэр
мэрия
мэтр
НЭП
облэнерго
пленэр
пэр
РЭБ
рэкет
санэпиднадзор
санэпидстанция
судмедэксперт
тинэйджер

26f60d12deb8a81b2c2a9f913971ca13.png

А может сделать смягчение с помощью другой буквы?

Возможно, что W будет выглядеть не слишком страшно, особенно с учетом «всегда мягкой E». Но можно спутать с V. Можно использовать X, а вместо нее для Ш использовать W. Слова с множеством X выглядят весело, но эта буква похожа на спецсимвол, и когда крестов много, то слово кажется неправильным. Тем более, что прочитать его с первого раза становится сложней. Можно использовать Q, что выглядит иногда даже мило, но читается с трудом: pqivo, krqivo.

После нескольких проб написать текст с другими буквами для смягчения, оказалось, что более читаемым (а может просто привычным по другим языкам) получается вариант с H.

Какой вариант лучше?

При написании от руки, безусловно, лучшим вариантом выглядит тот, в котором меньше букв. То есть вариант с «точками». Тем более, что он дает почти неограниченные возможности для дизайна шрифтов. Но от руки сейчас пишут редко, а специальные символы добавить в текст, который набирается на клавиатуре не так уж легко (хотелось бы автоматическую подстановку с помощью драйвера клавиатуры). «Точечный» легче читается, в нем меньше правил и исключений, но он требует программных дополнений к интерфейсам операционных систем и текстовых редакторов. Минусом может быть использование конкретно точки в конце слова, если оно последнее в предложении или после него идет любой знак препинания: может визуально казаться, что пропечаталась лишняя точка. Но никто не говорит, что это должна быть именно точка. Можно использовать волнистую линию, дугу, вертикальную или горизонтальную черту.

Вариант с буквой H удобен, если хочется прямо сейчас перейти к написанию текстов на латинице. Если нужно использовать точные ЧПУ. Если хочется называть мультиязычные программы русскими словами.

Оба варианта могут быть взаимозаменяемыми. Возможно, при условии, что «всегда мягкая E» не используется. Но её использование очень повышает удобство.

Можно даже использовать оба варианта, если это позволяет ситуация. Это бессмысленно, но может быть интересным дизайнерским решением для коротких фраз или отдельных слов.

Когда можно начинать использовать эту латиницу?

В любой момент. Не нужно ждать, когда кто-нибудь издаст закон о переводе русского языка на латиницу. Перевод нам не нужен. Просто должен быть альтернативный инструмент для своих задач:

  • для использования в интернете;

  • для устройств без русской раскладки;

  • для фирменного названия;

  • для программирования;

  • для написания имен;

  • для дизайнерских изысков.

Это только начало

Принимать плохой вариант, который предложили старинные англичане, нельзя. Нужно искать хороший. Пусть даже поиск будет долгим и не всегда продуктивным.

Концепция «смягчения согласных» более точное показывает особенности русского языка и позволяет уменьшить количество используемых букв. Возможно, что появятся другие способы для простой и короткой записи русских слов латинскими буквами.

Хорошо, когда каждый желающий сможет сформулировать основную идею и вывести правила, чтобы можно было обсудить и выбрать наиболее удачный вариант: краткий и понятный.

© Habrahabr.ru