Шенин Игорь Александрович : другие произведения.

Проблемы транслитерации

Самиздат: [Регистрация] [Найти] [Рейтинги] [Обсуждения] [Новинки] [Обзоры] [Помощь|Техвопросы]
Ссылки:
Школа кожевенного мастерства: сумки, ремни своими руками Юридические услуги. Круглосуточно
 Ваша оценка:
  • Аннотация:
    Замена русских букв латинскими. Что может быть проще? Однако идеальная система так и не создана.

Игорь Шенин

ПРОБЛЕМЫ ТРАНСЛИТЕРАЦИИ



Да, не повезло русскому языку в компьютерном мире. Мало того, что напридумывали множество кодировок нашего языка (KOI-8R, CP866, MacCyrillic, Windows-1251, ISO-8859-5, UTF-8...), так ещё и всячески извращаются с транслитерацией русских букв в буквы латинского алфавита. Казалось бы, такое простое дело - поменять одни буквы на другие, но даже здесь находятся свои сложности... Перечислять все имеющиеся на сегодняшний день варианты транслитераций, пожалуй, не будем (их, увы, ещё больше, чем кодировок), а лучше посмотрим на проблемы, связанные с этим.

И речь сейчас пойдёт не о том, что в разных документах одни и те же названия (имена, адреса) пишутся различно (а это, как вы понимаете, мешает совместимости наших документов за рубежом), а о том, почему такое разночтение происходит и как с этим безобразием бороться.

Но вначале упомянем о двух терминах. Есть транскрипция, когда слова одного языка переписывают буквами другого языка так, чтобы они при прочтении иностранцами звучали также, как и на родном языке. И есть транслитерация, когда буквы меняют по какому-то правилу, а произношение вообще в расчёт не принимают. Транскрипция (в нашем случае с русского) может быть лишь на язык какой-то одной конкретной страны, а транслитерация предназначена для многих стран.

Нас ниже будет интересовать именно транслитерация (конкретно перевод кириллицы в латиницу), но при этом всё-таки желательно, чтобы звучание получаемых слов хотя бы немного соответствовало исходному (то есть транслитерация с элементами транскрипции). Однако последнее затрудняется тем, что разные народы записанные латинскими буквами слова читают по-разному. Правда, сегодня многие государства, использующие латиницу, являются вассалами США, что как бы означает главенство американского варианта произношения, поэтому будем в основном ориентироваться на английский язык. Но, увы, это не очень-то упрощает дело, так как сами американцы имеют совершенно чудовищные правила озвучки букв в словах, когда одна и та же буква произносится по-разному в зависимости от своих соседей (а то и вообще никак не произносится)...

Итак, тридцать три русских буквы необходимо заменить двадцатью шестью латинскими, при этом варианты с точками, "птичками", тильдами и другими элементами над и под буквами (диакритиками) опускаем по причине их частой недоступности. Однако на самом деле конечных букв будет ещё меньше, ведь Q, X, W оказываются не при делах, хотя иногда зачем-то наше КС заменяют на ихнее X (ALEXANDR). Так что остаются лишь двадцать три буквы плюс апостроф (на наших компьютерных клавиатурах находится обычно вместе с Э). Обходят обозначенную проблему двумя путями: или двум-трём русским буквам ставят в соответствие одну латинскую, или же нашу букву заменяют двумя (диграфы), тремя и даже (о ужас!) четырьмя латинскими. Последнее, конечно, полный бред, поэтому желательно сделать так, чтобы каждая наша буква заменялась одной или максимум двумя забугорными, но диграфов не должно быть слишком много. Тут же заметим, что транслитерация может быть простой и обратимой. Вторая отличается от первой тем, что в ней перевод слов из русского алфавита в латинский и обратно получается без искажений. Хотя, думается, последнее сегодня не очень-то и нужно, поэтому дальше речь пойдёт только о простой (необратимой) транслитерации.

Начнём, пожалуй, с гласных. Их у нас десять, четыре из которых(Е, Ё, Ю, Я) имеют особенности в произношении. Эти четыре буквы, когда они стоят в начале слова, после гласных, после твёрдого и мягкого знаков, читаются как две: ЙЭ, ЙО, ЙУ, ЙА (йотированные гласные). А раз так, то есть смысл для транслитерации правило "двух букв" распространить на все случаи их написания. Хотя с буквами Е, Ё и Э чаще идут по другому пути - их все заменяют на одну латинскую E, что вполне приемлемо для простой транслитерации. Оставшиеся две йотированных буквы (Ю и Я) меняют соответственно на YU и YA, где латинская Y заменяет нашу Й. Хотя надо заметить, что букву Й в некоторых системах заменяют не на Y, а на J или даже на I, хотя последнее и приводит к путанице букв. И если вариант замены на I не кажется интересным, то вот замену на J многие приветствуют. Однако J лучше использовать для нашей Ж (ниже об этом поговорим).

В итоге получаем гласные: А - A, Е - E, Ё - E, И - I, О - O, У - U, Э - E, Ю - YU, Я - YA. Что касается оставшейся буквы Ы, то она, похоже, единственная, которая вообще никакого соответствия по звукам с латинским алфавитом не имеет. Но вспомним, что в русском правописании слова с Ы часто пишутся через И (ЦЫРК - ЦИРК). Поэтому И и Ы при простой транслитерации вполне можно заменять одной латинской I. И хоть МЫШКА и МИШКА - разные звери, но в нашем случае вполне сгодится. В некоторых других системах Ы заменяется на Y, что не кажется целесообразным, так как Y лучше задействовать для буквы Й. Других вариантов нет, так как буква Ы при транслитерации может быть или I, или Y.

Теперь рассмотрим буквы Ь и Ъ. Как вариант, их можно объединить, то есть Ъ при транслитерации записывать так же, как и Ь. Мало того, можно даже объединить их и в русском правописании, вообще изъяв Ъ из обращения, ведь разделительный твёрдый знак легко меняется на разделительный мягкий (ПОДЪЁМ - ПОДЬЁМ). И если уж вместо Ё в наших бумажных книгах ставят Е (хотя МЁЛ и МЕЛ не только разные слова, но и разные части речи), а вместо ЩЮКА пишут (и не только в книгах) ЩУКА, то замена Ъ на Ь выглядит абсолютно безобидно.

Однако, если посмотреть на то, где сегодня встречается твёрдый знак, то мы увидим, что он остался лишь в словах, где после согласных идут йотированные гласные (нашёл лишь одно исключение - СИНЪИЦЮАНЬ). А отсюда следует, что более логично вместо Ъ ставить Й, хотя это (Й после согласного) смотрится пока непривычно (СЪЕЗД - СЙЕЗД) по сравнению с мягким знаком, который выглядит почти одинаково с твёрдым знаком (СЪЕЗД - СЬЕЗД). В любом случае, твёрдый знак легко можно изъять из употребления, заменив его на Ь или Й. При этом на переходный период (сто лет) нужно разрешить одновременное применение старых и новых правил. И тогда имеет смысл на компьютерной клавиатуре буквы Ъ и Ё поменять местами, хотя Ъ лучше вообще убрать.

При транслитерации буква Ь чаще всего меняется на апостроф ('), хотя в некоторых системах её вообще игнорируют (заметим, что апостроф здесь означает не конкретно мягкий знак, а пропуск буквы). Что же касается Ъ, то, как мы только что увидели, его можно заменить или на апостроф, или на Y. Имеющиеся же системы транслитерации твёрдый знак или игнорируют, или меняют его на один апостроф ('), или на два апострофа (''), или на Y, или на J, или на IE (последнее лучше не комментировать, чтобы не переходить на ненормативную лексику).

Итак, Ь меняем на апостроф (больше не на что), а Ъ лучше менять на Y (чтобы не плодить лишние апострофы).

Со многими согласными проблем, как правило, не возникает: Б - B, Г - G, Д - D, З - Z, Л - L, М - M, Н - N, П - P, Р - R, С - S, Т - T, Ф - F. Что касается восьми оставшихся согласных, то четыре из них имеют искусственно созданные вариации. Так, в некоторых случаях нашу В зачем-то меняют не на V, а на W; а нашу К - не на латинскую K, а на их C; букву Ц - не на латинскую C, а на TS или даже на Z. Особый случай с нашей Х, которую часто меняют не на латинскую H, а на диграф KH (чуть далее разберём подробнее).

Со второй же четвёркой дело обстоит ещё хуже. Так, например, букву Ж в разных системах транслитерации меняют или на J (ЖУК - JUK), или на ZH, или на Z, или на G. Во всех этих случаях замена не кажется удачной, но самая лучшая из них - первая, ведь буквы Z и G уже задействованы, а ZH - диграф, количество которых хочется сократить.

Наиболее сложными для замены оказываются оставшиеся три буквы: Ч, Ш и Щ. Ведь сделать приемлемое по звучанию соответствие здесь не получится, поэтому придётся как-то комбинировать. Однако, помня о всеобщей американизации, букву Ч меняем на CH, а Ш на SH.

Наконец, добрались мы и до многострадальной буквы Щ. Как только её не заменяют! SC - коротко, но без "птичек" нелепо, SCH - ближе по звучанию, но уже три буквы, SHCH - то есть ШЧ (БОРЩ - БОРШЧ), достаточно хорошо по звучанию на русском, но на латинском смотрится ужасно (BORSHCH), да и четыре буквы вместо одной - явный перебор. Что же делать? Вот если бы в нашем правописании после шипящих никогда не стоял Ь, то можно было бы Щ передать как ШЬ - SH'. Но мягкий знак после Ш и Щ у нас встречается (МЫШЬ, ВЕЩЬ), да и получается уже три знака, поэтому такая замена не желательна. Пожалуй, остаётся только одно - для простой транслитерации объединить буквы Ш и Щ, что уже проделывалось с другими буквами, благо по звучанию они почти одинаковы (МОЩНЫЙ - МОШНЫЙ).

Правда, замена Ч на CH и Ш (с Щ) на SH приводит к путанице с русской буквой Х, которую логично менять на латинскую H. Чтобы путаницы не было, латинскую H в некоторых транслитерациях используют только в составе других букв, именно поэтому нашу Х нередко заменяют на диграф KH, хоть это и выглядит нелепо (МУХА - MUKHA - МУКХА). Почему, спросите вы, латинскую H с чем-то желательно соединять, а Y не обязательно. Ответ прост: с буквой Y слова получаются схожими по звучанию, а с латинской H нет. Например, ЮЛА - YULA - ЙУЛА, МАЙАМИ - MAYAMI - МАЯМИ и ШУМ - SHUM - СХУМ, СХЕМА - SHEMA - ШЕМА.

Впрочем, несмотря на всё сказанное, для простой транслитерации вполне допустимо нашу Х менять на одиночную латинскую H.

(Но если есть желание избежать показанной выше путаницы, то для сочетаний букв СХ и ЦХ можно сделать замену на S'H и C'H соответственно (СХОД - S'HOD, СПЕЦХРАН - SPEC'HRAN), благо в словаре на 130 тысяч слов сочетания СЬХ и ЦЬХ не встретились ни разу. В этом случае при прямом наборе русских слов на латинице не возникает никаких проблем, но есть небольшой нюанс при транслитерации готового русского текста. Любая такая программа переводит русские буквы в латинские поочерёдно одну за другой, ведь программы по другому не умеют, и могут это делать в любой последовательности, хотя, полагаю, делают это в алфавитном порядке. Однако в данном случае очерёдность преобразования некоторых букв необходимо обязательно соблюсти. Это, как вы понимаете, буквы С, Ц и Х. Сочетания СХ в S'H и ЦХ в C'H необходимо будет перевести до букв С, Ц и Х, а остальные в произвольном порядке.)

Итак, мы закрыли все буквы! И при этом максимально упростили правила замены. И вот, что у нас получилось.

(А - A), (Б - B), (В - V), (Г - G), (Д - D), (Е - E), (Ё - E), (Ж - J), (З - Z), (И - I), (Й - Y), (К - K), (Л - L), (М - M), (Н - N), (О - O), (П - P), (Р - R), (С - S), (Т - T), (У - U), (Ф - F), (Х - H), (Ц - C), (Ч - CH), (Ш - SH), (Щ - SH), (Ъ - Y ), (Ы - I), (Ь - '), (Э - E), (Ю - YU), (Я - YA).

Из всего сказанного выше следует, что идеальная транслитерация, скорее всего, вообще невозможна, если под словом "идеальная" понимать систему, которая была бы простой (без использования диакритиков, большого числа диграфов и применения хитроумных правил написания букв в зависимости от своих соседей) и при этом более-менее сносно бы передавала звучание русских слов. Ведь если система будет удовлетворительно передавать произношение, то она обязательно будет сложной, если же система не будет сложной, то звучание многих слов в устах иностранцев получится искажённым. Возможно поэтому (из-за поиска баланса) и появились многочисленные системы транслитерации. И как из всего множества кодировок нужно оставить только одну-единственную (UTF-8, естественно, без идиотского BOM), отказавшись от всех остальных, так и из всех систем транслитерации необходимо выбрать лишь одну, исключив наконец путаницу в наших забугорных документах.




PS:
Разрешается свободное распространение.

Транслитерация [Игорь Шенин]

 Ваша оценка:

Связаться с программистом сайта.

Новые книги авторов СИ, вышедшие из печати:
О.Болдырева "Крадуш. Чужие души" М.Николаев "Вторжение на Землю"

Как попасть в этoт список

Кожевенное мастерство | Сайт "Художники" | Доска об'явлений "Книги"