Володина А. А., Ёлкин С.В., Клышинский Э.С. : другие произведения.

Многоязыковой машинный транскриптор. Статья 2

Самиздат: [Регистрация] [Найти] [Рейтинги] [Обсуждения] [Новинки] [Обзоры] [Помощь|Техвопросы]
Ссылки:


 Ваша оценка:
  • Аннотация:
    Решена проблема автоматической транскрипции имен собственных на китайский язык. Из первичного языкового материала извлечены правила соответствия отдельных букв, буквосочетаний и слогов русского языка китайским слогам и составлена таблица. В дальнейшем было сделано сопоставление каждого слога фонетического языка-посредника, для системы автоматической транскрипции ћТрансскрибаЋ [1,2], записи китайского слога латиницей.

  Система автоматической транскрипции
  имен собственных на китайский язык
  
  Укрепление культурных связей между государствами среди прочего ставит проблему межъязыкового взаимодействия. Одной из задач в этом случае становится корректная передача имен собственных из одного языка в другой.
  Когда речь идет о переводе на китайский язык, ситуация осложняется тем, что почти все слоги китайского языка - значимые слова. Есть некоторое количество слогов, которые используются только для того, чтобы передавать фонетику в именах и заимствованиях, но подобных слогов очень мало. Задача осложняется тем, что в китайском языке существуют иероглифы с различным написанием, но одинаковым звучанием. Следовательно, даже идя по пути фонетического перевода, приходится решать, какой из иероглифов с таким звучанием выбрать - а это уже, как правило, бывает обусловлено их значением.
  Теоретически есть несколько способов перевода имен собственных. Первый (и самый распространенный) - "фонетический перевод". Слово переводится наиболее близким фонетическим аналогом, возможным в языке, на который делается перевод. Второй - "смысловой перевод", то есть перевод значащей части слова (если таковая есть). Второй способ наиболее распространен при переводе топонимов (река Черная, гора Белая). Также он может быть оправдан при переводе литературных произведений, где "говорящие" фамилии и названия используются как литературный прием.
  При передаче имен собственных на китайский язык используется комбинированный подход. С одной стороны, имена передаются с помощью поиска фонетически близкого аналога. С другой стороны, при наличии нескольких равнозначных вариантов транскрипции выбор производится по эмпирическим правилам, зачастую по личному отношению к носителю имени. Подобная окраска может приводить к качественному изменению отношения остальных носителей языка к данному человеку, что является, с нашей точки зрения, неприемлемым.
  Таким образом, перевод имен собственных на китайский язык является творческим процессом. В связи с этим создание автоматической системы транскрипции на китайский язык оказало бы помощь как при оформлении официальных документов, так и при личных коммуникациях.
  Отправной точкой для данной работы являлось построение правил для программы, которая переводила бы русские имена и фамилии на китайский язык. В качестве первичного материала были использованы фамилии, встретившиеся в книгах, переведенных с русского языка на китайский из собрания ВГБИЛ им. Рудомино. В дальнейшем использовались фамилии и имена, взятые из баз, расположенных в сети Интернет.
  Анализ материала показал, что для передачи русских фамилий на китайский язык используется перевод каждого слога на фонетически близкий китайский слог. При этом иногда "близость" эта довольно условна и перевод определяется скорее традицией. Например, звук "р" всегда передается звуком "л". При создании правил были вычленены соответствия, какими иероглифами передаются те или иные русские слоги. При этом (что вполне объяснимо, учитывая уже описанную специфику перевода на китайский язык) каждый слог может переводиться несколькими разными способами. На начальном этапе были проведены соответствия только для русских слогов соответствующим китайским слогам, без указания конкретного иероглифа, употребляющегося при записи. В дальнейшем было сделано сопоставление каждого слога языка-посредника, разработанного нашей группой для системы автоматической транскрипции "Трансскриба" [1,2], записи китайского слога латиницей. В качестве развития системы предусматривается сопоставление слогов китайского языка иероглифам, значение которых несет нейтральную или положительную окраску. При этом в случае отсутствия для некоторых слогов специального иероглифа, использующегося для заимствований и прочих фонетических соответствий, представляется целесообразным использовать сходные по прочтению иероглифы.
  Для перевода русской фамилии на китайский язык, первым делом необходимо разбить ее на слоги. Разбиение осуществляется следующим образом: слогом считается
  (1) CV,
  (2) V,
  (3) С,
  (4) (С)Vн,
  (5) (C)Vнь,
  (6) (С)Vй.
  (где C - согласный, V - гласный)
  При этом слоги (3), (4), (5), (6) выделятся только в том случае, если следующая буква - согласный. При этом согласный в (3) не может быть н, нь или й, если ему предшествует такой гласный, который может присоединить эту букву так, чтобы получился существующий в китайской фонетике слог. Несколько соседствующих гласных могут передаваться одним дифтонгом. В противном случае первая гласная будет образовывать слог с предшествующим согласным, а остальные передаются самостоятельно.
  Если фамилия заканчивается на указанные ниже буквосочетания, их необходимо переводить фиксированным образом. При этом оставшееся слово необходимо разбивать на слоги.
  - в (иванов, петров, кожухов) - fu.
  - ский, ской (достоевский, слободской) - siqi
  - кий (збанацкий) - qi
  - ный (дыховничный) - nei
  Очевидна возникающая при таком разбиении проблема - если на вход поступает фамилия, не разбитая на слоги, в которой содержится звук "н", то может оказаться, что существует несколько способов ее разделения на слоги. Данная проблема не является значительной при переводе с русского языка на китайский, но при переводе с китайского языка на русский слово может быть искажено до неузнаваемости. Для того чтобы избежать такого искажения на вход собственно этапа транскрипции имя передается уже разбитым на слоги. Но это достигается на других этапах работы с программой, в данной работе не рассматриваемых. В целях унификации транскрипции программа переводит слоги, идя по слову слева направо, и всякий раз выбирает самый длинный слог из возможных.
  Иногда встречаются разночтения. Например, в некоторых случаях две одинаковые буквы подряд могут рассматриваться как одна или как две. Такие разночтения в нашей системе унифицируются - например, мы рассматриваем их как две разные буквы. Такой же унификации подвергаются все подобного рода спорные моменты.
  Очевидно, что при таком подходе создаваемая программа не всегда будет переводить известные фамилии так же, как это уже принято - поэтому к программе может прилагаться список исключений, в который будут включены фамилии с традиционным переводом. Ниже приведены таблицы соответствия слогов русского языка китайским. Данные таблицы были разработаны в процессе работы над правилами транскрипции имен собственных с русского языка на китайский Володиной А.А. на основе эмпирического материала.
  
  Литература
  1. Бондаренко А.В. и др. Автоматизация процесса транскрипции для задачи многоязыковой передачи имен собственных / Известия Академии Наук. Теория и системы управления. Том 43, N. 6, 2004. сс. 892-898 2. Бондаренко А.В. и др. Метод фонетической транскрипции с использованием единого промежуточного фонетического представления / Препринт Института Прикладной Математики им Келдыша М.В. РАН, Љ90, 2003 г. 28 с.
 Ваша оценка:

Связаться с программистом сайта.

Новые книги авторов СИ, вышедшие из печати:
О.Болдырева "Крадуш. Чужие души" М.Николаев "Вторжение на Землю"

Как попасть в этoт список
Сайт - "Художники" .. || .. Доска об'явлений "Книги"