|
|
||
Учебник культа Изиды, инструкция по приготовлению трав, детали терапевтических процедур или история развития языков? Запутались? Возможно, не так сильно как большинство из тех, кто столкнулся с рукописью Войнича.
Разнообразие тем отражает уровень путаницы в вопросе. Краткое размышление над фразрй "письменная история говорения на языках" поможет запутаться еще больше.
Написанная в начале 15-го века рукопись, 240-страничная книга с неразборчивым и закодированным текстом, имеет длинный послужной список из тех, кто не сумел ее расшифровать, включая Алана Тьюринга.
По сей день Рукопись Войнича окутана тайной и вокруг нее много полемики. Последний всплеск интереса к ней связан с учеными, занимающимися темой Искусственного интеллекта (ИИ).
Дискуссия, которая еще не закончена, показывает как некоторые части коммуникации между людьми остаются за пределами понимания ИИ.
Весной 2019 года рукопись Войнича перестала быть тайной. На ее страницах была информация о растительных средствах, лечебных ваннах и астрологии. Рукопись была написана на прото-романском языке доминиканской монахиней как личный справочник для Марии Кастильской, королевы Арагона в Испании 15 века. Такие размышления содержались в исследовательской работе доктора Джерарда Чешира из Бристольского университета в Великобритании.
Знатоки манускрипты быстро указали на логические нестыковки и противоречия в исследовании Чешира, так что Бристольский университет быстро открестился от исследования.
Одним из критиков был Грег Кондрак, который за несколько лет до этого обратился к алгоритмам ИИ в своем стремлении понять рукопись. Отправной точкой Кондрака стало то, что языки имеют идентифицируемые качества, например, комбинации букв. Алгоритмы могут быть использованы для анализа таких показателей и создания "отпечатков пальцев" для разных языков. Применив алгоритмы к манускрипту Войничу, выяснилось, что он был написан на иврите, а потом закодирован в его нынешнем виде.
Однако, в этом деле осталось несколько нерешенных вопросов, которые не убедили экспертов. Один из них состоит в том, что алгоритмы обучены на современной версии языков, которые существенно отличаются от того, как они выглядели бы в 15 веке. Чтение оригинальной версии Кентерберийских сказок показывает, что может случиться с языком за такой промежуток времени.
В данный момент содержание рукописи Войнича, похоже, не имеет смысла. Возможно, его шифрование невероятно сложно или он написан на сложном неизвестном языке. Возможно, что это ересь от корки до корки.
Сама по себе неспособность ИИ взломать рукопись мало что значит. Тем не менее, это может помочь ответить на вопрос способен ли ИИ понимать человеческий язык.
Одна часть проблемы ИИ - это перевод между различными кодифицирвоанными наборами структур и связанного с ними контента. Да, я придумал это как причудливый способ говорить на языках. Я частично датчанин, поэтому я знаю значение предложения типа "de der er dyre dyr" и что æ, ø и å-настоящие буквы. Последние два слова также означают "остров" и "поток" соответственно.
Что касается переводчика Google, то он выдает перевод "те, кто дорогие животные". Это точный перевод, а не значение предложения. Это значит: "эти дорогие животные". Довольно неплохо, учитывая что dyr может означать как "животное", так и "дорогой".
Помимо этой отсылки, я бы обратил внимание, что языки требуют пристального внимания при шифровке и расшифровке. То же самое относится к переводам между компьютерными языками (код) и человеческими языками ("нечеткий" код).
Даже когда люди говорят на одном и том же языке, такие вещи как культурные ссылки, ирония, тон голоса и мимика играют ключевую роль в понимании часто только половины предложений. Все это работает на грани возможностей ИИ. Особенно, если ИИ должен понять что это ссылка на Star Trek, не говоря уже о понимании того, что она неудачная.
В то же время ИИ может оказать значительную помощь в исследовании живых и мертвых языков.
Например, исследователи из Массачусетского технологического института обучили ИИ сопоставлять слова из неизвестных языков с родственными словами из других языков, имеющих один и тот же корень. Они надеются использовать ИИ, чтобы взломать некоторые из еще нерасшифрованных древних языков.
Некоторые компнии и частные лица имеют свои наработки в области ИИ, помогающие сохранить языковые особенности. Зеландец Джейсон Ловелл помог разработать чат-бота, работающего на маори и на английском языке. В соседней Австралии дети, живущие в отдаленных общинах, столкнулись лицом к лицу c Opie, дешевым роботом, помогающим обучить местному диалекту.
Некоторые предполагают, что конечной целью может стать создание "глобального языкового архива", где система ИИ будет играть роль главного библиотекаря и исследователя.
Как подчеркивается в ежегодном докладе о состоянии ИИ, инструменты ИИ быстро развиваются, когда речь заходит о подлинном понимании языков, часто благодаря достижениям в области обработки естественного языка.
Отвечая на вопрос "мы уже там?" из раннего можно ответить, что нет, но движемся туда со стремительной скоростью.
|
Новые книги авторов СИ, вышедшие из печати:
О.Болдырева "Крадуш. Чужие души"
М.Николаев "Вторжение на Землю"