Щеглов Виталий Николаевич. Творческое сознание:интуиционизм, алгоритмы и модели

Щеглов Виталий Николаевич
Творческое сознание:интуиционизм, алгоритмы и модели

Самиздат: [Регистрация] [Найти] [Рейтинги] [Обсуждения] [Новинки] [Обзоры] [Помощь|Техвопросы]

Ссылки:

Школа кожевенного мастерства: сумки, ремни своими руками

Типография Новый формат: Издать свою книгу

Оставить комментарий © Copyright Щеглов Виталий Николаевич (corolev32@mail.ru) Размещен: 18/01/2006, изменен: 17/02/2009. 336k. Статистика. Эссе: Естествознание Математическая логика Скачать FB2		Ваша оценка:

ТВОРЧЕСКОЕ СОЗНАНИЕ

ИНТУИЦИОНИЗМ, АЛГОРИТМЫ И МОДЕЛИ ч. 1

__________________

В. Н. Щеглов

Тула 2004

СОДЕРЖАНИЕ

Предисловие

Ч а с т ь 1

Теории творческого сознания

1.Неформальные пояснения

2.Теория FIM

2.1. Арифметические аксиомы

2.2. Примитивно рекурсивная замкнутость

2.3. Схема выбора

2.4. Монотонная бар-индукция

2.5. Принцип непрерывности Брауэра

3. Схема Крипке

4. Теория IDB(U)

4.1. Арифметические аксиомы

4.2. Аксиома примитивно рекурсивной замкнутости

4.3. Аксиомы для непрерывных операторов

4.4. Схема выбора

5. Теория CS

5.1. Примитивно рекурсивная замкнутость

5.2. Схема выбора

5.3. Принцип аналитического задания

5.4. Принцип непрерывности

5.5. Схема выбора для конструктивных функций

6. Теория LS

6.1. Аксиомы IDB(U)

6.2. Аксиома существования беззаконных последовательностей

6.3. Принцип полной неопределенности

6.4. Принцип разрешимости

6.5. Принцип непрерывности

6.6. Аксиома выбора для конструктивных функций

Ч а с т ь 2

Алгебраические модели

1. Упорядоченное множество входных данных как псевдобулева алгебра

2. Формирование вынуждающих условий

3. Определение алгебраической модели конструктивной (интуиционистской) логики (АМКЛ)

4. Алгоритм построения АМКЛ

Ч а с т ь 3

Творческое сознание как управление решением проблем

1. Условия существования функции управляемости

2. Условия существования функции устойчивости

3. Определение общих динамических систем, отображаемых АМКЛ

Ч а с т ь 4

Интерпретации АМКЛ

1. Оценка максимальной ошибки модели

2. Качественная интерпретация модели

3. Аналитическая аппроксимация АМКЛ

4. Интерпретация АМКЛ как рекурсивного процесса

5. Визуализация АМКЛ

6. О связи АМКЛ с некоторыми теориями

6.1. Топология

6.2. Геометрия

6.3. Квантовая теория

6.4. Фильтрация шумов и проявление фотослоя как модели

6.5. Теория калибровочных полей и общая теория относительности 6.6. Квантовая теория калибровочных полей

6.7. "Правильная" квантовая теория гравитации

7. О построении контекстно-развивающейся базы данных для дальнейшего развития логической интеллектуальной системы

7.1. Построение контекстно-развивающейся базы данных

7.2. Построение более совершенной базы данных как улучшение согласования информационных потоков между объектом и исследователем

7.3. АМКЛ как интеллектуальная система анализа данных

Ч а с т ь 5

Построение и исследование различных моделей

1. Построение и исследование АМКЛ с целью управления, оптимизации или проектирования химико-технологических систем

1.1. Выявление причин, влияющих на содержание воды в метаноле-сырце в промышленных условиях

1.2. Исследование содержания ацетилена на выходе цеха окислительного пиролиза природного газа

1.3. Исследование технологического процесса флотации фосфоритной руды

2. Построение и исследование медико-демографических моделей

2.1. Логические модели структур заболеваний за 1986 - 1999 годы участников ликвидации аварии на Чернобыльской АЭС и/или мужчин, проживающих в пораженной зоне и имеющих злокачественные новообразования

2.2. Логические модели структур заболеваний за 1986 - 2000 годы жителей Тульской области, имеющих злокачественное новообразование щитовидной железы и проживающих на территориях, подвергшихся воздействию аварии на ЧАЭС

2.3. Мониторинг некоторых экологических факторов и образа жизни пациента, страдающего артериальной гипертензией

2.4. Логическая модель выживания или смерти от инсульта в течение 28 дней после начала приступа в 2002 - 2003 годах по Тульской области

2.5. Логические модели смерти от заболеваний органов дыхания, сопутствующих заболеваний и демографического статуса населения Тульской области, проживавшего в местности, пораженной радиоактивностью, в результате аварии на Чернобыльской АЭС

3. Гиперсинхронизация электрической активности головного мозга как модель энергоинформационных воздействий

4. Интерпретация некоторых операций алгоритма построения АМКЛ в терминах нейрофизиологии и парапсихологии

4. 1. Алгоритмическая модель слабых взаимодействий и синхронизации ультраструктур нейронов

4.2. Модель согласования выводов из теорий, используемых для объяснения особых состояний сознания

4.3. Редукция квантовых когерентных состояний некоторых ультрамикроструктур нейронов мозга и особые состояния сознания как процессы, описываемые АМКЛ

5. Сопоставление основных операций алгоритма построения АМКЛ со сходными по информационному смыслу качественными выводами из астрофизической модели Керра

6. Сопоставление структуры библейских заповедей с отдельными этапами алгоритма АМКЛ

Послесловие

Литература

ПРЕДИСЛОВИЕ

Предлагаемое исследование творческого сознания средствами математической логики нуждается в следующих пояснениях. Прежде всего, отметим, что за последние десятилетия исследование мышления человека с помощью классической нейрофизиологии, по-видимому, сильно отстает от всей практики применения современных вычислительных средств. Эти средства позволяют шаг за шагом, выдвигая соответствующие гипотезы и проверяя их, решать наиболее сложные задачи, как в научной, так и в практической областях, связанных, например, с отдельными информационными аспектами мышления. Настало время увеличить соответствующие усилия и в области исследования формально-логических, т. е. в своей основе алгебраических и по самой своей сути информационных "механизмов" сознания, возможно, как наиболее интересного объекта исследования. Далее автором будет показана полезность применения аксиоматического метода и вообще, накопленного опыта в этом направлении. Можно сказать, что, во всяком случае, со структурной (системной) точки зрения такой подход сейчас кажется и наиболее адекватным для изучения именно творческого сознания.

Поясним некоторые исходные термины. Так, термин "сознание" будем предпочтительно использовать лишь потому, что он отображает информационный подход, характерный при исследовании распределенных систем или сетей ("со-знание", знание, получаемое обычно в результате взаимодействия многих субъектов). Сразу же оговоримся, что мы склонны приписывать свойства субъекта и наиболее совершенным известным в настоящее время вычислительным системам. Такие системы обычно объединены с постоянно обновляющимися и развивающимися базами данных и с информационно-поисковыми системами, что позволяет в содержательном смысле интерпретировать вычисляемые модели. Стоит ли приписывать свойства субъекта, например, "ноосфере" да, может быть, и всей природе в целом - это скорее вопрос определения наших терминов и семантических соглашений для используемого языка исследования. Под творческим сознанием будем понимать, прежде всего, способность субъекта к логической индукции: построению некоторого процесса определенных конструктивных операций над большой совокупностью исходной информации; получение в итоге непротиворечивых на используемом массиве данных и по возможности кратких выводов и, в итоге, использование их. Под творческим сознанием мы будем понимать также способность к содержательной интерпретации (точнее, к "мажорированию" [20]) получаемых, таким образом, формальных выводов. Сам же этот процесс получения истинных выводов обычно называют их доказательством. Однако отметим, что нас будет интересовать и "скрытое" доказательство, когда его невозможно представить в явном виде, например, выявление лишь некоторых признаков, интерпретируемых как выявление существования конструктивного исчисления предикатов (с информационной точки зрения) при взаимодействии сложного объекта с исследующим его субъектом. В общих чертах, интуиционизм, как и конструктивное направление в математике, изучает также способы получения и исследования подобных ("интуитивных") выводов как в области основ математики, математической логики, так и в информационных процессах (см. Части 4 и 5). Заметим, что предлагаемый в данном исследовании алгоритм специально разработан для облегчения получения подобных выводов (в основном, для облегчения содержательной интерпретации получаемых формальных выводов, что приближает нас к пониманию принципиальной неалгоритмичности [49] функции творческого сознания). Сам же интуиционизм, как весьма специфическое направление в математике и математической логике, был выбран лишь потому, что это направление основные свои усилия в итоге направляет на исследование динамики конструктивных операций сознания именно как некоторого творческого субъекта, что нас будет интересовать в первую очередь. Далее, при таком подходе появляется возможность введения различной интерпретации семантики одного и того же используемого логико-математического языка ?, и, следовательно, различной интерпретации одной и той же области математики [1]. Такая сложная ситуация является ценой, которую мы платим за более тонкий (по сравнению с классической математикой) анализ эффективности в математике. Эффективной процедурой мы будем называть такую совокупность операций, которая позволяет по предложению используемого языка выяснить, задает ли это предложение истинное или ложное высказывание.

В современной литературе, посвященной логическому программированию [52] вопросы алгоритмизации творческого сознания в вышеприведенном смысле практически отсутствуют, в основном исследователей здесь интересуют использование (во всяком случае, в области медицины) уже накопленных баз данных для более обоснованного лечения пациентов. Сама исследовательская часть (например, получение баз данных для новых социально-демографических ситуаций) здесь как бы остается в тени.

Как будет показано далее, в первой части книги большинство формальных аксиоматических теорий с интуиционистской логикой ("теорий творческого сознания") можно рассматривать как краткие утверждения, отображающие если и не весь опыт человечества исследования структурных взаимоотношений в области сознания, то, во всяком случае, опыт наиболее продвинутых в этом отношении математиков и логиков. Во второй части мы рассмотрим и изучим теоретический инструмент для исследования этих аксиоматических теорий - алгебраические модели интуиционистской логики в конечном итоге в виде алгоритма получения непротиворечивых выводов, алгоритма, который использует по ходу вычислений рассмотренные ранее локальные аксиоматические теории. В третьей части творческое сознание в общих чертах рассматривается как его функция управления решением проблем. В четвертой части детально рассмотрены различные способы интерпретации получаемых моделей. Здесь следует обратить внимание на самый удивительный вывод - логические модели совместно с аппроксимацией соответствующих подмножеств рядами Эрмита возможно интерпретировать в общем смысле квантовой теории, хотя сами объекты исследования имеют классический (макроскопический) характер. В пятой (и наиболее обширной) части приводятся содержательные модели, полученные автором в самых различных областях исследований. Часть этих моделей в итоге носит как бы "мажорирующий" [20] характер, например, лишь выявляющий или согласующий разные содержательные теории с точки зрения их сходства с предлагаемым алгоритмом исчисления предикатов (как приблизительной модели нашего творческого сознания). Обратим внимание читателей, что именно в пятой части книги при изложении конкретных исследований приводятся некоторые тонкости интерпретации моделей, обобщение которых невозможно было привести в предыдущих теоретических частях.

Цель этой небольшой книги - изложить и по мере возможности обосновать с информационной точки зрения некоторые наиболее важные методы (алгоритмы) получения алгебраических моделей конструктивной (интуиционистской) логики (АМКЛ), которые частично отображают функцию сознания и, возможно, основную часть творческого сознания человека. Как показал опыт, эти модели оказались весьма удобными особенно в начальной стадии исследования сложных объектов (систем), когда часто также необходима интерпретация полученных выводов в терминах априорных (литературных) данных.

Более того, сама цель разработки автором АМКЛ заключалась, прежде всего, в том, чтобы получаемые краткие выводы в семантическом (содержательном) смысле согласовались бы с нашим основным знанием, что окружающий нас мир сложен и описывается используемым нами языком лишь приблизительно, что всегда существует проблема, как говорят физики, скрытых переменных. Алгоритмизация любого и, в особенности, творческого процесса всегда ограничена в общем смысле словарем и грамматикой используемого в данное время языка исследования. Интерпретация (с помощью информационного поиска априорных данных) результатов алгоритмического процесса по сути дела означает чаще всего переход к более сложному языку исследования, который со временем, возможно, также будет алгоритмизирован. Этот достаточно облегченный выход за пределы заданного формализма как раз и обеспечивают АМКЛ. Надо думать, что исследование в дальнейшем таких явлений, как интуиция, озарение и многие парапсихологические феномены будет возможно именно в этом направлении.

Автор прилагал усилия, чтобы сделать изложение доступным для возможно более широкого круга читателей, от которых требуется лишь определенная математическая культура и при необходимости возможность терпеливо восполнять некоторые рутинные шаги в доказательствах или пояснениях с помощью существующей литературы. Здесь, прежде всего, рекомендуется книга [1], которая содержит почти все необходимые сведения в нужной области. Для менее подготовленных читателей желательно также использование учебников [2, 3]. Заметим также, что терминология и обозначения в предлагаемом исследовании в значительной степени согласована с [1]. При первом ознакомлении читатель может ограничиться лишь чтением пятой части книги, выбирая из нее примеры разработки и интерпретации моделей в наиболее близкой для себя области. При возникновении интереса можно ознакомиться с алгоритмом построения АМКЛ и заняться программированием наиболее приемлемого варианта вычисления АМКЛ.

Эта книга - результат длительной работы автора в области прикладного моделирования сложных процессов средствами математической логики. Автор выражает благодарность своим коллегам и во многих случаях соавторам в различных творческих коллективах в разное время - В. В. Налимову из Московского университета, Г. А. Ефанкину и М. Д. Кацу из Северодонецкого филиала ОКБА, В. В. Сотникову из Ленинградского технологического ин-та им. Ленсовета, А. Г. Ли из Московского ин-та общей и медицинской парапсихологии, В. А. Хромушину и В. Ф. Бучелю из Компьютерного центра здравоохранения Тульской области (КЦЗТО), сотрудникам ин-та новых медицинских технологий в Туле, а также Г. Ф. Щегловой - за помощь и постоянное внимание к работе. Автор выражает свою благодарную память преподавателям МГУ и сокурсникам на биологическом и химическом факультетах, с которыми он учился в 1950 - 1956 годах.

В. Щеглов

Тула, Щекино, 2.07.04

Не премудрость ли взывает?..

"Я родилась..., когда еще Он

не сотворил ни земли, ни полей,

ни начальных пылинок вселенной".

Притч 8, 1, 25, 26.

Ч А С Т Ь 1

ТЕОРИИ ТВОРЧЕСКОГО СОЗНАНИЯ

1. Неформальные пояснения. Мы исходим из предположения, что в общих чертах уже существует модель (в смысле приблизительного компактного отображения действительности) творческого сознания - это вообще математика и, в частности, математическая логика в виде набора формальных теорий, включающих в себя схемы аксиом и некоторые принципы. Общий подход математической логики состоит в том, что следует, прежде всего, фиксировать некоторый начальный логико-математический язык ? (явное информационное проявление сознания), формулы которого будут отображать суждения и различные отношения между ними, т. е. уже известную на первом этапе исследования функцию сознания. Отметим также, что нам далее предстоит более точно описать ?: его морфологию, синтаксис и словарь наиболее нужных и часто употребляемых терминов (будем их отмечать курсивом).

Пусть ? содержит некоторый класс атомарных формул, из которых строятся формулы с помощью логических связок

(конъюнкция, "и", иногда будем использовать символ &),

(дизъюнкция, "или"),

(импликация, "если, то"), константы

("ложь") и кванторов

(общность, "для всех"),

("существует"). Пусть знаки

, ?, ? заменяют словесные обороты "есть по определению", "если..., то...", "тогда и только тогда", соответственно. Пусть отрицание ??

. Будем также использовать обычные обозначения арифметики, математического анализа и теории множеств, смысл которых будет ясен из контекста. Язык ? может содержать различные виды переменных, каждый вид рассматривается как пробегающий некоторую область конкретных объектов данного вида (в нашем случае - чисел). Переменные, входящие в формулу свободно (без ограничений), будем называть ее параметрами. Переменные, на которые наложены определенные условия, например, нахождение их значений в определенном интервале, будем называть связанными. Если приписать параметрам формулы соответствующие конкретные значения (термы, в нашем случае числа), то она будет определять высказывательную или оцененную форму (в частности, это может быть предложение).

Пусть у нас имеется текст записи различных состояний сознания, состоящий из отдельных строк (предложений), расположенных по времени, причем известно, что их истинность или ложность выявляется лишь спустя определенное время взаимодействия сознания и внешней среды. Обычно трудно задать эффективную процедуру (алгоритм), позволяющую по уже известным предложениям, содержащих большое число слов (переменных), оценить истинность или ложность новых предложений. Необходимо введение некоторых общих принципов, семантических соглашений, которым должно удовлетворять наше понимание формул языка. Совокупность этих соглашений будет составлять то, что называется семантикой языка.

Если аксиомы и правила вывода некоторой теории Т согласованы со всеми требованиями семантики языка ? (т.е. нашего понимания смысла аксиом, отображающих функции сознания в нашем случае), то и формулы, выводимые в Т, будут отображать хотя бы некоторые фрагменты содержательной математической теории сознания. Смысл Т здесь задается именно вводимой семантикой, которую также можно назвать исходным набором гипотез, проверяемых после того, когда становятся известными логические значения предложений (состояний) исследуемого объекта. Затем саму Т можно подвергнуть точному математическому исследованию (см. часть 2) и таким образом судить об особенностях семантики языка - насколько правильно было наше понимание "языка сознания" ?. Именно в этом виде организуется информационная обратная связь, которая исправляет старую семантику используемого языка. После этих операций понимание (интерпретация) исследуемого объекта становится ближе к действительности.

Если ? снабжен интуиционистской семантикой, то это означает, что про некоторые его предложения мы можем утверждать, что они истинны, другие - ложны, а некоторые еще неизвестны к настоящему времени, поскольку соответствующие состояния объекта, например, еще не реализованы и, возможно, вряд ли будут известны в будущем. Таким образом, интуиционистский подход к исследованию сознания достаточно близок к реальности наблюдаемых здесь информационных отношений - теория Т здесь зависит от "творящего" сознания субъекта-исследователя. То, что сейчас не истинно или не известно, далее (по мере функционирования) может стать, например, истинным. Что касается принципов сохранности (истины) и потенциальной осуществимости (в пространстве и времени), их применимость и ограничения будут обсуждаться далее. Можно сказать, что в общих чертах интуиционистский анализ, т.е. различные формальные теории для описания интуиционистских свободно становящихся последовательностей [1], в значительной мере являются также и формальными теориями творческого сознания. Именно по этой причине автор далее полностью приводит эти теории в том виде, как они изложены в [1], давая лишь свою их интерпретацию в основном в терминах предлагаемого далее алгоритма (см. часть 2).

Отметим еще, что возможны различные семантики одного и того же языка ? и, следовательно, различные математические теории сознания. В предлагаемом исследовании дается лишь некоторый набор таких теорий, число которых может быть увеличено при появлении новой информации, например, о физико-химическом механизме "вычислений" элементарных суждений. Использование более тонкого анализа эффективности (вычислимости, алгоритмичности) часто позволяет указывать и условия применимости каждой теории, и способы их уточнения или выбора.

Обратим еще внимание читателя на хорошо известные методы минимизации булевых функций, заданных в виде таблицы, и на вычисление, например, тупиковых дизъюнктивных форм этих функций. Все предыдущие соображения о желательности введения интуиционистской интерпретации получаемых результатов сохраняют здесь место. Другое дело, что традиционные методы минимизации булевых функций обычно не применяются из-за громоздкости вычислений для большого числа переменных. Далее во второй части книги будут приведены некоторые топологические соображения, позволяющие резко уменьшить общее число вычислений и к тому же получить довольно интересную пространственную интерпретацию получаемых результатов. Читатель, желающий скорее овладеть практическим аппаратом вычисления АМКЛ, может сразу же обратиться к части 2, где излагается алгоритм вычислений. Можно опробывать метод (до программирования) в ручном булевом варианте, используя, например, таблицу случайных булевых чисел (см. также работы [4 - 6]. Знание всех операций построения АМКЛ безусловно будет способствовать пониманию приводимых далее теорий, поскольку этот алгоритм можно рассматривать как конкретную конструктивную реализацию некоторых функций творческого сознания.

Для содержательной интерпретации и лучшего понимания текста читатель может воспользоваться достаточно хорошо аргументированной гипотезой [7 - 9], что сам "вычислительный" процесс, отображающий возникающие элементы сознания, реализуется, возможно, квантовым процессом изменения конформных состояний (КС) молекул белка тубулина (и его димеров), образующего микротрубочки в цитоплазме нейронов (да и во многих других клетках). Сходные изменения могут быть и в других структурах клеток и, прежде всего, в ДНК. По мере изложения формальных теорий мы будем иногда лишь для наглядности и для использования интуиции читателя обращаться к подобным физическим интерпретациям теорий. Для облегчения понимания многих логико-математических утверждений мы также часто будем иллюстрировать их, приводя в качестве примеров соответствующие части вычислительного процесса построения АМКЛ ("алгоритм" далее). С этой же целью будем качественно описывать лишь те аксиомы и утверждения, которые будут нужны для выявления смысла основных "вычислительных" процессов сознания.

Перед изложением теорий познания вкратце отметим здесь основные этапы алгоритма построения АМКЛ (более подробно см. ч. 2). В исходном массиве информации Х (n+1, m), где n - число переменных (столбцов в таблице Х) и m - число состояний объекта (строк в Х), выделяется один (или несколько) столбцов Y, для которых Y = f(X)., Значения Y разбиваются на k частей (обычно на 2 по медиане), и эти значения Z кодируются, например, Z = 0, 1,... Далее каждое состояние, где задано определенное целевое значение Z, сравнивается со всей окрестностью не целевых состояний, начиная с ближайших, и строятся конъюнкции К= (

< х

)&(

< x

)&..., являющиеся простыми импликациями (истинными формулами) для функции Z = f((X(n, m)). Аналогичные операции совершаются и в отношении не целевых состояний. Далее вычисляются оценки ?Г? для каждой К(число состояний, удовлетворяющих К), затем строятся тупиковые дизъюнктивные формы ( т. е. модели для каждой из Z = 0, 1,... в отдельности): начиная с наибольшей ?Г?, отбираются К и объединяются связкой "или"; предварительно отбрасываются те из них, множества состояний Г которых ("покрытия") уже входят в ранее выбранные К.

Далее собственные переменные (пусть пока в инженерном смысле - несущественные) будут обозначаться как ?, ?, ?, ... , конструктивные переменные (которые входят, например, в расчетные модели АМКЛ) будут обозначаться как a, b, c, ... Сами текущие значения (т.е. элементы, которые находятся в клетках таблицы) будут обозначаться как x, y, z. Детали других обозначений и соглашений, относящихся к интуитивистскому направлению можно найти в [1]. Мы настойчиво рекомендуем после первого чтения нижеприведенных аксиом и теорий творческого сознания вернуться к их более углубленному прочтению после овладения алгоритмом построения АМКЛ на отдельных небольших примерах, используя ручной метод расчета.

2. Теория FIM (Foundations of Intuitionistic Mathematics, Клини и Весли [10]). Эта теория формулируется в языке анализа An, т.е. в языке с единственным сортом (семейством) переменных для функций. Сформулируем аксиомы или, в частности, схемы аксиом этой теории.

2.1. Арифметические аксиомы. Это аксиомы теории HA(U) (Арифметика Гейтинга, в ней используется интуиционистское исчисление предикатов), где U - одноэлементное множество. Схема аксиом индукции:

?(0)

x (? (x)
? (Sx))

x ? (x),

где ? - произвольная формула этого языка и S = 1, 2, 3, ..., в нашем случае их можно интерпретировать как предъявление новых однородных состояний. Если во всех таких предъявлениях импликация истинна, то делается вывод - функция истинна для всех х.

2.2. Примитивно рекурсивная замкнутость.

х(?(х) = t(х)),

где t - произвольный терм языка, не содержащий ?. Эта схема утверждает, что любая примитивно рекурсивная комбинация функций нашей теории вновь является функцией этой теории. Термы t могут быть или числами или функторами - термами для функций, т.е. их определенными значениями. Так, например,

, где F - функтор, не содержащий ?. Например, в процессе сопоставления целевой строки с не целевыми постепенно строится сжимающийся интервал ??, который при некотором единственном значении ?, например, совпадающем с его значением в целевой строке обнуляет или "захлопывает" этот интервал (см. алгоритм, ч. 2). Физическая интерпретация аксиомы проста: "обработка" сигналов (уменьшение числа состояний, функционально не связанных с Z) может происходить, например, за счет пространственных затруднений при изменении КС в определенных направлениях, т.е. для определенных степеней свободы колебаний КС. Отсутствие таких степеней свободы соответствует "схлопыванию" этого интервала, другими словами, удалению интервалов несущественных значений переменной ?.

2. 3. Схема выбора:

Так, например, в нашем случае при достраивании конъюнкции К, т.е. при увеличении ее ранга r, выбор каждой последующей "существенной" переменной зависит от выбора предыдущей. Физическая интерпретация здесь аналогична: выбор очередного КС зависит от выбора предыдущего.

2. 4. Монотонная бар-индукция:

y))

(x))

в нашем случае этот вид бар-индукции ("тупиковой" индукции) описывает процесс удаления не существенных переменных (во всяком случае лишь в определенных интервалах их значений) при получении в итоге истинных формул К. При реализации всех частей этой схемы, ? (интервалы) строятся как функция кортежей x

y, где х - некоторая их часть, следствием которой ранее (см. 2. 3.) был осуществлен выбор переменной ?. Эта переменная в итоговой АМКЛ существует в виде отдельных фрагментов, покрывающих (по состояниям-строкам) весь Х,

= <

>. Фрагменты зависят от наборов различных множеств х, уже вошедших в постепенно достраивающиеся различные формулы К. Элементы y характеризуют эту достройку; пусть она состоит в наращивании ранга r для К, т.е. в переходе от ?(х) к ?(х). Здесь возможен случай, когда этот процесс присоединения кортежей x

y обрезается: после использования последнего значения

искомое множество аргументов (интервал их значений) становится пустым, появляется как бы сигнал запрета (тупика). На этом этапе алгоритма данная переменная отбрасывается и далее стандартным способом К достраивается с помощью иных переменных. Общим следствием бар-индукции является утверждение, что н е в с е функции являются общерекурсивными; это мы и видим в существовании запрета на повторение прежних операций. Физическая интерпретация бар-индукции - это, возможно, затухание колебаний первоначально большей части КС ввиду каких-то пространственных препятствий со стороны соседних КС.

2. 5. Принцип непрерывности Брауэра [11]. Функцию ? назовем стабильной, если для всех x и y из ?(х)

0 следует ?(х

y) = ?(х). Другими словами, при дальнейшем присоединении кортежей функция, например, границы строящегося интервала, остаются постоянными. Мы ограничим действие этого принципа; в нашем алгоритме это явление будет наблюдаться лишь в двух случаях: границы интервала будут оставаться постоянными лишь при выходе значений х вне интервала (он может лишь уменьшаться). Другой случай: граница для ? остается прежней, если при вычислении К (на этапе сопоставления какого-либо целевого состояния со всей окрестностью не целевых) уже исчерпан список всех переменных - они уже все удалены, кроме ?. В этом случае помечаются состояния, на которых К ложна и продолжается далее построение усложненной формулы за счет увеличения ранга конъюнкции К вплоть до истинности соответствующей импликации (предполагается достаточные размеры Х). Далее, функцию ? назовем запирающей, если для всякой функции ? найдется х такое, что

. Здесь под ? мы будем понимать функцию достраивания К (увеличение ранга) вплоть до ее истинного значения. Стабильные запирающие функции назовем непрерывными функционалами К. Непрерывность ? проявляется в том, что значение ?(?) определяется уже по некоторому к о н е ч н о м у фрагменту

функции ?, т.е. происходит непрерывное усложнение гипотезы К, на основе уже накопленного опыта. Обозначим через ??? функцию ? такую, что для всякого натурального ? имеем

другими словами, здесь ? зависит лишь от конечного фрагмента ? для данного шага вычислений

. Теперь сам принцип непрерывности будет выглядеть следующим образом:

Можно сказать, что принцип непрерывности есть попытка точно выразить идею Брауэра, предлагавшего рассматривать интуиционистский континуум как "среду свободного становления" (на которой, возможно, реализуются различные функциональные множества КС, соответствующие в итоге конъюнкции К, истинной для всех известных состояний исследуемого объекта).

3. Схема Крипке.

Эта схема была предложена Крипке [12] в качестве формализации теории Брауэра для последовательностей, зависящих от решения проблем (теория "творящего субъекта"). Значения ?(n) будут вычисляться последовательно к моменту n согласно следующему правилу. Если к моменту n доказано утверждение ?, то положим ?(n) = 1. В противном случае положим ?(n) = 0. Как видно, здесь последовательность ? "таинственным" образом зависит от течения времени, от исторической ситуации, в силу которой будет или не будет доказано ?. Далее, здесь построение ? зависит от творческой деятельности некоторого субъекта, который занимается доказательством суждений. С помощью схемы Крипке также можно вывести существование не рекурсивных функций и, более того, установить невозможность нумерации функций (это К на первом этапе алгоритма) натуральными числами. С практической точки зрения можно сказать, что без разумных ограничений число первоначальных гипотез К "ветвится" всё больше по мере сопоставления исходной целевой ситуации с большим числом не целевых ситуаций. Достаточно сложные выводы здесь не существуют заранее, они оперативно формируются в процессе "истории" всего мира (возможно, отображаясь в виде последовательно формируемых структур КС). Задана ли вся эта "история" a priori - мы этого не знаем.

4. Теория IDB(U). (Само название - аббревиатура с английского "индуктивное определение Браура", [10]). Это теория сознания со многими видами функциональных переменных. Как и ранее через U обозначено конечное множество видов с о б с т в е н н ы х переменных (те, которые удаляются алгоритмом как несущественные), будем их обозначать как ?, ?, ... Конструктивные виды переменных (функции цели, последовательности натуральных чисел) будем обозначать как a, b, ... Сами "бегущие" значения переменных (любых) будем обозначать как x, y,... Отметим, что всегда исходную информацию Х можно закодировать так, что она с достаточным приближением может быть отображена натуральными числами или, после перекодирования, в виде значений k-значной логики. Полезный пример здесь - конформные изменения молекул тубулина или изменения в расположении отдельных концевых групп в ДНК, которые имеют дискретный или квантованный характер, соответствующий k-значной логике. Согласно этой теории, функция сознания в общих чертах состоит в том, чтобы выделить прежде всего конструктивные параметры по натуральным числам, например, по некоторым входным переменным, или по функциональным, например, целевым параметрам. Язык IDB(U) есть расширение языка анализа An(U), который используется для отображения формальных теорий арифметики. Здесь вводится понятие класса К(а), а ? К, где а есть некоторый непрерывный оператор, например, вычисления по алгоритму некоторых интервалов значений переменных, а функтор К - конъюнкция этих интервалов.

4.1. Аксиомами IDB(U) являются все арифметические аксиомы, включая схемы аксиом равенства и индукции.

4.2. Аксиома примитивно рекурсивной замкнутости для конструктивных функций имеет вид:

где t(x) - произвольный терм языка, не содержащий а и содержащий только конструктивные параметры (например, это числа, отображающие "амплитуду колебаний" КС, см. алгоритм и изменяющиеся значения (?, ?)). Эта схема утверждает, что любая примитивно рекурсивная комбинация конструктивных функций вновь является конструктивной функцией. В общем смысле будем говорить о каждой переменной, что она является функцией некоторого источника. Отметим, что комбинация собственных функций может оказаться и неконструктивной. Здесь и далее

есть функторное обозначение (термы для функций).

4.3. Аксиомы для непрерывных операторов:

Эти аксиомы выражают индуктивное определение класса К функций, заданным законом, т.е. они в итоге входят в конъюнкции К (см. алгоритм). Аксиома 1) - базис этой индукции (если а есть функция-константа, отличная от нуля, то

(в нашем случае а - это процесс последовательного построения интервалов, соответствующих в итоге "непротиворечивым" выводам К). Аксиома 2) - шаг индукции: если а(0) = 0 и для любой "сдвинутой" функции

уже установлено

, то итоговое

. Аксиома 3) отображает идею, что класс К получен "только с помощью индуктивных правил 1) и 2) и никак иначе", т.е. является минимальным замкнутым классом (в нашем случае - "точек", заполняющих интервалы а, при описании алгоритма мы покажем расширение этого правила). Рассматривая наш процесс более детально, можно сказать, что а в нашем случае есть оператор последовательного пересечения некоторых замкнутых классов или построение уменьшающегося "острого конуса" значений переменных для не целевых состояний (см. алгоритм). С физической точки зрения процесс "вычисления" К может соответствовать, например, постепенному установлению совместных колебаний различных конформных состояний для разных димеров тубулина. Отметим еще, что из этих аксиом индуктивно следует, как и ранее, стабильность и запираемость функций из К.

4.4. Схема выбора:

- если для каждого числа х можно найти конструктивную функцию а, удовлетворяющую некоторому условию, не зависящему от неконструктивных параметров, то существует конструктивная функция b, кодирующая такие а для каждого х (в нашем случае - последовательно определяющая такие а для каждой степени свободы КС, т.е. в итоге определяющая К).

5. Теория CS. Эта теория сознания [13] также использует язык IDB(U), но где U - лишь одноэлементное множество, т.е. кроме конструктивных функций в теории CS (аббревиатура с английского для Choice Sequences) имеется еще лишь один вид собственных функций (как и ранее обозначаем их греческими буквами). Аксиомами CS являются прежде всего аксиомы IDB(U), затем

5.1. Схема примитивно рекурсивной замкнутости:

где t - произвольный терм (например, числа, соответствующие границам искомого интервала в процессе его вычисления).

5.2. Схема выбора (для чисел):

Другими словами, например, существует определенная связь столбцов в исходной таблице данных. Если уже существует определенная последовательность выбора чисел x, y для столбца ? при определении интервалов их значений для вычисления К, то существует и переход к другому определенному столбцу ? для проведения соответствующих операций (при увеличении ранга конъюнкции К). С физической точки зрения можно сказать, что существует определенная зависимость последовательного "подключения" различных КС, отображающая формирование сложного процесса К их колебаний (точнее, их некоторого взаимодействия).

5.3. Принцип аналитического задания имеет вид

|

|

где ?(?) - произвольная формула, содержащая кроме ? лишь конструктивные параметры. Согласно этой аксиоме закон образования собственной функции ? известен исследователю не полностью, а лишь "с точностью до конструктивного непрерывного оператора". Вместе с ? свойством ? обладают и все функции (a|?) при всех возможных ?. Невозможно установить какое-либо конкретное свойство индивидуальной неконструктивной последовательности. Можно вкратце сказать, что при вычислениях в условиях помех характерно формирование некоторых классов эквивалентности, отдельные элементы которых принципиально не различаются. На этот факт мы обратим более пристальное внимание в главе, посвященной различным моделям, в том числе и моделям сознания, в основу которых положен алгоритм АМКЛ.

5.4. Принцип непрерывности имеет вид

|?)).

Обозначения типа а|? см. в 2.5, здесь в отличие от этого подраздела утверждается существование не просто непрерывного, но и конструктивного непрерывного функционала.

5.5. Схема выбора для конструктивных функций:

В этой аксиоме выражена определенная специфика функций, заданных законом - должен существовать способ, указывающий конструктивный объект а для произвольной (неконструктивной) функции ?. Так, можно отыскать конечный фрагмент значений

, зная который, можно вычислить а такое, что

Алгоритмическая и физическая интерпретация этой аксиомы аналогична 5.2.

6. Теория LS (Lawless Sequences, [14]). Языки теорий LS ("беззаконных последовательностей") и CS совпадают. Однако собственные функции LS имеют здесь иные свойства. Аксиомы LS делятся на следующие группы.

6.1. Аксиомы IDB(U).

6.2. Аксиома существования беззаконных последовательностей:

6.3. Принцип полной неопределенности:

,...,

)

,...,

)

,...,

)

, ...,

))).
Эта аксиома гласит, что если ? отлична от остальных беззаконных последовательностей, упоминающихся в условии ?, то все, что известно относительно ? - это некоторое ее начало х. В каждый момент исследователю известна только конечная последовательность для функции ? и ничего более относительно закона ее образования. С физической точки зрения можно сказать, например, что степени свободы колебаний КС не заданы a priori, но формируются под влиянием входных сигналов.

6.4. Принцип разрешимости:

Беззаконную последовательность можно представить себе в виде некоторого источника, порождающего числа (например, k-значной логики), причем закон образования этих чисел совершенно неизвестен исследователю. Если ? и ? задаются одним и тем же источником (например, конформными состояниями определенного димера тубулина ДТ), то

Если же эти числа задаются разными источниками, то исследователь принципиально не имеет возможности установить, то что эти источники одинаковы.

6.5. Принцип непрерывности. Определим

, ...,

)

), где

. По сути дела эта запись означает, что все столбцы-переменные в Х различны и взаимосвязаны (логическая связка "и"). Принцип непрерывности запишем следующим образом:

Последнее выражение в этой формуле мы истолкуем как

- в LS отсутствует схема примитивно рекурсивной замкнутости для собственных функций (описания обозначений см. в 2.4.). Здесь же утверждается, что "непрерывное" усложнение конъюнкции К (функционала

) вплоть до получения истинной формулы, достигается более сложным образом: всегда существует на некотором шаге вычислений определенный сигнал z, в зависимости от которого и происходит это непрерывное усложнение К. Забегая вперед отметим, что таким z может быть, в частности, сравнение целевого состояния с первым или последним не целевым состоянием в Х (см. часть 2).

6.6. Аксиома выбора для конструктивных функций имеет вид:

Эта аксиома уточняет 6.5.: интересующий нас функционал

выбирается (из многих) с помощью предварительного определения конструктивных переменных b и d, последнее зависит (как и в 6.5.) от некоторого "сигнала окончания" х.

"Беззаконные" последовательности теории LS имеют так называемый "антисоциальный" статус: две такие последовательности (два массива Х) либо равны, либо совершенно не зависят друг от друга. Эта точка зрения отображает принцип трансцендентальности мира - он может быть детерминирован совершенно неизвестным нам образом. Отсюда, конечно, следует, что такие массивы, действительно отображающие с требуемой нами точностью реальный мир, должны быть достаточно велики и иметь большую размерность.

Ч А С Т Ь 2

АЛГЕБРАИЧЕСКИЕ МОДЕЛИ

Рассмотренные выше основные формальные аксиоматические теории творческого сознания можно рассматривать лишь как краткий результат опыта интуиционистского подхода при исследовании творческого сознания, выраженный в терминах теории множеств и формальной логики. В этой части мы введем и изучим теоретический инструмент для детального исследования этих аксиоматических теорий - алгебраические модели интуиционистской логики. Эти модели приближают нас к конструктивному (в данном случае - вычислительному) пониманию операций, проводимых с некоторой исходной информацией. Мы постараемся показать, что основные принципы построения этих моделей являются весьма удобной интерпретацией уже известных алгоритмов получения выводов из больших численных массивов данных, отображающих сложные объекты творческого познания [15].

1. Упорядоченное множество входных данных как псевдобулева алгебра. Назовем [1] логической матрицей структуру (алгебру) вида

М = (В, В
,
?),

где В - множество истинностных значений матрицы (массива) М, т.е. список, перечисляющий, какие именно элементы (числа) a, b, c

В истинны или ложны (для удобства справок по отношению к [1] сохраним здесь именно такие обозначения элементов из М). Пусть В

В - множество целевых значений.

Упорядочим a, b, c

B и обозначим это упорядочение как (B,

). Двухместные операции на В,

и элемент ?? В определим теперь более точно с помощью следующих условий:

1) a
a, 2)

9) ?

Согласно 3) и 4) конъюнкция

является точной нижней гранью, которая на числовой прямой лежит между наименьшим элементом конъюнкции и ближайшим к нему слева "чужим" (не целевым) элементом или, в частности, может совпадать с ним. В приводимом далее алгоритме эта грань ? выбирается так, чтобы она совпадала с этим "чужим" элементом. Аналогичное замечание можно сделать относительно дизъюнкции

- точной верхней грани ?, которая, в частности, может проходить по ближайшему справа "чужому" элементу.

В случае выполнения условий (1 - 9) множество (В,

) называется псевдобулевой алгеброй (п.б.а.). Если еще выполняется условие 10)

Т, где Т - наибольший элемент,

Т и где

то в этом частном случае п.б.а. будет называться булевой алгеброй. Придерживаясь ранее приведенных неформальных пояснений и несколько забегая вперед, можно сказать, что именно псевдобулева алгебра, возможно, является тем основным исходным формализмом, на основе которого проявляется творческое сознание.

2. Формирование вынуждающих условий. Алгебра (В,

) соответствует упорядочению значений каждого переменного х. Будем далее считать, что строки массивов исходных данных Х и У упорядочены по времени t их реализации (очередная строка записывается ниже). Введем принцип локальности во времени: будем сравнивать каждое целевое состояние из Х (оно задается значениями У) со своей ближайшей окрестностью не целевых состояний. Соответственно, упорядочение (М,

) зададим следующим образом. Будем различать текущие индексы j строк - jt для целевых и jn для не целевых; заметим, что каждой строке соответствует ее время реализации t. Далее будем вычислять абсолютное значение разностей | t(jt) - t(jn)|, где для каждого заданного по порядку t(jt) (сверху вниз по массиву Х) выбирается множество t(jn), соответствующее всем не целевым строкам. Эти разности упорядочиваются, соответственно им конструируется логические матрицы М (их число равно числу целевых состояний).

Сравнивая каждую целевую строку с упорядоченной окрестностью не целевых строк (начиная с ближайших) вычислим для каждого столбца х острый конус, порожденный х(jt):

[x(jt)] = {x(jn) ? M | x(jn)
x(jt)}.

Аналогичным образом вычисляется конуc для значений х(jn) >x(jt). Эти множества определяются для всех целевых строк. Семейства [x(jt)] задают порядковую топологию Т на М. Назовем п.б.а. всех открытых подмножеств этого топологического пространства алгеброй Крипке, а саму структуру (М,

) - шкалой Крипке, т.е. системой упорядочений массивов М, где каждое упорядочение повторяется столько раз, сколько целевых строк в Х.

Пусть на (М,

) существует некоторая функция D, с помощью которой вычисляются границы некоторого (по возможности наиболее часто встречающегося) открытого интервала (?, ?) для данной целевой строки. Так, D реализуется с помощью так называемых вынуждающих условий - значений х(tn), которые выбираются из множеств, соприкасающихся к острому конусу х[jt]. Этот процесс весьма нагляден на числовых прямых для каждого х - не целевые значения х как бы "обрезают" снаружи интервал (?, ?). Аналогично шкале Крипке определим шкалу Бета-Крипке (М,

, D). Отношение

будем называть отношением информативности; так если последующий (по ходу вычислений) интервал будет меньше предыдущего, будем говорить, что он информативнее его - это сжатие интервалов возникает только под влиянием дополнительной информации, что будет видно в дальнейшем при описании самого алгоритма. П.б.а., соответствующую шкале Бета-Крипке будем называть алгеброй Бета-Крипке.

Именно с помощью этой алгебры с определенной семантикой, которая в значительной мере определяется величинами абсолютного локального времени tl (удаленностью от определенного целевого состояния объекта) удается формализовать интуитивные (и, конечно, опытные) соображения, по которым в условиях неполной информации при изучении достаточно сложных объектов большое значение имеет так называемый "контрольный опыт", который по своим условиям - времени, пространству и т.д. - находится в наибольшей близости от "целевого опыта", когда выполняется цель исследования. Сопоставление таких наиболее близких (по наибольшему числу возможных переменных) состояний объекта позволяет отсеять несущественные переменные. В представленной выше формализации удается сделать гораздо больше в этом отношении. Отметим, что в итоге целевая строка сопоставляется со всеми не целевыми, последовательно расположенных все далее и далее вплоть до исчерпывания всей информации. В итоге, вывод К для задаваемой последовательно очередной целевой строки становится истинным на всем массиве Х.

Если же в качестве "контроля" выбирать состояния объекта, удаленные от целевого, то здесь выводы (будучи также непротиворечивыми для данного Х) могут зависеть не только от уже известных возмущений, но и от неизвестных (нерегистрируемых), например, от старения катализатора, изменения качества реагентов и т.п. возмущений, медленно эволюционирующих во времени. Заметим, что при их относительно быстром изменении применение принципа получения "локальных" по времени выводов становится менее эффективным.

3. Определение алгебраической модели конструктивной (интуиционистской) логики (АМКЛ). Алгебраическую модель конструктивной (интуитивистской) логики, отображающую сложные объекты (более точно - сложные системы) определим следующим набором:

АМКЛ = (B, D, R, Cnst, Fn, Pr)

Здесь В - полная п.б.а. Бета-Крипке, называемая здесь алгеброй истинностных значений модели, D - функция, вычисляющая множества предметных объектов (значений х для целевых строк). R - есть функция, вычисляющая замкнутые интервалы [min x, max x] или, иными словами, области определения х для соответствующих логических формул. Заметим, что в нашем случае существенную роль будут играть модели с непостоянной предметной областью. Функция Cnst определяет константы

(определяющие соответственные открытые интервалы). Напомним, что эти константы являются элементами D, но принадлежат к иному классу эквивалентности для Y (к не целевому классу). Функция Fn приписывает значения функциональным символам нашего логико-математического языка

Остановимся здесь подробнее на некоторых важных определениях. Ранее отмечалось, что открытый острый конус [x(jt)] задает порядковую топологию Т. Для краткости обозначим элементы из этого конуса символами u, v

T, v

u ("v выбираются позже u"). Для каждого i и точки u

М определяется множество U(i, u)

D (область предметных объектов, известных к моменту u). Объекты, с помощью которых будут конструироваться в нашем случае импликации, будем обозначать через q

U. Зададим функцию F ("алгоритм вычисления единственных значений q"), сопоставляющую каждому функциональному символу f и моменту u некоторое частичное отображение

Область определения

включена во множество U(i1, u)

U(in, u) - здесь имеются ввиду цепочки самой различной длины вплоть до n. Область значений включена в U(i, u), т.е. (во всяком случае на первой стадии вычислений) для некоторого единственного вида i элемента u). На это частичное отображение накладываются следующие условия:

А) если v

u и определено значение

более раннее значение единственного искомого qi), то определено и значение

поскольку заведомо известен более поздний и более информационный момент v. Кроме того,

(должен вычисляться один и тот же единственный qi);

Б) если u

то существует v

S такое, что определено

т.е. задано правило выбора единственного qi. После этих условий определим

(f1,q1,..., qn, q) =

Другими словами,

- это функция, вычисляющая те "предшествующие" элементы острого конуса

за которыми следуют элементы v. При их сопоставлении со строкой сравнения в момент v выдается сигнал "отбросить последнюю переменную, соответствующую объекту q" после этого происходит возврат к моменту u и запоминается q, т.е. те значения первого выбранного переменного х(i1), который будет также и первым элементом гипотезы (в общем случае - первым элементом конъюнкции К). Если эта гипотеза после проверки образует импликацию, истинную на М (и, соответственно, на Х), то происходит переход к следующим целевым строкам jt. Если же эта гипотеза ложна на некоторых jn, то для этой же целевой строки аналогичным образом происходит выделение новых q, но для иных переменных, ранг r конъюнкции (в итоге - импликации) возрастает. Аналогичным образом выделяются конъюнкции (как истинные формулы) по всем целевым строкам, они объединяются логическими связками "или", и вся сложная формула соединяется связкою "если, то" с целевыми значениями У. Можно сказать, что функция Fn в итоге приписывает значения этим функциональным символам используемого языка ?, т.е. вычисляется, какие именно переменные (по ходу вычислений) какими символами должны быть соединены.

Наконец, функцию Pr зададим следующим образом. Будем говорить, что D есть оператор типа пополнения на некоторой п.б.а. (М, T), если для всех a, b

М выполняются условия: 1) a

Da, 2) a

3) DDa = Da. Элемент a назовем полным, если а = Da. Множество всех полных элементов М обозначим через С(М). В этом случае потребуем еще выполнения условия 4)

, если

Таким образом, полные элементы (интервалы) Da или Db как бы размазаны по числовой оси до своих ближайших соседей. В итоге Pr определяется как функция, вычисляющая множество интервалов вида

соответствующих каждому частичному выводу для определенной целевой строки.

Итак, АМКЛ определяется конструктивно не только как некоторое множество символов переменных, констант, функциональных и предикатных символов, но и как некоторый алгоритм - совокупность операций и правил, определенных выше. Условия управляемости и устойчивости общих динамических систем, отображаемых АМКЛ, а также аппроксимации соответствующих подмножеств рядами функций Эрмита описаны в [15], по мере возможности при описании отдельных моделей мы будем их обсуждать.

Известно, что любая формальная теория Т будет полной, если не существует собственного (т. е. совпадающего с Т) непротиворечивого расширения Т с тем же самым словарем [51]. Действительно, попытки расширения Т, например, разрешение использования для получения К любых иных последовательностей не целевых строк (не только строк из локальной окрестности целевой строки) приводит к истинности К лишь на данном (конечном) исследуемом массиве Х и возможной противоречивости К на иных выборках Х. Так, известно, что при исследовании сложных объектов всегда существуют, например, или неизвестные медленно эволюционирующие или незарегистрированные Х, которые могут существенно влиять на сам вид К. Сравнение же значений целевой строки с ее ближайшей окрестностью не целевых строк, когда медленно изменяющаяся Х практически сохраняет свои значения, вид (и, конечно, истинность) вычисляемой К уже не зависит от такого вида незарегистрированных переменных.

4. Алгоритм построения АМКЛ. Предлагаемый далее алгоритм [15] является частью проектируемой интеллектуальной системы (ИС), отображающей интуитивистское исчисление предикатов (в частности - формулирование сравнительно небольшого набора кратких выводов из массивов информации большой размерности). Особенность ИС состоит в ее приспособленности к исследованию динамики сложных объектов, зависящих от так называемых скрытых переменных. Система выявляет также контекст выводов, что позволяет уточнить их смысл, формирует пары прямых и "обратных" выводов с их контекстами, сопоставление которых стимулирует интуицию пользователя при интерпретации выводов или при разработке новой теории. ИС может быть использована в любых областях науки или практики, где имеется возможность обучения с целью моделирования, диагностики или прогноза, а также для доказательства (или опровержения) некоторых априорных предположений, например, в области доказательной медицины.

Вход алгоритма: массивы X[1...m, 1...n], Y[1...m, 1...l] вещественных чисел (в частности целых) и строка-цель (сложный целевой критерий) z[1...l] натуральных чисел (в частности булевых 0 и 1), указывающие для каждого столбца Y[1...m] классы эквивалентности для соответствующих вычисляемых далее столбцов Z, относительно которых далее будут вычисляться модели. Строки X, Y упорядочены естественным образом, например, по времени t. При равных отсчетах времени этот параметр может соответствовать номеру строк i, (напомним, что j - это номера столбцов для входных или выходных переменных); запаздывание, если оно существует, заранее учитывается.

Выход: тупиковая дизъюнктивная форма относительно всех классов эквивалентности для Z (в частности, относительно сложного критерия цели z, которому соответствует единственное, например, булевое значение заданной на входе строки-цели), в данном алгоритме итоговая вычисленная форма обозначается как АМКЛ. Распознавание принадлежности новой строки m+1 к одному из классов эквивалентности Z; вычисление "контекста": интервалов [min x, max

x], [min y, max y] для каждого вывода (элементарной импликации К) по указанию пользователя.

Основные блоки:

I. Вычисление квантованного на ? = 0, 1, 2, ... классов эквивалентности Z для столбцов Y (порознь для каждого столбца или, по желанию пользователя, вычисление единого столбца Z для исходно заданного сложного целевого критерия z). Например, задан z = 0, 1, 0 : "Выводы К рассчитать относительно цели, когда одновременно Z₁ = 0, Z₂ = 1, Z₃ = 0". Рекомендуется вначале вычислять и интерпретировать модели порознь по каждому Z отдельно. Модели для сложного критерия обычно имеют значительно меньшие оценки |Г|.

II. Вычисление импликаций К

= x

& x

&...x

Z, где x

- области определения для х .

III. Минимизация покрытия всех строк i и вычисление АМКЛ.

IV. Вычисление контекста АМКЛ.

V. Распознавание принадлежности новой строки m+1 к одному из классов эквивалентности Z.

Начало блока I,

1) задать l, m, n, Y

, z (индекс 0 при Y пусть означает его целевой класс эквивалентности),

2) вычислить среднее y

по всем j (далее у⁰ будет называться точкой разбиения множества, соответствующего Y).

3) если y[i, j]

, то y^? [i, j] := 0, иначе y^?:=1,

4) если строка Y^?[ i ]=Y

, то Z[ i ]:=1, иначе Z:=0,

5) вычислить сумму S единиц в столбце Z,

6) если abs (m/2 - S)

0,05m, то перейти к блоку II,

7) иначе упорядочить y[i, j] по каждому столбцу по возрастанию,

8) если S m/2 и если y

[ j ]=0, тогда

9) выбрать в качестве точки разбиения y

среднее между предыдущим значением y

и ближайшим к нему значением y

, взятого из списка упорядоченных y

10) если y

[ j ]=1, тогда

11) выбрать в качестве точки разбиения y

среднее между предыдущим значением y

и ближайшим к нему значением y

, взятого из списка упорядоченных y

12) если S

m/2 и y

= 0, тогда аналогичным образом y

выбирается как среднее между предыдущим y

и ближайшим элементом y_j>y

, если же y_0j=1, то y

выбирается как среднее между предыдущим y

и ближайшим элементом y

, взятого из упорядоченного списка y_j,

13) подсчитать общее число обращений к п. 3, если это число "сдвигов" точек разбиения y

> m/2, то перейти к блоку II, иначе перейти к п. 3,

14) предусмотреть в необходимых случаях непосредственное задание булевых или k-значных столбцов Z. При использовании многоцелевого критерия-столбца Z следует иметь в виду, что его следует применять в самом конце исследований лишь после того, как будут интерпретированы все частные модели по каждому столбцу Z[j]. Этот способ помогает "склеивать" все частные критерии лишь в том случае, если это возможно - отдельные критерии-столбцы могут или противоречить по заданной извне цели друг другу, или вообще информационная энтропия моделей может возрасти из-за недостаточной симметрии разбиения значений по каждому столбцу. Заметим, что многоцелевой критерий довольно редко приходится использовать на практике. В этом случае можно в блоке I просто задать столбец Z (булевый или k-значный).

Конец блока I.

Начало блока II,

15) выбрать первую (при последующих обращениях - очередную) строку X, для которой Z=1,

16) ввести локальную точку отсчета времени t=0 для этой строки, упорядочить все строки X_i|Z

1 в порядке возрастания |t| (удаления от X_i|Z=1),

17) сравнить X_i|Z=1 с ближайшей X_i|Z

1, выбираемой из упорядоченного списка и построить интервалы ?_j< x_ij < ?_j, где x_ij берутся из X|Z=1, а ?, ? - ближайшие к x_ij значения этого же X_i, но взятые из X_i|Z=0. Интервалы по ходу их формирования могут лишь сжиматься. Если x_ij=x_i+k,j, где k=1,2,... - номер строки сравнения (Z

1), выбираемой из упорядоченного списка, то соответствующий интервал вычеркивается и в дальнейших сравнениях не принимает участия (только для используемой на данном этапе целевой строки X_i|Z=1),

18) если исчезают все интервалы, то следует восстановить интервал, исчезающий позднее всех.

19) После исчерпания всего упорядоченного списка строк сравнения подсчитать, сколько раз |Г| включаются x_ij для всех целевых строк в соответствующие интервалы и выбрать единственный интервал с максимальным |Г|, при одинаковых оценках |Г| выбирается первый по списку интервал (здесь возможно усложнение алгоритма: каждый из таких интервалов последовательно участвует в последующих операциях с целью получения формулы К с максимальной оценкой |Г|, см. п.24, однако время вычислений при этом заметно возрастает),

20) если в итоге все интервалы исчезают, выдать сообщение "строка i совпадает со строкой i+k" и перейти к п. 15.

21) Сформулировать гипотезу: "если ?_j < X_j < ?_j, то Z=1" и проверить ее по всем X_j|Z

1, если формула истинная, то запомнить (?_j, ?_j), ее оценку |Г| и перейти к п. 15, если ложная - пометить строки X|Z

1, где наблюдались противоречия,

22) удалить из упорядоченных строк сравнения все, кроме помеченных, вычеркнуть столбец X_i, элемент которого x_ijуже вошел в импликацию x

? Z=1 и перейти к п. 17,

23) после выделения каждого последующего интервала x

строится усложненная гипотеза x

? Z=1, где r - ранг соответствующей конъюнкции, т.е. r-местного предиката (в общем случае). При проверке гипотезы достаточно проверить лишь очередной новый интервал x

на не вхождение в X_j|Z

1, затем перейти к п. 17,

24) запись импликации К_i, множества Г_iвключенных в эту область номеров строк i и оценки |Г|, перейти к п. 15,

конец блока II.

Начало блока III,

25) упорядочить все К_iпо убыванию |Г|,

26) выбрать первый К_i ,

27) выбрать К₂: если Г₂? Г₁, то К₂вычеркивается, иначе выбираются следующие К_i,причем Г_iсравниваются с объединенным множеством

Г_iранее выбранных К_i, для каждого из них Г_i+1

Г_i,

28) запись АМКЛ, т. е. интервалов x

для каждой конъюнкции К, их Г и |Г|, далее записать К₁VК₂V... ? Z₁,

29) задать иные (??1) значения Z и вычислить соответствующие АМКЛ.

Конец блока III.

Начало блока IV,

30) вычислить (min x, max x) и (min y, max y) для некоторых К_i, х и у, заданных пользователем (обычно для тех х, которые не вошли в К и интервалы которых по каким-либо причинам представляются интересными для пользователя).

31) предусмотреть вычисление (min x, max x), (min y, max y) по всем переменным, входящим в АМКЛ,

32) запись АМКЛ с новыми интервалами,

конец блока IV.

Начало блока V,

33) записать строку X[m+1, 1...n], предъявленную для распознавания класса Z,

34) если

x|K_i

K_i, то записать |Г_i|, если эти включения в прямую АМКЛ (Z₁), то оценки |Г_i|положительные, если включения в К для иных АМКЛ (??1), то оценки |Г_i|отрицательные,

35) вычислить алгебраическую сумму оценок ?|Г^?|, если она положительна, то X[m+1, 1..n] относится к Z₁, если отрицательна - к Z^?^?¹ (иначе - отказ от распознания),

36) вычислить min Y, max Y для этой X по тем К_iдля распознанного ?, которые участвовали в распознавании Z,

37) аналогичным образом все вышеприведенные вычисления провести для иных значений ?,

конец блока V.

Пример.

Для иллюстрации (и в качестве упражнения в применении ручного метода по вышеприведенному алгоритму) приведем небольшой массив X, Z одноразрядных случайных натуральных чисел (с 0) и последовательность основных операций для вычисления АМКЛ.

	x₁	x₂	x₃	x₄	z
1	5	4	2	0	0
2	5	5	4	4	1
3	2	6	3	3	0
4	2	5	7	4	0
5	2	6	4	4	1
6	5	5	2	6	1
7	0	3	4	6	0

Лучше всего записать такой массив на миллиметровке. Пусть цель Z = 1. На другом листе миллиметровки перепишем строку 2 ("целевую"), сложим бумагу так, чтобы эта строка оказалась сверху и сравним ее со строкой1 ("не целевой"), где Z =0. Запишем карандашом на целевой строке в соответствующих клетках слева значения Х из не целевой, если эти значения меньше значений целевой, и справа, если эти значения больше (номера строк не участвуют в этих операциях). Если же значения целевого и не целевого Х совпадают, то целевое значение вычеркивается. Получаем в результате строку:

( - ), (4...5...), (2...4...), (0...4...), затем сравниваем ее с не целевой строкой 3 и записываем лишь те новые (не целевые) значения формируемых интервалов, которые лежат ближе к целевому значению (т. е. интервал может только уменьшаться!):

( - ), (4...5...6), (3...4...), (3...4...), те старые значения интервалов, которые изменяются, стираем ластиком. Далее сравниваем этот результат со следующей не целевой строкой:

( - ), ( - ), (3...4...7), ( - ). Сравниваем с последней не целевой строкой - в итоге должен быть вычеркнут последний существующий интервал, "делаем шаг назад": оставляем этот интервал. Формируем первую гипотезу: "если (3< х₃ <7), то Z = 1". Гипотезы имеет смысл проверять лишь на не целевых строках, лишь строка 7 противоречит ей (такое включение х₃ в этот интервал наблюдается в этой строке), однако здесь Z = 0. Помечаем такие противоречащие строки (в общем случае), восстанавливаем исходный массив, кроме столбца, соответствующего уже найденному интервалу, и далее проводим все те же операции, как в начале этого алгоритма, но дальнейшее "обучение" проводится с использованием лишь помеченных строк (начиная с ближайшей окрестности от целевой строки). Новый вычисленный интервал присоединяем к предыдущему с помощь логической связки "и" и для данной целевой строки в итоге получаем "всегда истинную" формулу К:

(33<7)&(01

5) ? Z = 1.

Далее, подсчитываем, в какие еще целевые строки включается эта формула, записываем это число (оценку этой формулы) и переходим к следующей по порядку (сверху вниз) целевой строке. Производим подобные операции для всех этих строк, упорядочиваем их оценки по убыванию и вычеркиваем те формулы (кроме первой), которые покрывают те же строки, что и объединение ранее выбранных формул (проверка производится каждый раз после присоединения с помощью логической связки "или" очередной формулы из их упорядоченного списка). В итоге получаем для данного массива АМКЛ в виде следующего выражения:

(33<7)&(01

(21

5)&(42

5) ? Z = 1. Заметим еще, что если после просмотра всего массива остается несколько выделенных интервалов (истинные формулы еще не вычислены), то надо найти оценки каждого такого интервала (он может быть и многомерным) и выбрать единственный интервал с максимальной оценкой. Далее, как обычно, формируется промежуточная гипотеза, помечаются противоречащие строки и т. д. Часто полезно также рассчитать и модель для не целевых строк относительно целевых; в некоторых случаях для облегчения интерпретации исследуемого объекта вычисляется также "контекст" модели по отдельным заранее заданным переменным (см. раздел по интерпретации моделей).

В дальнейшем вся суть исследований заключается в использовании на первых этапах вычислений ближайшей окрестности не целевых состояний. Следует помнить, что наибольшее семантическое значение имеет первая переменная в ее записи в К - происходит сравнение как бы с наиболее близким "прототипом" целевого состояния, далее целевое состояние сравнивается со всеми другими не целевыми. На первом этапе работы минимальное общее число не целевых состояний может быть равным общему числу переменных. В том случае, если выводы К кажутся при этом исследователю слишком простыми или даже тривиальными, далее следует постепенно расширять эти упорядоченные пространства (обычно по времени реализации очередных не целевых состояний в случае весьма редкой реализации целевых). Остановка этих рекурсивных вычислений происходит, если, например, получаемые выводы К (во всяком случае ходя бы для К с максимальными оценками) уже плохо интерпретируются на основании имеющихся априорных данных. Так, трудно поддаются интерпретации К большого ранга, что обычно бывает при исследовании массивов данных весьма большой размерности. Для предварительной оценки таких массивов желательно использовать, например, хорошо известные методы корреляционного анализа для сокращения размерности массива данных. Но проще всего для начала исследований взять из исходного большого массива его наиболее важную в структурном отношении смысловую часть (если это возможно).

Как уже, наверное, заметил читатель, большую часть работы над подготовкой исходного (большого) массива к исследованию с помощью АМКЛ приходится проводить, как бы "упорядочивая" синтаксис исходного языка исследования. Необходимо ввести такие операции, которые бы способствовали выявлению лишь отделимого пространства по отношению к нашей цели и также не давали бы с самого начала исследований слишком сложных выводов. Далее, когда все эти условия выполнены, производятся уже вычисления АМКЛ и делается семантический анализ результатов, в зависимости от которого иногда приходится опять переходить к синтаксическому анализу и т. д. Всегда следует иметь ввиду, что согласно Гёделю понятие математической истины только частично достигается в рамках любой формальной системы.

Ч А С Т Ь 3

ТВОРЧЕСКОЕ СОЗНАНИЕ КАК УПРАВЛЕНИЕ РЕШЕНИЕМ ПРОБЛЕМ

Во всех последующих главах творческое сознание рассматривается в основном как генератор правдоподобных (непротиворечивых) частных гипотез при наличии некоторых исходных данных, и далее все дело сводится или к последующей проверке этих гипотез на новых данных или прямо к использованию полученных моделей для практической деятельности. Однако в условиях сложного научного поиска нас также интересует, например, содержательная интерпретация полученных моделей, ее согласование (или отсутствие такового) со всем ранее накопленным опытом. В таких условиях по пути вычисления подходящей модели наше сознание должно решить еще и некоторое множество важных проблем не только, конечно, в содержательном плане, но и по практической приемлемости моделей. Так, еще необходимо выявить признаки устойчивости, управляемости в динамике всего множества "подбираемых" нашим сознанием моделей в условиях, например, больших внешних возмущений и явной неполноты данных. В этой главе для согласования с существующей литературой будем использовать термины и обозначения общей теории систем [50] и под "нашей" системой здесь будем понимать функции исследуемого творческого сознания в выше приведенном смысле, моделируемого в виде АМКЛ.

Далее в Части 5 п. 4.3 приведена весьма правдоподобная гипотеза, что наше сознание представляет собою сложную динамику квантованных конформных состояний особых белков (тубулинов) по крайней мере, в нейронах головного мозга. Если это так, то приводимые далее теоретико-множественные формулы в компактном виде частично отображают всю сложность этой динамики при заданных целях управления построением модели сложного объекта в процессе исследовательской деятельности. Заметим, что эти соотношения (как и приведенные ранее теоретико-множественные формулы, отображающие различные теории творческого сознания) в значительной мере имеют в содержательном смысле "сетевой" (нелокальный) характер. Действительно, деятельность ученого (чаще, мирового сообщества ученых) всегда связана с хранилищами информации: журналами, книгами, памятью индивидуального компьютера (и с другими базами данных в сети), Интернетом и, конечно, с непосредственным общением с другими людьми. Творческое сознание обычно имеет подобного рода нелокальный (распределенный в пространстве и времени) характер. Индивидуальное же "озарение" и интуиция частично моделируются с помощью АМКЛ чаще всего как выявление таких обычно редких ситуаций, которые могут указывать на интересную в содержательном смысле новую интерпретацию таких явлений. Отдельные подобные примеры можно найти в тех подразделах, где исследуется построение содержательных моделей.

1. Условия существования функции управляемости. Определим нашу систему S, как некоторое собственное подмножество декартова произведения S: M

Y (т. е. как некоторый ограниченный массив данных), где M

U = X - вход и У - выход системы и где М - внешние возмущения и U - управляющие сигналы. Кроме S задается и критерий качества системы G: M

V. В том случае, если вместо У используется его расчетное по модели значение S(m, u), (m, u)

M, U, вычисляется расчетный критерий качества g(m, u) = G(m, u, S(m, u)). В качестве V можно задать, например, усредненный критерий Фишера (по этапам построения модели), который равен отношению дисперсии у_k,(т. е. для импликации К) относительно общей средней

к дисперсии у_k, относительно у_k,m = f(X), рассчитываемого по модели. В качестве

_k для К можно взять условное среднее у_k?К (вертикальная черта пусть обозначает "при условии"). Соответственно выбираемым формулам К, отображающих подсистемы S, производится и усреднение критерия Фишера. В дальнейшем будет указан метод аппроксимации множеств, соответствующих К, рядами Эрмита.

Множество

назовем достижимым относительно заданного g, когда существует такое внешнее возмущение и управление, что расчетное значение критерия g (табличное значение с заранее заданным уровнем значимости) равно или меньше критерия v, рассчитываемого с помощью у_k. Множество

назовем вполне управляемы когда,

т. е. в частности, когда внешнее возмущение такое, что g

v. Заметим, что если

вполне управляемо, то оно достижимо относительно заданного g; однако обратное утверждение неверно - достижимость этого критерия еще не означает вполне управляемости. Для этого нужно, согласно приведенному выше определению, существование лишь определенного (не всякого!) вида внешних возмущений. Заметим, что роль именно такого определенного вида возмущений играет контекст АМКЛ.

Пусть каждому столбцу у_j соответствует v_j ; в этом случае систему будем называть многокритериальной, v_j

. Как и раньше, множество

будет достижимым; дополнительно также будем считать, что

Множество

назовем несклеенным, когда

достижимо. Соответственно, система будет называться склеивающей, если не все требуемые компоненты

можно реализовать одновременно, т. е. между различными v в этом случае существует функциональная зависимость. Существование этой зависимости является достаточным условием неуправляемости S, т. е. системы, определяемой упорядоченным набором элементов

соответствующего ранее определенной логической матрице М, на основе которой строится АМКЛ. Срыв управляемости может быть, таким образом, описан в терминах склеенности многокритериальной системы.

2. Условия существования функции устойчивости. Весьма просто и естественно определяется общее понятие устойчивости АМКЛ, соответствующей системе S, s

S, и где s - подсистемы, соответствующие отдельным импликациям К. Пусть S(x_io,j) = y, где индексом io будем обозначать ту очередную целевую строку (состояние объекта), с помощью которой будет вычисляться только для нее соответствующая К (далее их общее число будет минимизироваться). Интервалы

для Х и У, соответственно, назовем здесь системой окрестностей относительно целевой строки io. Тогда пару х_{io, j1}, y_{k, j1} назовем устойчивой относительно

в том и только в том случае, когда

Другими словами, значения некоторых х и у устойчивы, когда найдутся другие значения х и у, имеющие одни и те же интервалы

соответственно. Это условие позволяет отбирать более устойчивые (чаще встречающиеся) интервалы. Символом Г_i будем обозначать далее множество Г_i = {io?K_j}, а с помощью выражения ?Г_i? - мощность этого множества, т. е. число состояний io, включенных в область К_i. Вышеприведенное условие отображает общесистемный подход, к понятию устойчивости. Аналогичным образом вводится понятие функции типа функции Ляпунова для общей динамической системы и формулируются необходимые и достаточные условия устойчивости в терминах этой функции при наличии модели в аналитическом виде, соответствующей АМКЛ.

3. Определение общих динамических систем, отображаемых АМКЛ. До сих пор динамика не обсуждалась. Однако, из описания АМКЛ ясно, что выводы, получаемые их этих моделей, связаны со временем t. Использование окрестностей ?t времени около t, соответствующего целевой строке, имело смысл частичного преодоления условий информационной неопределенности. Остановимся теперь подробнее на тех временных характеристиках, которые непосредственно связаны с проблемами управления сложными системами S.

Каждая импликация, соответствующая целевой строке io, является в общем случае функцией времени, ?_io(t). Итоговая АМКЛ конструируется, как дизъюнкция конъюнкций К, соответствующих этой функции, причем отбрасываются те К, которые частично покрывают те же строки, что и К с бСльшими оценками (частные К последовательно выбираются из их упорядоченного списка в порядке уменьшения их оценок). Далее рассмотрим лишь совсем простой случай, когда каждому итоговому К приписывается среднее (целочисленное) значение индексов io, присущих соответствующим ему частным К (они рассчитываются по каждой целевой строке). После упорядочения этих индексов по возрастанию, припишем каждому из них свое значение переменной t:

т. о., наша модель отображает изменение поведения S во времени.

При достаточно быстром расчете АМКЛ практически реализуется дуальное управление. Так, после накопления в памяти некоторого итогового множества К, для управления выбирается та конъюнкция К, для которой выполняется цель управления и контекст которой (или переменные х

К) соответствуют существующим в момент управления возмущающим воздействиям. При отсутствии возможности реализации требуемой К, осуществляется дежурный режим управления. В простейшем случае это может быть или управление по последнему(текущему) управлению К, или подбор К по "ограниченному" контексту, когда подбирается интервал определения переменной лишь по одному или нескольким наиболее важным возмущающим воздействиям, или, наконец, задается среднее ("глобальное") по исходным данным значение переменных управления. Во время дежурного управления накапливаются новые данные и рассчитывается новая модель, по которой и производится дальнейшее управление.

При достаточно быстром расчете новой модели происходит процесс изменения как параметров

, так и структуры АМКЛ, т. е. здесь осуществляется адаптивное оптимальное управление сложным объектом. Отметим еще, что цель Z управления U принимает в общем случае значения k-значной логики, однако целевые и не целевые модели по самому способу расчета остаются булевыми: вычисление любой конкретной целевой модели всегда производится по сравнению со всем дополняющим множеством не целевых строк. Вышеприведенные схемы использования АМКЛ для управления объектом практически реализуют (в интервальном виде) весьма перспективную универсальную адаптивную (самонастраивающуюся) систему управления с идентификатором в цепи обратной связи.

В тех случаях, когда время не является лимитирующим фактором при поиске оптимального управления, например, при исследовании "почти" стационарного процесса, в дальнейшем запоминаются лишь те состояния, для которых области определения существенных переменных включаются внутрь старых областей определения (ранее рассчитанных К). После накопления необходимого числа новых состояний рассчитывается новая модель и т. д. В результате такого рекурсивного применения алгоритма построения АМКЛ происходит постепенное продвижение к оптимальному в существующих условиях (т. е. как бы адаптивному) критерию Y управления. Итоговая АМКЛ здесь будет представлена некоторым набором малых ячеек К, соответствующих различным режимам, зависящих от существования внешних возмущений М. Мощность множества этих ячеек будет тем больше, чем сложнее исследуемый процесс. Назовем вышеописанный способ управления с постепенным уточнением режимов функционирования объекта эволюционным управлением.

Отметим еще возможность отображения АМКЛ как системы S с переменной структурой управления: динамической системы, поведение которой на случайных интервалах времени характеризуется различными структурами К и описывается различными уравнениями.

Кроме вышеперечисленных аспектов включения "крупномасштабных" временных зависимостей, в модели время может быть включено как непосредственно (Х₀ = t), таки в виде заранее заданных функций от Х. Например, вводится дискретное время Х₁(t) - X₁(t - 1) = ?X₁(t), аналогичным образом могут быть введены разности второго порядка и т. д. Для непрерывного времени могут быть рассчитаны и введены в массив Х необходимые частные производные. Обозначая текущее состояние как Х(t), можно исследовать систему "с памятью", включая в каждую строку Х(t) предыдущую строку Х(t - 1) и т. д. Задавая все ?t = 1, ..., m -1 (для этого дискретного случая), будем говорить, что данная система имеет глубину памяти равную ?t.

Для построения АМКЛ, если необходимо, следует учитывать и время запаздывания регистрации каждого х по сравнению с Y (в противном случае при содержательной интерпретации модели следует отмечать реальный смысл зарегистрированных в определенное время переменных).

Приведем теперь формальное определение, согласующее АМКЛ (рассматриваемые как S) с общей теорией систем. Пусть t

> t, T_t =

(Символ : здесь означает выражение "при условии").

Введем операцию сочленения элементов, положив

(операция сочленения элементов

Пусть заданы АМКЛ, соответствующая система

и некоторое множество С = {?, ?}, которое будет являться по определению пространством состояния системы S тогда и только тогда, когда найдутся два таких семейства функций:

что

1) для всех

для всех

где

В этом случае АМКЛ назовем динамической системой S в пространстве состояний С. В данном случае ?_t - это некоторая функция, соответствующая К (вычисляющая У), а

- семейство таких функций, соответствующих АМКЛ. Соответственно определяются функции перехода состояний

Условие 1) отображает начало использования модели: процесс обучения должен идти до тех пор, пока не найдется такое пространство состояний С= {?, ?}, которое могло бы быть использовано для начала управления объектом. Другими словами, структура системы S всегда ограничена "генетически" той информацией, на основе которой она была создана, и это условие задает признак, когда такое обучение можно кончать (когда системой уже можно управлять). Символом

здесь обозначается набор всевозможных допустимых состояний управляемой системы. Назовем динамическую систему в пространстве состояний полной тогда и только тогда, когда для всех

выполняется равенство

Заметим, что реальная система S лишь до какого-то определенного времени может считаться полной, т. е. иметь в памяти запас конъюнкций К, соответствующих наблюдаемым состояниям объекта управления.

Условие 2) отмечает переход от обучения к использованию функции (модели) ?_t вне интервала времени, на котором она была получена. В этом случае, если нет готовой начальной (уже находящейся в списке К) функции ?_о = ?_t происходит процесс "доучивания", т. е. адаптации к новым допустимым состояниям исследуемого объекта. Пусть

и т. д.; вначале функция ?_t определялась на множестве сочлененных (непрерывно следующих друг за другом по мере расширения окрестности ?t) элементов

С помощью этого множества элементов сравнения старые интервалы суживаются и функция перехода (в алгоритме построения АМКЛ она выступает как некоторая последовательность операций) строит новый интервал

который и используется для управления. Таким образом, само понятие динамической системы для АМКЛ включает в себя возможность адаптации к новым состояниям исследуемого объекта.

Условие 3) обеспечивает возможность использования условия 2) в более широкой (открытой) окрестности нежели замкнутый интервал

т. е. в неограниченной окрестности ?t (в том смысле, как это было описано в подразделе о формировании вынуждающих условий). Напомним, что

где элементы

не ограничены справа.

В условиях весьма малой окрестности ?t (в идеальном случае - при отсутствии новых строк сравнения) интервалы (?, ?) остаются прежними (условие 4)). Вышеприведенное определение общей динамической системы, отображаемой АМКЛ, позволяет (например, после аппроксимации большинства К рядами Эрмита) совершить переход к более детализированным понятиям минимальной реализации, линейности, предопределенности, стационарности и другим понятиям, образующих единую математически формализованную на аксиоматической основе структуру, с помощью которой строится общая теория систем.

Ч А С Т Ь 4

ИНТЕРПРЕТАЦИИ АМКЛ

1. Оценка максимальной ошибки модели. Хорошую оценку ошибки дает применение генератора случая. Вы-воды из случайного массива имеют малые оценки: каждый такой вывод соответствует обычно лишь одной строке. Для вычисления оценки вероятности максимальной ошибки р (ведь единичные выводы в логической модели продолжают оставаться истинными) будем суммировать эти единичные оценки по прямой и обратной моделям и относить их к общему числу строк. Можно дать следующую конструк-тивную интерпретацию такой ошибки: для сравнительно больших массивов данных, когда вычеркивание какой-либо одной строки мало сказывается на структуре рассчитывае-мой модели, ошибка распознавания очередной строки будет происходить с вероятностью, не превосходящей р.

Действительно, в данном случае ошибочно могут рас-познаваться лишь те строки, которые имеют единичные оценки, все остальные строки с большими оценками всегда распознаются точно (при вычеркивании лишь одной строки). Эта ситуация характерна для планируемого "сле-дящего" использования АМКЛ. Пользователь (или автоматическое устройство) каждый раз заносит в память очередную строку (ситуацию) и модель тут же обновляется, т.е. прогноз более чем на шаг вперед в данной ситуации и не требуется. Использование такого вида оценок ошибок моделей проявляет принципиально иной гносеологический подход при использовании данного вида логических моделей. Предполагается предельный информационный детерминизм познающего субъекта (и, возможно, природы), однако в силу явной ограниченности наших познавательных и вычислительных ресурсов, большинство результатов нашей деятельности в более общем контексте всегда имеют явную неопределенность. Информационная ценность простых ("всеобщих") выводов, полученных из ограниченных массивов информации о весьма сложном объекте, проявляется лишь при их сравнении с более сложными соответствующими массивами, которые в неявном виде несут информацию, о которой познающий субъект практически ничего не знает.

2. Качественная интерпретация модели. Очевидна более высокая значимость (и устойчивость) вывода К с максимальной оценкой, однако на практике часто бывают случаи, когда пользователь включает в X переменные заведомо сильно закоррелированные с Z и поэтому сразу же включающихся в K||Г| = max. Обычно информационная ценность подобных K мала, эти переменные следует исключать из X, также как и переменные, например, линейно связанные между собой или несущие явный шум. Здесь следует отметить, что АМКЛ является хорошим тестом на качество генератора случая, для идеального генератора все |Г_i| = 1 и r = n, т. е. исходную случайную таблицу X АМКЛ превращает в другой вид случайной таблицы.

Обычно в начале рассматривается целевая модель, K||Г| = max сравнивается с априорными (литературными) данными, и итогом такого сравнения является вывод (мажоранта [20]) о принадлежности ситуации K₁||Г| = max к более общей группе фактов или к некоторой теории. Эта теория уточняется при подобной интерпретации К₂, К₃ и т.д. вплоть до такого момента, когда содержательная интерпретация очередного K_i оказывается противоречащей интерпретации предыдущих K. Временно вывод K_iисключается из рассмотрения и процесс интерпретации продолжается далее. Следует иметь в виду, что формулы с единичными оценками также истины, однако принадлежат к редко встречающимся ситуациям. В смысле соответствия их вышеприведенному "семантическому соглашению" они могут быть шумом, но не исключается ситуация нахождения "жемчужного зерна" в X, информационное значение которого после дополнительных исследований окажется большим. Для исключенных K_iищется иная интерпретация (теория), чем первоначальная. Далее подобным образом рассматривается не целевая (обратная в булевом случае) модель.

В более сложном положении оказывается исследователь, когда по полученной модели отсутствует априорная информация. В этом случае (и наиболее частом) полезные указания, стимулирующие интуицию пользователя, можно получить следующим образом. Пусть Z = (0, 1) и Z₁ - цель исследования. Для вывода K₁||Г₁| = max | Z₁ищем соответствующей ей K_i|Z₀, который или содержит тот же самый набор x_j, или по крайней мере часть этого набора. Во всех случаях желательно использовать K_i|Z₀с наибольшей оценкой (при отсутствии требуемых x_j просто выбирается K₁||Г₁| = max | Z₀). Более точные данные о выборе пары представлены в п.3. Для наборов x_j как из K_i|Z₁ ,так и K_i|Z₀ далее вычисляются взаимно недостающие интервалы (min x_j, max x_j) по дополняющим переменным, которых недостает как в прямых выводах по отношению к обратным, так и наоборот - в обратных по отношению к прямым.

Другими словами, вычисляются соответствующие контексты по блоку IV алгоритма. Если K являются формулами, необходимыми и достаточными для импликации Z, то соответствующие контексты являются лишь необходимыми условиями. Истинности новых сложных формул K с дополняющим контекстом сохраняются, т.к. [min x_j, max x_j] вычисляется по тому же множеству Г_i строк, которые покрываются K_i. При этом ранг K увеличивается, каждый интервал из контекста присоединяется к исходной формуле с помощью логической связки "и. Следует, однако, помнить, что сам по себе контекст отображает лишь факт существования [min x_j, max x_j] на множестве Г_i строк. Только в конъюнкции с существенными значениями переменных контекст приобретает черты условия, необходимого для истинности также и новых сложных формул К. В итоге сопоставление таких прямых и обратных выводов с одним и тем же набором переменных позволяет исследователю выявить комплекс причин (некоторый "синдром"), в результате действия которого выявляется существенное различие между целевыми и не целевыми К. Аналогичным способом сравниваем и последующие пары К. Этот метод имеет эвристический характер, в некоторых случаях исследователю удается таким путем "раскачивания" объекта выявить и содержательные причины отличия Z₀ от Z₁.

Отметим еще, что сам внешний вид моделей позволяет приближенно судить о сложности исследуемого объекта. Так, с информационной точки зрения большое число дизъюнктивных членов модели (т.е. отдельных выводов) свидетельствует о такой сложности. Соответственно, можно говорить в этом случае о большей неопределенности (информационной энтропии) выводов [17]. Большое число переменных в отдельном выводе ("синдроме") также свидетельствует о его сложности. Сам процесс моделирования (процесс творческого сознания) направлен на получение малого числа наиболее кратких выводов, т.е. на получение наиболее ценной информации, которая дает минимальную сложность описания конечного объекта. Это описание соответствует минимальной длине программы (итоговой формы АМКЛ), содержащей всю требуемую информацию о заданном объекте, достаточную для его восстановления [17] (в том смысле, что из этого восстановленного объекта всегда можно получить точно такие же, как и ранее, выводы).

Наконец, отметим, что мы можем получать непротиворечивые модели лишь для отделяемого исследуемого пространства. В противном случае соответствующая программа АМКЛ должна выдавать сообщения вида "целевое состояние... совпадает с не целевыми состояниями ...". Эти сообщения являются сигналом для исследователя о необходимости увеличения размерности входной информации, например, увеличения числа датчиков ("рецепторов") или, переходя к лингвистическим терминам, увеличения словаря (или, вообще говоря, сложности) используемого языка). Невозможно отобразить и понять сложные реальные процессы, используя примитивные средства общения с исследуемым объектом. "Непонимание" объекта исследования или непонимание исследователей друг друга чаще всего связано именно с этой неотделимостью исследуемого пространства (или с его отображением в сознании в социальном случае). Поскольку природа сама по себе в пределе, по-видимому, обладает свойством неотделимости (трансцендентальности), постоянное усложнение языка представляется необходимым историческим условием развития познания природы и условием развития самого сознания.

3. Аналитическая аппроксимация АМКЛ и метод построения эрмитовых моделей. Часто на практике требуется аппроксимировать подмножества К, соответствующие АМКЛ, с целью получения, например, переменной структуры управления в аналитическом виде. Ряды Эрмита [15, 43] удобны в данном случае тем, что с их помощью можно вводить обобщенные функции, т. е. задавать требуемую степень гладкости ряда эрмитовой модели (ЭМ). Для удобства расчетов примем, что вне интервалов (?, ?)?К целевая функция у принимает средние значения у_с. В этом случае аппроксимация каждой К дает на графике (где по ординате отложен у?К, а за ось х принята абсцисса, проходящая через среднее значение у_с) некоторую кривую в простейшем случае в виде "волны". Если же х выходит за пределы (?, ?)?К, то эта кривая стремится к константе у_с. В итоге, отображение модели в виде набора ("распределения") рядов Эрмита отображает некоторую обобщенную функцию, которая весьма удобна в различных приложениях. Так, в данном случае, можно весьма просто делать преобразование Фурье всей модели - ряды остаются прежними, лишь нечетные его члены умножаются на мнимое i. Более того, задавая всю исходную информацию в области мнимых чисел, мы получаем в итоге комплексные ряды функций Эрмита, что делает вычисляемые модели крайне привлекательными для отображения, например, объектов, зависящих от квантовых процессов.

Поскольку заранее (из АМКЛ) известно, что информация о поведении системы распределена среди некоторого конечного множества К? АМКЛ, необходимо подобрать кусочно-линейную (по функциям Эрмита h_n) функцию таким образом, чтобы по возможности большее число К вошло бы в ЭМ, но при этом следует отдавать предпочтение тем К, которые имеют большие оценки (ввиду устойчивости этих К). Для этого обращаемся к АМКЛ, составленной из списка К, упорядоченного по убыванию оценок этих частных импликаций К. Аппроксимация (расчет ЭМ) проводится, начиная с использования Н₀, вычисляя критерий Фишера V порознь по всем К (кроме тех, оценка которых равна 1). Помечаем те К, для которых выполняется заданный уровень значимости g. Затем упорядочиваем полученные V и удаляем половину того списка К, для которых V меньше V максимального (при хорошей аппроксимации остаточная дисперсия уменьшается, соответственно, V увеличивается). Затем рассчитываем V итоговый с учетом всех степеней свободы для всей выделенной половины множества К (вместе с помеченными К). Если g выполняется и для V итогового, то помечаем все соответствующие К, записываем соответствующие ЭМ. После этого список К восстанавливается, кроме помеченных К (вошедших в ЭМ), и производится аппроксимация оставшихся К с использование следующего полинома Эрмита. Для ранее помеченных К остается прежняя аппроксимация ("принцип минимизации общего числа подгоночных коэффициентов С в конечной модели на выходе алгоритма"). Подобным образом аппроксимация продолжается далее. Аналогичным образом производится аппроксимация при дальнейшем увеличении n, записывается вычисленная ЭМ. Если же g не достигнут (хотя бы для части списка К), и при увеличении n (пусть будет сделано еще два шага) наблюдается уменьшение V, то записывается (и специально помечается) ЭМ с максимальным V. Далее возможно задание другого уровня g, чтобы оценить статистическую значимость ЭМ по итоговой максимальной величине V (например, для оставшейся части списка К).

В тех случаях, когда при вычислении АМКЛ появляется сообщение "строки ... совпадают", т. е. при аналитических исследованиях теряются некоторые степени свободы (некоторые состояния объекта при заданном разбиении у_с расположены в неотделяемом пространстве), можно использовать следующий простой прием. Усредняем значения у для совпадающих строк, затем вновь вычисляем у_с, и АМКЛ. (Заметим, что в том случае, когда у имеет булевы значения 0 и 1, для совпадающих строк можно задать значение у равное 2, которое будем интерпретировать, как "неизвестные значения цели", соответствующая им АМКЛ будет описывать те области пространства, где цель у невозможно точно указать.)

Аппроксимация АМКЛ функциями Эрмита дает в итоге единое аналитическое описание объекта в r-мерном римановом пространстве - аналитическая функция для каждой K_i гладко (например, в точке (у_с, ?) переходит в следующую функцию для K_i+1; там, где информация отсутствует (в процессе управления, например), задается у_н = y_с. Полезный геометрический образ такой "аналитической" АМКЛ - это вид раскрытой книги, где каждому листу соответствует евклидово r-мерное пространство для K_i, и все эти пространства "склеены" в линии сгиба y_с. В тех случаях, когда заранее известно, что у отображает некоторый колебательный процесс, сходным образом производится аппроксимация K рядами Фурье.

Еще одна полезная геометрическая интерпретация "аналитической" АМКЛ - это сферическая поверхность y_с= const, некоторые участки которой имеют локальные для каждого множества из К "всплески" или "углубления" (при отрицательном у_н). Поверхность такой многомерной сферы здесь состоит как бы из отдельных малых плоских участков с евклидовыми координатами. Угол между этими малыми плоскостями соответствует изменению кривизны пространства при переходе от одного "объекта" К к другому.

Заметим, что последовательность (распределение) этих функций, вычисляемых из набора различных К в АМКЛ, соответствует всегда дифференцируемой так называемой обобщенной функции [43], аналитически отображающей в целом исследуемый сложный объект, расположенный в пространстве Римана.

Алгоритм построения эрмитовых моделей (ЭМ).

-- Задать упорядоченный по возрастанию оценок ?Г?список импликаций К (кроме К с единичными оценками) и выбрать очередную К.

-- Задать таблицу критерия Фишера для уровня значимости, например, 0,05.

-- Задать полиномы Эрмита Н₀ = 1, Н₁ = х_н, Н₂ = х_н² - 1, Н₃ = х_н³ - 3х_н, Н₄ = х_н⁴ - 6х_н² + 3, ..., и формулу Н_{n+ 1} = х_нН_n - nH_{n - 1}.

-- Вычислить у_с - среднее всех у по всему столбцу исходных данных, пусть абсцисса графика функции проходит через у_с (при этом условии нормированные у будут обозначаться как у_н= у - у_с), а ордината (для положительных х и у_н) проходит через ? (через левую границу набора открытых интервалов (?, ?)?К. Заметим, что сами ? и ? являются точками из иного класса эквивалентности, они не входят в К, но примыкают к нему, образуя его внешнюю границу). Имея в виду, что простейшая функция Эрмита для одного переменного и для Н₁ имеет вид "волны" h = х ехр(-х²/4) с максимумом при х =

-- вычислить нормированный х_н =

(х - ?)/[((х_с?у_н > у_нс?К) - ?)] по всем х, входящим в данное К. Эти операции соответствуют отбору точек, лежащих выше условного среднего у_нс, затем их абсциссы усредняются (х_с). Для функции, лежащей на графике ниже у_с условие отбора точек меняется на у_н Џ у_нс (в правом нижнем квадранте графика). Заметим, что такого рода нормировка производится с целью как ускорения сходимости рядов Эрмита, так и для упрощения вида формул в том случае, если ЭМ состоит из первых членов ряда (хотя бы для некоторых К). В том случае, если для них х равен условному х_с, расположенному в знаменателе формулы для х_н, то х_н =

, и у_н имеет максимальное значение; соответственно, для графика, лежащего ниже абсциссы, у будет минимальным. Формулы нормировки для левых квадрантов графика будут аналогичны, лишь ? заменяется на ? (ордината будет проходить через ?.

-- Задать Н_n = 0, 1, 2, ....

-- Задать упорядоченный набор К₁, К₂, К₃, ... и выбрать очередную К.

-- Вычислить эрмитову функции h_n для очередной импликации К, включающей r переменных:

, где r - ранг К.

-- Вычислить C_n = h_ny_н / h_n² для каждой заданной К.

-- Вычислить y_рк = C_nh_n, где у_рк - расчетное у, т. е. функция от правой части формулы, для заданного К.

-- Определить максимальное V, упорядочить V по убыванию, пометить половину К, для которых V меньше максимального V.

-- Вернуться к п. 7. После исчерпания списка К

-- рассчитать модель и итоговый V для помеченных К:

-- C_n = ?h_ny_н / ?h_n², где суммирование ведется по этим К (см. п.9).

-- Вычислить y_р = ?C_nh_n (см. п.10).

-- Если итоговый критерий Фишера по этой модели больше или равен заданному уровню значимости, то записать эту модель, иначе переход к п.6. Дальнейшая аппроксимация производится аналогично, но лишь по тем К, где g не выполняется. Во всех случаях этот расчет в итоге производится по всем ранее вычисленным отдельным слагаемым.

-- Если итоговый критерий Фишера больше или равен заданному уровню значимости, то записать эту модель, иначе если после двух очередных вычислений с увеличением n критерий уменьшается, то записать модель для максимального значения критерия.

4. Интерпретация АМКЛ как рекурсивного процесса. Наиболее простая рекурсия для аналитической модели по п.3 - это наращивание числа членов ряда функций Эрмита, наибольшее сглаживание задается первыми членами ряда, последующие отображают более "острые" пики функции. Сжатие исходной информации в виде "аналитической" АМКЛ, т.е. в виде соответствующих эрмитовых моделей, последовательно задаваемых с требуемой степенью их приближения, аналогично так называемому wavelet analysis, используемому для этих же целей.

Другие виды рекурсии обуславливаются в основном различными практическими потребностями. Так, итоговая целевая функция Z может быть задана в начале исследования в булевой форме Z = (0,1), затем в форме k-значной логики Z = (0,1,2) и т.д. Однако на практике, когда возможна обратная связь с объектом, более эффективен другой способ рекурсии - способ усиления локальной разрешающей способности. Задается Z = (0,1), из полученной модели выбирается K_i, наиболее информационно значимая, например, при максимальной Г. Если х для нее является управляющим (или несколько x_i), то функционирование объекта переводится в область определения (?_i, ?_i) и набирают новый массив входных данных X, включающие эти новые области определения, затем рассчитывается новая модель и т.д. В том же случае, если x_i не является управляющими, то набирается также новый массив X, включающий в себя лишь требуемые (?_i, ?_i). Однако, поскольку этот процесс будет практически случайным, набор нового X потребует дополнительного времени и затрат - значительную часть состояний объекта, которые не включают требуемые (?_i, ?_i) будет отбрасываться и не включаться в X. Пределом таких видов рекурсии является точность измерения x_i, которая начинает совпадать с (?_i, ?_i).

5. Визуализация АМКЛ. Здесь кратко отметим лишь те аспекты отображения логических моделей на плоскости, которые не касаются использования для этих целей аналитических моделей. Наиболее простая модель для таких отображений, удобных для наглядной интерпретации (для вещественных чисел) - это набор таких состояний К_i исследуемого объекта, которые с некоторым разбросом укладываются около некоторой линейной функции. Пусть для простоты такой модели прямая и обратная К имеют наибольшие оценки и зависят лишь от одной и той же переменной. Пусть также начало координат, расположенное в центре экрана, соответствует левой границе для прямой К и все значения У положительны - состояния (точки) для К расположены в правом верхнем квадранте. Соответственно, для обратной К ее значения пусть будут лежать в левом нижнем квадранте.

Для более компактного заполнения поля зрения будем также выбирать очередную пару импликаций из их упорядоченных списков и выберем их начало координат таким образом (посредством простого линейного преобразования), чтобы они располагались в левом верхнем и правом нижнем квадрантах, соответственно. Зададим размеры элемента (ячейки) изображения, которые будут обратно пропорциональны оценкам для К, и минимальную оптическую плотность D окраски таких ячеек. После отображения соответствующих точек (ячеек) постараемся сформировать некоторый удобный для обзора и привычный зрительный образ (подобный, например, летнему пейзажу с озером) изображенному в виде перекрывающихся мазков-ячеек (как бы в манере Сезана). Различия между прямыми и обратными моделями здесь интерпретировались бы как различия отдельных частей этого пейзажа (в соответствующих квадрантах).

Пусть, прежде всего, выполняется принцип непрерывности границы из ячеек, определяющей "глубину" планов изображения. Все ячейки нижних квадрантов в случае разрывов соединяются ячейками с минимальной D по кратчайшей горизонтальной линии (в том числе и с боковыми краями экрана), низ экрана вплоть до этих (нижних) ячеек пусть соответствует переднему плану и закрашивается, например, желтым цветом с наибольшим D. Все множество нижних ячеек пусть закрашивается ярко-зеленой, пересекающиеся части ячеек имеют, соответственно, увеличенную D. Далее изображение над этими ячейками до оси абсцисс закрашивается синим, его плотность должна быть меньше плотности желтого на первом плане. Аналогичные операции проводятся и с ячейками в верхних квадрантах. Изображение от оси абсцисс до верхних ячеек окрашивается зеленой с D, меньшей, чем у синего, сами ячейки закрашиваются также этим цветом, но с гораздо меньшей плотностью, здесь также соблюдается правило усиления плотности цвета при пересечении ячеек. Наконец, верхняя часть экрана над этими ячейками окрашивается голубым цветом с минимальной D.

В общем случае, когда ранг импликаций больше 1, требуемые квадранты делятся по вертикали на число частей, соответствующих этому рангу, локализация основных цветов закраски остается прежней, однако, чем выше изображение, тем исходная D должна быть меньше, соответственно уменьшается размер ячеек, т. е. увеличивается детализация изображения. Булевым или k-значным значениям переменных должны соответствовать полосы заранее определенной ширины, проходящие через наперед заданные ординаты.

Смысл этих преобразований логических моделей (отдельных выводов) в зрительный образ (помимо указанных выше соображений) - это более быстрое в этом случае "схватывание" сознанием сложных различий в форме и цвете между целевой и не целевой импликациями (выводами), по сравнению с длительным анализом их формул. Конечно, эти различия желательно в дальнейшем интерпретировать в их содержательном виде. По-видимому, визуализация АМКЛ будет полезной при оперативном исследовании логических моделей, для использования современных средств распознавания зрительных образов и связанного с ними оперативного ручного управления объектами (наподобие корректирования их траектории). Эта визуализация будет удобна также для демонстрации или оперативного зрительного слежения за процессом динамики обучения, точнее, за степенью различия "контраста" между целевыми и не целевыми импликациями и для выявления удобного момента остановки обучения.

6. О связи АМКЛ с некоторыми теориями. Отметим здесь лишь некоторые общие теории (конечно, помимо алгебры), в которых более или менее явно отображается логическая (точнее, индуктивная в смысле АМКЛ) сторона творческого сознания.

6.1. Это прежде всего топология, соответствующие конструктивные операции ранее были приведены в описании алгоритма. Они определяют вводимое используемыми моделями топологическое пространство (Х, Т), где Х - точки (они задаются исходным массивом данных) и Т ("топология") - пересечения К конечного числа вычисляемых открытых интервалов, где К образуют импликации вида "если наблюдается К, то цель выполняется" для каждого состояния объекта. Далее определяется операция объединения этих К и их некоторого сокращения, т. е. строится итоговая АМКЛ. Принятие топологии как модели (т.е. как нашего приблизительного ожидаемого образца поведения исследуемого объекта) ведет к важным следствиям. Мы ожидаем наличия у объекта в некотором конструктивном, обнаруживаемом в процессе исследования, смысле непрерывности, гомеоморфизма, отделимости, компактности, связности, возможности введения метрики. Так, с этой точки зрения, например, можно ожидать, что каждая из точек Х, включенных в Т, имеет свою окрестность (это "пустые" места между известными значениями Х). Отсутствие же этих свойств, например, отделимости будет для нас сигналом к пересмотру исходных данных и, возможно, к введению новых датчиков, регистрирующих новые Х.

6.2. Далее, рассматривая более детально наборы К, можно сказать, что сам алгоритм построения АМКЛ как бы производит отбор различных геометрий, необходимых для более точного или более удобного для интерпретации отображения исследуемого сложного объекта. Так, различные К могут иметь разные ранги (размерности пространства). Более того, К, которые состоят из одних и тех же переменных, но интервалы которых имеют различные значения, удобнее представлять каждую в своей системе координат - представление всей модели в виде обобщенной функции дает для ее отдельных фрагментов более точную аппроксимацию, чем аппроксимация сложного объединения точек двух или более сходных К. Наконец, генерация алгоритмом определенного набора К соответствует отбору также определенного вида геометрии Римана (см. выше п. 3).

6.3. Из физических теорий, прежде всего, отметим квантовую теорию, точнее, ее основные исходные положения. Каждое открытое пространство К (вывод, как класс эквивалентности некоторых отдельных импликаций для каждого состояния объекта) в АМКЛ в определенном конструктивном смысле может быть гомеоморфен некоторой информационной "частице", r-мерному кубику, конъюнкции К ранга r используемого нами языка, и в частности, творческого сознания. Эта конкретная К может быть или не быть (ее "корпускулярные" свойства), она также может быть отображена в виде определенного "пакета волн", имеющих информационный характер, например, в виде ортонормированного ряда эрмитовых функций (см. п. 4.3), а для периодических процессов, может быть и в виде ряда Фурье ("волновые" свойства К). В этой модели неразличимы "частицы" одного сорта - те частные выводы, которые соответствуют отдельным состояниям объекта (это многомерные "точки", "кванты", для каждого К их число равно |Г|). Здесь выполняется и "соотношение неопределенности": при наперед заданном числе наблюдений m (при возможности проведения эксперимента) желание увеличить оценки для уже известного К путем повторения именно его реализации, увеличивает лишь его оценки. Однако эти действия приводят к уменьшению оценок для иных К: обострение "внимания" лишь на определенные ситуации вызывает ухудшение восприятия иных ситуаций (при ограничении на информационные ресурсы). Если отобразить АМКЛ в виде сферы Римана, где каждому К соответствует "всплеск" или "впадина" целевой функции, то последовательная реализация К соответствует перемещению по поверхности этой сферы, или для наблюдателя, фиксированного к каждой реализации нового К - к некоторому сложному вращению, "спину" этой сферы. В свою очередь при такой фиксации внимания наблюдателя относительно каждой вершины r-мерного "кубика" К происходит некоторое "вращение" и этой "частицы" (в исходном n-мерном пространстве) в порядке записи х_j в К: первые из них выявляются при сравнении целевой строки с ближайшей своей окрестностью не целевых строк и более ценны при интерпретации К, последние - при сравнении с отдаленной окрестностью.

Рассмотрим теперь более детально возможности введения квантового формализма при построении АМКЛ при некотором гипотетическом (или далеком будущем) исследовании квантового процесса изменения, например, конформных состояний КС молекул белка тубулина в нейронах коры головного мозга у исследователя, каким-то образом делающим выводы из накопленных данных. Поскольку теперь заведомо придется иметь дело с квантовыми процессами, перейдем к отображению объекта в комплексной области чисел. Пусть вся исходная информация в динамике (в том числе и целевая) записывается в виде мнимых чисел как ix или iy. Отобразим далее (см. также п. 4.3) АМКЛ в виде обобщенной функции iУ, в частности, в виде набора (распределения) комплексных рядов функций Эрмита. Переход в комплексную область здесь явно виден, если рассматривать аппроксимацию отдельных K, т.е. некоторых многообразий, ограниченных точками из (?_j, ?_j), рядом функций Эрмита (по системе полиномов

, и т.д.), где

, [15, 43]). Так, при ранге 1 конъюнкции К нечетные члены ряда будут мнимыми, а четные - действительными. При ранге > 1 возникает подобная ситуация чередования мнимых и действительных членов. После суммирования ряда функций Эрмита возникает комплексное число для каждого состояния объекта. Если же в итоге мы желаем рассматривать iУ как вещественную функцию, то следует разделить левую и правую части модели на i. В данном гипотетическом эксперименте мы получаем модель, которая отображает некоторую динамику квантовых конформных изменений, соответствующих последовательности "осознания" некоторого множества выводов.

Заведомо известно, что реальное исследование сознания не может быть ограничено только классическими квантовыми эффектами (согласно существующей в настоящее время квантовой теории [49]). Метод АМКЛ в итоге реализует эту возможность исследования, как микро, так и макрообъектов. Так, можно принять, что в "квантовом" смысле суперпозиция состояний исследуемого объекта - это и есть его эрмитова модель (ЭМ) в виде сложного вида кривой в комплексном пространстве. Точки, по которым производилось аппроксимирование, здесь являются "реальными" альтернативами существующего динамического объекта. Бесчисленное количество других точек, лежащих на этой кривой между наблюдаемыми точками (состояниями), являются как бы "суперпозициями" некоторых "альтернативных" состояний, которые, возможно, еще могут быть реализованы в будущем. "Увеличению" таких альтернатив до классического уровня здесь может соответствовать существование исходных К, по которым, собственно, и производилось вычисление ЭМ.

Если под "частицами" подразумевать динамику изменений iх, то в К существует их взаимодействие (корреляция) - при изменении одной из iх изменяются и другие в соответствующей К - ЭМ (как и квантовая теория) не локальна, в то же время ЭМ не линейна по отношению к Х.

Квантовый формализм позволяет частично интерпретировать некоторые операции при вычислении АМКЛ также и для классических объектов. Так, сравнения по алгоритму АМКЛ векторов состояний приводят к их редукции, что в терминах квантовой теории соответствует "коллапсу" некоторой исходной весьма сложной квантово-волновой функции классического объекта. В итоге (при данном подходе) можно сказать, что АМКЛ есть конструктивная, уже реализованная в виде формул интерпретация волновой функции исследуемого объекта в терминах интуиционистского исчисления предикатов и ЭМ (и далее - в терминах содержательных теорий). Этот используемый логический оператор по своей сути разрывен (по сравнению с полностью детерминированной и непрерывной волновой функцией в ее классическом понимании, см. также [49]). Еще раз напомним, что вероятностное описание всех непересекающихся классов эквивалентности К состояний объекта можно при необходимости получить следующим простым способом. Нужно пересекающиеся и оставшиеся части К обозначить как новые К с новыми индексами; затем следует нормировать новые оценки (путем деления на общее число состояний) и записать их в виде чисел, которые в сумме бы давали 1.

В используемом алгоритме, возможно, даже есть некоторый аналог эффекта Эйнштейна - Подольского - Розена. Выбор первого интервала определенной переменной путем сравнения его со значениями этой же переменной из ближайшей не целевой окрестности, является отдаленной, нелокальной причиной того, что по мере дальнейшего и, возможно, длительного функционирования алгоритма вполне определенный последний элемент из другой переменной, выбираемый при сравнении, например, с максимально удаленной во времени и пространстве ("нелокальной") окрестностью, войдет в К, т. е. образует единую непротиворечивую формулу, где эти, по крайней мере, два элемента связаны ("коррелированы") между собой. Информация о выборе на ближайшей окрестности здесь в итоге передается на большое расстояние и время, например, относительно функционирования изменений квантованных конформных состояний тубулина.

Поскольку АМКЛ в значительной мере отображают творческое сознание, их интерпретации в общем смысле квантовой теории весьма знаменательна: возможно, сама квантовая теория частично создавалась на основе весьма глубоких гипотез и догадок, имеющих в свою очередь своим основанием свойства глубинных механизмов сознания исследователей.

6.4. Сам процесс сопоставления каждого целевого состояния вначале с его ближайшей, а затем все расширяющейся окрестности не целевых состояний можно интерпретировать также как фильтрацию самых разнообразных (в том числе и тепловых) шумов, которые препятствуют получению непротиворечивых формул К при использовании больших массивов информации. Удачная физическая модель похожего процесса - это диффузия проявителя в глубину фотослоя: восстановление ионов серебра до металлического серебра вначале на тех кристаллических дефектах AgBr, которые возникли под влиянием фотонов, а затем, вследствие каталитического влияния мелких частиц Ag, и в ближайших областях кристаллов AgBr. При отсутствии такого упорядоченного каталитического процесса "сцепленности" частиц серебра, например, при повышенной температуре, не было бы достигнуто требуемое качество изображения (возникновение "вуали"). Роль времени здесь также велика: фотослой должен быть достаточно тонким, иначе при увеличении времени проявления продукты распада проявителя также вызвали бы помехи.

Поскольку АМКЛ частично формализует творческое сознание, можно сказать в итоге, что и квантовая теория (точнее, ее основные постулаты, как это было показано выше) также является существенной частью теории творческого сознания. Высказывание Эйнштейна при споре со сторонниками квантовой теории, что "Бог не играет в кости", можно при таком подходе решить почти полностью в его пользу ("если и играет, то с помощью субъекта - процесса творческого сознания", т. е. следует подчеркнуть его интерпретирующую, вероятностную и, часто, "интуитивную" роль).

6.5. Творческое сознание (и особенно его формализованный аналог АМКЛ) частично отображается также теорией калибровочных полей [18], обобщающей общую теорию относительности (требование локальной инвариантности теории) и являющейся в общих чертах аспектом геометрии. Здесь реализуется глубокая физическая и философская идея Эйнштейна о том, что геометрия пространства-времени сама по себе не существует, ибо она определяется взаимодействием физических тел. Иными словами, утверждается, что каждый вид взаимодействия создает свою геометрию, в нашем случае - это взаимодействие целевого и не целевого состояний ("строк", "квантов") исследуемого объекта. Утверждается существенно локальный характер (от точки к точке n-мерного пространства исследования) всех внутренних свойств симметрии этих состояний. В исследование вводится новый физический объект - калибровочное поле - особого рода геометрия "пространства творческого сознания", которая возникает при взаимодействии этих состояний (см. п. 4.3., где как пример рассматривается роль стереохимических препятствий при колебании отдельных групп в молекулах тубулина). Взаимодействие с этим определенного рода калибровочным полем в итоге обеспечивает инвариантность получаемых выводов относительно каждой заданной группы симметрии - в данном случае относительно каждой заданной целевой строки (см. алгоритм). Инвариантность будем здесь интерпретировать как независимость получаемых выводов от изменения множества других медленно изменяющихся и часто нерегистрируемых переменных.

При обычном планировании экспериментов эта идея получения "правильных" выводов находит свое отображение в подборе специальным образом организованных "контрольных" экспериментов. При обработке же результатов наблюдений с помощью логических методов приходится специальным образом организовывать сопоставление целевых и не целевых состояний объекта. Каждое целевое состояние сравнивается с упорядоченной последовательностью не целевых, начиная с ближайших в каком-либо смысле. Например, задается своя локальная норма времени отсчета от каждого целевого состояния до не целевого (т.е. независимо - вперед или назад по отношению к реальному времени реализации) и все не целевые состояния далее упорядочиваются по возрастанию этого локального времени и сравниваются в этом же порядке с определенным целевым состоянием. Некоторое приближение к независимости получаемых здесь выводов от медленно изменяющихся или вообще нерегистрируемых переменных здесь очевидно: уже первое сравнение с наиболее близким "контролем" задает список возможных существенных переменных, который в дальнейшем может лишь сокращаться (подробнее см. алгоритм).

Используемый здесь принцип локальной калибровочной инвариантности приводит в итоге к построению некоторого расслоенного пространства - вместо сложного n-мерного исходного пространства мы получаем набор более простых пространств К (т.е. АМКЛ). Можно представить, что вся модель в целом соответствует поверхности некоторой сложного вида сферы (некоторому риманову пространству). Тогда каждому локально полученному выводу К будет соответствовать маленький квадратик, касательный к поверхности этой сферы (евклидово пространство), на котором реализуется частичная модель К, угол же между этими квадратиками будет соответствовать коэффициенту их связности или при стандартной физической интерпретации - их гравитационному (калибровочному) полю. Переход от одного вывода К к другому здесь, возможно, соответствует изменению "кривизны" пространства конформных состояний некоторых функциональных групп в молекулах тубулина в нейронах, т. е. переходу от одного состояния к другому (включая и иные группы). В переводе на язык теории относительности этот процесс соответствует какому-то локальному изменению гравитации.

6.6. Отмеченная ранее при обсуждении основных положений квантовой теории формальное сходство каждого вывода К с некоторой "частицей" также имеет свое отображение в квантовой теории калибровочных полей [18] - это частицеподобные решения соответствующих уравнений калибровочных полей (солитоны, вихри). Можно надеяться, что в будущем эти модели помогут нам уяснить механизм некоторых так называемых особых состояний сознания [19].

6.7. Существуют некоторые общие полезные аналогии между алгоритмом построения АМКЛ и "правильной" квантовой теорией гравитации (ПКТГ) [49]. Если для наглядности в качестве Х ввести в рассмотрение фазовое пространство, то сам механизм выделения единственного элемента (и, затем, его исчезновения - "сингулярности", "черной дыры", "одногравитонного уровня") на определенной стадии алгоритма соответствует слиянию линий тока. Это слияние соответствует потере в таком аналоге "черной дыры" информации о значениях всех других переменных в исследуемом целевом состоянии. Напомним, что по алгоритму эта информация все же сохраняется, но уже в виде "контекста". Его значение всегда относится к прошлому, к уже использованному для вычисления модели массиву Х. Еще отметим увеличение энтропии при этом процессе. Никаким образом, идя обратно по времени процедуры поиска этого единственного элемента, нельзя восстановить исходное целевое состояние (по всем переменным); вся информация стирается, кроме этого элемента. Другими словами, процедура этого поиска не является симметричной в этом времени (по модулю времени удаления от целевого состояния в окрестности не целевых состояний). Все эти операции как бы выявляют наличие в исследуемом пространстве окрестности некоторой неоднородности его "гравитационного поля". После вычисления итоговой модели она обычно используется для управления, прогнозирования, интерпретации, т. е. используется в условиях нового контекста - эта стадия соответствует расщеплению линий тока в фазовом пространстве. Вообще, согласно ПКТГ, будущее детерминировано, но не вычислимо даже в теоретическом плане из-за временных ограничений на процесс вычисления.

Всеми этими соображениями мы ограничимся здесь, указывая еще на причастность к творческому сознанию, конечно, теории управления и как важного ее старого раздела в физиологии, посвященного исследованию элементов сознания, - теории условных рефлексов И. П. Павлова.

7. О построении контекстно-развивающейся базы данных для дальнейшего развития логической интеллектуальной системы. Интеллектуальная система (ИС, [21]) является в своей основе моделью интуиционистского исчисления предикатов, отображающего индуктивную часть мышления - формулирование сравнительно небольшого набора кратких выводов из массивов информации большой размерности. Особенность ИС состоит в ее приспособленности к исследованию динамики сложных объектов, зависящих и от так называемых скрытых переменных. Система выявляет также контекст выводов, что позволяет уточнять их смысл, формирует пары прямых и "обратных" выводов с их контекстами, сопоставление которых стимулирует интуицию пользователя при интерпретации полученных выводов или при разработке новой теории. С общей точки зрения эту систему можно рассматривать как своеобразного "переводчика", согласующего информационные каналы сложного объекта и исследующего субъекта. Таким субъектом может быть также и некоторая достаточно мощная ИС и/или вся "история" взаимоотношений исследующего субъекта (в предельном случае - общества в целом) как с внешним, так и со своим внутренним развивающимся миром.

Основная цель вычисления АМКЛ состоит в том, чтобы получить по возможности наиболее краткие (и "понятные") суждения, отображающие способы достижения цели Y. Эти суждения можно рассматривать как своего рода ключевые фразы, которые помогают распознавать в априорных (литературных) данных сходные способы достижения Y или, возможно, подходящие теории. Для автоматизации всего интеллектуального процесса с помощью ИС для понимания (интерпретации) полученных выводов здесь требуется связь АМКЛ с соответствующими информационно-поисковыми системами или просто с новыми данными (библиотечными, служебными, лабораторными, Internet и т.п.). После такой интерпретации часто выясняется, что, например, соответствующая теория содержит некоторые дополнительные переменные, которых не было в К. Эти переменные, если они входили в Х ("контекст К"), также легко вычисляются в АМКЛ - им соответствует интервал значений Х, которые входят в "покрытие" Г - в список именно тех состояний объекта, которым соответствует К. Контекст увеличивает ранг r для К - число интервалов соответствующих переменных Х, соединенных логической связкой "и"; истинность формулы К (импликации, полученной из одной целевой строки) при этом сохраняется.

7.1. Построение контекстно-развивающейся базы данных. Из предыдущего изложения принципов функционирования ИС ясно, что понимание сложного объекта тесно связана с тем языком или базой данных, которую мы используем. Достаточная мощность языка, хотя бы его словарный запас (число переменных), и его выразительность (пусть это будет компактность, точнее не избыточность цепочек его слов К) без сомнения способствовали бы лучшему описанию и, соответственно, пониманию сложных объектов. Вся семантическая проблема состоит в том, как этого достичь наиболее экономным образом.

Известна общая концепция в конструктивной математике [20] относительно некоторой иерархии алгорифмов, определяющих в итоге способы понимания сложных суждений. Здесь под алгорифмом будем понимать последовательность некоторых операций над сложными суждениями, в результате которых они становятся более простыми (более "ясными") в семантическом, т.е. содержательном смысле. Основное условие "ясности" (понимания) заключается в том, чтобы алгорифм строил бы, в частности, по любому состоянию объекта Х(t) в момент времени t суждение К такое, что оно было бы мажорантой по отношению к Х(t). Под мажорантой будем понимать такую формулу (или вообще - суждения, теорию), которая соответствует в нашем случае (или хотя бы потенциально - не противоречит) большему числу состояний объекта Х, чем |Г| для К (т.е. большему, чем число состояний-строк из Х, истинных для К). Действительно, если взять для наглядности даже одну какую-либо переменную входящую в виде открытого интервала в К, то можно сказать, что исходным состояниям соответствовало реально лишь |Г| точек, в то время как формуле К соответствует число точек, сплошь покрывающих этот интервал, и это число зависит лишь от точности прибора, регистрирующего данный х. Вычисление именно открытых интервалов (вплоть до точек, соответствующих не целевым состояниям) специально введено в алгоритм построения АМКЛ, чтобы осуществить хотя бы потенциально "выход" за пределы конкретных наблюдений. Отметим еще здесь, что увеличение сложности объекта ведет к увеличению ранга r для К, что уменьшает число степеней свободы для таких объектов. Здесь весьма желательно вычислять именно открытые интервалы, чтобы получать мажоранту в виде К - обобщенного, выходящего за пределы конкретных исходных данных вывода для |Г| состояний.

Приведем еще другой, более общий пример мажоранты, относящийся к библиотечному информационному поиску. Здесь, например, каталожные карточки являются аналогом отдельных выводов К, а книги, найденные по этим карточкам соответствуют их информационным расширениям, т. е. мажорантам. Если эти книги последовательно, например, уточняют К, то можно сказать, что некоторой иерархии алгоритмов, реализуемых с помощью АМКЛ (и продуцирующих К), соответствует иерархия способов приблизительного разъяснения (понимания) суждений К.

Следующая ступень иерархии этого алгорифма "понимания" объекта заключается в вычислении не только целевых моделей, но и не целевых (сравнение каждого такого состояния будет происходить по ближайшей окрестности всех целевых состояний). Однако эти модели уже выводят нас за рамки конструктивного направления - мы вычисляем лишь область, в которую попадать не следует. Скорее модели этого вида представляют собою лишь некоторые "наводящие соображения" [28], они могут быть полезными, например, при управлении объектом, когда целевые области К соответствуют некоторому стационарному управлению, а не целевые К определяют области, из которых следует выйти с помощью соответствующего управления объектом. В случае же сложных объектов, когда управление практически невозможно и оценки |Г| малы, т.е. когда Х близок к генератору случайных чисел и велика "энтропия" К (число дизъюнкций в АМКЛ), использование отрицания обратных моделей позволяет отобрать малое число более "надежных" прямых К в том смысле, что и при дальнейшей работе с новыми данными будет чаще наблюдаться отделимость пространства прямых и обратных моделей. В целом можно сказать, что эта ступень состоит в обязательном построении обратных моделей, что приводит как бы к увеличению контрастности или "раскачиванию" объекта на две взаимно дополняющиеся модели.

Дальнейшая ступень улучшения этого "понимания" исследуемого объекта при сохранении старого списка переменных (при сохранении прежнего языка "диалога" с объектом) состоит в активном использовании априорных данных (т.е. новой базы данных) для распознавания в полученных моделях отдельных содержательных теорий или их фрагментов, или уже известных фактов и отображения их в терминах прежнего списка переменных. Во всех случаях при отсутствии в К каких-либо переменных, которые входят в опознанные теории, значения этих переменных (точнее, их замкнутые интервалы) вычисляются из контекста К, как это было пояснено выше.

Следующая ступень этой иерархии прямо вытекает из предыдущей - новая опознанная теория предполагает наличие переменных, которые не отображены в прежнем их списке. Здесь осуществляется переход к более мощному и выразительному языку в том смысле, что на его основе уже была компактно сформулирована некоторая теория, отображающая сложный объект. В связи с этим важным переходом отметим здесь как полезный аналог теорему Гёделя о неполноте формализованной арифметики как теории, в рамках терминов которой невозможно доказать выводимость (или опровергнуть) некоторые К, которые можно каким-то иным образом предложить вне рамок этой теории. Этот переход возможно здесь осуществить, используя более мощный язык и его выразительные свойства, т.е. используя регистрацию (если это возможно) совершенно новых переменных, соответствующих этой новой опознанной теории. Каждая К может соответствовать новой теории (или совместно с иными К). Например, формулы с большими |Г| могут выявлять основную теорию, которая затем уточняется с помощью остальных К, хороший пример такого рода интерпретации объекта можно найти в [6].

Наконец, при отсутствии подходящих теорий или установленных априорных фактов, которые можно было бы привлечь для объяснения вычисленных моделей, иногда используется любое допустимое в данной конкретной ситуации расширение языка "общения" со сложным объектом, например, использование новых датчиков, сбор иных дополнительных сведений и т.п. Эти действия в данном случае в какой-то мере сходны со случайным поиском более оптимального управления в окрестностях уже существующего режима функционирования объекта. Естественно, в редких случаях отсутствия подходящей интерпретации после дополнительных проверок исследователь может выдвинуть и некоторую совершенно новую гипотезу, касающуюся природы объекта.

7.2. Построение более совершенной базы данных как улучшение согласования информационных потоков между объектом и исследователем. Построение любой модели (прежде всего АМКЛ) уже есть не что иное, как некоторое ограничение мощных информационных потоков сложного объекта и переложение их в виде, удобном для интерпретации, т.е. для понимания основных особенностей объекта в терминах, доступных исследователю. Переход к последовательному ряду более совершенных баз данных, генерируемых по ходу все уточняющихся исследований, можно сравнить с постепенным обучением исследователя "языку" объекта, на котором он ведет "диалог" с исследователем. Лишь в конце этого обучения, определяемого практическими соображениями, можно ожидать достаточно понятного по нашим меркам сообщения от объекта в виде модели его функционирования. Ограничим здесь обсуждение этих взаимоотношений объекта и экспериментатора (или чаще, наблюдателя, вопросы которого к объекту обычно имеют ограниченный характер) одной простой геометрической моделью [1, c. 86]. Эта модель наглядно показывает в общих чертах, особенно в случае вычисления АМКЛ, как аналитическую часть работы исследователя, так и его конструктивные усилия по построению гипотез, а затем итоговых непротиворечивых моделей и их реализаций в своей практической деятельности.

Пусть (лишь в данном примере)
- упорядоченные на числовой прямой элементы х (значения определенной переменной на целевых строках) и у (значения на не целевых строках), взятых из исходной базы (массива) данных Х и соответствующих какому-либо столбцу из Х. Каждому такому элементу сопоставим множество [x] = {y

- острый конус, порожденный х. Согласно алгоритму построения АМКЛ [15, 27], здесь задается какая-либо целевая строка (состояние объекта) из Х и, в частности, значение определенной переменной х в этой строке. Оно сравнивается со всем множеством соответствующих значений у этой же переменной, взятых из не целевых строк, упорядоченных, например, в зависимости от удаления от заданной целевой строки. При этих сравнениях запоминается лишь открытый интервал, наиболее близких к х (соответственно, правило построения острого конуса надо задать и для у ( х). В частности, при больших базах данных обычно в итоге этих сравнений [x] = 0, что оправдывает название "острого конуса".

Напомним, что эти сравнения проводятся в векторном смысле - для всех переменных. Будем теперь последовательно один за другим записывать элементы множества [х] в виде строк (одна под другой), появляющихся после каждого такого сравнения с очередной упорядоченной не целевой строкой, будем также центрировать эти записи около их средних элементов. Касательные, проведенные по крайним элементам [x] (и по исходной целевой строке сверху), будут образовывать конус, направленный вершиной (острием) вниз. Исчезновение ("захлопывание") последнего открытого интервала является сигналом для его запоминания: происходит своего рода фильтрация с помощью этого конуса-воронки, выявление информационного "окна", т.е. интервала существенных целевых значений х. Обычно одного такого окна недостаточно для получения всегда истинной формулы К, далее определяется подобным образом интервал существенных значений для другой переменной и т.д. до получения истинности К. При их поиске каждый раз множества [x] (да и целевая строка) становятся все более редкими: последовательно генерируемые конусы становятся все "острее" и результатам вычислений здесь соответствует конъюнкция К выявляемых интервалов.

Аналогичным образом производятся вычисления по всем целевым строкам и далее определяется наиболее компактная форма (АМКЛ) - придерживаясь вышеприведенной терминологии, дизъюнкция множества "маленьких" информационных окон К заменяется небольшим количеством больших. С нейрофизиологической точки зрения этой модели, возможно, соответствует (при генерировании К) постепенное уменьшение числа колеблющихся конформных связей отдельных димеров молекул тубулина, образующих "микротрубочки" в ультрамикроструктурах нейронов мозга. Итоговой К, при данном подходе, соответствуют колебания ограниченного числа конформных связей, соответствующих рангу r для К; так, интервалы входящих переменных задают амплитуду этих колебаний, имеющих r степеней свободы [19].

Отметим еще, что вычисляемые семейства острых конусов задают порядковую топологию на М, которая лежит в основе теории построения АМКЛ [1, 15, 27]. Эта топология, в частности, определяет инвариантность формул получаемых моделей при медленном (эволюционном) изменении несущественных (возможно и нерегистрируемых) переменных, что весьма важно при исследовании сложных объектов. Обращаясь вновь к вопросам рационального построения базы данных, можно сказать, что подобного рода модели сами организуют в этом смысле и свою базу данных (для дальнейших исследований). При этом выявляются не только существенные переменные, что облегчает создание базы данных, но и задаются интервалы изменений требуемых переменных, что также облегчает, например, создание некоторых датчиков и задает требования к их точности.

Вышеприведенная геометрическая модель в виде конуса, направленного вершиной вниз отображает в основном аналитическую и системную деятельность исследователя (или "сознание" ИС). Далее, возможно, начиная с процесса усложнения гипотез, т.е. построения конъюнкции К, а затем и их множеств по всем целевым строкам, входящим в базу данных, затем их сокращения до компактного набора, следует разработка множества конструктивных все уточняющихся во времени правил для достижения поставленной цели обычно в условиях больших помех. Приведенная выше иерархия алгорифмов понимания суждений в конструктивной математике [28], т.е. постепенно расширяющееся множество способов использования в конечном итоге обновляющейся базы данных, соответствует здесь в информационном смысле также простой геометрической модели - конусу конструктивных операций со все расширяющимся основанием. Если на этапе построения модели наибольшее значение имела аналитическая и системная деятельность ИС, то для последней стадии наибольшее значение имеет синтез: в новых условиях обновляемой базы данных и по новым моделям получать реальные возможности управления сложным объектом. Можно сказать, что в этом случае с психологической точки зрения разрабатываемая ИС начинает приобретать "волевые" качества.

7.3. АМКЛ как интеллектуальная система анализа данных. Отметим некоторые особенности алгоритма, связанные с активным применением метода Гёделя [16, 44] нумерации объектов используемого языка. В частности, синтаксическими объектами будут здесь названия столбцов (переменных величин), названия строк (состояний исследуемого объекта или объектов) и названия (семантика) значений дискретных переменных. Каждому такому объекту перечисленных выше типов будет однозначно ставиться в соответствие некоторое натуральное число 1, 2, 3, ... или для дискретных переменных 0, 1, 2, ..., k - 1 значений k-значной логики (метод гёделевской арифметизации используемого языка). Аналогично установленной Гёделем неполноты формализованных систем арифметики в нашем случае также следует иметь ввиду неполноту в этом смысле и языка АМКЛ - здесь можно записать, например, из литературных данных некоторые истинные суждения, которые не будут противоречить конкретному массиву данных, но эти суждения, возможно, нельзя будет вывести из заданного массива.

Другая особенность алгоритма АМКЛ заключается не только в кодировании натуральными числами входных синтаксических объектов, но и в активном построении некоторых вполне определенных натуральных чисел, которые в итоге дают конструктивное обоснование (реализуемость по Клини) получаемых выводов. Это построение границ конъюнкций открытых интервалов (соответствующих предикатам) и построение рангов для вычисляемых конъюнкций или выводов К.

Систему ("искусственный интеллект") желательно использовать или в начальной стадии исследования или в тех случаях, когда применение иных стандартных методов не позволяет получить достаточно краткие и непротиворечивые выводы, которые были бы удобны для их качественной интерпретации, например, с помощью литературных данных. Алгебраическая модель конструктивной (интуиционистской) логики (АМКЛ) при геометрической интерпретации представляет собой наборы малого числа ячеек-параллелепипедов K малой размерности, выполнению цели здесь соответствует "попаданию" внутрь K | Г | точек-состояний. Другая полезная интерпретация этих моделей -- это разложение исходной сложной системы на малое число более простых подсистем K, по отношению к которым более удобно использовать, например, традиционные методы статистического анализа.

В смысле получения выводов из накопленных данных ИС соответствует так называемому "искусственному интеллекту". С помощью ИС облегчается информационный поиск содержательных теорий, интерпретация полученных выводов, вычисление их контекста (значения интервалов переменных, не вошедших в K) и, при необходимости, аппроксимация подмножеств Г-состояний для некоторых К рядами функций Эрмита или Фурье.

При исследовании сложных систем для их моделирования с заранее заданным уровнем значимости обычно наблюдается недостаток информации - числа состояний системы. Разложение ее на более простые подсистемы K, обладающие меньшим числом степеней свободы (меньшим числом переменных) частично решает эту проблему. Во многих случаях возможно рекурсивное использование ИС: набор новых данных лишь для тех переменных, которые входят в K, что позволяет усилить "разрешающую способность" итоговых моделей. В случае невозможности получения таких дополнительных данных следует использовать интерпретационные возможности АМКЛ: поиски с помощью K ("ключевых слов") соответствующих априорных (литературных) данных или теорий. Используя их, можно, например, задать имитационный процесс, который будет генерировать новые состояния для K, итоговая модель здесь не будет противоречить и сложной системе и уже известному априорному опыту функционирования отдельных подсистем.

Известные признаки [32] интеллектуальности программы АМКЛ в основном выполняются. 1)Программа выбирает лишь "существенные" переменные (в зависимости от заданной цели) и упорядочивает окончательные выводы, включающие эти переменные, также по их существенности (по числу их встречаемости в исходном массиве). 2)Программа порождает непротиворечивые на данном массиве гипотезы - импликации К (часть которых входит в тупиковую дизъюнктивную форму), с помощью которых облегчается информационный поиск соответствующих априорных данных или теорий. 3)Программа оценивает максимальную ошибку полученных результатов путем сравнения полученной модели с результатами обработки подобного массива, отображающего "белый шум". 4)Программа отвечает на вопрос "почему" - или просто указанием на выделяемые области пространства входных переменных, или путем выбора (мажорирования) подходящих априорных фактов или теорий (для реализации последнего требуется использование информационно-поисковых систем). 5)Программа реализует формализованную эвристику для синтеза одной из познавательных процедур - индукции. 6) Программа производит процесс обучения на заданном массиве информации. 7) Адаптация программы при изменении структур данных производится пользователем путем простого введения, например, новой нумерации объектов используемого языка (см. вводную часть этого подраздела).

Вкратце еще отметим, что ввиду сравнительно большого быстродействия программа АМКЛ, по-видимому, может быть в дальнейшем после требуемого усложнения использована и для работы с текстами.

Приведем список некоторых задач в области медицины, для решения которых можно рекомендовать использование проектируемой ИС.

Отслеживание объекта (мониторинг системы) для оперативного реагирования при возникновении чрезвычайных ситуаций или катастроф; дифференциальная диагностика сходных заболеваний; выбор оптимальной стратегии и управления лечением; прогноз вариантов развития и исхода болезней; ранняя диагностика хронических заболеваний; снижение стоимости лечения, исключение ненужных медикаментов, диагностических или иных процедур; распознавание прототипов неизвестных заболеваний или синдромов, например, в области социальной психиатрии; согласование информационных каналов ИС с существующими информационно-поисковыми системами; решение задач в области доказательной медицины.

С некоторыми примерами интерпретации АМКЛ, которым трудно дать обобщенное описание, читатель может также ознакомиться в части 5 этой книги.

Ч А С Т Ь 5

ПОСТРОЕНИЕ И ИССЛЕДОВАНИЕ РАЗЛИЧНЫХ МОДЕЛЕЙ

В этой части приведем в начале некоторые химико-технологические модели, полученные по рядовым производственным данным, т.е. в условиях больших помех самого разнообразного, в том числе и социального характера. Эти модели весьма интересны по своей содержательной интерпретации, многие из них удивительным образом соответствуют уже известным теориям, что является хорошей проверкой самого метода построения АМКЛ как "искусственного интеллекта", проявляющего некоторые черты творческого сознания. Новизна некоторых выводов будет специально обсуждаться в соответствующих подразделах. Приводимые далее модели, относящиеся к медицине и физиологии, интересны скорее как образцы кратких и непротиворечивых выводов, также получаемых в условиях больших помех, однако соответствующих теорий в этом случае либо нет, либо применимость их весьма относительна. Большая часть таких выводов может быть здесь названа "правдоподобными гипотезами", которые желательно не только интерпретировать с помощью подходящих априорных данных, но и испытать их на новых массивах информации, или, что еще более желательно, в новых прямых экспериментах.

Модели, относящиеся к парапсихологии, к применению основных физических теорий в космологии и модели, относящиеся к религии, носят более дедуктивный характер. Так, исследуется, возможно ли приписать отдельным этапам алгоритма, имитирующего творческое сознание, определенные квантованные состояния некоторых белковых молекул нейронов, исследуется аналогия между теорией эволюции звездной пары с черной дырой (в том виде, как это следует из решения соответствующих уравнений гравитационного поля) и процессом вычисления АМКЛ. Другими словами, здесь представлена попытка выявления субъективного компонента в процессе применения и интерпретации результатов расчетов, в которых были использованы фундаментальные физические теории. В конце части 4 исследуется, существует ли определенная внутренняя семантическая структура древних текстов, которая могла хотя бы частично объясняться последовательностью операций, характерных для индуктивного творческого сознания.

1. Построение и исследование АМКЛ с целью управления, оптимизации или проектирования некоторых химико-технологических систем.

1.1. Выявление причин, влияющих на содержание воды в метаноле-сырце в промышленных условиях. Количество примесей и, прежде всего, воды в метаноле-сырце в значительной степени определяют экономику производства метанола. Выпишем основные реакции синтеза метанола и пробочные реакции, в результате которых образуется вода и другие побочные продукты [4, 6, 15]:

CO + 2H₂ = CH₃OH (1)

CH₃OH + nCO + 2nH₂ = C_nH_2n+1CH₂OH + nH₂O (2)

2CH₃OH = CH₃OCH₃ + H₂O (3)

nCO + (2n+1)H₂ = C_nH_2n+2 + nH₂O (4)

CH₃OH + nCO + 2(n-1)H₂ = C_nH_2n+1COOH + (n-1)H₂O (5)

nCO + 2nH₂ = (CH₂)n + nH₂O (6)

H₂ + CO₂ = CO + H₂O (7)

3H₂ + CO₂ = CH₃OH + H₂O (8)

Все реакции, кроме (7) и (8), экзотермичны. Вода в основном образуется в результате реакции (7).

В условиях нормальной промышленной эксплуатации были обследованы три реактора синтеза метанола, на вход которых поступал свежий газ с повышенным содержанием СО₂ (примерно 4,4%) и, для сравнения, три реактора, которые работали на газе с содержанием СО₂ примерно 2,7%. Все реакторы были полочного типа с цинк-хромовым катализатором. Для первой группы реакторов было зарегистрировано 48, а для второй - 61 стационарных режимов. Поскольку основная цель работы заключалась в получении качественных выводов, которые необходимы для проектирования более экономичных способов производства метанола, было решено отобразить значения переменных в виде двух классов эквивалентности - меньше или равно медиане и больше медианы. Смысл этой операции - облегчить интерпретации моделей с помощью таких операций сравнения как "больше" или "меньше" (при сопоставлении с текстами публикаций) или с помощью терминов "возрастает" или "убывает" (при сопоставлении с некоторыми формулами в публикациях).

Ниже перечислены обозначения переменных, их наименования и значения медиан (в скобках - для второй группы реакторов, прочерки означают "значения не регистрировались").

Х₁ - пробег колонны, сутки, 200, (210). Х₂ - давление, кПа10^-2, 300, (297). Температуры

: Х₃ - 1-ой полки, 320, (323), Х₄ - средняя по колонне, 363, ( - ), Х₅ - последней полки, 383, (384), Х₆ - максимальная по колонне, 384, ( - ). Состав свежего газа, % по объему: Х₇ - СО₂, 4,4, (2,7), Х₈ - СО, 24,7, (25,4),

Х₉ - Н₂, 68,2, (69,0), Х₁₀ - СН₄, 2,3, ( - ), Х₁₁ - N₂, 0,1, (1,9), X₁₂ - H₂/CO, 2,75, (2,68). Состав циркуляционного газа, % по объему: X₁₃ - CO₂, 0,8, (0,6), X₁₄ - 7,0, (7,0), X₁₅ - H₂, 72, (75), X₁₆ - CH₄, 20,0, (3,1), X₁₇ - N₂, 20,0, (12,1), X₁₈ - H₂/CO, 11, (11). Х₁₉ - объемная скорость, тыс. норм. м³/час, 25, (20). Х₂₀ - нагрузка по газу основного хода, тыс. норм. м₃/час, 85, ( - ). Х₂₁ - нагрузка по свежему газу, тыс. норм. м³/час , 12,5, ( - ). Х₂₂ - нагрузка по продувочному газу, норм.м³/час, 700, ( - ). Анализ метанола-сырца: Y₁ - эфирное число, отн. ед., - , (0,19), Y₂ - кислотное число, - , (0,017), Y₃ - альдегиды, %, - , (0,041), Y₄ - непредельные, %, - , (0,010), Y₅ - перманганатная проба, мин., - , (2,4), Y₆ - вода, 11,5, (6,4).Как обычно значения булевых переменных, меньшие или равные медиане, будем помечать чертой сверху, будем также опускать символ конъюнкции. Импликанты в моделях упорядочены по их оценкам, в начале записаны К с наибольшими оценками.

Булева модель первой группы реакторов для режимов с малым количеством примеси воды в метаноле-сырце получена в следующем виде (максимальная ошибка модели р = 0,02):

Модель второй группы реакторов, р = 0,02:

(10)

Модель второй группы реакторов с учетом анализа метанола-сырца (кроме Y₆), р = 0,03 :

(11)

Интерпретация моделей. Будем просматривать модель 9, начиная с К с наибольшими оценками (т. е. наиболее устойчивые К с точки зрения теории управления). Выводы из каждой последующей К (будем их все нумеровать по порядку) могут или уточнять уже полученные выводы, или описывать процесс с точки зрения некоторой новой теории, или такие теории могут отсутствовать.

Допустим, например, что для К₁ (для первого формального вывода) истинна теория химического равновесия. Тогда при увеличении концентрации СО (

) реакция 1 должна сдвинуться вправо, в сторону увеличения концентрации метанола. Процентное содержание примесей при этом должно быть меньше, что соответствует правой части модели (получается меньше воды в метаноле-сырце). Итак, увеличение

здесь не противоречит теории химического равновесия для реакции 1. Известно, что повышение нагрузки по свежему газу

уменьшает максимальную температуру на полках

из-за увеличения теплосъема с катализатора. Действительно, в К₁ наблюдается конъюнкция переменных

.Итак, увеличение здесь

не противоречит теории, отображающей динамику теплообмена в реакторе. Далее, понижение температуры

вызывает сдвиг реакции 1 вправо, т. к. она экзотермична. Концентрация метанола при этом возрастает, что соответствует в итоге

. Итак, это понижение температуры не противоречит теории теплового равновесия для реакции 1. Вода в основном образуется по реакции 7, и вышеприведенные теории химического и теплового равновесия соблюдаются и здесь. Реакция 7 в случае К₁ сдвигается влево, что влечет

Все эти выводы имеют качественный характер, для более детальной интерпретации следует взять систему уравнений гидродинамики, отображающую законы сохранения вещества и тепла. Эта система должна решаться совместно с термодинамическими уравнениями состояния системы, а также совместно с некоторыми другими уравнениями. Общее решение этой системы уравнений представляет здесь почти непреодолимые трудности, вследствие чего эту систему приходится упрощать тем или иным способом. АМКЛ дает возможность обоснования такого упрощения, причем важно отметить - здесь становятся заранее известными интервалы, в которые заключены значения всех существенных переменных (существенных в смысле их достаточности для разделения на заданное число классов эквивалентности). Метод построения АМКЛ здесь полезен именно в силу своей конструктивности - всегда можно вначале задать наименьшее требование к исследуемой системе, например, для различения лишь больших и малых значений у. Далее выбираются лишь те уравнения из общей системы, которые имеют своих представителей в АМКЛ, например, выбираются лишь те уравнения, которые соответствуют компонентам смеси, вошедшим в К₁, К₂ и т. д. Все эти соображения позволяют резко ограничить сложность решаемой системы уравнений.

Так, для рассматриваемого случая следовало бы написать систему уравнений гидродинамики, отображающей законы сохранения вещества по крайней мере для 10 компонентов. Теперь же для построения аналитической модели по К₁нужен лишь один компонент (СО). Большое разнообразие выводов К в АМКЛ несет в себе весьма богатую информацию, что проявляется и становится видным при сопоставлении К с уже известными теориями. При использовании достаточно эффективно работающих информационных систем поиска содержательных теорий в существующей литературе АМКЛ можно рассматривать, как некоторый "генератор правдоподобных гипотез" - они уже истинны на использованных массивах данных. Существенно отметить, что К, для которых не были найдены подходящие теории, также ценны с информационной точки зрения, возможно они содержат элементы новизны.

Рассмотрим теперь технологическую ситуацию (вывод) К₂. Будем придерживаться принципа "экономии" - вначале пробуем сохранить первую теорию, соответствующую К₁, лишь уточняя ее. Теперь во входящем свежем газе увеличивается содержание метана, что сдвигает реакцию 4 влево, в сторону уменьшения образования воды, что согласуется с К₂. Увеличение потока свежего газа как и ранее ведет к снижению температуры на выходе и к тому же подавляется образование тепла по реакции 4. Таким образом, число компонентов в системе уравнений, которую необходимо решить, возрастает до двух. На этом связь со старой теорией кончается: переменная

указывает, что старая теория должна быть принципиально усложнена, в рассмотренном до сих пор списке компонентов реакций нет азота.

Дополним ранее приведенную теорию, пусть кинетика рассматриваемого гетерогенно-каталитического процесса соответствует изотерме Лангмюра - молекулы, прежде чем вступить в реакции, должны быть сорбированы на активной поверхности катализатора. В данном случае азот при понижении его концентрации занимает уже меньшую часть активной поверхности катализатора, что в свою очередь влечет возрастание адсорбции остальных молекул, принимающих участие в химических превращениях, и прежде всего СО, который всегда присутствует в избытке. Это ведет к сдвигу основной реакции 1 в сторону образования метанола, реакция 8, соответственно, сдвигается влево и воды образуется меньше. Упрощается решение системы уравнений адсорбции: число компонентов будет равно лишь трем (при решении общей системы уравнений влияние остальных переменных будет отображено значениями рассчитываемых неизвестных констант).

Разобранные выше два вывода имеют наибольшие оценки: они покрывают примерно треть всех благоприятных режимов. Далее подобным же образом можно уточнить общую теорию при дополнительном использовании К₃ и т. д.

Останавливаясь в процессе интерпретации лишь на этих двух выводах отметим в итоге, что при работе реакторов 1 группы (содержание СО₂ в свежем газе около 4, 4%) требуется повысить расход энергии и свежего газа и очищать его от инертных газов. В этом случае содержание воды в метаноле-сырце уменьшается в среднем с 13,6% до 10,6%. Полученный итоговый простой вывод имеет в основном проектный характер. Он позволяет не только оптимизировать существующее производство, но и с помощью подходящей и достаточно простой теории рассчитывать процесс при иных, еще не наблюдавшихся значениях переменных и затем с помощью, например, экономических критериев выбрать нужный регламент производства. До сих пор подобные расчеты были затруднительны из-за сложности решения громоздкой системы уравнений или из-за плохих результатов, наблюдавшихся при недостаточно обоснованных упрощениях.

Рассмотрим теперь модель 10, отображающую работу второй группы реакторов (содержание СО₂ в свежем газе равно примерно 2,7%). Для первого вывода К₁ следует выбрать уравнение, отображающее баланс тепла, поскольку в этот вывод не входят переменные соответствующие каким-либо компонентам реакций, но указывается зависимость от давления и температур первой и последней полок реактора. При увеличении

будут сдвигаться вправо те реакции, которые протекают с сокращением исходного объема. Реакция 7, по которой в основном образуется вода, протекает без изменения объема, поэтому повышение давления на нее не должно существенно влиять. Итак, увеличение

должно приводить согласно этой теории к

, что действительно наблюдается в К₁. Аналогичным образом действует

, что соответствует ситуации разобранной при интерпретации К₁ в модели 9. Повышение температуры на последней полке здесь можно объяснить тем, что для второй группы реакторов на вход подавался свежий газ с меньшим содержанием СО₂, что приводило к меньшей роли экзотермической реакции 7.

Следующий вывод К₂ уточняет вышеприведенную теорию - уравнение баланса тепла следует дополнить уравнениями, отображающими баланс СО₂ в свежем газе и в циркуляционном газе. Уменьшение концентрации СО₂ здесь сдвигает реакции 7 и 8 влево, что приводит к уменьшению содержания воды в метаноле-сырце.

Следующий вывод К₃ опять позволяет уточнить предыдущие теории - следует ввести уравнения, в которые входит Н₂, уменьшение парциальных давлений которого приводит к снижению роли побочных реакций (судя по коэффициентам при Н₂ в записях реакций 1 - 8). Роль повышенного давления и повышенной температуры была уже уточнена теорией, соответствующей К₁. Отметим еще, что из специально организованных и дорогостоящих экспериментов известно следующее. Повышение давления в реакторе и понижение температуры на входе процесса способствуют увеличению скорости образования метанола относительно скорости образования побочных продуктов (главным образом воды). Таким образом, модель 10 позволяет получить такие же или даже более детальные выводы значительно более легким путем - по текущим данным с действующего промышленного объекта, т. е. без специальной организации экспериментов, которые здесь весьма затруднительны и опасны.

Модель 9 отображает прежде всего адсорбцию и баланс СО, возможно потому, что в данном варианте процесс проводился при больших концентрациях СО₂ в свежем газе, когда определяющим моментом является конкуренция между СО и СО₂ при их адсорбции на катализаторе. Модель 10 отображает прежде всего тепловой баланс процесса возможно потому, что эта группа реакторов работала на свежем газе, содержащем примерно в 19 раз больше азота. На этот вывод косвенно указывает К₆ - малое содержание воды в метаноле при большом содержании азота возможно лишь в том случае, если катализатор свежий и свежий газ содержит повышенный процент водорода.

Рассмотрим модель 11, она интересна тем, что в качестве входа были использованы также и технологические переменные на выходе процесса - анализ метанола сырца по 5 компонентам (кроме анализа на воду, процентное содержание которой по-прежнему являлось целевой функцией). Другими словами, исследовалась целесообразность конструирования управления процессом с помощью соответствующей обратной связи - зависимости управления также и от полного анализа получаемого продукта.

Вывод К₁ указывает на возможность такого регулирования процесса, если известна информация о концентрации непредельных соединений на выходе - при их малом содержании и одновременно при повышенном давлении и при малом содержании водорода в циркуляционном газе наблюдается уменьшение содержания воды в метаноле-сырце. Существенным фактором в этой ситуации является сдвиг основной реакции 1 вправо, для которой наблюдается наибольшее изменение объема. Реакция 6, по которой образуются непредельные соединения менее сильно зависит от изменения объема и, как следствие, в итоге доля непредельных соединений в случае К₁ будет меньше. Аналогичным образом могут быть интерпретированы и последующие К. Как весьма интересный случай отметим К₃, здесь цель может выполняться даже при большом содержании альдегидов в продукте, однако для этого потребуется повышение отношения Н₂/СО в свежем газе и лучшее удаление инертных газов из циркуляционного газа.

Процесс интерпретации К обычно продолжается вплоть до "отказа" - отсутствия соответствующих априорных сведений (теорий). Возможно, что именно первое противоречие на этом пути может быть сигналом перехода далее или от булевой формы моделей к моделям в предикатной форме, или в крайнем случае к количественным методам интерпретации - решения соответствующих систем уравнений (для этих К) с целью обнаружения причин такого рода несогласованности данных старым теориям.

Приведенные выше модели весьма примечательны с методической точки зрения при исследовании творческого сознания. В данном случае мы имели в "запасе" богатый набор хорошо известных теорий, с помощью которых могли подтвердить или опровергнуть выводы, получаемые алгоритмом АМКЛ из массивов, отображающих сложный реальный (в том числе отчасти и социальный) производственный процесс. Согласование с этими теориями основных выводов моделей позволяет сделать вывод, что здесь АМКЛ являются также моделью индуктивного творческого сознания (во всяком случае, хотя бы для п. 1.1.). Как известно, процесс познания идет обычно путем построения соответствующих моделей и путем замены их все более совершенными. При исследовании этих моделей можно далее получить некоторые выводы (гипотезы) относительно более детальных функций сознания, эти гипотезы можно подтвердить или опровергнуть на новом материале и т. д.

Интерпретация выводов с помощью АМКЛ о функционировании сознания с помощью общих известных данных нейрофизиологии по отношению к данному примеру была бы весьма желательна; однако современный уровень системных исследований в этой области кажется пока весьма неадекватным тому громадному опыту, который уже накоплен в математике и, в частности, в математической логике. Более общие вопросы интерпретации получаемых выводов К изложены в части 3 п.2.

Итак, модели 9 - 11 и приведенное выше их сопоставление с литературными данными дают ответ на основную цель данного исследования реакторов синтеза метанола - выявить причины, влияющие на содержание воды в метаноле-сырце. Сами же формулы 9 - 11 есть списки простых и конструктивных рекомендаций для проектирования более точной и более совершенной системы управления синтезом метанола в промышленных условиях.

1.2. Исследование содержания ацетилена на выходе цеха окислительного пиролиза природного газа. Экономичность процесса окислительного пиролиза природного газа до ацетилена в значительной степени зависит содержания ацетилена в газе пиролиза. В промышленных условиях реакторы пиролиза обычно объединяют в группы. Из-за колебаний режимов по отдельным реакторам средний процент ацетилена на выходе из цеха обычно меньше оптимального, наблюдаемого на отдельных реакторах. Опытный оператор может иногда достаточно удачно учитывать индивидуальные различия реакторов и подбирать управление, основываясь на накопленном опыте. С помощью АМКЛ удается, как будет далее показано, имитировать действия опытного оператора, причем с гораздо большей детализацией и обоснованностью [5].

Ниже перечислены обозначения переменных, их наименования и значения медиан для трех различных обследований реакторов (они перечислены по порядку 1, 2, 3), прочерки обозначают отсутствие регистрации данных.

Х₁ - содержание О₂ в техническом кислороде, объемный %, 95.05, 94.90, 93.75. Состав природного газа, объемный %: Х₂ - кислород, 0.005, 0.007, 0.012, Х₃ - азот, 1.9, 1.9, - , Х₄ - метан, 94.3, 93.4, 91.8, Х₅ - этан, 1.975, 1.975, - , Х₆ - углекислота, 0.875, 0.875, - , Х₇ - пропан, 0.714, 0.714, - , Х₈ - и-бутан, 0.156, 0.156, - , Х₉ - н-бутан, 0.183, 0.178, 0.220, Х₁₀ - и-пентан, 0.0675, 0.675, - , Х₁₁ - н-пентан, 0.04885, 0.485, - . Х₁₂ - плотность, кг/м³, 0.7625, 0.7625, - . Расходы, норм. м³/час: Х₁₃ - природного газа, 3460, 3200, 3295, Х₁₄ - кислорода, 2165, 1880, 2215; кислорода стабилизирующего на горелку: Х₁₅ - по центру, 20.1, 17.3, 14.4, Х₁₆ - по краю, 29.5, 29.5, - ; Х₁₇ - воды горячей, 27.3, 26.5, 26.5, Х₁₈ - воды холодной, 26.5, 26.5, - . Температура, ?С: Х₁₉ - природного газа, 612, 623, 613, Х₂₀ - кислорода, 616, 623, 613, Х₂₁ - смеси, 617, 623. - , Х₂₂ - пирогаза после закалки, 88.5, 88.5, - . Перепад давления, кПа: Х₂₃ - на реакторе, 24.2, 24.2, - , Х₂₄ - на выходе, 109, 109, - . Состав пирогаза, объемный %: Y₁ - метана, 3.55, - , - , Y₂ - кислорода, 0.23, - , - , Y₃ - водорода, - , 54.25, - , Y₄ - непредельных, - , 0.45, - , Y₅ - ацетилена, 7.90, 7.95, 7.95, Y₆ - углерода (усл. ед.), - , - , 7.00, Y₇ - диацетилена в готовом продукте, - , 0.0045, - .

Основные реакции, отображающие химизм образования ацетилена, имеют вид [5]:

СН₄ + О₂ = СО + Н₂О + Н₂ + 282 кДж (12)

СН₄ + 2О₂ = СО₂ + 2Н₂О + 802 кДж (13)

2СН₄ = С₂Н₂ + 3Н₂ - 380 кДж (14)

Суть процесса заключается в следующем. Предварительно нагретые природный газ и технический кислород смешиваются и затем поступают в реакционную зону, пройдя через горелку реактора. В результате реакции, происходящей в пламени, примерно 30% метана превращается в ацетилен, затем продукты реакции поступают в зону закалки, где для предохранения ацетилена от разложения в факел вспрыскивается горячая и затем, по ходу потока, холодная вода. Все три обследования производились с интервалом примерно полгода. Последнее (3) обследование производилось над системой совместно работающих реакторов, поскольку последние принципиально не отличались между собой, для них введены единые медианы по всем соответствующим переменным.

При первом обследовании (один реактор) в течение трех месяцев зарегистрировано 52 стационарных режима, здесь булева модель процесса, соответствующего повышенному содержанию ацетилена на выходе, имела следующий вид (условия записи здесь такие же, как и в предыдущих моделях):

(15)

Отметим, что эта модель имеет большую степень сжатия (меньшее число выводов К, которые имеют обычно меньший ранг), чем модель для малых концентраций ацетилена на выходе (она здесь не приводится). Очевидно, такая модель определяется весьма большим разнообразием причин ухудшения производства, вплоть до явных нарушений режимов. При проектировании новых (но подобных) типов реакторов получения ацетилена и также с целью практического повышения эффективности уже существующих реакторов здесь возникают громадные вычислительные трудности для решения соответствующих уравнений гидродинамики для большого числа компонентов при неопределенности многих граничных условий. АМКЛ позволяют в данном случае увеличить определенность решений за счет выявления многих граничных условий, относительно которых заведомо известно, что их соблюдение приводит к выполнению цели, а также за счет упрощения соответствующих систем уравнений.

Рассмотрим вначале вывод (конъюнкцию) К₁, покрывающую наибольшее число технологических ситуаций в модели 15 (как обычно, будем считать, что К перенумерованы слева направо). Поскольку в эту ситуацию входят лишь два компонента (н-бутан и кислород в природном газе) соответствующая система уравнений значительно ограничивается. Более того, участие здесь кислорода позволяет предложить гипотезу о значительной роли предварительного смешения и диффузии кислорода и природного газа. Это позволяет на этом (предварительном) этапе ограничиться решением лишь уравнений диффузии для этих компонентов для построения наиболее простой теории пиролиза природного газа до ацетилена. Просматривая далее список выводов, можно отметить, что в общем случае диффузионная теория оправдывается по крайней мере для первых четырех выводов (в К₂ входит пониженная концентрация азота, который не входит в реакцию, здесь потребуется незначительное усложнение этой теории).

Обсудим теперь роль закалки в К₁. Уменьшение расхода горячей воды на закалку согласно известному эмпирическому уравнению закалки вызывает удлинение факела. В этих условиях образовавшийся ацетилен при повышенном содержании легко разлагаемого н-бутана может достичь той части закалочного устройства, где вспрыскивается холодная вода.

Итак, польза модели 15 заключается в том, что она указывает на приемлемость для основного числа ситуаций диффузионной теории, которая более проста для численных решений, чем решение полной системы уравнений. Основное множество рекомендаций хорошо увязывается с теорией газового факела с дополнительными условиями, определяющими процесс закалки.

Примерно через полгода было проведено второе обследование этого же реактора. Содержание следов кислорода в природном газе было здесь повышенным, согласно ранее полученным рекомендациям после первого обследования, был уменьшен расход горячей воды для закалки. Приведем для краткости лишь одну наиболее часто встречающуюся ситуацию:

(16)

- для повышения концентрации ацетилена на выходе в этой ситуации падение температуры природного газа должно быть компенсировано увеличением расхода кислорода (для повышения температуры смеси). Эта модель, действительно, соответствует технологическому опыту.

По этим же данным была вычислена следующая модель, в которой учитывался полностью состав Y пирогаза (опять для краткости приведем наиболее часто встречающуюся ситуацию):

(17)

В этой модели введение дополнительных переменных на выходе процесса оправдано тем, что позволяет оценить, например, вышеприведенную гипотезу - насколько целесообразно проектирование управляющего устройства, использующего для оптимизации процесса в качестве обратной связи содержание метана у₁ в пирогазе.

После изучения работы отдельного реактора была исследована работа всего пиролизного отделения цеха окислительного пиролиза природного газа. В цехе работало на общий коллектор ацетилена семь реакторов (в различных сочетаниях) из общего их числа, равного восьми, один реактор находился на профилактическом осмотре. Всего было зарегистрировано 116 следующих друг за другом режимов, которые записывали раз в смену. Переменные в модели, относящиеся к определенному реактору имеют вторые индексы (после запятой), соответствующие номеру реактора. Приведем для краткости лишь два наиболее частых вывода:

р = 0,01 (18)

Рассмотрим здесь вывод К₁, который соответствует взаимодействию реакторов 1 и 7. Здесь значения первых двух переменных отображают пониженное содержание кислорода и пониженный расход воды при закалке, известно, что все это вызывает, согласно известной теории газового факела, увеличение его длины. Значение третьей переменной, согласно известному эмпирическому уравнению закалки, также указывает на увеличение длины факела. Следующий по значимости вывод К₂ указывает на то, что в данной ситуации природный газ был обогащен компонентами, легко разлагающимися при нагреве. В этих условиях оказались полезными пониженная температура нагрева газа и более интенсивная закалка пирогаза.

С практической точки зрения после использования имеющихся средств интерпретации отдельные выводы К АМКЛ можно рассматривать списки тех содержательных теорий, которые могут быть использованы, например, не только для оптимизации конкретного технологического процесса, но и для проектирования более экономичных подобных процессов или для проектирования соответствующих им систем автоматического управления, функционирующих в более широком диапазоне данных по сравнению с исследованным исходным процессом.

Исследование с помощью АМКЛ сложных технологических процессов синтеза ацетилена и метанола, показывает принципиальную возможность реализации информационного поиска (подбора) непротиворечивых простых теорий на основании некоторых наиболее значимых качественных признаков К. Как показывают вышеприведенные примеры, этот подбор достаточно конструктивен - для выявленных теорий всегда можно указать некоторые определенные непротиворечивые конструкции (реализации). Надо надеяться, что использование всех имеющихся данных и мощной вычислительной техники позволит в будущем получать достаточно полное знание (объяснение) весьма сложных объектов при наличии априорных данных. Ограничиваясь рассмотрением автономно работающей сложной и достаточно мощной вычислительной системы как некоторого "субъекта", полученное им знание более правильно было бы назвать творческим сознанием, поскольку оно явилось результатом (моделью) взаимодействия сложного конкретного опыта на входе вычислительной системы и иных (априорных) моделей, ранее полученных иными субъектами.

1.3. Исследование технологического процесса флотации фосфоритной руды. Горно-химические производства отличаются малой оснащенностью средствами контроля, большими уровнями помех и значительными изменениями качества перерабатываемого сырья, т. е. производства отличается значительной информационной неопределенностью. В данном случае ставилась задача проектирования управления с переменной структурой - нахождения такого множества подсистем функционирования объекта, на котором частные модели управления были бы сравнительно легко реализуемы с помощью имеющихся технических средств и были бы достаточно приемлемы по заранее заданным критериям управления. Переменной структуре управления в данном случае ближе всего подходит построение модели в интервальном виде, т. е. в виде исчисления предикатов. Флотация фосфоритной руды заключается в ее измельчении до определенного класса размеров частиц, взвешенных в воде, в которую добавлены определенные реагенты и воздух, пузырьки которого являются транспортирующим средством - частицы фосфорита адсорбируются на границе жидкость-газ и, таким образом, отделяются от вмещающих пород.

Исходный массив данных (96 состояний, включающих 32 входные и выходные величины) был составлен по диспечерским отчетам [15], показания приборов контроля регистрировались каждый час, было учтено запаздывание по всем переменным. Выходные переменные У разбивались по медианам на 2 класса эквивалентности, причем целевые значения У₁ соответствовали большим значениям содержания Р₂О₅ в готовом продукте - фосфоритной муке, а целевые значения У₂ соответствовали (одновременно) малым значениям содержания MgO в фосфоритной муке. Ниже перечислены обозначения переменных, отображающих процесс флотации фосфорита и вошедшие в АМКЛ и также значения медиан для У.

Расход руды, т/ч, Х₂; влажность руды, %, Х₃; концентрация жидкого стекла, %, Х₁₂; жирность раствора таллового мыла, %, Х₁₆; расход керосина, т/ч; содержание частиц класса >0,18 мм в анионном концентрате, %, Х₁₉; расход таллового мыла, т/ч 10², Х₂₉. Фосфоритная мука: содержание Р₂О₅, %, У₁ = 28,6; содержание MgO, %, У₂ = 1,8. На первой стадии исследования было решено ввести в массив исходных данных также и запаздывающие на один час значения выходных переменных У (т. е. с точки зрения теории управления на вход была введена переменная У(t - 1) как обратная связь между выходом процесса и входом). Для краткости рассмотрим лишь первый, наиболее значимый вывод К₁ из полученной интервальной формы АМКЛ (для интервальных форм будем обозначать конъюнкцию как &):

(4.90< х₁₂(t)< 5.05)&(82.7529(t)<86.0)&(28.35< y₁(t-1)<30.45)& (1.052<(t-1)<2.05)?

?(28.751(t)<30.45)&(1.052(t)<1.85).

(19)

Отметим некоторые особенности модели 19. Ввиду достаточной сложности цели (одновременно большое содержание Р₂О₅ и малое содержание MgO в продукте) было найдено всего 8 состояний, когда наблюдается попадание в область К₁. Другими словами, на действующем объекте цель управления достигалась лишь с вероятностью 8/96 = 0.083, а в остальных случаях система находилась в состоянии поиска цели. Модель указывает достаточные условия существования целевого состояния для зарегистрированных Х и У. Для этого, прежде всего, требуется некоторое приближение к цели - интервалы У(t - 1) включают в себя интервалы для У(t). Однако К₁ не дает информации, каким образом должен осуществляться захват и сопровождение цели. Для этого, по-видимому, требуется анализ других К или обработка новой информации. Далее, после выполнения этого условия следует задать определенные в модели 19 интервалы значений управляющий воздействий Х₁₂ и Х₂₉. Интересно отметить, что согласно этой модели расход дорогостоящего компонента Х₂₉ здесь уменьшен. Для выполнения цели управления потребуется, судя по модели, стабилизировать концентрацию жидкого стекла в процессе флотации на уровне примерно 5%. Известно, что именно в этом случае растворимый силикат способствует снижению содержанию MgO и, соответственно, увеличению содержания Р₂О₅ в готовом продукте. Напомним, что этот вывод относится лишь к первому элементу (К₁) проектируемой системы управления системы с переменной структурой.

Для выяснения роли обратной связи была построена по тем же данным модель 20, которая, однако, не содержала в расчетном массиве У(t - 1), ограничимся здесь также рассмотрением лишь К₁:

(2432<285)&(3.753<10.3)&(4.2114<4.80)&(16.416<20.5)& (0.93518<1.10)&(25.2819<36.00)?

?(28.601<31.7)&(0.0642<2.0). (20)

Для модели 20 цель управления достигается с вероятностью лишь 5/96 = 0,052, ликвидация здесь обратной связи ведет к уменьшению частоты попадания в цель. Если в модели 19 ранг вывода К₁ был равен 4, то в модели без обратной связи этот ранг был равен 6, т. е. закон управления стал более сложным и стал реже реализоваться. Таким образом, в модели 19 введение обратной связи приводит к более устойчивому и более простому закону управления.

2. Построение и исследование некоторых медико-демографических моделей.

2.1. Логические модели структур заболеваний за 1986 - 1999 годы участников ликвидации аварии на Чернобыльской АЭС и/или мужчин, проживающих в пораженной зоне и имеющих злокачественные новообразования. Исследование здоровья участников ликвидации аварии на Чернобыльской АЭС (ЧАЭС) и их лечение принимает в настоящее время большое значение, как ввиду сравнительно быстрого прогрессирования всего комплекса болезней, связанных с радиационными поражениями, так и просто с вымиранием этих людей, отдавших свое здоровье для защиты общества от дальнейшего распространения радиоактивности. Эти исследования имеют и международное значение, поскольку существует возможность повторения трагедии, аналогичной Чернобыльской, из-за войн, катастроф или террористических действий. Наши ликвидаторы, да и люди, проживающие сейчас в радиоактивных зонах, к сожалению, являются как бы подопытными объектами, на которых отрабатываются как различные способы лечения, так и модели демографических, социальных и экономических изменений в государствах, которые могут подвергнуться катастрофам, аналогичных Чернобыльской.

В этом исследовании (см. также [46]) использованы данные лишь о самих фактах заболеваний, точнее о 100 группах болезней. В качестве цели выбраны злокачественные новообразования (ЗН) лишь потому, что их возникновение связано с воздействием ионизирующей радиации и интерпретация получаемых моделей (М) в этом случае может быть облегчена. Для уменьшения вычислительного времени удобно было преобразовывать каждый раз для каждого заданного вида злокачественного новообразования (ЗН) всю исходную выборку следующим образом (для 9000 мужчин (Л), проживающих в пораженной зоне и/или ликвидаторов, которые обследовались четыре или более число раз по Тульской области). Задавалась цель исследования (определенный вид ЗН), затем выбиралась первая строка массива, содержащая данное ЗН, после чего выбирались последующие две, не содержащие данное ЗН и т.д. Таким образом, при данном подходе (и при простом алгоритме этой выборки) удавалось хотя и приблизительно, но подобрать пару возможно близких по времени обследования пациентов в качестве контроля, не имевших заданное ЗН. Далее задавалось ограничение, определяемое лишь временем счета - выборка должна была содержать не более чем 570 человек. В том случае, если определенное ЗН имело малое число пациентов, выборка дополнялась до заданного числа строками, идущими после последнего пациента, имевшего заданное ЗН - на данном этапе работы было выгодно иметь как можно больше строк сравнения (и приемлемое время счета), для того, чтобы получать возможно более детальные выводы (конъюнкции наибольшего ранга). В данной работе все переменные х

будут булевыми, при обнаружении болезни х = 1, при ее отсутствии х = 0. Для удобства логическую (булеву) М можно записать, например, в виде

... х

...

( х

... x

... )

Z, (1)

где интервалы между х означают связку "и", подчеркнутые х = 0, r1 - признак принадлежности К к целевой модели (ЦМ), где Z = 1, r0 - принадлежность К к не целевой модели или "модели контроля" (МК), где Z = 0 и

- отрицание.

После вычисления К рассчитывается ее оценка ?Г? - число (повторяемость) К в выборке и множество Г ликвидаторов (их номера), соответствующее данному К. Затем отбрасываются те К, Г которых является подмножеством более "мощных" К.

Алгоритм построения АМКЛ предназначен для исследования сложных систем в динамике. Предполагается, что эти системы зависят также и от "скрытых" (незарегистрированных) переменных, медленно эволюционирующих во времени. Для того, чтобы сделать К мало зависящими от этих переменных, сам алгоритм построен на сопоставлении каждой целевой строки (Л со ЗН) со своей окрестностью не целевых строк (вычисление ЦМ), аналогично вычисляются и МК.

Логические модели структур заболеваний. В данной работе для краткости приводится запись лишь трех К с наибольшими ?Г? для каждой МК и трех для соответствующей ей ЦМ. В выборке из 570 Л наблюдается примерно по 10 Л с каждой разновидностью ЗН, и для ЦМ большинство ?Г? = 1, поэтому для выборки в ЦМ трех К применялись следующие приемы. Помечались переменные х

, совпадающие по индексу i как в ЦМ, так и в МК (большинство таких х

в ЦМ имеют инверсные, т. е. обратные значения по отношению к МК, их помечали звездочкой * справа, как в МК, так и в ЦМ). Затем выбирались те К, которые имели наибольшее число таких инверсий (И), поскольку содержательная интерпретация таких К более проста, далее они записывались в порядке уменьшения числа И. В случае одинакового их числа предпочтение для записи оказывалось тем К, для которых И ближе по записи к началу К. Следует заметить, что первые по записи х

появляются в результате сопоставления с ближайшими окрестностями "не целевых" строк, т. е. этой информации соответствует более правильный во времени (1986 - 1999 годы) подбор "контроля" для каждой целевой строки исходного массива данных.

Для лучшего обзора М условимся записывать вместо х

лишь индекс i. Так, МК и ЦМ (которые удобно интерпретировать порознь) будут записываться в следующем виде, например,

* i

... i

...

* i

... i

...

*, p, m, (n)

где черта под i означает х = 0, т. е. отсутствие заболевания (без черты - наличие заболевания, х = 1), интервал между i пусть означает логическую связку "и", * - инверсные значения х, встречающиеся как как в КМ, так и в ЦМ, r - ранг (сложность) "синдрома" К, z - признак функции цели, р - максимальная ошибка распознавания цели в общей М (см. (1)), m - число Л с определенным видом ЗН, соответствующее всей модели (без усечения числа К) и (n) - номер формулы (пары МК и ЦМ). Единственная переменная х

(доза

- излучения, зарегистрированная или с помощью индивидуального дозиметра или путем расчетов по времени работы в соответствующей зоне) на входе программы выражалась в виде вещественного числа, однако у многих Л эта доза была неизвестна. Поэтому сам факт появления в М х

будем считать эквивалентным выражению "имеется взаимодействие с зарегистрированной дозой излучения" (обратное здесь высказывание по смыслу - "нет взаимодействия с зарегистрированной дозой излучения или доза неизвестна"). Помимо М ЗН вычислены еще М нарушения иммунитета, М болезней щитовидной железы (ее ЗН не были выделены в исходном массиве), М для новообразований (Н) неопределенного характера и М для доброкачественных Н. Далее ЦМ располагали в зависимости от места записи х

в К (и от их числа), т. е. в начале приведены ЦМ, имеющие явное взаимодействие с дозой излучения. Для удобства обзора М там, где возможно, будем подчеркивать несколько в подряд расположенных i для х = 0 единой чертой.

Нарушения иммунитета: МК: 87 15 36* 71 55* 30

87 49 36* 50 71 55* 30

50 30 19 71 36* 73 87

22*,

ЦМ: 5 36* 37

55* 5

5 74 36*

22*, p = 0.068, m = 13.

(2)

Доброкачественные Н:

МК: 19 50* 29 46 58

93 50* 43* 74* 73 19 45

46 71* 45 1

15*,

ЦМ: 43* 50* 57 72 5

5 74* 43 26 73 32 71*

57 55 74* 26 72

15*, p = 0.082, m

7. (3)

ЗН органов дыхания:

МК: 46 29* 49

26* 29* 49

50* 29*

10*,

ЦМ: 30 43 50* 26* 55 22 5

68 29* 74

5 40 26* 37 57

10*, р = 0.033, m = 19. (4)

ЗН лимфоидной ткани:

МК: 55* 58* 43 31*

74 58* 55* 5

74 43 58* 55

14*,

ЦМ: 5

31* 19 50

58* 71 74 42 50 32

50 55* 30 19 74 29 71 93 15

14*, p = 0.019, m = 11. (5)

Н неопределенного характера:

МК: 8* 19* 54*

40* 43 32*

50 32* 31

17*,

ЦМ: 8* 36 93 32* 79 37

40* 20 5

80 19* 37

17*, p = 0.018, m = 10. (6)

Болезни щитовидной железы:

МК: 30 55* 40 29 46 32 57* 5 87 22

88 29 71 57* 55*

50* 32 87 40 5 31

32 29 71 87 46 57* 55* 40 5 30

19*,

ЦМ: 50* 57* 55* 5

74 43 50* 55* 46

37 55* 8

19*, p = 0.058, m

36. (7)

ЗН органов пищеварения: МК: 29* 46*

30* 33*

50* 29*

9*,

ЦМ: 46* 15 43 50* 32 74 80 93 10 29*

33* 74 46* 5

22 15 32 36 50* 30*

9*, p = 0.025, m = 16. (8)

ЗН губы и полости рта: МК: 11* 32* 36* 40* 41*

19*

32* 36* 40* 44* 11*

8*,

ЦМ: 36* 52 19*

44* 41* 55 19*

37 40* 19* 50 5

8*, p = 0.014, m = 10. (9)

ЗН мочеполовых органов:

МК: 15 79* 37 57* 71*

43* 15 71*

46* 15 41* 57*

71*

12*,

ЦМ: 79* 46* 31

43* 57* 74 71 85 36 26 29

50 74

19 71* 29 15

12*, P = 0.018, m = 10. (10)

ЗН костей:

МК: 43 8* 74

45 29 94*

50 74 8 94

11*,

ЦМ: 94*

8* 26

15 50 8* 32 36 40 41

11*, p = 0.0088, m = 7, (11)

где 5 - доза излучения, 8 - ЗН полости рта, 9 - ЗН органов пищеварения, 10 - ЗН органов дыхания, 11 - ЗН костей, 12 - ЗН мочеполовых органов, 14 - ЗН лимфоидной ткани, 15 - доброкачественные Н, 17 - Н неопределенного характера, 19 - болезни щитовидной железы, 20 - болезни других эндокринных желез, 22 - нарушения иммунитета, 26 - невротические расстройства, 29 - дегенеративные болезни ЦНС, 30 - болезни ЦНС, 31 - болезни периферической нервной системы, 32 - болезни глаза, 33 - болезни уха, 36 - гипертензивная болезнь, 37 - ишемическая болезнь сердца, 40 - цереброваскулярные болезни, 41 - болезни артерий, 42 - болезни вен, 43 - острые респираторные инфекции (РИ), 44 - болезни верхних дыхательных путей, 45 - пневмония и грипп, 46 - хроническая обструктивная болезнь легких, 49 - болезни полости рта, 50 - болезни желудка, 52 - грыжа, 54 - болезни кишечника, 55 - болезни органов пищеварения, 57 - болезни мочевыделительной системы, 58 - болезни мужских половых органов, 68 - воспалительные болезни кожи, 71 - дорсопатии, 72 - ревматизм, 73 -хондропатии, 74 - симптомы, выявленные при клинических исследованиях (С), 79 - переломы костей верхней конечности, 80 - переломы костей нижней конечности, 85 - открытые раны головы, 87 - открытые раны нижней конечности, 88 - повреждения кровеносных сосудов, 93 - последствия проникновения инородных тел, 94 - ожоги.

Интерпретация моделей. При общем обзоре М видно явное увеличение числа заболеваний в ЦМ по сравнению с МК, возможно, вследствие различного вида нарушений иммунитета, которые можно классифицировать по самим этим заболеваниям. Можно сказать, что наличие ЗН (и некоторых других заболеваний кроме ЗН органов пищеварения) соответствует увеличению энтропии состояний Л (увеличению "хаоса"). Обратим также внимание на i*, которые удобны для "линейной" интерпретации - отсутствию болезни i* в МК соответствует наличие болезни i* в ЦМ ( и определяется сам вид этой модели, см. (1)). Для любой К может быть вычислен ее "контекст" - в общем случае это интервалы значений тех х, которые не вошли в К, но которые необходимы для облегчения их интерпретации. В случае булевых М это могут быть вероятности значений, например, х = 1?К, Г. Следует обратить внимание и на р, большим ее значениям соответствует большее разнообразие выводов К, что отображает зависимость М от неучтенных х (от "скрытых переменных х) и, в частности, признаком существенного влияния динамики заболеваний, явно не отображенной в М.

Далее для краткости ограничимся в основном интерпретацией лишь первых i по ходу их записи в каждой К в ЦМ, поскольку их выбор определяется сопоставлением с состояниями более близкими по времени "контрольных" Л. Будем также интерпретировать все i*, поскольку эти высказывания, например, в ЦМ подтверждаются подобными инверсными высказываниями в МК (конечно, эта интерпретация соответствует лишь самому простому подходу к М, когда х считаются независимыми). Все К ("синдромы") в ЦМ пусть будут перенумерованы по ходу их записи. Знак ... будет иногда заменять термин "и прочие" (подобные элементы). Первые модели будут интерпретированы подробнее, последующие более кратко.

(2): 5 36* 37 - нарушения иммунитета обычно возникают сравнительно быстро после облучения, возможно, в данной ситуации еще не успели повлиять различные помехи (в течение многих лет), которые уменьшают проявление в М непосредственной связи Z с "управляющей" переменной х

. В тех же случаях, когда болезнь развивается с большим запаздыванием, например, в случае ЗН кости под влиянием

Sr, этой непосредственной связи может и не быть, как в (11). Взаимодействие с гипертензивной болезнью можно объяснить как исходной слабостью ЦНС, так и стрессом, который возник или во время катастрофы или в более позднее время в результате ухудшения здоровья. Отсутствие ишемической болезни сердца у этих Л можно объяснить более молодым возрастом Л?(К

, ЦМ) по сравнению с Л?МК. 55* 5 - связь болезней органов пищеварения с облучением здесь можно объяснить не только воздействием внешнего облучения, например, на эпителий кишечника, но и внутренним его облучением за счет

I, концентрация которого в желудочном соке в 40 раз больше, чем в плазме крови. 5 74 36* - эта группа Л похожа на Л?К

, но у них отмечены еще некоторые С (в этом случае необходимо смотреть их личные карты). М(2) соответствует большое значение р, которое можно интерпретировать как влияние неучтенных х, возможно связанных с быстрой динамикой заболевания сравнительно с заболеваниями, возникающими с большим запаздыванием после катастрофы.

(3): 43* 50* 57... 5 - доброкачественные Н в этой группе Л со сравнительно сильной иммунной системой сопровождаются болезнями желудка и мочевыделительной системы, связанные с излучением. 5 74* 43...71* - то же при воздействии излучения, С, РИ и при отсутствии дорсопатии (возможно этот вывод соответствует Л, не занятых физической работой и со слабой иммунной системой). 57 55 74* ... - то же, но при болезнях мочевыделительной системы, отсутствии болезней органов пищеварения и при наличии С. М(3) соответствует максимальное значение р (максимум "разнообразия" выводов) которое можно интерпретировать, например, как проявление влияния всего не учитываемого большого многообразия различных видов доброкачественных Н на иммунитет и заболеваемость Л.

(4): 30...50* 26* 55 - ЗН органов дыхания наблюдаются при болезнях ЦНС (неврологические расстройства, что возможно свидетельствует о перенесенном стрессе), отсутствии болезней органов пищеварения. 68 29* 74 - то же при воспалительных болезнях кожи, отсутствии дегенеративных болезней ЦНС и при С. Интересно отметить, что в МК часто наблюдается наличие дегенеративных болезней у Л. Поскольку эти болезни обычно наблюдаются при алкоголизме ("профессиональная вредность" у Л), возможно, что алкоголь каким-то образом уменьшает вероятность ЗН органов дыхания, однако "ценой" этого является появление дегенеративных болезней. 5 40 26* 37... - то же, но для Л, у которых вследствие стресса возникли цереброваскулярные болезни, невротические расстройства и ишемическая болезнь сердца.

(5): 5 - ЗН лимфоидной ткани в данной ситуации возникали при сравнительно меньших дозах (< 36 рентген), чем для Л из МК. Для получения более содержательных выводов метод АМКЛ позволяет или удалить столбец Х, который слишком "закоррелирован" с Z, и произвести повторное вычисление М, или позволяет вычислить для К его "контекст". В данном случае можно выбрать К

= 5 58* 55* (инверсии 58 и 55 взяты из К

в МК, они же присутствуют в других К в ЦМ). Истинность К при этом сохраняется, если только итоговое Г не пусто. Тогда можно сказать, что ЗН здесь возникают при дозах излучения меньших, чем 36 рентген, при этом наблюдаются болезни мужских половых органов и болезни органов пищеварения, что все вместе соответствует как психической травме, так и нарушению иммунитета. 31* 19... - то же при болезнях периферической нервной системы и при отсутствии болезней щитовидной железы. 58* 71... - то же при болезнях мужских половых органов и при отсутствии дорсопатии. 50 55* 30 ... - то же при болезнях органов пищеварения и при отсутствии болезней ЦНС.

(6): 8* 36 93 32* ... - Н неопределенного характера наблюдались при ЗН полости рта, отсутствии гипертензивной болезни, отсутствии последствий проникновения инородных тел и при болезнях глаза. 40* 20 5 - то же при цереброваскулярной болезни, болезнях эндокринных желез и воздействии излучения. 80 19* 37 - то же при переломах костей нижней конечности, болезни щитовидной железы и ишемической болезни сердца.

(7): 50* 57* 55* 5 - болезни щитовидной железы наблюдаются у Л при болезнях органов пищеварения, болезнях мочевыделительной системы и при воздействии излучения (возможно,

I на ранних сроках после катастрофы). 74 43 50* 55* ... - то же при ПС, РИ, болезнях органов пищеварения. 37 55* ... - то же при ишемической болезни сердца и болезнях органов пищеварения.

(8): 46*... 50*... 29* - ЗН органов пищеварения при хронической обструктивной болезни легких, отсутствии болезней желудка и отсутствии дегенеративных болезней ЦНС. Возможной причиной ЗН здесь может быть радиоактивная пыль, содержащая также и

I, который помимо щитовидной железы концентрируется частично также и в желудочном соке. 33*... 46* 5 - то же при болезнях уха, хронической обструктивной болезни легких и действии излучения. 22... 50* 30* - то же при нарушениях иммунитета, отсутствии болезней желудка и отсутствии болезней ЦНС.

(9): 36* 52 19* - ЗН полости рта при гипертензивной болезни (стресс, нарушение иммунитета), грыже (тяжелая мышечная работа) и при отсутствии болезней щитовидной железы. 44* 41*... 19* - то же при болезнях верхних дыхательных путей, болезнях артерий и при отсутствии болезней щитовидной железы. 37 40* 19*... - то же при ишемической болезни сердца (стресс), цереброваскулярной болезни и при отсутствии болезней щитовидной железы.

(10): 79* 46*... - ЗН мочеполовых органов при переломах костей верхней конечности (стресс) и хронической обструктивной болезни легких (пыль, резорбция радиоактивности). 43* 57*... - то же при РИ (нарушение иммунитета) и болезнях мочевыделительной системы. 50... 71* 29... - то же при болезнях желудка..., дорсопатии (тяжелая физическая работа) и дегенеративных болезнях ЦНС (возможно, при алкоголизме здесь нет его "защитного" эффекта).

(11): 94* - ЗН костей при ожогах (значительное нарушение иммунитета). 8* 26 - то же при Н не уточненной природы и невротических расстройствах. 29* 42... - то же при дегенеративных болезнях ЦНС и болезнях вен. В отдаленные сроки (длительное воздействие

Sr на костную ткань) возможный здесь алкоголизм также не дает "защитного" эффекта. Отметим в (11) отсутствие включения в ЦМ дозы излучения i = 5 и наименьшую р среди всех М. "Скрытые" переменные (в основном исходная динамика причин развития ЗН кости, связанная с излучением) здесь имеют меньшее значение вследствие значительного запаздывания развития этого вида ЗН, когда эта связь может быть перекрыта более значимым влиянием последующих событий. Вероятно, именно вследствие этих причин М здесь становится более компактной (меньшее число К, истинных лишь для одного Л).

Интерпретация М "первого" приближения (2)...(11) в булевом виде естественным образом ограничена "словарем" используемого языка описания состояния здоровья Л - самими лишь фактами наличия или отсутствия некоторых заболеваний. Но даже в терминах этого языка прелагаемые выше интерпретации большей частью как следствия нарушения (или сохранения) иммунитета по отношению к выделенному (целевому) заболеванию могут быть полезными для дальнейшего исследования Л с целью ранней диагностики ЗН - обнаружение, например, нарушений иммунитета, соответствующих вышеперечисленным "синдромам" К.

Интерпретация МК так же представляет интерес, но скорее как "генератор правдоподобных гипотез", не противоречащих М для данной выборки (570 Л). Как правило при этом последовательно исследуются с помощью априорных (литературных) данных

К? МК, причем в булевом варианте как и ранее особое внимание уделяется интерпретации х*? МК с учетом их места записи в К. Выполненный анализ имеющихся данных с помощью метода построения АМКЛ (и особенно в булевой форме) можно рассматривать лишь как начальную стадию системного исследования здоровья Л. Обычно далее выделяют наиболее интересные в содержательном смысле "синдромы" К и более детально исследуют их состояния Г ?К, по которым вновь вычисляют АМКЛ, но уже в предикатном (интервальном) виде с включением новых переменных в виде вещественных чисел, например, С, которые ранее были свернуты в единую булеву переменную с i = 74. Использование АМКЛ в таком рекурсивном режиме частично позволяет избежать ограничений на вычислительные ресурсы, которые часто возникают при исследовании сложных систем.

2.2. Логические модели структур заболеваний за 1986 - 2000 годы жителей Тульской области, имеющих злокачественное новообразование щитовидной железы и проживающих на территориях, подвергшихся воздействию аварии на ЧАЭС. В этой работе использованы данные (КЦЗТО) лишь о самих фактах заболеваний, зарегистрированных в течение 1986 - 2000 годов, всего за 15 лет. Отметим, что регистрация заболеваний в исходном массиве производилась независимо от того, в каком году оно было обнаружено; динамика заболеваний в данной работе не изучалась. Далее вместо выражения "итоговый список заболеваний за весь период наблюдений (обследований)" будем говорить для краткости "совместные заболевания". Появление в выводах (импликантах, обычно в виде конъюнкций К) сразу нескольких переменных будем истолковывать далее как "совместное" наличие их в списке болезней или других признаков за весь период наблюдений.

Для практической реализации расчетов удобно было преобразовывать следующим образом исходную выборку для 47000 жителей, которые проживают в контролируемой зоне и которые были обследованы пять или более число раз за весь период наблюдений. Задавалось ограничение, определяемое лишь временем расчета моделей - вся выборка должна была содержать не более чем 864 человека. Далее задавалась цель исследования - наличие злокачественного новообразования щитовидной железы (ЗНЩЖ), затем выбиралась первая строка массива (характеризующая определенного больного по всем обследованиям), содержащая заданное заболевание, после чего выбирались последующие 56 строк "контроля", не содержащие это заболевание и т.д. После выборки всех целевых и частично не целевых строк рабочий массив дополнялся до 864 далее следующими не целевыми строками. Приблизительное число строк "контроля" для каждой целевой строки задавалось как (864 - 15) : 15 T 56, где 15 соответствовало общему числу людей, заболевших ЗНЩЖ, из общей выборки 47000 человек. В данном исследовании исходный массив данных не был упорядочен во времени (последовательность обследуемых больных каждый следующий год могла быть иной).

Предварительный расчет моделей для 225 переменных (болезней, некоторых синдромов, а также социальных сведений) для 272 жителей, позволил выделить на этой предварительной стадии всего 44 "существенных" переменных (их общее число в целевых и не целевых М) Заметим, что произведение числа переменных на число строк массива определяются лишь оперативной памятью используемого компьютера. Эти сведения позволили сформировать далее рабочий массив, содержащий, как уже указывалось, 864 человека и 44 существенные переменные, что привело к получению более детальных моделей (конъюнкций большего ранга c большими оценками).

Для облегчения интерпретации М помечались переменные х

, совпадающие по индексу i как в ЦМ, так и в МК, но имеющие инверсные, т. е. обратные значения; их помечали звездочкой * справа, как в МК, так и в ЦМ). Поскольку в данном случае число целевых строк было весьма мало и оценки для К в ЦМ были также малы, большое внимание здесь приходилось уделять МК, формулы которых имели большие оценки. Здесь выбирались те К, которые имели наибольшее число таких инверсий. В случае одинакового их числа предпочтение для записи оказывалось тем К, которые имели большую оценку. Затем именно эти инверсии искались в ЦМ и выбиралась одна К по тем же правилам, что и для ЦМ.

Для удобства логическую (булеву) М можно записать, например, в виде

( х

... x

... )

... х

...

(1) где интервалы между х означают связку "и", подчеркнутые х = 0, r1 - признак принадлежности К к целевой модели (ЦМ), где Z = 1, r0 - принадлежность К к не целевой модели или "модели контроля" (МК), где Z = 0 и

- отрицание.

Будем далее сравнивать между собой именно такие пары К. Для компактности записи и лучшего обзора формул условимся записывать вместо всех x_iлишь их индексы i, будем также записывать формулу для интерпретации в виде дизъюнкции этих К (естественно, К для МК должна быть здесь с отрицанием). Эта дизъюнкция имплицирует цель исследования так же, как и любая частичная (для каждой строки) своя формула К для ЦМ. Подчеркнутые индексы пусть означают, что для них х = 0, для не подчеркнутых х = 1. Для удобства обзора М там, где возможно, будем подчеркивать несколько в подряд расположенных i для х = 0 единой чертой.

Булевы модели структур заболеваний при ЗНЩЖ:

?(17* 29*) ? 28* 17* 23* 31* ? 36* 23* 26 29* ? 12, (2)

?(22* 17*) ? 28* 17* 39* 22* ? 12, (3)

?(17* 33 39*) ? 17* 27 22 26 39* ? 20 24 39* ? 12, (4)

?(39*29* 15*) ? 15* 29* 17* ? 12, (5)

?(39* 36* 6* 29* 32*) ? 17* 30 20* 26* 29* 39* ? 35 6* ? 12, (6)

?(17* 28*32*) ? 17*30* 28* 39* ? 12, (7)

?(28* 23* 4*) ? 4* 32* ? 12, (8)

?(28* 18* 37*) ? 17* 37* 39* ? 12, (9)

?(6* 37* 19*) ? 6* 37* 19* 26* 17 31* 21 ? 12, (10)

?31* ? 7 31* ? 12, р = 0.01, m = 15, (11)

где 4 - нетоксический зоб неуточненный, 6 - тиреоидит неуточненный, 7 - синдром врожденной йодной недостаточности, 12 - злокачественное новообразование щитовидной железы, 15 - анемии, связанные с питанием, 17 - нарушения обмена веществ, 18 - болезни мышц глаза, нарушение аккомодации и рефракции, 19 - ишемическая болезнь сердца, 20 - другие болезни сердца, 21 - болезни артерий, артериол и капилляров, 22 - острые респираторные инфекции верхних дыхательных путей, 23 - другие болезни верхних дыхательных путей, 24 - хронические болезни нижних дыхательных путей, 26 - болезни желчного пузыря, желчевыводящих путей, 27 - дерматит и экзема, 28 - артропатии, 29 - дорсопатии, 30 - болезни мягких тканей, 31 - остеопатии и хондропатии, 32 - другие нарушения костно-мышечной системы и соединительной ткани, 33 - мочекаменная болезнь, 35 - травмы локтя и предплечия, 36 - травмы области голеностопного сустава и стопы, 37 - травмы, классифицированные в других рубриках, 39 - пол (1 - мужчины, 0 - женщины).

Интерпретация моделей. Далее выводы для отрицательных дизъюнктивных членов будем записывать в скобках. Будем также, как частный случай, удобный для интерпретации, при раскрытии скобок в М делать отрицание для каждой переменной в скобках. При интерпретации, чтобы напомнить происхождение таких выводов, они помещаются также в скобки. Выводы по каждому дизъюнктивному члену отделяются друг от друга словом (логической связкой) или.

Выводы по М2. ?(17* 29*) ? 28* 17* 23* 31* ? 36* 23* 26 29* ? 12 - злокачественное новообразование щитовидной железы (12) наблюдается при следующих списках существовавших (или не существовавших) болезней: (при нарушении обмена веществ (17) и дорсопатии (29)), или при артропатии (28), нарушении обмена веществ (17), других болезнях верхних дыхательных путей (23) и при отсутствии остеопатии и хондропатии (31), или при травмах области голеностопного сустава и стопы (36), других болезнях верхних дыхательных путей (23), болезнях желчного пузыря, желчевыводящих путей (26) и дорсопатии (29).

Выводы по М3. ?(22* 17*) ? 28* 17* 39* 22* ? 12 - злокачественное новообразование щитовидной железы (12) наблюдается при следующих списках существовавших (или не существовавших) болезней: (при отсутствии острых респираторных инфекций верхних дыхательных путей (22) и наличии нарушения обмена веществ (17)) или при артропатии (28) и нарушении обмена веществ (17) у женщин (39) и при отсутствии острых респираторных инфекциях верхних дыхательных путей (22).

Выводы по М4. ?(17* 33 39*) ? 17* 27 22 26 39* ? 20 24 39* ? 12, - злокачественное новообразование щитовидной железы (12) наблюдается при следующих списках существовавших (или не существовавших) болезней: (при нарушении обмена веществ (17) и мочекаменной болезни (33) у женщин (39)), или при нарушении обмена веществ (17), отсутствии дерматита и экземы (27), при острых респираторных инфекциях верхних дыхательных путей (22), болезнях желчного пузыря, желчевыводящих путей (26) у женщин (39) или при других болезнях сердца (20) (не ишемии), хронических болезнях нижних дыхательных путей (24) у женщин (39).

М5 - М11 интерпретируются аналогичным образом (оценки отрицательных дизъюнктивных членов для них значительно меньше). М2 - М11 рассчитывались без учета возраста и районов проживания жителей. Значения этих переменных отображаются двух или трехзначными числами; в случае их использования самая интересная часть исследования - выявление самой структуры заболеваний в различных вариантах было бы проведено недостаточно эффективно (часть структуры выводов была бы занята этими не столь существенными переменными на данном этапе исследований).

Приведем для полноты описания несколько отдельно рассчитанных ЦМ с наибольшими оценками, включающих возраст, все остальные исходные переменные были булевыми. Индексную запись сохраним здесь лишь для булевых х, предикатные выражения запишем в скобках:

17 (38 < Х38 < 40) 31 ? 12, (12)

(53 < Х38 < 58) 17 5 ? 12, (13)

(63 < Х38 < 66) 4 19 ? 12. (14)

Приведем также отдельно рассчитанную и с большей оценкой ЦМ, включающую в себя коды районов проживания (остальные исходные данные были булевыми):

28 17 (204 Џ Х43 < 212). (15)

Приведем еще одну отдельно рассчитанную, более сложную и включающую в себя взаимодействие между возрастом и кодами районов проживания ЦМ, в эти расчеты были включены все переменные:

(53 < Х38 < 63) (248 < Х43 < 401) 26 ? 12. (16)

В М12 - М16 индекс 5 означает тиреоидит, Х38 - возраст (годы), Х43 - коды (сокращенные) районов проживания, их значения приведены при интерпретации М. Остальные переменные те же, что и ранее. Ошибка р М12 - М16 примерно такая же, что и ранее для М2 - М11.

Выводы по М12. 17 (38 < Х38 < 40) 31 ? 12 - злокачественное новообразование щитовидной железы (12) наблюдается при следующих списках существовавших (или не существовавших) болезней: при нарушении обмена веществ (17) для жителей сравнительно молодого возраста (около 39 лет) и при отсутствии у них остеопатии и хондропатии (31).

Выводы по М13. (53 < Х38 < 58) 17 5 ? 12 - злокачественное новообразование щитовидной железы (12) наблюдается при следующих списках существовавших (или не существовавших) болезней: для жителей, которые имеют возраст 54 - 57 лет при нарушении обмена веществ (17) и при отсутствии у них тиреоидита (5).

Выводы по М14. (63 < Х38 < 66) 4 19 ? 12 - злокачественное новообразование щитовидной железы (12) наблюдается при следующих списках существовавших (или не существовавших) болезней: для пожилых жителей (64 - 65 лет) при нетоксичном зобе (не уточненном) и при отсутствии ишемической болезни сердца (19).

Выводы по М15. 28 17 (204 Џ Х43 < 212) - злокачественное новообразование щитовидной железы (12) наблюдается при следующих списках существовавших (или не существовавших) болезней: при артропатии (28) и нарушении обмена веществ (17) для жителей Арсеньевского (204), Белевского (206) и Богородицкого (208) районов (при регистрации районов области использовались лишь четные коды).

Выводы по М16. (53 < Х38 < 63) (248 < Х43 < 401) 26 ? 12 - злокачественное новообразование щитовидной железы (12) наблюдается при следующих списках существовавших (или не существовавших) болезней: при возрасте 54 - 62 года для жителей Ясногорского района (250) и районов г. Тулы с кодами 368, 375, 364, 373, 380 при отсутствии у них болезни желчного пузыря, желчевыводящих путей (26).

Сравнение М12 - М16 с основными М2 - М11, достаточно детально отображающих структуру заболеваний для жителей, имеющих ЗНЩЖ, показывает, что М12 - М16 также полезны для оценки взаимодействий возраста жителей и/или их района проживания с некоторыми заболеваниями (или их отсутствием). М такого вида будут важны для дальнейшего перехода к более детальным М, отображающих также и демографические, социальные и экологические (радиационные) причины возникновения ЗНЩЖ. Приведенная выше интерпретация М естественным образом ограничена "словарем" используемого языка описания состояния здоровья населения - самими лишь фактами наличия или отсутствия некоторых заболеваний. Но даже в терминах этого языка рассмотренные выше выводы можно использовать как признаки возможного наличия (или отсутствия) ЗНЩЖ. Так, можно принять, что в М2 - М16 перечислены соответствующие этим М "синдромы" К, указывающие в определенном контексте на возможность наличия (или отсутствия) именно у этих людей ЗНЩЖ. В качестве такого контекста, значительно уточняющего К, могут быть выбраны интервалы значений большинства "несущественных" переменных, которые соответствуют той определенной когорте жителей, для выделения которой необходимо и достаточно существование у них определенного признака К. Сам по себе этот контекст необходим, но недостаточен для распознавания целевой функции. Увеличение ранга К за счет присоединения контекста сохраняет истинность К и уменьшает ошибку распознавания за счет лучшей фильтрации полезной информации при использовании полученных моделей на новых массивах данных. Наилучший выход здесь заключался бы в построении такой следящей системы распознавания, где возможно было бы постоянное обновление ("доучивание") М при обследовании каждого очередного пациента. Естественно, для построения контекста необходимо получение на входе более детальной информации, отображаемой в основном в виде вещественных чисел или в виде чисел k-значной логики.

2.3. Мониторинг некоторых экологических факторов и образа жизни пациента, страдающего артериальной гипертензией. Нижеприведенная модель (данные В. А. Хромушина, КЦЗТО), отображающая влияние некоторых экологических факторов и образа жизни на уменьшение гипертензии у пациента, имеет в основном методологическое значение.

Построение массива исходных данных. Предполагается, что пациент заполняет специальный бланк, разработанный его лечащим врачом, и имеет некоторую минимальную осведомленность об экологических факторах и техническую оснащенность (наличие приборов, измеряющих давление и т. п.). Также предполагается, что он имеет достаточный интеллектуальный уровень развития и, насколько это возможно, объективно оценивает большинство этих факторов, связанных со здоровьем. Разработана программа, позволяющая вводить в компьютер все исходные данные в форме, удобной для их дальнейшей обработки.

Один из возможных списков переменных Х (использованных в данной работе) приведен ниже. Отметим, что все субъективные оценки состояний пациента (значения соответствующих переменных) здесь отображены натуральными числами, включая нуль, который везде интерпретировался как неизвестное значение Х. Далее, для Х9 - Х17, Х19, Х21, Х25 значение 1 интерпретируется как "нет", "не было", "без употребления". Значение 2 интерпретируется как "слабое", "незначительное"; 3 - "умеренное", "нормальное"; 4 - "значительное", "много", "большое" (для употребления соли); 5 - "большое", "на уровне стресса" (для Х12 - Х14), или как "большая доза".

Обозначения переменных: Х1 - значения счетчика записей; Х2 - квантили систолического давления. Здесь особо отметим, что за точку разбиения, отделяющую "пониженное" давление от "повышенного" было принято среднеарифметическое между минимальным и максимальным систолическими давлениями для всего массива зарегистрированных давлений. Таким образом, интерпретировать получаемые далее выводы следует относительно именно данного исследуемого пациента: какие именно "синдромы" необходимы для вывода пациента из его среднего состояния (для систолического давления, равного 153 мм рт. ст.). Далее, Х3 - квартили систолического давления; Х4 - среднее за день значение систолического давления; Х5, Х6, Х7 - то же аналогично для диастолического давления; Х8 - средний за день пульс; Х9, Х10, Х11 - физическая нагрузка утром, днем, вечером, соответственно; Х12, Х13, Х14 - психическая нагрузка утром, днем, вечером, соответственно; Х15, Х16, Х17 - эмоциональное состояние утром, днем, вечером, соответственно; Х18 - величины перепада за сутки атмосферного давления в мм ртутного столба; Х19 - употребление соли в пищу; Х20 - время, проведенное на свежем воздухе, (1 - 0 ч, 2 - до 1 ч, 3 - (1 - 2 ч), 4 - (2 - 3 ч), 5 - (3 - 4 ч), 6 - (4 - 5 ч), 7 - (5 - 6 ч), 8 - (6 - 7 ч), 9 - равно или более 7 ч); Х21 - суточное употребление спиртных напитков; Х22 - суточная транспортная нагрузка в часах, интерпретация та же, что и для Х20; Х23 - наличие магнитной бури, 1 - "была", 2 - "не была"; Х24 - курение; Х25 - усталость/утомляемость; Х26 - головная боль, здесь значение 3 интерпретируется как "сильная"; Х27 - Х29 - переносимые заболевания в кодах МКБ-10, 1 - коды от К59 до К59; Х2 - коды от J00 до J00; Х3 - код для G51; Х30 - Х36 - принимаемые лекарственные средства: Х30 - энап, 10 мг, 3 раза в день; Х31 - моноприл, 1 раз утром; Х32 - гипотиазид, 25 мг, 3 раза в день; Х33 - феназипам, 0,001 г, 0,5 таблетки 3 раза в день; Х34 - аспирин, 0,5 таблетки на ночь (во всех случаях значение 2 интерпретировалось как "принималось"); Х37 - превышение диастолического давления над систолическим в процентах; Х38 - квантили превышения диастолического давления над систолическим.

Интерпретация и обсуждение полученных моделей. Рассмотрим выводы из данных, полученных за 143 дня самонаблюдений одного пациента. Этот набор кратких выводов К (импликаций, частичных моделей) отображает зависимость уровня его гипертензии от некоторых существенных входных переменных. Напомним, что общая модель может быть записана как перечисление этих выводов, объединенных логическими связками "или", с общим символом импликации ("если, то...") и ее значением в записи справа. Ошибка выводов (в смысле сравнения с генератором случая) здесь вычисляется как сумма единичных оценок соответствующих выводов, отнесенных к общему числу строк. Она равна около 5% для общей модели (прямой и обратной). Следует еще заметить, что обсуждаемые далее модели выбраны путем пробных расчетов из некоторого их числа, различающихся удалением некоторых переменных, которые вели к получению слишком тривиальных выводов с наибольшими оценками. Импликации (выводы) для целевой модели далее приводятся в порядке уменьшения их оценок (числа ситуаций-строк, соответствующих выводу). Сразу же отметим, что в случае данного исследования "память" модели (выводов) здесь ограничена информацией, подаваемой на вход программы в виде строки или состояния пациента лишь за текущие сутки. Весьма вероятно, что его состояние зависит и от предыдущих суток, в этом случае на вход программы следовало бы подавать уже некоторую "предысторию" пациента.

Содержательную (смысловую) интерпретацию выводов будем проводить следующим образом (желательно всегда начинать с целевой модели). Представим, что в нашем распоряжении имеется некоторая информационно-поисковая ("мажорирующая") система с ограниченными ресурсами, как по количеству накопленных данных ("содержательных выводов"), так и по времени ее использования. Эта система будет производить "перевод" упорядоченных по оценкам (в порядке их уменьшения) формальных выводов К на язык содержательных выводов. Будем далее для простоты записей вместо обозначений К_i из его упорядоченного списка (по оценкам К) писать лишь натуральные числа 1, 2, ..., соответствующие индексам для целевых К, или числа 1*, 2*, ... - для не целевых (обратных) К*. После интерпретации каждого целевого К будем искать такой не целевой К*, который ближе всего подходил бы по наличию и значениям соответствующих переменных в целевом К, и затем интерпретировать его (или интерпретировать совместно К и К* после нахождения К*, "метод раскачивания объекта"). В том случае, если наша поисковая система отказывается интерпретировать К или К*, будем записывать знак "?". Обычно в этом случае необходимо более подробное знакомство с состоянием пациента (введение новых переменных), или необходимо ввести контекст данного вывода (интервалов значений всех других переменных, соответствующих множеству состояний, которые обобщаются выводом). Будем характеризовать суммой таких отказов качество (ошибку) всей работы, как моделирования (при заданном "словаре" и "синтаксисе" в конкретном исследовании), так и возможности интерпретации используемой системой. Поскольку формальная содержательная система интерпретации по крайней мере в данной области исследования еще не создана, будем пока под этой системой подразумевать самого исследователя и его консультантов, использующих для интерпретации любые априорные (библиотечные) сведения. Напомним также, что ошибка, рассчитываемая по сумме единичных оценок соответствующих импликаций, характеризует лишь возможную максимальную ошибку распознавания целевой функции очередной новой строки-ситуации. Заметим, что первая, наиболее часто встречающаяся импликация (по крайней мере для целевой, т. е. прямой модели) обычно всегда содержательно интерпретируема за счет отбрасывания в начале процесса моделирования тех столбцов переменных в исходном массиве данных, которые приводят к не интерпретируемой или тривиальной по смыслу первой целевой импликации.

Напомним, что выводы 1, 2, ... соответствуют уменьшению артериальной систолической гипертензии (менее 153 мм ртутного столба для данного исследуемого пациента), а выводы 1*, 2*, ... - ее увеличению (более или равной 153 мм рт. столба). Далее для краткости будем обозначать целевую модель как М, а не целевую - как М*. Запишем вначале целевые формальные выводы К для М:

1. (1< X32 <= 3), (этот вывод покрывает 19,6% всех целевых состояний). 2. (X27 = 2) & (X30 =1), (покрытие равно 13,7%). 3. (X33 = 2), (11,8%). 4. (X9 = 2), (11,8%). 5. (X10 = 2) & (X26=1), (9,8%). 6. (X11 = 4), (9,8%). 7. (X25 = 1), (9,8%). 8. (X14 = 1) & (- 4< X18 < -1) & (X22 = 2), (7,8%). 9. (X14 = 1) & (X18 = -1) & (X13 = 2), (7,8%). 10. (5< X18 < 9) & (0 = Запишем формальные не целевые выводы К* для М*:

1*. (X13 = 4) & (-2< X18 < 6), (покрывает 17,4% всех не целевых состояний). 2*.(3< X14 <= 5), (16,3%). 3*. (0< X27 <= 2) & (1< X30 <= 3), (14,1%). 4*.(X14 = 3) & (X13 = 3), (12,0%). 5*.(X27 = 3), (11,9%). 6*.(X13 = 3) & (X22 = 3) & (1= Запишем теперь содержательные интерпретации формальных выводов для соответствующих пар (К, К*); хорошо известные интерпретации не приводятся. Наблюдается уменьшение гипертензии в следующих ситуациях для К или ее повышение для К*:

1. "После приема 2 - 3 таблеток гипотиазида (в сутки, у пациента возможна гиперосмотическая форма гипертензии"). 6*. "После нормальной психической нагрузки днем и транспортной нагрузке 1 - 2 часа и приеме 1 - 2 таб. гипотиазида (эта доза гипотиазида мала".

2. "При остром назофарингите и отсутствии приема энапа. Возможно, на некоторых стадиях развития назофарингита гиперемия слизистых оболочек частично связана с понижением ранее наблюдавшегося общего давления (и также в некоторых областях головного мозга). Пациент, измеряя свое давление, в таких ситуациях принимал решение не принимать гипотензивное средство (энап). Так, на выходе вычислений появляется конъюнкция (взаимодействие) наличия назофарингита и отсутствие приема энапа". 3*. "При функциональной диарее или неврогенной возбудимости кишечника и при приеме энапа (здесь можно высказать гипотезу о плохом всасывании этого препарата в ситуациях 3*)".

3. "После приема феназипана (улучшение сна)". 7*. "При перепаде атмосферного давления +3 мм рт. ст. и отсутствии приема феназипама (небольшие положительные перепады атм. давл. в этом случае вызывают повышение гипертензии)".

4. "После незначительной утренней физической нагрузки". 23*. "При перепаде атм. давл. -16... - 12 мм рт. ст. и отсутствии физической нагрузки утром (значительные отрицательные перепады атм. давл. ведут к ситуациям 23*, т. е. в тех случаях, когда нет утренней физической нагрузки повышается гипертензия").

5. "После незначительной дневной физической нагрузки и при отсутствии головной боли (эта боль может быть в некоторых случаях признаком гипертензии)". 23*, см. выше.

6. "После значительной физической нагрузки вечером (следует заметить полезность вообще физической нагрузки для данного пациента)". 23*, см. выше, ссылка на физическую нагрузку лишь в этом выводе.

7. "При отсутствии чувства утомляемости". 18*. "При нормальном эмоциональном состоянии утром и умеренной или значительной утомляемости (в течение дня)".

8. "При отсутствии психической нагрузки вечером и перепадах атмосферного давления от -3 до -2 мм рт. столба и суточной транспортной нагрузке менее 1 часа". Особо интересно выявление в данном исследовании с помощью АМКЛ некоторого частично экологического "оздоравливающего" синдрома. Он чаще всего наблюдался при взаимодействии незначительной психической нагрузки или при ее отсутствии и небольшого понижения атмосферного давления (не менее чем на -4 мм рт. ст.). По этому поводу можно высказать следующее предположение (см. также ссылку [48] на пониженное артериальное давление у жителей высокогорных областей). Так, считается, что гипервентиляция легких (аналог увеличенного потребления кислорода при его повышенном парциальном давлении) ведет к повышению чувствительности мозга к воздействию переменных магнитных полей и, возможно, к иным воздействиям. При этом происходит формирование застойной области в заднетеменном отделе правого полушария, увеличение синхронизации медленных ?-ритмов и возникновении там гиперсинхронных ?-подобных разрядов, активирующих эпилептическую систему мозга [23]. Если принять в качестве гипотезы, что наиболее экологически (социально) значимым (в смысле развития гипертензии) для данного пациента является психическая нагрузка, то дополнительная активация мозга при такой нагрузке при повышении парциального давления кислорода может способствовать увеличению гипертензии. Таким образом, выводы 8, 9 и 15, вероятно, отображают в модели обратную ситуацию: "синдром" небольшого понижения атмосферного давления и отсутствия психической нагрузки способствует уменьшению гипертензии пациента. При обзоре всех К и К* отметим еще, что в К чаще встречаются отрицательные перепады атм. давл., а в К* - чаще положительные (судя по % покрытия ситуаций отдельно для М и М*). 1*. "После значительной психической нагрузки днем и перепаде -1...+5 мм рт. ст. атм. давл.".

9. "При отсутствии психической нагрузки вечером и перепаде атмосферного давления -1 мм рт. столба и незначительной психической нагрузке днем (см. 8)". 2*. "После значительной или на уровне стресса психической нагрузке вечером".

10. "При перепадах атмосферного давления от +6 до +8 мм рт. столба и функциональном кишечном нарушении (?)". 3*. "При функциональной диарее или неврогенной возбудимости кишечника и при приеме энапа (как уже отмечалось выше, в этих ситуациях возможно ухудшение всасывания энапа)".

11. "При незначительном или умеренном эмоциональном состоянии утром и незначительной психической нагрузке днем и приеме энапа". 14*. "При приеме энапа и отсутствии или небольшой психической нагрузке утром (незначительное влияние энапа в данных ситуациях)".

12. "При пребывании 1 - 2 часа на свежем воздухе и при отсутствии приема энапа (здесь возможно сознательное исключение пациентом приема энапа, когда была прогулка на свежем воздухе)". 29*. "При 1 - 2 часах, проведенных на свежем воздухе и незначительной или умеренной психической нагрузке утром".

13. "При перепадах атмосферного давления от -7 до - 5 мм рт. столба и при умеренной психической нагрузке вечером". 11*. "При умеренной психической нагрузке вечером и перепаде атм. давл. -4...-2 мм. рт. ст. (в этих ситуациях, по-видимому, нужен больший перепад атм. давл. для уменьшения гипертензии".

14. "При 1 - 2 часах транспортной нагрузки, перепадах атмосферного давления от - 11 до - 7 мм рт. столба и при отсутствии или наличии функциональных кишечных нарушений". 23*. "При перепаде атм. давл. -16...-12 мм рт. ст. и отсутствии физической нагрузки утром (в этих ситуациях для снижения гипертензии, возможно, нужен меньший перепад атм. давл. в сходных условиях)".

15. "При перепаде атмосферного давления -2 мм рт. столба и незначительной усталости". 17*. "При перепаде атм. давл. -2 мм рт. ст. и незначительном употреблении соли в пище".

16. "При перепадах атмосферного давления от -9 до +1 мм рт. столба и нормальном эмоциональном настроении утром". 13*. "При перепаде атм. давл. -7...- 4 мм рт. ст. и психическая нагрузка вечером отсутствует или слабая" и 22*. "При перепаде атм. давл. -10...-9 мм рт. ст.. Для понижения гипертензии, возможно, большое значение имеет нормальное эмоциональное состояние. При этом перепад атм. давл. в отрицательную сторону может иметь большой разброс (т. е. как бы повышается устойчивость состояния организма при снижении гипертензии к таким перепадам атм. давл.)".

17. "При перепадах атмосферного давления от -10 до -5 мм рт. столба и отсутствии психической нагрузки утром". 22*. "При перепаде атм. давл. -10...-9 мм рт. ст. (в этих ситуациях также видна лучшая адаптация организма к перепадам атм. давл. при уменьшении гипертензии)".

18. "При нормальном употреблении соли в пищу". 17*. "При перепаде атм. давл. -2 мм рт. ст. и незначительном употреблении соли в пище (?)".

19. "При перепадах атмосферного давления от -9 до -8 мм рт. столба и отсутствии приема моноприла (взаимодействие понижения атмосферного давления с отсутствием приема моноприла можно объяснить существовавшей обратной связью: поскольку измерение показывает уменьшение гипертензии, лечащий препарат пациентом не применялся)". 22*. "При перепаде атм. давл. -10...-9 мм рт. ст. (?)".

20. "При отсутствии приемов энапа и моноприла и незначительной или нормальной психической нагрузке днем (возможно, в этих ситуациях наибольшее значение имеет незначительная или нормальная психическая нагрузка)". 27*: "При незначительном эмоциональном состоянии днем и при отсутствии приемов феназипама, моноприла и энапа (возможное увеличение гипертензии здесь - из-за отсутствия приема феназипама и ухудшения сна)".

4*. "После нормальной психической нагрузки вечером и днем".

5*. "При обострении мегаколона".

8*. "При отсутствии времени, проведенного на свежем воздухе, и при наличии магнитной бури".

9*. "При перепаде атм. давл. +5 мм рт. ст.".

10*. "При перепаде атм. давл. +8...+10 мм рт. ст. и отсутствии или незначительном употреблении гипотиазида".

12*. "При перепаде атм. давл. +2...+5 мм рт. ст. и нормальной психической нагрузке днем".

15*. "При значительной психической нагрузке утром".

16*. "При перепаде атм. давл. -4 мм рт. ст. (?)".

19*. "При слабой психической нагрузке утром и отсутствии транспортной нагрузки (вероятно, наибольшее значение в увеличении гипертензии для пациента имеет наличие психической нагрузки)".

20*. "При перепаде атм. давл. -2...0 мм рт. ст. и наличии магнитной бури".

21*. "При перепаде атм. давл. +2...+11 мм рт. ст. и нормальном эмоциональном состоянии вечером".

24*. "При повышенном эмоциональном состоянии днем".

25*. "При незначительной психической нагрузке утром и перепаде атм. давл. +4 мм рт. ст. ".

26*. " При отсутствии перепада атм. давл. и умеренной утомляемости".

28*. "При умеренной психической нагрузке днем и перепаде атм. давл. +1...+3 мм рт. ст. и незначительной утомляемости.

Проценты покрытия числа ситуаций из Х, вычисленные порознь для М и М*, т. е. только для своих целевых или (для М*) не целевых ситуаций, были приведены ранее в этих моделях.

Прежде всего, рассматривая формальные модели, приведем один структурный вывод: М* соответствует большее разнообразие К*, чем К для М. Можно сказать, что М* характеризуется большей энтропией выводов. Существует большее число причин К* данной патологии, чем число ситуаций К, которые способствуют ее уменьшению.

Как видно из приведенных выше содержательных моделей, отказ нашей интерпретационной "системы" наблюдался примерно для 6% целевых строк и для 10% не целевых (отказ от интерпретации в среднем в 8 % случаях), причем наблюдается больше отказов для объяснения более "энтропийных" (не целевых) состояний. Заметим, что большинство интерпретаций здесь имеют характер относительной (правдоподобной) истинности. Так, иногда специально помечалось, что подобные выводы истинны по крайней мере для зарегистрированных ситуаций, входящих в К или в К*. Использование контекста выводов и/или увеличение используемого словаря (числа переменных), уточнение семантики исследования в дальнейшем должно облегчить исследователям уточнение этих выделенных ситуаций, при которых следует использовать вышеприведенные интерпретации.

Логико-математический анализ данных пациента по его слежению (мониторингу) за влиянием некоторых экологических и иных факторов (образа жизни) на артериальную гипертензию вполне может быть использован врачом для получения более обоснованного диагноза и назначения адекватного лечения по сравнению с использованием обычного разового опроса пациентов. При дальнейшей компьютеризации деятельности практического врача подобные массивы следует расширять за счет включения в него данных, реализуемых с помощью, например, аналитических приборов в условиях постоянного диспансерного наблюдения, или, возможно, (для некоторых простых аналитических методик или приборов) в домашних условиях. При создании мониторинга на уровне лечебно-профилактического учреждения помимо данных самонаблюдения пациентов желательно также по возможности использовать уже существующую статистическую документацию.

2.4. Логическая модель выживания или смерти от инсульта в течение 28 дней после начала приступа в 2002 - 2003 годах по Тульской области.

Вычисление модели по данным регистра инсульта. Для вычисления моделей использованы данные по 197 больным, из которых 54 умерли в течение 28 дней после начала приступа. Данные по всем больным были упорядочены по времени их госпитализации. В качестве исходных переменных взяты те, которые присутствуют в регистре инсульта (кроме некоторых, которые явно несущественны для данного исследования). Включены также данные по неврологическому статусу. Значения Х в основном отображались в виде значений k-значной логики 0, 1, 2, ... (k - 1). В данном исследовании значение 0 использовалось в основном для кодирования данных, которые не помечались лечащим врачом при заполнении регистра инсульта. Следует заметить, что таких незаполненных строк в предоставленных данных было очень много. Поскольку эта ситуация характерна при обработке требуемых форм при медицинских и демографических исследованиях, следует в дальнейшем уделить этой социальной проблеме особое внимание. Получается, что при существующем положении дел, врач, заполняющий формы, практически в таких случаях выдает сообщение "не известно", хотя при более внимательном подходе соответствующая информация у него обычно имеется. В связи с этим еще заметим, что полученные выводы в данной работе отображают не только сами по себе синдромы выживания или смерти от инсульта, но и их зависимость от условий сбора, регистрации и кодирования информации участниками данного обследования, имеющих определенную квалификацию и целевые установки. Другими словами, модель в неявном виде отображает также и существовавшие социальные условия при всем процессе создания модели, что необходимо учесть в будущем при организации более детальных подобных исследований в области медицины и демографии.

Вычисление моделей (целевой и не целевой) производились следующим образом. Вначале модели (каждая отдельно) вычислялись по всем переменным, затем рассматривались К с наибольшими оценками и оценивалась их семантика по отношению к заданной цели исследования Х45 = 1 для выживших (или 2 для умерших). Если хотя бы одна из переменных Х в К не имела явного отношения к патогенезу инсульта, то она удалялась из исходного массива Х данных (соответственно, только для целевой или не целевой модели), далее производился последующий расчет и т. д. Аналогичным образом для последующих вычислений производилось удаление несущественных с точки зрения смысла исследования столбцов Х для К, которые меньше по своей значимости (оценке). Подобный путь "очистки" семантики моделей необходим потому, что К с большими оценками сильно влияют на выявление алгоритмом последующих К.

Сразу же отметим, что по отношению к умершим от инсульта чаще встречаются переменные, значения которых соответствуют семантике "не известно". Максимальная ошибка, т. е. относительная доля К с единичными оценками, для представленных ниже двух моделей (целевой и не целевой, их надо всегда рассматривать совместно) около 1%. Для компактности записи приведем окончательные, выверенные по своей семантике две модели в булевом виде относительно заданной цели - выживание в течение 28 дней. Для не целевой части общей модели все К для умерших от инсульта заключены в фигурные скобки и впереди поставлен знак логического отрицания. Для удобства интерпретации модели условимся перед каждым К писать его номер жирным шрифтом (для не целевой части модели этот номер будет со звездочкой *); будем записывать также частоту встречаемости каждого К во всем исходном массиве.

Модель имеет частично экологический характер: некоторые выводы содержат указание на место жительства, курение и потребление алкоголя. Целевая (начальная) часть модели соответствует перечню через логические связки "или" признаков ("синдромов") для пациентов, переживших срок 28 дней, далее после знака отрицания и скобки следует список для умерших в этот период:

1) 0,239(0< X193 <=15) ? 2) 0,147(4< X192 < 12) ? 3) 0,122(28< X1<=36) ? 4) 0,117(15< X1< 19) ? 5) 0,101(3< X170 <= 7) ? 6) 0,091(X170 =1) & (0< X159 <= 3) ? 7) 0,086(2< X168 < 5) & (1=8) 0,081(X53 =1) & (1< X1 < 11) ? 9) 0,071(X168 =2) & (1=10) 0,061(19< X1 < 27) ? 11) 0,061(1< X1 < 14) & (X168 = 1) ? 12) 0,056 (X59 =3) & (15< X1<=19) ? 13) 0,046(X77 =1) & (X171 = 1) ? 14) 0,046(X54 =3) & (X93 =1) ? 15) 0,041(4< X195< 12) ? 16) 0,041(X87 < 2003) ? 17) 0,041(1< X171<= 4) & (1=18) 0,025(X169 = 2) & (0< X170 < 3) ? 19) 0,025(X54 = 2)&(14< X1< 27)&(X170 = 3) ? 20) 0,015(X63<=95) ? 21) 0,015(1< X80 < 4) ? 22) 0,015(X171 = 1) & (X170 = 2) & (X59 = 2) & (X54 = 4) ? 23) 0,010(X157 = 2) & (X59 = 2) ?

? { 1)*0,086(X51 = 1) & (1< X99 <= 4) ? 2)*0,061(1< X167<= 4) & (13< X1 < 16) ? 3)* 0,059(13< X189 <=15) ? 4)*0,046 (X52 = 5) & (2< X102 <= 4) ? 5)*0,046(12< X188 <=15) ? 6)*0,035(X89 = 2) ? 7)*0,030(2< X79 <= 4) & (1< X52 <= 5) ? 8)*0,030(X166 = 3) & (0 <= X193 < 12) ? 9)*0,025(X175 = 3) ? 10)*0,020(52< X5 < 57) & (X97 = 5) ? 11)*0,020(1< X154 < 8) & (12< X180 <=15) ?

12)*0,015(X5 = 75) & (14 <= X1 < 19) ? 13)*0,015(69< X5 < 73) & (1< X155 <= 5) ?

14)*0,015(77< X5 < 80) & (1< X102 <= 4) ? 15)* 0,010(1< X167<= 4) & (115 < X90 < 130) ?

16)*0,010(6< X91 < 70) ? 17)*0,010(2< X51<= 5) ? 8)* 0,005(36< X5 < 39) ?

19)*0,005(X1 = 11) & (2< X98 <= 6)} ? Х45 = 1.

Для краткости изложения семантика значений Х в этой модели приводится далее при интерпретации К последовательно по мере записи Х (слева направо) в соответствующих К; в начале - для целевой части модели, затем для не целевой. Единственно, приведем здесь лишь таблицу кодирования семантики для Х180 - Х195, поскольку при их интерпретации (опять таки для краткости) обычно приводились выражения, обобщающие сразу несколько значений кода Х). При необходимости, более детальную (но и более громоздкую) интерпретацию можно получить, сравнивая нижеприведенный перебор всех значений состояний конечностей в записи неврологического статуса (кодов) для соответствующих больных (номера этих больных приводятся при каждом К в исходных моделях, однако, для краткости изложения они здесь не приводятся):

Код 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Справа рука 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1

нога 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1

Слева рука 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1

нога 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1

В регистре инсульта (неврологического статуса) неотмеченным значениям этих переменных соответствует 0 ("нет нарушений"), помеченным любым символам соответствует 1 ("есть нарушения").

Интерпретация и обсуждение выводов из модели. Содержательную (смысловую) интерпретацию будем проводить следующим образом. Представим, что в нашем распоряжении имеется некоторая информационно-поисковая ("мажорирующая") система с ограниченными ресурсами, как по количеству накопленных данных ("содержательных выводов"), так и по времени ее использования. Эта система будет производить "перевод" упорядоченных по оценкам (в порядке их уменьшения) формальных выводов К на язык содержательных выводов.. После интерпретации каждого целевого К сразу же будем искать такой не целевой К*, который ближе всего подходил бы по наличию и значениям соответствующих переменных в целевом К, и лишь затем интерпретировать их совместно ("метод раскачивания объекта"). Напомним также, что ошибка, рассчитываемая по сумме единичных оценок соответствующих импликаций, характеризует лишь возможную максимальную ошибку распознавания целевой функции очередной новой строки-ситуации. Она равна в данном исследовании около 1% для общей модели (прямой и обратной). Следует еще заметить, что обсуждаемая далее модель выбрана путем пробных расчетов из некоторого их числа, различающихся удалением некоторых переменных, которые вели к получению или слишком тривиальных выводов, или выводов, каким-либо образом не связанных с патофизиологией инсульта. Следует отметить, что в К граничные значения Х (после или до знака неравенства < ) не принадлежат К; эти значения не подлежат интерпретации. Импликации (выводы) для целевой модели далее приводятся в порядке уменьшения их оценок (числа ситуаций-строк, соответствующих выводу). В том случае, если для какого-либо вывода не нашлось сходного с ним вывода по наличию соответствующих переменных из другого вида модели (для Х45 = 1 или для Х45 = 2), этот вывод интерпретировался отдельно:

1) 0,239(0< X193 <=15): если при пяточно-коленной пробе координаторные нарушения наблюдаются или для всех сочетаний конечностей слева и справа, или лишь в отдельных таких сочетаниях, то больной выживает (В) в течение 28 дней. Однако, 8)*0,030(X166 = 3) & (0 <= X193 < 12): если фотореакция слева отсутствует и при пяточно-коленной пробе наблюдается или отсутствие всех координаторных нарушений, или наличие лишь некоторых нарушений порознь, то больной не выживает в течение 28 дней (смерть (С) больного). Далее будем эти стандартные выражения приводить в сокращенном виде. Сравнивая выводы 1) и 8)*, можно отметить решающее влияние отсутствия фотореакции на вывод о С больного.

2) 0,147(4< X192 < 12): если при пальце-носовой пробе существуют любые сочетания (порознь) наличия или отсутствия координаторных нарушений, то В. Этот признак лучше интерпретировать как существование самой возможности у таких больных проведения данной пробы.

3) 0,122(28< X1<=36) ? 4) 0,117(15< X1< 19) ? 10) 0,061(19< X1 < 27): если больные проживали в Узловой, Щекино, Алексине, Бородино, Липках, Марьино, Романцевском, Центральном, Киреевске, Октябрьском, Суворове, Суворовском, Ясногорском районах, курорте "Краинка", Ефремове, Ефремовском, Каменском районах, Северо-Задонске, то В. Однако, 2)*0,061(1< X167 <= 4) & (13< X1 < 16) ? 12)*0,015(X5 = 75) & (14 <= X1 < 19) ? 19)*0,005(X1 = 11) & (2< X98 <= 6): если корнеальные рефлексы D или S, или DS снижены и больные проживали в Теплом или Туле; или если больным было по 75 лет и проживали они в Теплом, Туле, Узловой, Щекине, Алексине; или если больной проживал в Плавском районе и не наблюдалось выполнения двигательных заданий - ни полных, ни частичных, то С (во всех этих случаях). Следует обратить внимание на частое присутствие в целевой модели конъюнкций К ранга 1 (только одна переменная величина). Это признак слишком малого количества не целевых состояний (С); желательно набирать равное количество состояний В и С (если была бы возможность проведения активного эксперимента!)

5) 0,101(3< X170 <= 7): если наблюдается парез мимических мышц центральный справа и слева, периферический справа или слева, или справа и слева, то В.

6) 0,091(X170 =1) & (0< X159 <= 3): если лицо симметрично и наблюдаются произвольные движения глаз OD и горизонтально, и вертикально, и то и се, то В.

7) 0,086(2< X168 < 5) & (1=11)*0,020(1< X154 < 8) & (12< X180 <=15): если есть менингеальные симптомы, кроме ригидности + синдром Кернига (одновременно слева и справа) и наблюдается парез или во всех сочетаниях или лишь справа и также дополнительно в левой руке или в левой ноге, то С.

8) 0,081(X53 =1) & (1< X1 < 11): если больной не злоупотребляет алкоголем и его место жительства Бибиково, Майский, Кимовск, Костомарово, Советск, Первомайский, Иншинский, Головеньковский, Плавск, то В. Однако, см. интерпретации 2)*, 12)*, 19)*, которым соответствует С; они приведены при интерпретации 3).

9) 0,071(X168 =2) & (1= 11) 0,061(1< X1 < 14) & (X168 = 1): если место жительства больного Бибиково, Майский, Кимовск, Костомарово, Советск, Первомайский, Иншинский, Головеньковский, Плавск, Плавский р-н, Киреевский р-н, Болохово и чувствительность лица сохранена, то В. Однако, см. интерпретации 2)*, 12)*, 19)*, которым соответствует С; они приведены при интерпретации 3).

12) 0,056 (X59 =3) & (15< X1<=19): если больные последние 3 месяца постоянно проходили лечение артериальной гипертензии АГ и их место жительства Узловая, Щекино, Алексин, Новомосковск, то В. Однако, см. интерпретации 2)*, 12)*, 19)*, которым соответствует С; они приведены при интерпретации 3).

13) 0,046(X77 =1) & (X171 = 1): если транзиторные ишемические атаки (ТИА) отмечались однократно и слух сохранен, то В.

14)0,046(X54=3)& (X93 =1): если психо-эмоциональное напряжение выраженное и больной принимал гипотензивные средства, то В.

15) 0,041(4< X195< 12): если координаторные нарушения (проба на координацию, адиадохокинез) имеют место для разных сочетаний конечностей, кроме всех вместе, то В.

16) 0,041(X87 < 2003): если дата последнего инсульта была ранее 2003 года, то В. Наилучшая интерпретация этого вывода - больные, пережившие ранее инсульты, имеют больше шансов для выживания, чем больные, у которых инсульт наблюдается впервые (как бы сохранение прежней ситуации излечивающегося типа инсульта).

17) 0,041(1< X171<= 4) & (1= 18) 0,025(X169 = 2) & (0< X170 < 3): если глазные щели асимметричные, D > S и лицо или симметрично или наблюдается парез мимических мышц центральный справа, то В.

19) 0,025(X54 = 2)&(14< X1< 27)&(X170 = 3): если психо-эмоциональное напряжение умеренное и место жительства Тула, Узловая, Щекино, Алексин, Новомосковск, Бородино, Липки, Марьино, Романцевский, Центральный, Киреевск, Октябрьский, и на лице наблюдается парез мимических мышц центральный слева, то В. Однако, см. интерпретации 2)*, 12)*, 19)*, которым соответствует С; они приведены при интерпретации 3).

20) 0,015(X63<=95): если дата первого инфаркта была в 1995 году или ранее, то В. Интерпретация этого вывода сходна с 16). Многие инсульты возникают, например, путем переноса склеротических сгустков по сосудам не только в сердечную мышцу, но и в головной мозг.

21) 0,015(1< X80 < 4): если в анамнезе наблюдался инсульт в вертебро-базиллярном бассейне, то В. Интерпретация этого вывода аналогична 16).

22) 0,015(X171 = 1) & (X170 = 2) & (X59 = 2) & (X54 = 4): если слух сохранен, на лице наблюдается парез мимических мышц центральный справа, последние 3 месяца производилось эпизодическое лечение посредством АГ и психо-эмоциональное напряжение неизвестно (можно принять его как умеренное), то В.

23) 0,010(X157 = 2) & (X59 = 2): если положение глаз в покое OD вправо, и последние 3 месяца производилось эпизодическое лечение посредством АГ, то В.

1)*0,086(X51 = 1) & (1< X99 <= 4): если имеется сопутствующая патология - гипертензия и нарушена сила мышц правой руки, то С.

2)*0,061(1< X167<= 4) & (13< X1 < 16): если корнеальные рефлексы снижены и больные проживали в Теплом или Туле, то С. Однако, см. интерпретации 3), 4) и 10).

3)*0,059(13< X189 <=15): если патологические рефлексы имеют место сразу для всех сочетаний конечностей или для всех, кроме левой ноги, то С.

4)*0,046 (X52 = 5) & (2< X102 <= 4): если неизвестно, курил больной или нет и нарушена сила мышц левой ноги: больной или не может поднять ногу, или нет никаких движений в ноге, то С.

5)*0,046(12< X188 <=15): если сухожильные рефлексы снижены для всех конечностей сразу или для всех, кроме левой руки или ноги, то С.

6)*0,035(X89 = 2): если динамика состояния отрицательная, то С.

7)*0,030(2< X79 <= 4) & (1< X52 <= 5): если возможен инсульт в каротидном бассейне и больной курил, то С.

8)* (см. интерпретации при 1)).

9)*0,025(X175 = 3): если наблюдается афагия, то С.

10)*0,020(52< X5 < 57) & (X97 = 5): если возраст больного 53 - 56 лет и наблюдается отсутствие речевого контакта на внешние раздражители, то С.

11)*0,020(1< X154 < 8) & (12< X180 <=15): если наблюдаются различные менингеальные симптомы кроме ригидности + синдром Кернига (оба) и парез или всех конечностей или парез, кроме левой руки или ноги, то С. Однако, 7) 0,086(2< X168 < 5) & (1= 12)* (см интерпретации при 3)).

13)*0,015(69< X5 < 73) & (1< X155 <= 5): если возраст больного 70 - 72 года и наблюдается гипоосмия или аносмия справа и слева, то С.

14)*0,015(77< X5 < 80) & (1< X102 <= 4): если возраст больного 78 - 79 лет и нарушена сила мышц левой ноги, то С.

15)* 0,010(1< X167<= 4) & (115 < X90 < 130): если корнеальные рефлексы снижены или повышены и АД систолическое в момент инсульта 116 - 129 мм рт. ст., то С.

16)*0,010(6< X91 < 70): если АД диастолическое в момент инсульта 7 - 69 мм рт. ст., то С.

17)*0,010(2< X51<= 5): если у больного наблюдался сахарный диабет, ревматизм или прочие сопутствующие патологии, то С.

18)* 0,005(36< X5 < 39): если больному 37 - 38 лет, то С. Однако, см. интерпретации 16), 20), 21).

19)*0,005(X1 = 11) & (2< X98 <= 6): если больной проживал в Плавском районе и наблюдаются нарушения двигательных реакций, то С. Однако, см. интерпретации при 3), 4), 10).

Заключение. При обзоре всех выводов по модели инсульта, прежде всего, чувствуется их согласованность в общем с нашим априорным знанием патофизиологии инсультов (и даже иногда, возможно, и с их экологическими причинами); во всяком случае здесь не видно явного противоречия с уже известными сведениями. Несколько удивляет краткость (малый ранг К) многих выводов. Однако отметим, что в реальности, для некоторых больных некоторые К пересекаются, т. е. присутствуют одновременно, в этом случае ранг К (т. е. сложность вывода) может заметно возрасти, но при этом частота существования подобных "склеенных" К заметно уменьшается - такие выводы становятся редкими, что на первом этапе исследования обычно не желательно. Другой, более перспективный путь усложнения или, лучше сказать, уточнения выводов - это использование его контекста (интервалов значений некоторых переменных, не вошедших в К для тех строк массива, которые покрывает именно данная К, эти интервалы присоединяются к К посредством логической связки "и", при этом ранг исходной К увеличивается). Этот подход обычно следует применять при сравнениях К с подобными априорными выводами, которые отличаются от К, например, дополнительными сведениями, которые отображаются некоторыми Х из модели. Ввиду значительного увеличения объема работы этот подход мы оставили на будущее.

Самое главное, надо иметь ввиду, что выполненная работа имеет в основном предварительный характер, и наша цель состояла скорее в том, чтобы определить, возможно ли вообще получать полезную информацию при обработке сравнительно малого массива данных в достаточно неопределенных условиях сбора, способов регистрации и кодирования информации. Несомненно, накопление значительно больших массивов, как по числу больных, так и, главное, по числу переменных, доступных для регистрации лечащему врачу, лучшей социальной организации его работы с точки зрения отображения и быстрой передачи всей доступной информации для последующего этапа вычислений, позволит в будущем оперативно не только прогнозировать дальнейший ход болезни, как в данном случае, но и получать новые интересные качественные выводы для лучшего понимания патофизиологии различных заболеваний.

2.5. Логические модели смертности от заболеваний органов дыхания, сопутствующих заболеваний и демографического статуса населения Тульской области, проживавшего в местности, пораженной радиоактивностью, в результате аварии на Чернобыльской АЭС.

Отметим здесь особенности вычисления АМКЛ в случае так называемых "редких" множеств целевых состояний. Предположим, что массив данных содержит сотню целевых и несколько тысяч не целевых состояний (например, контрольных измерений). В этом случае стандартное решение приводит к целевой АМКЛ, в которой почти все К встречаются по одному разу (т. е. с минимальной оценкой) и ранги (число переменных в таких К) обычно велики, что влечет большие трудности при интерпретации целевых К. Этого и следовало бы ожидать: при весьма большом числе не целевых состояний почти всегда найдется состояние, сходное с целевым, и для "отделения" целевого состояния от не целевых программа увеличивает ранг К. Более того, пространства целевых и не целевых строк часто оказываются в этом случае неотделимыми, наблюдается большое число полных совпадений этих состояний объекта. Наилучший выход из этого положения заключается в подборе заведомо приемлемого (по скорости счета, по рангу вычисляемых импликаций, т. е. по практически приемлемой сложности для дальнейшей интерпретации) числа строк "контролей" из ближайших не целевых состояний и отбрасывания остальных. В общем же случае желательно решение задачи минимизации числа К в АМКЛ (минимизации числа "или" - т. е. в данном случае задача минимизации энтропии АМКЛ за счет подбора требуемого для этого числа "контролей".

Следует иметь в виду, что основная цель вычисления логических моделей заключается в поиске их семантики, которая с точки зрения исследователя каким-то образом согласовывалась бы с уже известными данными или была бы интересна с какой-либо иной точки зрения. Такое согласование могло бы быть достигнуто после специального обзора литературных или иных данных, например, после использования информационной поисковой системы. Естественно, что этот поиск облегчается при малом ранге К. Другими словами, цель логического моделирования заключается в наилучшем согласовании информационных каналов субъекта (исследователя, библиотечных данных, когда ранг имеющихся выводов К обычно мал) и объекта, для которого (в принципе) ранг К большой. Напомним, что логические модели на используемых массивах всегда истинны по построению ("точны") даже в случае единичных оценок К при отделимости исследуемых пространств.

При обработке массива данных использовались свидетельства о смерти для 7261 умерших по Тульской области за 2000 - 2003 годы по 36 переменным: помимо переменных, отображающих демографический статус, были введены переменные, соответствующие перечню трехзначных рубрик всех болезней по МКБ-10, кроме болезней органов дыхания, и все подрубрики болезней органов дыхания. При пробных вычислениях выявилась большой трудоемкость выделения ближайших "контрольных" строк для каждой целевой строки и большая длительность вычисления АМКЛ на применяемых типах компьютеров (РС Pentium) для непораженной местности, где проживали более 97% умерших. По всем этим причинам было решено ограничиться вычислением по всему массиву лишь модели причин смерти жителей, проживавших в местности, пораженной радиоактивностью. Была также и методическая причина: выяснить влияние на модель учета всего большого множества "контролей", когда "скрытые" переменные могли сильно меняться в различных направлениях в течение трех лет. При подготовке данных из исходного массива было удалено примерно 5% совпадающих строк, у которых при заданном кодировании значения Z = 1 (местность поражена радиоактивностью) или равна 2 (местность чистая) были разными. Это явление оценивалось, прежде всего, как недостаток числа переменных в использованных свидетельствах о смерти, которые бы отображали более детально болезни, приведшие в итоге к смерти в зависимости от поражения местности; или как ошибка записи, или, во всяком случае, как ошибка будущей модели. Далее, все строки массива были упорядочены по дате смерти. Для вычислений использовался массив из 6916 строк и 33 переменным (были удалены столбцы, отображающие N строк, место смерти и дату смерти). Всего в пораженной местности за эти 3 года умерло 197 человек (соответствует общему числу целевых состояний или строк).

Следует заметить, что в итоге вычисленная модель отличается большим разнообразием причин смерти в пораженной местности. Так, АМКЛ для 197 умерших состояла из 124 К, которые в основном имели единичные оценки. Обычно предполагается использование АМКЛ не только для интерпретации полученных выводов, но и также для мониторинга (точнее, для отслеживания динамики исследуемого объекта и последующего "подновления" и уточнения модели на каждом шаге в случае, например, отказа от распознавания). Так, в вычисленной модели максимальная величина отказа от распознавания причины смерти для 197-го умершего (если ему соответствует К с единичной оценкой) при обучении на выборке из 6915 умерших, из которых 196 проживали в пораженной зоне, определялась с р примерно равной 0,44. Этот случай наблюдался бы, если новая предъявляемая ситуация не содержала бы ни одного из всего большого множества К, вычисленных ранее с единичными оценками. Однако, при подобной операции "вычеркивания" в старом массиве и опознания строки, которой ранее соответствовала бы К с оценкой большей, чем единица, эта строка всегда распознается точно за счет строки, которая генерирует в АМКЛ ту же самую К. Конечно, в этом мысленном эксперименте мы полагаем, что исходный массив достаточно велик для того, чтобы удаление одной его строки заметно бы повлияло на качественный состав списка К в такой АМКЛ.

В приведенной ниже записи моделей после исходного номера К приведена частота встречаемости К в использованном массиве данных, умноженная на 10⁴. В этой записи отсутствуют те К, которые либо не содержали Х, соответствующих болезням органов дыхания, либо были Х, значения которых указывали на отсутствие этих болезней. Также для краткости записи (и интерпретации) не приводятся К, которым соответствовали единичные оценки. Согласно теории систем, такие состояния исследуемой системы предельно неустойчивы (согласно алгоритму АМКЛ оценок, меньше единицы, быть не может). Следует, однако, заметить, что даже такие выводы всегда истинны в данном массиве и их интерпретация может содержать элементы новизны (они являются как бы генератором "правдоподобных" гипотез).

Логические модели смертности от болезней органов дыхания, сопутствующих заболеваний и демографического статуса:

1) 19(69 2) 16(69 3) 14(50 4) 13(61 5) 10(X31=1) & (61 6) 9(66 7) 9(56 8) 4(64 9) 4(53 10) 4(78 11) 3(X32=4) & (X35=66) & (X21=1) ?

12) 3(1= 13) 3(X35<79) & (X33=4) & (X16=1) & (X31=1) ?

14) 3(54 15) 3(73 16) 3(64 где Х2 - цель исследования (1- проживание в пораженной радиоактивностью местности, 2- в непораженной местности; Х3 - некоторые инфекционные и паразитарные болезни; Х4 - злокачественные новообразования; Х5 - болезни крови, кроветворных органов и отдельные нарушения, вовлекающие иммунный механизм; Х11 - болезни кровообращения; Х13 - грипп и пневмония;

Х16 - хронические болезни нижних дыхательных путей; Х18 - другие респираторные болезни, поражение интерстициальной ткани; Х21 - другие болезни органов дыхания; Х22 - болезни органов пищеварения; Х31 - пол (1 - мужской, 2 - женский); Х32 - семейное положение (1 - состоял в браке, 2 - никогда не состоял в браке, 3 - вдов(а), разведен(а), 5 - неизвестно); Х33 - 1 - высшее, 2 - неоконченное высшее, 3 - среднее специальное, 4 - среднее общее, 5 - неполное среднее, 6 - начальное и ниже, 7 - неизвестно; Х35 - возраст в годах.

Интерпретация моделей. Семантическая интерпретация вышеприведенных моделей производилась в порядке записи переменных в К. Все эти импликации можно рассматривать как выявление некоторых новых сложных неизвестных "синдромов", приводящих в итоге к смерти в пораженной радиоактивностью местности. Первый вывод рассмотрим более детально, остальные по мере возможности более кратко.

1) 19(69-4 (по отношению ко всей области) чаще всего причиной смерти в пораженной местности является следующий сложный демографический и медицинский "синдром": возраст умерших Х35 68 - 75 лет (включительно), неполное среднее (5) или начальное и ниже (6) образование Х33, семейное положение Х32 - в браке состоял (1) или никогда не состоял (2), хроническая болезнь нижних дыхательных путей (ХБНДП), Х16. Итак, сочетание старческого возраста, низкого образования, возможное отсутствие ухода в семье и возможное поражение легких радиоактивной пылью (аэрозолями) приводило к смерти эту группу людей.

2) 16(69-4 причиной смерти является следующий "синдром": возраст умерших 68 - 80 лет, образование среднее специальное или общее (3 или 4), ХБНДП, отсутствие других болезней органов дыхания (Х21 = 0). Практически, этот вывод подтверждает предыдущий: сочетание старческого возраста и возможное поражение легких радиоактивной пылью (возможно, конечно, и ослабление иммунитета из-за внешнего и внутреннего облучения и обострение вследствие этого ранее существовавшей ХБНДП).

3) 14(50-4 причиной смерти является сходный "синдром": возраст 51 - 60 лет, образование, как и в 1) неполное среднее или начальное или ниже, ХБНДП. Этот вывод похож на предыдущие, однако смерть здесь наступала в предпенсионном возрасте.

4) 13(61-4 причиной смерти здесь является следующий "синдром": возраст 62 - 77 лет, семейное положение - состоял в браке или никогда не состоял в браке (как и в 1)), образование начальное или ниже или неизвестно (7), другие болезни органов дыхания Х21, например, респираторная недостаточность. Если наблюдается именно этот последний признак, то он является как бы дальнейшим развитием ХБНДП, и все вышеприведенные "синдромы" сходны между собою.

5) 10(X31=1) & (61-4 причиной смерти является следующий "синдром": мужской пол Х31 = 1, возраст 62 - 67 лет, болезни кровообращения Х11, образование неполное среднее, отсутствие поражения интерстициальной ткани Х 18 = 0, ХБНДП. По сравнению с предыдущими причинами здесь выявляется связь смерти также с болезнями кровообращения именно у мужчин (наряду с уже известными ранее признаками).

6) 9(66-4 причиной смерти является следующий "синдром": возраст 67 - 74 года, ХБНДП, образование среднее общее, состоит в браке, болезни кровообращения. В отличие от 5) этот "синдром" наблюдается при большем возрасте, как для мужчин, так и для женщин.

7) 9(56-4 причиной смерти является следующий "синдром": возраст 57 - 68 лет, семейное положение - или никогда не состоял(а) в браке, или вдов(а), или разведен(а), образование неполное среднее, ХБНДП, болезни кровообращения. Здесь явно проступает возможная зависимость от отсутствия помощи (нет семьи) наряду с болезнями, как и в 6).

8) 4(64-4 причиной смерти является следующий "синдром": возраст 65 - 67 лет, другие болезни органов дыхания (обычно это различные респираторные нарушения), семейное положение - те же, что и в 7), образование неизвестно. Интерпретация здесь сходна с 7).

9) 4(53 10) 4(78 11) 3(X32=4) & (X35=66) & (X21=1) - с частотой 3.10^-4 причиной смерти является следующий "синдром": семейное положение - разведен(а), возраст 66 лет, наличие других болезней органов дыхания (см. сходство с 8)).

12) 3(1= 13) 3(X35<79) & (X33=4) & (X16=1) & (X31=1) - при возрасте менее чем 79 лет, среднем общем образовании, ХБНДП, для мужчин. Если бы у этих умерших было неполное среднее образование и еще болезни кровообращения и отсутствие поражения интерстициальной ткани, то этот "синдром" вошел бы как частный случай в 5).

14) 3(54 15) 3(73 16) 3(64 Рассмотрим теперь появление некоторых наиболее часто встречающихся переменных в рассмотренных 16-ти выводах. Так, ХБНДП встречается в них 9 раз (в 56% рассмотренных моделей при различных взаимодействиях с другими переменными). Болезни кровообращения встречаются 6 раз (в 37%), респираторная недостаточность встречалась 5 раз (в 31%).

Интересно сопоставить полученные результаты с основным выводом (включающим злокачественные новообразования органов дыхания и грудной клетки), полученным ранее при исследовании смертности в основном от злокачественных новообразований. В исходных данных описывались (лишь за 2002 и 2003 годы) помимо демографических данных и основных трехзначных рубрик также и все подрубрики группы новообразований. При вычислениях моделей использовалось не все множество данных по смертности жителей в не пораженной зоне, а лишь "контроли" - ближайшие по дате смерти 6 не целевых строк по отношению к каждой целевой строке. Выбор этой "окрестности" определялся лишь возможностью счета всей модели (р = 0,05) за приемлемое время. Так, с наибольшей частотой 41.10^-4 была получена следующая частичная (соответствующая одному К) модель: "в пораженной радиоактивностью местности умирают мужчины с неполным средним образованием, при отсутствии признаков раковой интоксикации и при наличии злокачественных новообразований органов дыхания и грудной клетки в возрасте 68 - 74 года". Отметим, что признак "отсутствие раковой интоксикации" практически означает, что свидетельство о смерти выписывалось в сельской местности.

Интересно отметить, что в модели, отображающей все заболевания органов дыхания за 3 года, вообще нет указания на соответствующие злокачественные новообразования, что частично можно объяснить отсутствием в ней более подробной рубрификации этого вида заболеваний. Возможно также, что при большом количестве "контролей" (здесь использовался весь массив полностью) более устойчивым признаком, наряду с другими, характеризующими пораженную местность, является, например, ХБНДП. Если рассматривать процесс вымирания населения в пораженной местности во времени, то, согласно приведенным моделям, можно было бы сказать следующую гипотезу. В "чистой" местности по мере миграции населения из пораженных районов в течение трех лет и дальнейшего распространения радиоактивности, например, в продуктах питания, привозимых из пораженной местности; также и по мере загрязнения местности другими канцерогенами (выхлопными газами и промышленными отходами), возможно, ситуации, связанные со смертью населения от злокачественных новообразований, становятся весьма похожими с такими же ситуациями в пораженной радиоактивностью местности.

Оставить комментарий
Размещен: 18/01/2006, изменен: 17/02/2009. 336k. Статистика.
Эссе: Естествознание

Связаться с программистом сайта.
Новые книги авторов СИ, вышедшие из печати:
О.Болдырева "Крадуш. Чужие души" М.Николаев "Вторжение на Землю"
Как попасть в этoт список

Кожевенное мастерство | Сайт "Художники" | Доска об'явлений "Книги"

Щеглов Виталий Николаевич Творческое сознание:интуиционизм, алгоритмы и модели

Щеглов Виталий Николаевич
Творческое сознание:интуиционизм, алгоритмы и модели