Д.Б. Ханковский
О МОДЕЛИРОВАНИИ ПРОЦЕССА ПЕРВИЧНОГО ЭТАПА ФОРМИРОВАНИЯ ЗНАНИЙ В АВТОНОМНО ЭВОЛЮЦИОНИРУЮЩЕЙ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЕ*
В рамках информационно-эволюционного подхода к системному анализу и моделированию объективной реальности исследуются механизмы формирования первичных знаний в подсистеме знаний интеллектуальных систем уровней «сознание»-«подсознание». Формируются основы алгоритмической реализации процесса формирования первичных знаний из потока информации внешней в отношении интеллектуальной системы среды. Статья продолжает цикл работ, посвященных моделированию универсальных механизмов интеллектуальной деятельности различного генезиса.
Ключевые слова: информация, мышление, знания, интеллектуальные системы, сознание, подсознание.
Введение
Неотъемлемой особенностью интеллектуальных систем (ИС) является способность оперировать индивидуально-имманентными информационными моделями объективной реальности (ОР). Данная способность предполагает наличие в ИС вполне определенных подсистем знаний, той или иной степени развития, включающих механизмы сенсориума, синтеза, анализа, хранения и преобразования моделей ОР (знаний различного уровня генезиса). До последнего времени основное внимание в области теории интел-
© Ханковский Д.Б., 2013
* Статья подготовлена в рамках реализации Программы стратегического развития РГГУ, проект 2.1.1 «Решение комплексных проблем в области общественных и информационных наук» в Центре системного анализа и моделирования мышления ИИНТБ.
лектуальных систем уделялось разработке механизмов логического программирования, сенсорного восприятия внешних сигналов и хранения знаний. Однако при решении задач синтеза универсальных эволюционных механизмов интеллектуальной деятельности необходимым образом возникает вопрос о построении механизмов автоматического формирования знаний из сверхбольших объемов внешней (по отношению к ИС) информации.
Исследования механизмов обучения и самообучения (формирования знаний) проходят в основном в рамках различных направлений семиотико-логической1 или нейросетевой2 парадигмы. Оба подхода, а также гибридные на их основе3, являются априори индуктивными. Их использование позволяет успешно решать целый ряд задач имитационного характера4. Логический подход, родившийся из моделей естественного языка (ЕЯ), к настоящему времени исчерпывает себя, отражая лишь базовые процессы логико-вербального мышления антропных систем, что выражается в постоянно декларируемых кризисах, «трудно разрешимых» в методологии имитации (копирования) антропного интеллекта в антропогенном. Бионический подход развивается в направлении от частного к общему, от изучения основных закономерностей организации и функционирования мозга к построению моделей такого функционирования. Это делает данное направление вполне определенно ограниченным особенностями реализации биологического носителя интеллекта.
Использование информационно-эволюционного подхода5 (ИЭП) к системному анализу и моделированию (САМ) позволяет взглянуть на задачи информационной самоорганизации в ИС с новых позиций. Данный подход является дедуктивным и позволяет предложить более универсальные механизмы наполнения подсистем знаний ИС, чем традиционно исследуемые.
1. Краткий обзор достигнутых результатов
В используемом нами представлении информационное функ-
ционирование ИС реализуется в двух «плоскостях»: «сознание»
и «подсознание». Будем считать, что в ИС осуществляются ло-
гические алгоритмические вычисления, реализующие механизм принятия решений, включающий аппарат логического вывода, происходит формирование, расширение, преобразование подсистемы знаний ИС. Уровень, на котором реализуются перечисленные процедуры, мы будем идентифицировать понятием «сознание».
Информационное функционирование ИС, однако, не исчерпывается процессами, реализуемыми на данном уровне. Предполагается, что ИС способна также реализовывать алогические функции, базирующиеся, в частности, на аппарате нелинейной динамики6. Уровень, на котором функционирует данный аппарат, будем связывать с понятием «подсознание» («бессознательное»)7.
В качестве модели, описывающей функционирование ИС на «сознательном» уровне - уровне оперирования знаниями, будем использовать модель-универсум информации ИЭП САМ ОР8. Абстрактной экспликацией модели-универсума информации в контексте представления и моделирования знаний является ^гиперпространство семиотико-хроматических (СХ) гйпертопографов (щ-графов) №. Используемая экспликация модели-универсума обеспечивает моделирование и сенсориума, и подсистем знаний и коммуникации, и пространство целей, и объектов внешней среды, их свойств и отношений. Поскольку подсистема знаний относится к динамическим системам, в качестве динамических моделей представления знаний в зависимости от постановки задач используются конечные мета-алгебраической системы, метаалгебры и метаавтоматы, или семиотико-хроматические гипертопосети10.
Весьма интересным с точки зрения обоснованности результатов проведенных исследований является их сравнительный анализ с близкими, независимо полученными результатами научной группы В.И. Бодякина ИПУ РАН в отношении использования при моделировании эволюционных механизмов формирования «сознания» (подсистемы знаний ИС) аппарата нейроподобных11 сетевых (теоретико-графовых) структур12. Заметим, что введенное В.И. Бодякиным понятие нейросетевой структуры свободно интерпретируется в аксиоматике абстрактной модели семиотико-хроматической гипертопосети, что позволяет легко спроецировать полученные результаты на используемый нами универсальный аппарат моделирования мышления уровней «сознание-подсознание», где в качестве базовой модели «бессознательного» («подсознание») используем р-адическую модель мышления13.
В процессе исследования механизмов взаимодействия уровней «сознание-подсознание», то есть морфизмов моделей мышления уровней «сознание-подсознание», ранее был предложен ряд формальных алгоритмов и процедур14. Синтезированные процедуры построения соответствий и отображений используемых моделей позволяют реализовать механизм формирования информационного запроса из подпроцесса уровня «сознания»
в подпроцесс уровня «подсознания» с сохранением прагматической разнозначимости структуры запроса. Обратное отображение результата функционирования модели «подсознания» на уровень «сознания» носит «диффузный» характер, так как в результате работы модели динамической системы «подсознания» мы получаем точку [GF(2)]n, где п ^ да, которую в настоящих условиях невозможно однозначным образом идентифицировать конкретным актуальным Гв-объектом. Однако мы имеем возможность идентифицировать некоторый «размытый» результат работы «подсознания», соотнеся его с некоторым классом гипертопографов. Такая «размытость» вполне соответствует эмпирическим наблюдениям в области психологии и может быть охарактеризована как интуитивно-образное мышление.
Таким образом, чтобы перевести данное исследование в область экспериментальной апробации теоретических результатов, необходимо разработать аппарат информационной самоорганизации подсистемы знаний ИС, решив вопрос об априорно-апостериорном наполнении областей «подсознание/сознание».
2. Формирование области «подсознания»
В предлагаемой нами модельной интерпретации в процессе взаимодействия материальных систем возникает актуальное возмущение среды взаимодействия, являющейся материальным носителем информации о процессе взаимодействия, номинируемой нами термином сигнал. Сигналы воспринимаются соответствующими сенсорами ИС. На уровне сенсорного восприятия происходит потеря информации о прообразе, так как сенсоры воспринимают лишь ограниченную часть информационного прообраза в рамках своей способности различения. В развитии гипотезы языка внутренней речи15, по Н.И. Жинкину, полученные информационные образы можно рассматривать как универсальный внутренний код ИС. В рамках общей теории кодирования и моделей фон Неймана данные образы могут быть представлены в формате GF(2). Получающиеся двоичные последовательности (векторы вида а= (а1, а2, ..., ап), где а. е {0,1}, I = 1, п) суть первичные модели (информационные образы) «внешнего» мира (ОР). Область «подсознания» последовательно формируется из таких первичных моделей.
Рис. 1. 2-адическое дерево «подсознания»
Процесс информационного наполнения области «подсознания» происходит с использованием категорий «тождества/ различия», по Г. Лейбницу16, и реализуется в модели времени «по наступлении события». Будем считать, что первоначально данная область пуста. В процессе взаимодействия ИС с внешним миром начинает функционировать сенсориум ИС. В предлагаемой нами модельной интерпретации результатом такого функционирования являются двоичные последовательности. Начальная двоичная последовательность а = (а1, а , ..., а), где а. е {0,1}, I = 1, п, которая попадает в «подсознание», представляет собой модель однородной среды, где образы внешнего мира неразличимы. Однако уже следующий набор сигналов, воспринимаемый сенсориумом, может с какого-то места отличаться от предыдущего. То есть ИС может сгенерировать двоичную последовательность в= (в1, в2, ..., в„), где в, е {0,1}, I = 1, /, имеющую общий корень определенной длины с первой последовательностью а, но с какого-то момента отличающуюся от нее. При этом 2-адическая метрика на а , в приобретет значение р2 (а, в) = ^/2 * , где £ наименьший номер, такой, что а( * в, £ ^ тах(/, п), £ е N. Это означает, что в однородной среде был выделен некоторой отличимый объект, то есть произошла детализация ранее неразличимого внешнего мира. Все дальнейшее наполнение области «подсознания» происходит по принципу постоянной детализации. Учитывая, что для кодирования мы используем двоичные последовательности, в процессе детализации на каждом шаге возможно выделить лишь один объект. Этот процесс аналогичен построению 2-адического дерева17 (рис. 1).
Вопрос о том, конечен ли этот процесс и конечную ли длину имеют получающиеся векторы, сводится к вопросу о возможности построения гипермножества18, синтезируемого с использованием принципа «бесконечной» делимости «целого» на «части». А также к эпистемологической проблеме о принципиальной познаваемости мира.
В любом случае процесс информационного наполнения области «подсознания» можно отождествить с процессом построения части 2-адического дерева, которое можно рассматривать как некоторое счетное или конечное подмножество множества целых 2-адических чисел 72.
В процессе существования ИС 2-адическое дерево, соответствующее ее «подсознательной» области, постоянно «разрастается»: длины ветвей увеличиваются, появляются все новые и новые ветви. В какой-то момент, возможно, отделяется одна очень крупная ветвь, соответствующая специфическому набору сигналов. Этот набор сигналов можно назвать «внутренним», то есть характеризующим и описывающим информацию ИС о самой себе. Таким образом, можно предполагать, что в ИС появляется некая первичная модель самой ИС.
3. Формирование вторичных моделей ОР (знаний)
На некотором этапе развития ИС в отношении ее информационного наполнения осуществляется качественное преобразование информации в соответствии с диалектическим законом «перехода количества в качество». Информация, представленная на уровне «подсознания» в виде 2-адического дерева (двоичные последовательности большой длины), компрессируется. Преобразование информации происходит согласно концепции «концентрации зна-ний»19 и представляет собой формирование вторичных моделей ОР.
В рамках данной модельной интерпретации реализация качественного преобразования информации поддается достаточно простому формальному описанию. Первоначальное формирование знаний в нашем представлении реализуется по достижении двух условий, связанных с 2-адическим деревом области «подсознания». Первое условие - достаточная длина общего корня у любых ветвей некоторого поддерева, второе - достаточно большое количество ветвей в этом поддереве. Другими словами, знание формируется тогда, когда мощность множества А достаточно близких двоичных векторов становится больше некоторого порогового значения:
1.р2 (а., а) < д Уа., а. е А, где I,= 1, I, д е
2. |А| > п, где п е N.
Таким образом, любую достаточно большую ветвь 2-адического дерева можно рассматривать как единый объект. Общий корень ветви говорит о том, что этот объект формировался из достаточно близких сигналов, воспринятых сенсориумом ИС. Собственно, общий корень непосредственно определяет получившийся объект, а ветвление, то есть расхождение этого общего корня, можно рассматривать как набор хроматических атрибутов - цветов (свойств) и/или их значений. Также можно произвести поименование сформированного объекта. Формируется первичный уровень области «сознания».
Процесс построения знаний связан с постоянным отображением некоторых ветвей 2-адического дерева в форму СХ-цх-графов Гъ. Однозначность такого отображения частично решает вопрос «диффузности» отражения результата функционирования модели «подсознания» на уровень «сознания». Отражение всех таких ветвей порождает часть пространства гипертопографов Гъ. Так как процесс построения знаний носит постоянный характер, то данное пространство должно постоянно расширяться и преобразовываться. Более того, операции20 в пространстве Гъ семиотико-хроматических гипертопографов позволяют синтезировать и информационные модели более высокого порядка, то есть строить метамодели, метазнания.
Можно предположить, что крупная ветвь 2-адического дерева, соответствующая первичному информационному образу ИС о самой себе, эволюционирует до вторичной модели, то есть в ИС сформируется знание о самой себе. Этот процесс можно считать зачатком формирования у ИС эго, самосознания.
Заключение
Предложенные базовые универсальные механизмы, основанные на ИЭП, позволяют заложить основу алгоритмической реализации процесса формирования первичных знаний из потока информации, внешней в отношении ИС среды.
Данный подход является дедуктивным и позволяет частично решить вопрос о биективности отображения результатов функционирования области «сознания» в область «подсознания», а также дает возможность выделять часть хроматических атрибутов формируемых вторичных моделей ОР, то есть позволяет синтезировать полихромные гипертопографы.
В перечень последующих исследований предполагается включить изучение возможности представления предложенных условий первоначального формирования знаний в виде статистического критерия. Необходимо произвести расчет параметров такого критерия, определить вид функции распределения процесса формирования знаний. С этой целью предполагается алгоритмизация разработанного аппарата и перевод исследования в область экспериментальной апробации теоретических результатов, то есть переход к имитационно-статистическому моделированию.
Автор выражает глубокую благодарность проф. А.Е. Баранови-чу за постановку задачи и ценные методические указания в процессе научной работы.
Аббревиатуры
ЕЯ - естественный язык
ИС - интеллектуальная система
ИЭП - информационно-эволюционный подход
ОР - объективная реальность
САМ - системный анализ и моделирование
СХ - семиотико-хроматический
Примечания
См.: Поспелов Д.А. Логико-лингвистические модели в системах управления. М.: Энергоиздат, 1981. 232 с.; Тарасов В.Б. Логико-лингвистические модели: прошлое, настоящее и будущие // Политехн. чтения: Сб. тр. Вып. 7. Искусственный интеллект - проблемы и перспективы / Политехн. музей: науч. ред. Г.Г. Григорян, В.Л. Стефанюк. М., 2006. С. 48-54. См.: Редько В.Г. Эволюционная кибернетика. М.: Наука, 2001. 156 с.; Он же. Модели адаптивного поведения - бионический подход к искусственному интеллекту // Моделирование процессов / Под ред. В.А. Райхлина. Казань: КГУ, 2007. С. 109-134.
См.: Ярушкина Н.Г. Основы теории нечетких и гибридных систем: Учеб. пособие. М.: Финансы и статистика, 2004. 320 с.
См.: Андрейчиков А.В., Андрейчикова О.Н. Интеллектуальные информационные системы: Учебник. М.: Финансы и статистика, 2006. 424 с., ил. См.: Баранович А.Е. Информационно-эволюционный подход в теории интеллектуальных систем // Интеллектуальные системы. Т. 15. Вып. 1-4. М., 2012. С. 15-52.
См.: Кадомцев Б.Б. Динамика и информация. М.: Наука, 1998. 394 с.; Капица С.П., Курдюмов С.П., Малинецкий Г.Г. Синергетика и прогнозы будущего. М.: Наука, 1997. 285 с.
3
4
5
См.: Франц М.-Л. Прорицание и синхрония: психология значимого случая / Пер. с англ. З. Кривулиной; Под общ. ред. В. Зеленского. СПб.: Изд. Группа «Азбука-классика», 2009. 224 с.
См.: Баранович А.Е. Структурное метамоделирование телеологических информационных процессов в интеллектуальных системах. М.: МО РФ, 2002. 316 с. См.: Баранович А.Е. Семиотико-хроматические гипертопографы. Введение в аксиоматическую теорию: информационный аспект. М.: МО РФ, 2003. 404 с., ил. См.: Баранович А.Е. Семиотико-хроматические гипертопосети: унифицированная модель представления знаний // Открытые семантические технологии проектирования интеллектуальных систем = Open Semantic Technologies for Intelligent Systems (0STIS-2011): Матер. Междунар. научн.-техн. конф. / Редкол.: В.В. Голенков (отв. ред.) [и др.]. Минск: БГУИР, 2011. С. 71-86. Функция активации в классической модели искусственного нейрона Макка-лока-Питтса заменяется на сложный многопараметрический функционал. См.: Бодякин В.И. Механизм автоматического формирования информационной модели в информационно-управляющей системе, построенной на базе нейросе-мантической парадигмы // Нелинейная динамика в когнитивных исследованиях: Мат-лы II Всерос. конф. ИПФ РАН. Нижний Новгород, 2011. С. 20-23. См.: Хренников А.Ю. Моделирование процессов мышления в _р-адических системах координат. М.: Физматлит, 2004. 295 с.
См.: Баранович А.Е., Ханковский Д.Б. О моделировании взаимодействия подпроцессов мышления уровней «сознание»-«подсознание» // Вестник РГГУ. Сер. «Информатика. Защита информации. Математика». 2012. № 14. С. 169186; см.: Баранович А.Е., Ханковский Д.Б. О реализации механизмов взаимодействия моделей подпроцессов мышления различного генезиса // Конгресс по интеллектуальным системам и информационным технологиям «IS&IT 2012»: В 4 т. Дивноморское, 2012. С. 312-317.
См.: Жинкин Н.И. О кодовых переходах во внутренней речи // Вопросы языкознания. 1964. № 6. С. 26-38.
См.: Баранович А.Е. Семиотико-хроматические гипертопографы. Введение в аксиоматическую теорию: информационный аспект. С. 172. См.: Хренников А.Ю. Моделирование процессов мышления в _р-адических системах координат.
См.: Barwise J., Moss L. Hypersets // Mathematical Intelligencer. 1991. Vol. 13. № 4. Р. 31-41; Idem. Vicious circles and the mathematics of non-well-founded, Phenomena. Stanford: CSLI Public., 1996. Р. 390.
См.: Сайт Центра системного анализа и моделирования мышления [Электронный ресурс]. URL: http://samtcenter.ru (дата обращения: 30.04.2013). См.: НикитинН.О. К вопросу моделирования динамических процессов накопления знаний в интеллектуальных системах // Вестник РГГУ. Сер. «Информатика. Защита информации. Математика». 2013. № 14 (115) (в печ.).
i
8
9
10
11
12
13
14
15
16
17
18
19