Изв. вузов «ПНД», т. 19, № 6, 2011
УДК 159.9.001.5
ФРАКТАЛЬНЫЙ АНАЛИЗ АКТИВНОСТИ НЕЙРОНОВ И ПОВЕДЕНИЯ МОДЕЛИ
А.К. Крылов
Показано, что наличие фрактальной структуры в активности нейронов не объясняется теорией рефлекса. Построена редуцированная модель формирования и реализации индивидуального опыта, основанная на классическом рефлекторном представлении структуры опыта в виде дерева. Поведение такой модели не обнаруживает фрактальных свойств. Предполагается, что более адекватной будет нерефлекторная модель структуры опыта в форме дерева навыков. Показана возможность использования оценки нелинейных (фрактальных) свойств данных для проверки теоретических представлений.
Ключевые слова: Моделирование, фрактальный анализ, поведение.
В настоящей работе показано, как теоретические представления о закономерностях структуры опыта могут быть проверены путем построения модели и проверки реализуемого ею поведения на нелинейность в сопоставлении с нелинейными (фрактальными) свойствами поведения организма и активности нейронов.
Метафоры теории рефлекса о мозге: от фонтана к калькулятору
В XVII веке вследствие развития механики появилась механистическая метафора работы мозга - Декарт предположил наличие сходства между функционированием фонтана (движение воды по трубам) и нервной системой человека (движение «животных духов» по нервам). В дальнейшем на основе этих общефилософских материалистических представлений И.П. Павловым была развита теория рефлекса. В ней представления Декарта были выражены постулатом о детерминации внешним стимулом последующего поведения (называемого реакцией).
В XX веке на смену рассматривавшимся до этого аналогиям между мозгом и гидравлической машиной, а затем и телефонным коммутатором, пришла новая метафора, полагающая мозг аналогом компьютера. Функцией нейрона, как и мозга в целом, в соответствии с «вычислительной метафорой» (обзор см. в [3]) оказалось перекодирование входного сигнала в выходной. Мозг стали рассматривать
109
как электронную схему, которая входные сигналы («стимулы») перекодирует в выходные («реакции»). Эта идеология была заложена в Neural Networks. В парадигме реактивности, основанной на механицизме и редукционизме, кажется адекватным видеть сходство между очередной новинкой технического прогресса и живым организмом. Критикуя такую установку мышления, Н.А. Бернштейн назвал ее «семеро-морфизм» - оформление по образцу и подобию сегодняшнего дня (обзор и критику парадигмы реактивности см., например, в [3]).
На основании проведенного нами и другими исследователями анализа парадигмы реактивности и основанной на ней теории рефлекса, мы считаем [3], что сущность теории рефлекса можно выразить следующей формулировкой: индивид, в своем действии и состоянии, объективно отражает предшествующий внешний сигнал (воспринимаемую часть внешней среды). Это утверждение представимо следующей формулой: Y(t + т) = f (S(t)), т > 0 (1). Обозначения: S(t) - внешний сигнал, воспринимаемый индивидом; Y(t) - действие индивида в момент t; f - некоторая функция. Эта формула описывает причинно-следственную связь - причиной является внешний сигнал (S), следствием является действие индивида (Y): если S, то Y. Эта формулировка означает, что между воспринимаемым внешним сигналом и последующим поведением имеется функциональная зависимость. Формула (1) есть, можно сказать, определение «вычислителя», ее можно озвучить и так: к входному сигналу S(t) применяется некая функция f и с задержкой т выдается результат вычисления. Соответственно, и функцией нейрона в парадигме реактивности оказывается преобразование входного сигнала в выходной.
Фрактальная активность нейрона как несоответствие рефлекторной теории
В классических рефлекторных представлениях предполагалось, что спайко-вая активность нейрона детерминируется входным сигналом, только в этом случае нейрон может исполнить роль перекодирующего элемента. Считалось, что нейрон -не вполне идеальная электронная схема и перекодирует входной сигнал неточно, и что спайковая активность нейронов представляет собой пуассоновский процесс, то есть очередной спайк и межспайковый интервал не зависят от предшествующей активности нейрона. Однако позднее было обнаружено не только наличие корреляций между последовательными межспайковыми интервалами, которое можно было бы объяснить марковской моделью с конечной глубиной памяти, но и наличие корреляций на разных временных масштабах, то есть фрактальные свойства нейронной активности [10]. Такие свойства нейронной активности не соответствуют представлению о роли нейрона как перекодирующего элемента, поскольку в этом случае по выходной активности нейрона нельзя сказать, каким был входной сигнал.
Если нейрон является функциональным преобразователем типа (выход^+1)) = = F(вход(^), как это предполагает классическая рефлекторная теория, то при подаче на вход простого сигнала (константа или синусоида), на выходе не может появиться фрактальная структура. Однако она обнаруживается рядом авторов [1, 2, 4, 7-9]. Наличие фрактальных свойств нейронной активности означает особый тип детерминации активности клетки - не рефлекторный, но и не полностью случай-
110
ный (рис. 1). Поэтому наличие фрактальной размерности в последовательности межспайковых интервалов является нарушением рефлекторной схемы детерминации, и некоторыми авторами рассматривается как доказательство того, что организм и нейрон обладают
«внутренним инициатором действий», РИс. 1. Наличие фрактальных свойств нейронной «внутренней причинностью» [8]. активности
Проверка нейронной активности на фрактальность
Один из простейших методов проверки на фрактальную размерность - построение гистограммы межспайковых интервалов в логарифмических координатах (рис. 2, б), с проверкой возможности аппроксимации хвоста распределения прямой линией, означающей наличие степенной зависимости в исходных данных, и временной инвариантности - самоподобия распределения на разных масштабах времени (рис. 2, в).
Нами обнаружено несколько типов гистограмм межспайковых интервалов [2], один из которых может рассматриваться как свидетельство в пользу наличия у некоторых нейронов фрактальной структуры их активности.
Более надежные тесты - фактор Фано (ФФ) и метод DFA (detrended fluctuation analysis) [1,7,9]. Для вычисления ФФ вся запись нейронной активности последовательно разбивается временными окнами величины T ив каждом окне подсчитывается число спайков Ni(T), попавших в это i окно (рис. 2, а). Фактор Фано для каждого T вычисляется как отношение дисперсии к среднему значению последовательности N (T). Для пуассоновских процессов он равен единице для любого T.
I п I и ши и I I I IIIII inn I I I I 11 iiiwi
Q 1.0 10.0 100.0 1000.0 в 1 0 10.0 100.0 1000.0
Рис. 2. а - фрагмент активности нейрона (10 с): вертикальные штрихи - моменты спайков; под ними -временные окна величины T, цифры - число спайков, попавших в это окно. б - гистограмма межспайковых интервалов в логарифмических осях. По оси абсцисс - величина бина (в мс). По оси ординат -величина межспайкового интервала (в мс). в - та же гистограмма, но в форме линии, соединяющей вершины бинов. Рядом показана аппроксимирующая прямая (наклон равен —1.2)
111
Кривая 1 (угол наклона равен 0.33) - для исходных данных, кривая 2 (угол наклона равен 0.26) - для перемешанных. По оси абсцисс - время (мс). б - DFA для того же нейрона. График аппроксимируется прямой линией с наклоном 0.53
Для фрактальных процессов с увеличением T ФФ растет и аппроксимируется прямой в логарифмических осях (рис. 3, а). Причиной может быть как распределение межспайковых интервалов, так и их последовательность. Чтобы выяснить этот вопрос, вычисляется также ФФ для перемешанной последовательности межспайковых интервалов (кривая 2 на рис. 3, а). В приведенном примере асимптотика ФФ сохраняется и после перемешивания, что означает, что сама статистика межспайковых интервалов, а не только их специфическая последовательность, в данном случае дает такие показатели ФФ.
Структуры индивидуального опыта в парадигмах активности и реактивности
В рефлекторной теории (РТ), разработанной И.П. Павловым, индивидуальный опыт представлялся как набор рефлексов. Рефлекс является преобразованием входного сигнала в выходной (см. выше). В теории функциональных систем, разработанной П.К. Анохиным, элементом индивидуального опыта является функциональная система (ФС), а структура опыта состоит из набора функциональных систем. Функциональная система нацелена на достижение определенного результата - нового соотношения организма со средой. В РТ считается, что рефлекторное действие (рефлекс обеспечивает связь стимул-реакция) просто выполняется, и неизвестно, к чему приведет. В отличие от РТ, с точки зрения теории ФС, элементы структуры опыта целенаправленны. РТ соответствует парадигме реактивности, а теория ФС к парадигме активности [3]. Системно-эволюционная теория (СЭТ), разработанная
В.Б. Швырковым [6] и его школой [3,5], является развитием теории ФС. В СЭТ показано, что новая ФС формируется как наслоение на имеющуюся структуру опыта [3,6]. При этом новая ФС позволяет достигать более дифференцированного результата поведения, то есть учитывать больше деталей в соотношении со средой [3,5,6].
В экспериментах нашей лаборатории животные обучались инструментальному пищедобывательному поведению: нажимали на правую педаль, чтобы получить пищу из правой кормушки и нажимали левую педаль, чтобы получить пищу из левой кормушки [5]. Кроме того, животные учились захватывать пищу из кормушек и с руки.
112
Рис. 4. а - структура опыта по теории рефлекса. б - структура опыта по системно-эволюционной теории - наслоение навыков. Последовательность обучения - снизу вверх
С точки зрения РТ, у животных формировалась структура опыта, представляющая собой набор рефлексов (рис. 4, а). В РТ допускаются произвольные модификации структуры опыта: можно добавить новый рефлекс к набору имеющихся, можно модифицировать имеющийся (ослабить или усилить), можно удалить имеющийся. Такие представления о структуре опыта можно назвать линейными - элементы опыта формируются независимо друг от друга и последовательность их формирования (история обучения) не имеет значения.
С точки зрения СЭТ, у животных формировались функциональные системы достижения соответствующих результатов, причем эти ФС образуют структуру типа дерева: от менее дифференцированных (более общих) к более дифференцированным (более конкретным) (рис. 4, б). Под менее дифференцированным элементом опыта понимается умение захватить пищу вообще, неважно откуда; а под более дифференцированным - умение захватить пищу, например, конкретно из левой кормушки. Эксперименты показали, что сформированная однажды ФС в дальнейшем не может «стереться» - обучение «вместо выученного ранее поведения захватывать пищу из левой кормушки, теперь захватывать пищу из правой» заключается не в стирании существующей ФС, а в наслоении новой ФС, которая будет реализоваться вместо прежней [3,5,6]. Поэтому история обучения имеет принципиальное значение для формирования структуры опыта [3,5,6]. Таким образом, СЭТ утверждает нелинейность структуры опыта.
Ранее нами была построена математическая модель формирования структуры опыта на основе РТ (см. рис. 4, а) и проведены эксперименты с ней как с компьютерной моделью мобильного робота в задаче фуражирования [3]. Проведенный анализ поведения модели позволил выявить ряд нелинейных феноменов [3].
В настоящей работе мы построили редуцированную модель формирования и реализации опыта на основе представлений СЭТ. Структура опыта образовывалась в форме дерева (рис. 5) одновременно с реализацией соответствующего поведения. В качестве модельной задачи мы использовали не полную задачу фуражирования, как раньше, а ее редуцированный вариант - задачу поискового поведения в неизменной среде, то есть агент ищет пищевые объекты, но они отсутствуют. В этом случае ситуация, с точки зрения агента, постоянная - он не видит и не находит ничего. С точки зрения РТ, в этой задаче вход постоянный - нулевой, стимулы отсутствуют. Эта задача интересна тем, что, несмотря на отсутствие каких-либо стимулов, поведение животных в ней оказывается нелинейным и демонстрирует фрактальную структуру [4]. В терминах РТ получается, что при нулевом входе генерируется нелинейный выход - что невозможно с точки зрения РТ. Поэтому подобные результаты
113
Рис. 5. а - дерево опыта: кружком обведена текущая ситуация, черными стрелками показаны возможные развития событий. б - иллюстрация к редуцированной модели формирования и реализации опыта в виде дерева ситуаций: вероятность порождения новой ситуации равна 0.05, вероятность «начать с начала» равна 0.7
противоречат РТ. Некоторые авторы считают, что эти данные доказывают наличие внутренней причинности [8].
Структура опыта по упрощенному алгоритму и схема поведения агента следующие (см. рис. 5):
- на каждом такте времени актуален определенный узел дерева опыта;
- с вероятностью 0.05 формируется новый элемент опыта, наслаивается на текущий узел дерева (образуя новую ветвь), и он выбирается в качестве следующего и совершается тот же акт;
- в противном случае делается выбор элемента среди имеющихся исходов из данного узла (ветвей), пропорционально их длине и ветвистости;
- если не сработало предыдущее правило, то, когда дошли до конца дерева (до листа), с вероятностью 0.7 агент продолжает поведение, переходя к корню дерева, а с вероятностью 0.3 агент совершает действие «разворот» и снова актуализируется корневой элемент дерева, на этом цепочка действий завершается и начинается новая.
При компьютерной симуляции мы регистрировали структуру формирующегося опыта и длительность поведенческих цепочек - интервалы времени движения в одном направлении без разворота. Таким образом, данные модельного эксперимента можно сопоставить с данными эксперимента на животных [4].
Длительность поведенческих цепочек была проанализирована на наличие фрактальной размерности с помощью показателя DFA [7] и фактора Аллана [1,9]. При варьировании в модели вероятности формирования нового элемента опыта (от 0.02 до 0.05) и вероятности пассивного возврата к корню дерева (от 0.7 до 0.9) показатели альфа-DFA и фактор Аллана демонстрировали отсутствие фрактальной структуры в поведении модели. Следовательно, наша редуцированная математическая модель не описывает системную сложность, присущую реальной биологической системе в мере, достаточной для того, чтобы модель проявила такое принципиальное свойство, как фрактальность.
114
Полученный результат говорит не в пользу принятого в теории рефлексов и ИИ представления знаний в виде дерева ситуаций и переходов между ними (рис. 4, а; рис. 5). Возможно, обоснованное системно-эволюционной теорией представление знаний в форме дерева навыков (рис. 4, б) окажется более адекватным. Необходимо развитие моделирования в этом направлении для отражения обнаруженных в экспериментах нелинейных нейробиологических и поведенческих закономерностей. При этом может использоваться оценка нелинейных (фрактальных) свойств в поведении модели для определения ее адекватности.
Работа поддержана фондом РГНФ (грант № 11-06-00482а), Советом по грантам Президента Российской Федерации ведущим научным школам Российской Федерации (проект № НШ-3752-2010.6).
Библиографический список
1. Дымов А.Б. Использование факторов Фано и Аллана для анализа свойств спай-ковой последователности нейронов слуховой системы // Тр. 11-й Всерос. научно-технической конф. «Нейроинформатика-2009». М.: МИФИ, 2009. Ч. 1.
C. 257.
2. Крылов А.К. Нелинейные и фрактальные свойства нейронной активности -следствия для моделирования // Материалы XV Международной конференции по нейрокибернетике. Ростов-на-Дону: Изд-во ЮФУ, 2009. Т.1. С. 105.
3. Крылов А.К., Александров Ю.И. Парадигма активности: от методологии эксперимента к системному описанию сознания и культуры // Компьютеры, мозг, познание: Успехи когнитив. наук / Отв. ред. Б.М. Величковский, В.Д. Соловьев. М.: Наука, 2008. С. 133.
4. Непомнящих В.А. Как животные решают плохо формализуемые задачи // Проблемы интеллектуального управления - общесистемные, эволюционные и нейросетевые аспекты / Нейроинформатика-2003. М.: МИФИ, 2003. С. 186.
5. Созинов А.А. и др. Условия и мозговое обеспечение интерференции при формировании системной структуры индивидуального опыта // Тенденции развития современной психологической науки / Отв. ред. А.Л. Журавлев, В.А. Кольцова. М.: Институт психологии РАН, 2007. Ч. 2. С. 343.
6. Швырков В.Б. Введение в объективную психологию. Нейрональные основы психики. М.: Институт психологии РАН, 1995.
7. Bhattacharya J. et al. Long-range temporal correlations in the spontaneous spiking of neurons in the hippoacampal-amygdala complex of humans // Neuroscience. 2005. Vol. 131. P. 547.
8. Brembs B. et al. Order in spontaneous behavior // Soc. Neurosci. Abstr. 2005. Vol. 754. P. 2.
9. Teich M.C. et al. Fractal character of the neural spike train in the visual system of the cat // J. Opt. Soc. Am. A. 1997. Vol. 14. P. 529.
Институт психологии РАН, Москва Поступила в редакцию 11.07.2011
115
FRACTAL ANALYSIS OF NEURON’S ACTIVITY AND MODEL’S BEHAVIOR
A.K. Krylov
It is shown that discovered fractal properties of neuronal interspike interval sequence contradicts the reflex theory. The simplified model of formation and realization of individual experience based on reflex theory view of individual experience structure as a tree has been proposed. Behavior of the model does not show fractal properties. It is suggested that non-reflex model of individual experience structure formed as a tree of skills is needed. It is shown the possibility of nonlinear (fractal) properties estimation in the data for evaluation of a theory.
Keywords: Model, fractal analysis, behavior.
Крылов Андрей Константинович - родился в Москве (1975), окончил Московский государственный университет им. М.В. Ломоносова (1996). После окончания МГУ закончил аспирантуру в Институте психологии РАН. Защитил диссертацию на соискание ученой степени кандидата психологических наук в ИП РАН (2007) по психофизиологии. Опубликовал 30 научных работ по моделированию работы мозга и поведения.
129366 Москва, ул. Ярославская, 13 Институт психологии РАН E-mail: [email protected]
116