НОРМАЛЬНАЯ И ПАТОЛОГИЧЕСКАЯ ФИЗИОЛОГИЯ
УДК 612.821
НЕЙРОПЛАСТИЧНОСТЬ СОМАТОСЕНСОРНОЙ КОРЫ КРОЛИКА В ПАВЛОВСКОМ АВЕРСИВНОМ ОБУЧЕНИИ И ОПЕРАНТНОМ ОБУСЛОВЛИВАНИИ ЕДИНИЧНОЙ И МУЛЬТИКЛЕТОЧНОЙ АКТИВНОСТИ ПРИ БИОУПРАВЛЯЕМОЙ НОЦИЦЕПТИВНОЙ СТИМУЛЯЦИИ
В.В. Трубачев
Московская открытая социальная академия, Марийский филиал, г. Йошкар-Ола
Нейронная активность соматосенсорной коры кролика может инструментально обучаться в соответствии с алгоритмом биоуправляемой ноцицептивной стимуляции, увеличивать или снижать частоту разрядов мультиклеточной активности, изменять диапазон межспайковых интервалов, формировать паттерн нейронных разрядов на условный сигнал, которые являлись оперантами в этих опытах. Взаимодействия изменений активности нейронных популяций при биоуправляемой ноцицептивной стимуляции с синергетич-ной модуляцией системы сердечно-сосудистой и болевой регуляций ведут к появлению медленных 0,02-0,5 Гц волновых паттернов, объединяющих элементы в интегративную деятельность при обучении.
Ключевые слова: нейропластичность, нейронный оперант, нейробиоуправление, соматосенсорная кора, ноцицептивная обратная связь, медленные нейронные 0,02-0,5 Гц осцилляции.
Введение. Нейробиология в начале XXI в. совершает выдающийся прорыв в понимании системных механизмов нейропластичности мозга [3, 23, 30, 43 и др.]. Условный рефлекс, открытый И.П. Павловым более 100 лет назад, остается основной парадигмой изучения интегративных механизмов мозга в осуществлении поведения и когнитивной деятельности [1, 10, 12, 13, 15, 20, 33, 39 и др.].
Традиционное исследование нейрофизиологических коррелятов поведения отличается высокой вариабельностью результатов и оценок вследствие эмпирического выбора электрофизиологических показателей обучения, присущей живым системам индивидуальной изменчивости и многообразия реакций отдельных элементов за счет распределенного участия в других системах и регуляциях. Успешной альтернативой классическим
подходам оказалась организация эксперимента с созданием систем «искусственных» обратных связей (адаптивное биоуправление, программированное биоуправление и др.) для выделения релевантных изменений (параметров) процессов обучения и направленного регулирования функций организма. Обучение в биотехнической системе основывается на нейропластичности и текущей информации для управления тем специфическим процессом или ответом, который поступает по обратной связи [9, 14, 22 и др.].
В настоящее время большое внимание уделяется развитию нового научного направления в нейрофизиологии - разработке технологии мозг-компьютерного интерфейса фО), позволяющей на основе нейропластичности использовать электрические сигналы мозга для управления техническими
устройствами [32, 35 и др.]. Между тем это направление является продолжением нейрофизиологических исследований по оперант-ному обучению нейронов и функциональному биоуправлению с использованием биологических обратных связей (biofeedback, neurofeedback). Исследования, заложившие основание научного направления BCI, были начаты в конце XX в. независимо двумя группами ученых из США и СССР [5, 7, 22]. В наших работах было установлено, что медленные осцилляции нейронных ансамблей выполняют роль оперантного процессинга и самоподкрепления в механизмах системной пластичности и обучения.
Нейропластичность относится к свойству нейронов, их связей и мозга в целом изменять и реорганизовывать самих себя как морфологически, так и функционально. Это включает изменения силы синаптических связей, образование и элиминацию синапсов, дендритов, аксонов и др. Недавние работы показали, что сенсомоторная кора очень динамична и вовлекается не только в моторное обучение, но также в когнитивные функции, образуя ассоциированную нейропластичность [24]. Пластичность помимо восстановления при повреждении может быть мобилизована несколькими способами: активностью, пользованием или стимуляцией.
Как было показано в исследованиях ряда авторов [30, 43], корковые поля сенсорных систем не являются статичными у взрослых особей, а претерпевают пластические изменения в ответ на периферические воздействия, упражнения и поведенческий опыт (обучение) в течение жизни, т.е. в определенных пределах кора способна локализовать корковые области в зависимости от их использования.
В целом, корковая пластичность содержит 2 основных компонента [19]: 1) изменения в соматотопии сенсомоторных полей при повреждении, ампутации или обучении заданию, которые могут объединяться, захватывая изменения дендритных и синаптических структур; 2) пластичность внутри сетей, вызванная микростимуляцией, изменяющей полевые потенциалы в горизонтальных слоях коры. Во время обучения соотношение меж-
ду нейронными разрядами и этими параметрами могут изменяться в формах нейропластичности.
Работы в области нейропластичности обучения подвели исследователей к поиску методов, позволяющих управлять мозговой нейропластичностью. Одним из приемов мобилизации мозговой пластичности является использование технологии нейробиоуправления для того, чтобы определить в модельных исследованиях на животных возможности и границы нейронных и системных механизмов пластичности [14 и др.].
Цель исследования. Исследование мозговой пластичности при оперантном обусловливании активности отдельных нейронов и популяций сенсомоторной коры на слабую ноцицептивную стимуляцию как биоуправляющий сигнал. Важно было также сравнить, как эти регуляции осуществляются в парадигмах классического обучения и оперантно-го обусловливания. При этом мы учитывали, что ноцицептивные рефлексы представляют собой один из фундаментальных механизмов системной нейропластичности сохранения целостности и выживания организма.
Материалы и методы. В работу включены материалы исследований 900 отдельных нейронов и мультиклеточных единиц коры кролика. Обучение животных проводилось по методике классического оборонительного рефлекса и биоуправляемого обусловливания по типу Сидмановского избегания [29]. Внеклеточная регистрация нейронной и множественной активности выполнялась по методике Василевского на фиксированном животном (по ЕуаГз) в сенсомоторной коре с координатами 4-6 мм по коронарному шву и 1-2,5 мм кзади. Каждая нейронная единица подвергалась тестированию рецептивных полей и реактивности на тактильные, звуковые, световые, болевые раздражители, осуществлялись полиграфическая регистрация 1-2 единиц нейронной активности, ЭЭГ с кончика микроэлектрода, кардиоинтервалограммы (запись ЯЯ-интервалов). Исследования проводились на автоматизированном многопараметрическом комплексе. Статистическая ЭВМ-обработка данных проводилась с использованием соответствующих программ. Основны-
ми методами являлись дисперсионный анализ (ЛКОУЛ), автокорреляционные и кросскор-реляционные оценки. Оценка достоверности межгрупповых показателей проводилась по
1-критерию Стьюдента, критерию %2.
Результаты и обсуждение. Одной из ключевых проблем нейрофизиологии высшей нервной деятельности является анализ механизмов подкрепления и мотивации. Перспективным приемом исследования оказалось использование метода вероятностного (частичного) подкрепления, определяющего основные показатели обучения и сохранения навыков в парадигмах как классического и опе-рантного обусловливания [42], так и при программированном биоуправлении [14].
Традиционным подходом к анализу нейронных ответов при обучении является определение характера перестроек на условный сигнал в связи с физическими параметрами подкрепления [10 и др.]. Значительно менее исследован вопрос отражения в нейронных перестройках режима подкрепления, т.е. семантической ценности сигналов [39, 34 и др.]. Нами проведено исследование динамики условных изменений активности нейронов сенсомоторной коры кролика при вероятностном и постоянном подкреплении оборонительного условного рефлекса. Режим вероятностного подкрепления задавался двумя способами: посредством схемы фиксированного отношения - болевое подкрепление отсутствовало в каждой 4-й пробе или наказывалась каждая 3-я проба; вторая схема квазислучай-ного подкрепления формировалась при программированном биоуправлении - оперант-ном подкреплении паттерна нейронного разряда на условный сигнал при его сопряжении с избеганием болевого наказания. С целью создания контролируемого состояния животных обучение проводили в течение однодневного эксперимента (выполнение условия [41]), включавшего не менее 2-3 сеансов постоянного и частичного подкрепления. В работе анализируются данные, полученные на полисенсорных нейронах, обнаруживших при сочетаниях «адаптивный» характер условных изменений, отличающихся от привыкания. Обучение при частичном подкреплении проводили спустя 30 мин после выработки обо-
ронительного условного рефлекса с постоянным подкреплением и угашением. Сеанс обучения состоял из 130-160 проб, угаше-ние - из 30-40 проб. После образования условных нейронных изменений при подкреплении 75 % проб отмечалась выраженная реакция на сочетаемые сигналы и на последующий после пропуска наказания раздражитель, которая проявлялась на месте подкрепления. При угашении условные паттерны сохранялись в течение 30 проб. В основе этих реакций лежат, по-видимому, экстраполирующие свойства нейронных ансамблей, описанные ранее [13 и др.].
Из «обучавшихся» нейронов (п=112), прошедших повторные сессии обусловливания при подкреплении каждой третьей пробы, 24 % обнаружили сохранение выработанной ранее картины условного ответа без выраженного дифференцирования реакций на подкрепляемый и неподкрепляемый сигналы. Такой характер изменений активности на условный сигнал является, по-видимому, отражением развивающегося эффекта генерализации. Несколько нейронов (4 %) на разных стадиях обучения показали заметное преобладание реакций в подкрепляемых пробах. У 28 % нейронов через 40-70 сочетаний наблюдалась большая активация условного ответа в пробах без наказания и возрастание частоты нейронных разрядов во второй не-подкрепляемой пробе, т.е., по-видимому, проявлялось ожидание животным наказания в цикле «подкрепление - два неподкрепле-ния». В фоновой активности нейрона при этом происходило формирование реакции, предваряющей условный сигнал. При угаше-нии происходило более длительное по сравнению с постоянным подкреплением сохранение условных изменений (р<0,05), преимущественное воспроизведение условного паттерна на месте бывшего подкрепления и в фоне последействия, при первых 4-8 пробах отмечалось наличие антисипационных реакций (рис. 1). Остальные нейроны (44 %), сформировавшие условные перестройки при постоянном подкреплении, показали заметный их декремент в течение одной или нескольких сессий вероятностного обучения, отсутствие условной активации при процеду-
ре угашения. Таким образом, у полисенсор-ных нейронов соматосенсорной коры кролика обнаруживаются два типа антисипацион-ных перестроек на условный сигнал при высокой вероятности болевого подкрепления (Р=0,75) и ожидании менее вероятного сигнала (Р=0,33). Эти формы условных нейронных паттернов при частичном подкреплении классического оборонительного условного рефлекса напоминают картину изменений при инструментальном обучении. Отсутствие наказания в части проб, вероятно, «оценива-
лось» животным как избегание, и манифестировались условные антисипационные ответы и в последействии - антисипационная ассоциативная нейропластичность. Таким образом, отражение в условных нейронных паттернах сенсомоторной коры сложных взаимодействий вероятности подкрепления и принятия решения свидетельствует об ее участии в общей системе высших интегративных механизмов мозга вместе с фронтальной корой и базальными ганглиями [34, 39 и др.].
Рис. 1. Перистимульные гистограммы нейрона сенсомоторной коры при образовании и угашении оборонительного рефлекса в условиях постоянного и частичного подкрепления. А, 1 - привыкание; Б - сочетания: 2, 3 - постоянное подкрепление; 4-6 - подкрепление каждой третьей пробы; В, 7 - угашение. На гистограммах приведены осциллограммы проб. Кружками на гистограммах и осциллограммах обозначены пробы условного сигнала длительностью 4 с. На осциллограммах три темных кружка - подкрепляемая проба с отметкой безусловного сигнала 0,5 с; светлые кружки - неподкрепляемая проба; при частичном подкреплении приведены две или четыре осциллограммы соседних проб; при угашении проба № 6 + «счетная» по подкреплению из периода сочетаний. Вся гистограмма - 25 с, 1 бин - 100 мс, число итераций - 10; слева вверху - номера проб
Рис. 2. Динамика условных нейронных паттернов при их оперантном подкреплении и угашении. Вверху, слева - профили формируемых ответов: ранний, средний, поздний (группы из 20 нейронов). Справа - проявляемость ответов в блоках по 20 проб (первые 20 проб при постоянном подкреплении). Длительность изолированного условного сигнала - 1,5 с. Внизу - формирование паттерна активности полисенсорного нейрона соматосенсорной коры кролика при биоуправляемом обучении: болевая стимуляция выключалась в пробах, если вызванная условным сигналом реакция превышала на 5 импульсов фоновую активность. Слева монтаж осциллограмм: А - угашение ориентировочной реакции на звук (20 проб); Б - выработка временной связи (101 проба); В - отмена сочетаний. Сверху вниз на кадре: ЭЭГ, нейронограмма, отметка раздражителя и его номер, толстая линия - отметка наказания (вертикальные линии - наводка электрокожного раздражения). Справа - монтаж постстимульных гистограмм соответствующих периодов опыта. Цифры на гистограмме - номера 10 суммированных проб; внизу - отметка раздражителя (стрелка - условный, точка - безусловный); по абсциссе - время (1 бин -170 мс), по ординате - количество импульсов
С каждым годом в архиве наблюдений увеличивалось количество «обучавшихся» нейронов, но многие нейроны не следовали антропоморфной логике экспериментатора. В
обсуждениях родилась идея выбрать более полезный для животного парадигм обучения: появление нейронного ответа на условный раздражитель (оперант), превышающего на
определенное число импульсов значение периода предшествующего фона, приводило животное к избавлению от боли, т.е. эффекту положительного подкрепления [29]. Порог управления устанавливался в зависимости от наблюдавшейся картины обучения и частоты разрядов нейрона так, что болевая стимуляция выключалась, когда ответ превышал фон не менее чем на 20-30 %. Критериальный период ответа включал весь условный сигнал, его первую или вторую половины. По этой схеме обучалось 68 нейронов. Для элиминации двигательных артефактов и выделения «чистых» форм нейронных изменений при многократных периодах сочетаний обучение проводилось на обездвиженных кураре животных в течение 6-8 ч. В соматосенсорной коре отбирались неспецифические нейроны с отсутствующей или угасающей реакцией на звуковой сигнал, будущий условный, но с наличием возбудительной реакции на болевой раздражитель лапы. В начальном периоде обусловливания (15-20 проб) давалось постоянное подкрепление для «обозначения» нейронного ответа на условный сигнал, и при его определении вводился режим порогового подкрепления, при котором условный нейронный паттерн проявлялся в течение нескольких десятков проб, отсутствовала динамика обучения по типу «угашения с подкреплением». Если при стандартной процедуре обучения условный нейронный ответ в соматосенсорной коре регистрировался в 37 % проб на протяжении нескольких сессий, то при биоуправляемом обучении - в 58 % (р<0,05), и оказалось возможным оперантно формировать условный ответ, приуроченный к определенному сегменту условного сигнала (рис. 2). В конце выработки временной связи (80-120 проб) основной формой условных изменений становились антисипационная реакция и ответ в последействии раздражителей. Паттерн условных изменений состоял из трех волн активности с периодом, равным времени между условным и безусловным раздражителями. При первых угашениях отмечалась выраженная реакция облегчения (rebound ответ) в фоновой и вызванной активности нейрона, сопровождавшаяся мощной активацией ЭЭГ, а через 6-10 неподкре-
плений появлялись типичные паттерны ответов на условный сигнал и в его последействии, сохранявшиеся в течение нескольких десятков проб. На протяжении всего обучения композиция нейронного ответа при сочетаниях непрерывно изменяется, формируется некий динамический паттерн вокруг условного сигнала и подкрепления (избегание наказания), комплексно кодируя ряд параметров сигналов и их взаимодействия. Таким образом, корковая нейропластичность при биоуправляемом подкреплении уменьшает «временной парадокс» (декремент) обусловливания.
В наших опытах [4] было обнаружено, что одним из кодов условнорефлекторных перестроек нейронов является появление в вызванной и прилежащей фоновой активности межимпульсных интервалов, близких к частоте болевого (безусловного) раздражителя. Поэтому другой парадигм биоуправляе-мого обучения основывался на подкреплении (отмене болевых стимулов) межспайковых интервалов определенного диапазона, выше или ниже критериального интервала (36 животных, 36 нейронов). На обездвиженных кроликах производилось избирательное наказание (болевая стимуляция конечности, заметно не влиявшая на текущую частоту) определенного диапазона коротких или длинных межимпульсных интервалов в фоновой активности нейронов соматосенсорной коры (рис. 3). Временной селектор, с помощью которого определялась длительность каждого межимпульсного интервала, и программное устройство обеспечивали автоматически управляемую стимуляцию по сигналу обратной связи. Анализ постинтервальных гистограмм показал, что в результате происходящей при этом реорганизации импульсных потоков уменьшается общее количество меж-спайковых интервалов (оперант), наказываемых болевыми стимулами. При наказании коротких интервалов (п=14) снижалась текущая частота разрядов и увеличивалась вероятность появления длинных интервалов непосредственно вслед за наказываемыми короткими интервалами - эффект оперантного обучения (р<0,05). При наказании длинных интервалов (п=16) у одной группы корковых нейронов увеличивалась средняя частота раз-
рядов и, соответственно, уменьшалось общее количество длинных интервалов. У другой группы нейронов уменьшение количества длинных интервалов произошло на фоне снижения средней частоты разрядов клеток с формированием коротких пачек. Реорганизация импульсных потоков определялась, по-видимому, степенью синхронизации восходящих активирующих ноцицептивных влияний и их суммацией с фазами возбуждения и торможения в реципрокно взаимодействующих совокупностях нейронов [36 и др.]. Таким образом, открытый Бйе [22] в двигательной коре факт оперантного обусловливания частоты нейронных разрядов при пище-
вом подкреплении и целеуказании был обнаружен при болевой биоуправляемой стимуляции межимпульсных разрядов нейронов соматосенсорной коры, активность которой предшествует активации двигательной коры в моторных актах [2 и др.].
Описанные выше исследования были расширены при оперантном обучении активности малых 2-8-нейронных популяций по методике Сидмановского избегания [29], когда спонтанные осцилляции частоты разрядов мультиклеточной активности (интегрированная частота разрядов) автоматически подкреплялись избеганием животным слабого болевого наказания.
Рис. 3. Динамика средней частоты корковых нейронов, обучавшихся при биоуправляе-мом наказании заданного диапазона межспайковых интервалов: А - наказывались интервалы менее 200 мс; В - наказывались интервалы более 100 мс.
I - фон, II - обучение, III - фон после. Сверху вниз: а) динамика меток и стимулов, б) динамика средней частоты разрядов, в) постинтервальные гистограммы, приведенные к одному интервалу, где п - общее количество наказываемых интервалов в пятиминутных отрезках периодов опыта. По абсциссе - время, мс, по ординате - среднее количество разрядов за каждые последовательные 10 мс вслед за «меченым» интервалом. Внизу -осциллограммы внеклеточных потенциалов в фоне, калибровка 100 мс и 1 мВ
После «нейронного взрыва» 1950-1970 гг., когда шло широкое освоение техники и результатов микроэлектродной регистрации отдельных нейронов, возникла неудовлетворенность в понимании интегративных механизмов мозга, вызвавшая в последней трети XX в. большой интерес к мультиклеточной
активности, регистрируемой одним или множественными электродами [26 и др.]. Регистрация мультиклеточной активности - простая процедура, широко используемая ныне, но она весьма «досаждала» при выделении отдельных нейронов и выбраковывалась много лет. Позднее Freeman [25] сформулировал
ряд важных понятий (нейронные массы, ансамбль, картель и др.) и обосновал необходимость колебательного нейронного хаоса, обеспечивающего неограниченную пластичность мозга. Нейронный ансамбль как процессинг взаимодействующих элементов (тер-
мин «ансамбль» ввел А.А. Ухтомский) приобрел в последнее десятилетие измеряемые черты и интенсивно исследуется в теоретическом и прикладном аспектах благодаря развитию мощных методов оценки и распознавания множественных сигналов [21].
Рис. 4. Протокол полиграфической записи биоуправляемого обучения кролика повышению частоты разрядов мультиклеточной активности соматосенсорной коры (разные опыты, А и В). 1 - запись периода фона, 2 (стрелка) - период обучения: «наказываются» эпизоды мультиклеточной активности ниже 40 Гц. На записях А и В сверху вниз: 1 - отметка стимулов (для 1 - «мнимые», для 2 - реальные); 2(Ы) - огибающая частоты мультиклеточной активности (нижний уровень пула); 3(Ы) - огибающая нейронных разрядов верхнего управляющего уровня пула; 4(БКв) - кардиоинтервалограмма; 5(ББО) -локальная ЭЭГ; 6 :Г - 5-5,5 Гц составляющая ЭЭГ; 7 :Г - 12-13 Гц составляющая ЭЭГ, 8(18) - отметка времени 1 с. Медленные модуляции нейронной активности и сердечного ритма начались после включения болевой стимуляции
Мультиклеточная активность представляет собой сложный поток различающихся по амплитуде и форме импульсов, являющихся потенциалами действия определенного множества нервных элементов [26 и др.]. Частотные характеристики этой активности зависят главным образом от размеров регистрируемых популяций и определяются в первую очередь диаметром и сопротивлением микроэлектрода, его расположением в неоднородном субстрате мозговой ткани и функциональным состоянием животного (рис. 5, 6).
В наших исследованиях впервые была показана возможность выработки устойчивых сдвигов частоты разрядов мультиклеточ-ной активности соматосенсорной коры кролика, флуктуации которой становились опе-рантами и сопрягались с наказанием как в сторону их повышения, так и понижения в последовательных сессиях обучения. У 64 % нейронных популяций через 2-12 мин управляемой по обратной связи ноцицептивной стимуляции («наказывалась» частота разрядов ниже/выше пороговой) наблюдалось зна-
чимое повышение/снижение частоты нейронных разрядов, медленные модуляции активности и соответствующее уменьшение количества болевых раздражений, их минимизация на 30-50 % по сравнению с исходным уровнем в течение 2-5 мин - эффект опе-рантного обучения, воспроизводившийся и в последующих сессиях. Устойчивые сдвиги после однократной биоуправляемой стимуляции как в сторону увеличения, так и в сторону снижения частоты разрядов сохранялись в течение 15-20 мин после ее выключения. Изменения частоты разрядов малых
нейронных популяций были направлены в сторону ухода от тех частот, при которых на объект подавалась биоуправляемая болевая стимуляция. Механизм развития адаптивных сдвигов активности корковых нейронных популяций осуществляется посредством опе-рантного взаимодействия импульсных потоков, основанного на временной синхронизации состояний мозга с моментами выключения биологически отрицательных воздействий и воспроизведением «обученных» паттернов, на основе непрерывной оперантной нейропластичности мозга.
Рис. 5. Динамика образования устойчивых изменений активности нейронных популяций при биоуправляемой стимуляции к повышению или снижению частоты их разрядов. А - осциллограмма разрядов одной из нейронных популяций. Б - графики развития устойчивого увеличения (кривая 1) и снижения (кривая 2) частоты разрядов для разных нейронных популяций, построенные по минутным значениям. 1’, 2’ - соответствуют кривым 1 и 2 - среднее число стимулов наказания в минутных отрезках для периода обучения II (для периодов I и III - число псевдостимулов-отметок). I - исходная фоновая активность, II - период обучения-стимуляции, III - фон после. Горизонтальные пунктирные линии - средний уровень исходного фона, порог подкрепления. В - огибающая текущей средней частоты разрядов нейронной популяции; Г - автокоррелограммы для нейронной популяции 1 с отсутствием периодики в фоне и формы участков десинхронизированной и медленноволновой активности (наложение 40 пятнадцатисекундных отрезков, где по ординате - среднее число стимулов на 1 участок; вертикальные линии -достоверные границы, заштрихованные столбики - зона наказания) соответственно периодам I, II, III. Д - то же для нейронной популяции 2 с квазипериодическими флюктуациями фона и форма участков медленной и десинхронизированной активности
С помощью построения автокоррело-грамм были проанализированы медленные изменения текущей частоты разрядов корковых нейронных популяций при биоуправляе-мой выработке устойчивых сдвигов в сторону увеличения или снижения их активности. Эндогенные колебания частоты разрядов мультиклеточной активности характеризуются наличием медленных осцилляций (с периодом 10-20 с) и десинхронизированных участков (рис. 5). При биоуправляемой автостимуляции механизм развития устойчивых сдвигов связан с преимущественным воспроизведением менее «наказываемых» болевым стимулом колебаний активности корковых нейронных популяций. Динамика воспроизведения этих составляющих до, во время и после управляемой стимуляции коррелировала с распределением количества болевых стимулов (кривой обучения-избавления) в те же периоды опыта. Резонансная синхронизация определенных внутренних состояний мозга, лежащая в основе выработки устойчивых адаптивных сдвигов, обусловлена наличием непрерывных медленных осцилляций частоты разрядов нейронных популяций, модулированных ноцицептивной системой и сигналами обратной связи. После предварительного введения аминазина (3-6 мг/кг) не наблюдалось направленных перестроек активности нейронных популяций, приводящих к минимизации болевых воздействий, связанных с тем, что нейролептик полностью подавлял двухфазную реакцию частоты сердцебиений на ноцицептивную стимуляцию, выключал барорефлекторный процессинг и вторично нарушал совместную дофа-минергическую систему подкрепления и болевого контроля [14].
Фурье-анализ текущей частоты разрядов нейронных популяций показал, что медленные флюктуации фоновой активности муль-тиклеточных совокупностей соматосенсорной коры со средней частотой 20-60 Гц отличаются несколькими профилями спектра. В большинстве случаев (67 %) нейронные популяции имеют в своей активности ту или иную ритмическую составляющую с большим весом в диапазоне 0,02-0,7 Гц и низким присутствием других частот. В других случа-
ях спектр состоит из двух групп частот с относительно большим весом (19 %), значительно реже встречается отсутствие ритмических колебаний (14 %). При анализе осцилляций текущей частоты мультиклеточной активности во время оперантного обучения обнаружилось появление в спектре 0,35-0,5 Гц компонента малого веса, связанного, вероятно, с сигналами обратной связи, и значительное повышение мощности низкочастотных колебаний 0,02-0,18 Гц, отражающих не только переходные изменения, но и настройку процессинга общего адаптивного регулирования организма, манифестацию адапто-генных ритмов (рис. 6).
Заключение. Многими исследователями была обнаружена периодическая активность отдельных нейронов и популяций: вентро-базального таламического ядра (0,09-1,3 Гц), обонятельной луковицы [25] (менее 1 Гц), осцилляций ретикулярных таламических и таламо-корковых нейронов [40], сердечный ритм 0,05-0,5 Гц нейронных флюктуаций продолговатого мозга [31], таламуса [28] и мультиклеточной активности соматосенсорной коры. Эти медленные осцилляции являются, по-видимому, одним из основных свойств деятельности систем мозга, на основе которого происходит саморегуляция нейронных ансамблей в процессах адаптации, восприятия сигналов и обучения организма. Динамическая система адаптивной регуляции может быть представлена в виде комплекса непрерывных взаимодействий, ассоциаций, текущих нейронных осцилляций с сенсорным возбуждением, непосредственно следующим за их отдельными составляющими. Этот контур регуляции связывается с медленными модуляциями ритмов продолговатого мозга, отражающих синергетичность болевой и барорефлекторных систем при повторяющихся ноцицептивных воздействиях [37]. Образующиеся временные резонансные сопряженности с мотивационно-подкрепляющими системами избирательно активируют или подавляют компоненты биоэлектрической активности, формируя соответствующую популяцию нейронов, минимизирующих возмущающие воздействия [15, 14].
Рис. 6. Динамика активности отдельной нейронной популяции, оперантно самообучающейся снижать или повышать частоту разрядов. А - схема биоуправляемой стимуляции при обучении нейронной популяции повышать частоту разрядов выше заданного порога (звездочка). Сверху вниз: отметка стимулов, огибающая мультиклеточной активности (слева ее осциллограмма), отметка времени. Б - динамика текущей частоты нейронных разрядов, построенная по минутным значениям в различные периоды опыта (1 - фон; 2 - обучение, наказывается частота разрядов выше 50 Гц; 3 - фон после; 4 - контроль (неуправляемая стимуляция); 4’ - фон после; 5 - обучение (наказывается частота разрядов ниже 50 Гц); 6 - фон после. В - Фурье-спектры текущей средней частоты разрядов мультиклеточной активности из соответствующих периодов опыта (фрагменты из 4000-6000 импульсов, время усреднения - 1 с). По абсциссе - частоты (максимальная 0,5 Гц), по ординате - нормированные мощности частот спектра
Основными принципами осуществления процессов оперантной нейропластичности в механизмах саморегуляции-обучения, опосредующих достижение полезного результата (избегание ноцицептивной стимуляции), являются классический Павловский условный рефлекс [11], оперантное обусловливание
B.F. Skinner и формирование акцептора действия П.К. Анохина [1].
У обучившихся популяций нейронов наблюдается характерная картина медленных модуляций активности - формирование доминирующего локуса периодической активности, отражающей различные стадии развития оперантного взаимодействия импульсных потоков (адаптивных саморегуляций) и сохранения памятного следа. Саморегуляция по обратной связи локуса медленных модуляций нейронных взаимодействий приводит к минимизации болевых воздействий на организм
и осуществляется, вероятно, в режиме доминантного функционирования (по А.А. Ухтомскому [17]). В ряде работ последнего десятилетия показана роль медленных осцилляций во взаимодействии корковых, таламических, гиппокампальных нейронных сетей [16, 27, 38 и др.].
Один из актуальных вопросов в поведенческой нейронауке касается механизма нейропластичности нейронных взаимодействий при обучении организма. Уже давно предложены принципы клеточного обучения ИеЬЬ (1949) в тех или иных парадигмах, но по-прежнему мало известно о том, как нейроны объединяются в локальных и распределенных сетях, образуя системную пластичность, формируя агрегаты и репрезентативные поля пластичности корковых зон. В наших модельных экспериментах по управлению формированием определенного диапазона меж-
спайковых интервалов при биоуправляемой ноцицептивной стимуляции экспрессируется межимпульсная нейропластичность. Межклеточные взаимодействия мультинейронных единиц сенсомоторной коры, собирающих активность в сфере нескольких сот микрон, эффективно самообучаются посредством обратной связи управлять минимизацией болевых воздействий на организм в значительном диапазоне и направлении частотных изменений, сохраняя пластические перестройки более 15-20 мин - это ассоциированная нейропластичность. В нейронных популяциях головного мозга (в сенсомоторной коре в частности) при биологически значимых воздействиях осуществляется непрерывный процессинг оперантной нейропластичности в системах сердечно-сосудистой и болевой регуляций посредством модуляции механизма подкрепления, приводящей к минимизации возмущающих воздействий, образуя системную пластичность.
Обнаруженные экспериментально зависимые изменения в активности нейронных популяций столь выражены, длительно сохраняются, переучиваются в зависимости от знака биоуправляемой стимуляции, что не оставляют сомнений в том, что ассоциированная оперантная нейропластичность - изначальное свойство колебательной активности (осцилляций) нейронных взаимодействий, локальных и распространенных, создающих объединения ансамблей из непрерывного «квазихаоса» элементов и связей [25], создающего «неограниченную» пластичность мозга. Следует также отметить, что при биоуправляемой ноцицептивной стимуляции могли обучаться нейронные популяции как соматосенсорной коры (ответственной за болевую нейропластичность), так и слуховой и зрительной коры [7]. При раздельной биоуправляемой стимуляции от амплитудных составляющих мультиклеточной активности наблюдалась сходная динамика знака и частотных перестроек активности выделенных мультиклеточных единиц.
Большая часть наших знаний о нейропластичности сенсомоторных изменений связана с долговременной потенциацией и депрессией, морфологическими изменениями,
происходящими в синаптическом субстрате [10]. Синаптическая пластичность играет важную роль при обучении [19, 43]. Существуют новые доказательства, что сенсомотор-ные поля остаются в течение жизни более пластичными, чем гиппокамп [24]. Пластичность внутри структуры мозговой коры усиливается под влиянием модуляторных систем (дофаминовой и холинэргической). Достижения метода одновременной множественной микроэлектродной регистрации (ВСЬтехно-логия) позволяют усилить взаимодействие с этими механизмами и разработать новые средства для мобилизации сенсомоторной пластичности двигательного обучения [23,
32, 35].
Оперантный механизм интегративного взаимодействия импульсных потоков при обучении посредством биоуправления, приобретение нейронными ансамблями системного свойства саморегуляции на основе эволюционной оперантной пластичности нейронных взаимодействий, обнаруженной также в нейронах ганглиев насекомых [18], посредством медленной модуляции их активности, приводящей к минимизации возмущающих воздействий, осуществлются путем формирования доминантного центра, обладающего свойствами подкрепляющего эффекта и временного командного управления. Опе-рантное обусловливание низкочастотных нейрональных осцилляций является рабочим механизмом системной интеграции и пластичности в процессах обучения и памяти.
Системная оперантная нейропластичность является основным процессом в интегративных механизмах обучения. Открытие оперантного взаимодействия осцилляций нейронных совокупностей и формирования самоорганизующихся паттернов их активности позволит, вероятно, в недалеком будущем обучать нейронные ансамбли посредством использования автоподстраивающихся алгоритмов микропроцессорных чипов, управляя необходимой функциональной пластичностью и предупреждая дисфункциональную нейропластичность.
Выводы:
1. Исследование ассоциативной нейропластичности при обучении с различной ве-
роятностью болевого подкрепления обнаруживает у полисенсорных нейронов соматосенсорной коры кролика два типа перестроек на условный сигнал с высокой и низкой частотой подкрепления. При пропусках каждого четвертого наказания сохраняются условные нейронные паттерны на подкрепление. При 33 % вероятности сочетаний активация нейронных ответов развертывается в пробах без наказания, нарастая во втором пропуске подкрепления за счет предваряющей реакции и в последействии.
2. Биоуправляемое подкрепление активности отдельных нейронов по заданному изменению частоты разрядов в сегменте условного сигнала оптимизирует обучение нейронного паттерна, формирующегося в парадигме Павловского аверсивного обусловливания с развитием антисипационных ответов, минимизирующих болевой стресс, - антиси-пационная пластичность.
3. Обнаружение «меченых» частотой подкрепления межимпульсных интервалов в нейронной активности привело к исследованию избирательного наказания болевыми стимулами определенных диапазонов коротких или длинных межимпульсных интервалов в фоновой активности клеток, приводящих к уменьшению наказываемых интервалов, - селективное управление межспайковой нейропластичностью.
4. У 64 % мультиклеточных единиц через 4-12 мин биоуправляемой ноцицептивной стимуляции («наказывалась» частота разрядов ниже/выше пороговой) наблюдается устойчивое повышение/снижение частоты нейронных разрядов и соответствующая минимизация болевых раздражений на 30-50 % в течение
2-5 мин, сохранявшиеся 15-20 мин, - опе-рантная нейропластичность корковых нейронных популяций.
5. Автокорреляционный и спектральный анализ медленных колебаний активности нейронных популяций показал, что при био-управляемом обучении происходит преобразование медленных осцилляций мультикле-точной активности в диапазоне 0,02-0,5 Гц, приводящее к воспроизведению менее наказываемых биоритмов, образуя механизм текущей интеграции.
1. Анохин П. К. Биология и нейрофизиология условного рефлекса. М. : Медицина, 1968. 547 с.
2. Асанума Хи. Моторная кора : монография / пер. Р. А. Григорьян. СПб. : ФГУП СМЭП МВД РФ, 2007. 137 с.
3. Балабан П. М., Коршунова Т. А. Сетевые, клеточные и молекулярные механизмы пластичности в простых нервных системах // Успехи фи-зиол. наук. 2011. Т. 42, № 4. С. 3-19.
4. Василевский Н. Н., Суворов Н. Б., Труба-чев В. В. Воспроизведение частотных параметров безусловных ответов в условнорефлекторных реакциях нейронов соматосенсорной коры // Журн. высш. нервн. деят. 1972. Т. 22, № 5. С. 801-809.
5. Василевский Н. Н., Суворов Н. Б., Труба-чев В. В. Выработка устойчивых изменений частоты разрядов корковых нейронных популяций // Физиол. журн. СССР. 1972. Т. 58. №5. С. 639646.
6. Василевский Н. Н., Суворов Н. Б., Труба-чев В. В. Эндогенная ритмика нейронных популяций и адаптивное регулирование // Физиол. журн. СССР. 1973. Т. 59, № 12. С. 1852-1859.
7. Василевский Н. Н., Трубачев В. В. Системный анализ адаптивной саморегуляции функций организма: экспериментальные и теоретические основания, перспективы // Адаптивная саморегуляция функций. М. : Медицина, 1977. С. 11-49.
8. Василевский Н. Н., Трубачев В. В., Суворов Н. Б. Изменения импульсной активности корковых нейронов при избирательном подкреплении выбранного диапазона их межимпульс-ных интервалов // Нейрофизиология. 1972. Т. 4. С. 339-348.
9. Гондарева Л. Н. Прогнозирование и коррекция состояния человека по биоритмологическим характеристикам физиологических процессов при различных видах деятельности : автореф. дис. ... д-ра биол. наук. СПб., 1996. 37 с.
10. Кандель Э. В поисках памяти: Возникновение новой науки о человеческой психике. М. : Астрель : Corpus, 2012. 736 с.
11. Павлов И. П. Двадцатилетний опыт объективного изучения высшей нервной деятельности (поведения) животных. М. : Наука, 1973. 661 с.
12. Симонов П. В. Лекции о работе головного мозга. М. : Ин-т психологии РАН, 1998. 95 с.
13. Соколов Е. Н. Восприятие и условный рефлекс: новый взгляд. М. : УМК «Психология» ; Московский психолого-социальный институт, 2003. 287 с.
14. Сороко С. И., Трубачев В. В. Нейрофизиологические и психофизиологические основы адаптивного биоуправления. СПб. : Политехника-сервис, 2010. 607 с.
15. Судаков К. В. Условный рефлекс в системной организации поведенческих актов // Фи-
зиол. журн. им. И. М. Сеченова. 1993. Т. 79, № 5. С. 23-35.
16. Трубачев В. В. Медленные нейронные осцилляции как оперантный процессинг механизмов интеграции, обучения, пластичности // Рос. физи-ол. журн. им. И. М. Сеченова. 2012. Т. 98, № 1.
С. 155-171.
17. Ухтомский А. А. Доминанта. СПб. : Питер, 2002. 448 с.
18. Balaban P. M. Cellular mechanisms of behavioral plasticity in terrestrial snail // Neurosci. behav. Rev. 2002. Vol. 26, № 5. P. 597-630.
19. Buonomano D. V., Merzenich M. M. Cortical plasticity: from synapses to maps // Annu. Rev. Neurosci. 1998. Vol. 21. P. 149-186.
20. Clark R. The classical origins of Pavlov's conditioning // Integrat. Physiol. Behav. Sci. 2004. Vol. 39, № 4. P. 279-294.
21. Deadwyler S. A., Hampson R. E. The Significance of Neural Ensemble Codes During Behavior and Cognition // Annu. Rev. Neurosci. 1997. Vol. 20. P. 217-244.
22. Fetz E. E. Operant control of single unit activity and correlated motor responses // Operant Control of Brain Activity. Los Angeles, California : UCLA Press, 1974. P. 61-90.
23. Fetz E. E. Volitional control of neural activity: implications for brain-computer interfaces // J. Physiol. 2007. Vol. 579 (3). P. 571-579.
24. Francis J. T., Song W. Neuroplasticity of the Sensorimotor Cortex during Learning // Neural Plasticity. 2011. Vol. 20. P. 11.
25. Freeman W. J. Role of chaotic dynamics in neural plasticity // Prog. Brain Res. 1994. Vol. 102. P. 319-333.
26. Gabriel M., Wheeler W., Thompson R. F. Multiple-unit activity of the rabbit cerebral cortex in single-session avoidance conditioning // Physiological Psychology. 1973. Vol. 1. P. 45-55.
27. Gray C. M. Synchronous oscillations in
neuronal systems: Mechanisms and functions
// J. Comput Neurosci. 1994. Vol. 1 (1-2). P. 11-38.
28. Heart rate variability is encoded in the spontaneous discharge of thalamic somatosensory neurons in cat / M. Massimini [et al.] // J. Physiol. 2000. Vol. 526, № 5. P. 387-396.
29. Kimble G. A. Foundations of conditioning and learning. NY : Appleton Century Crofts, 1967. 696 p.
30. Kolb B., Whishaw I. Q. Brain Plasticity and Behavior // Annu. Rev. Psychol. 1998. Vol. 49. P. 43-64.
31. Lambertz M., Langhorst P. Simultaneous changes of rhythmic organization in brainstem neurons, respiration, cardiovascular system and EEG between 0,05 Hz and 0,5 Hz // J. Autonomic Nervous System. 1998. Vol. 68. P. 58-77.
32. Lebedev M. A., Nicolelis M. Brain-machine interfaces: past, present and future // TRENDS in Neurosciences. 2006. Vol. 29, № 9. P. 536-546.
33. Lennartz R. C., Weinberger N. M. Analysis of response systems in Pavlovian conditioning reveals rapidly versus slowly acquired conditioned responses support for two factors, implications for behavior and neurobiology // Psychobiology. 1992. Vol. 20 (2). P. 93-119.
34. Midbrain Dopaminergic Neurons and Striatal Cholinergic Interneurons Encode the Difference between Reward and Aversive Events at Different Epochs of Probabilistic Classical Conditioning Trials / M. Joshua [et al.] // J. Neurosci. 2008. Vol. 28, № 45. P. 11673-11684.
35. Moritz C.T., Perlmutter S. I., Fetz E. E. Direct control of paralysed muscles by cortical neurons // Nature. 2008. Vol. 456. P. 639-642.
36. Price D.D., Dubner R. Neurons that subserve the sensory-discriminative aspects of pain // Pain. 1977. Vol. 3. P. 307-338.
37. Randich A., Maxiner W. The role of sinoaortic and cardiopulmonary baroreceptor reflex arcs in nociception and stress-induced analgesia // Stress-induced analgesia. NY : Acad. Sci., 1986. № 41. P. 385-401.
38. Schroeder C., Lakatos P. Low-frequency neuronal oscillations as instruments of sensory selection // Trends in Neurosciences. 2008. Vol. 32, № 1. P. 9-18.
39. Schultz W. Multiple Dopamine Functions at Different Time Courses // Annu. Rev. Neurosci. 2007. Vol. 30 (1). P. 259-288.
40. Steriade M. Impact of network activities on neuronal properties in cortico-thalamic systems // J. Neurophysiol. 2001. Vol. 86. P. 1-39.
41. Thompson R. F. The Neurobiology of Learning and Memory // Science. 1986. Vol. 233. P. 941-947.
42. Trubachov V. V. The activity of neurons of sensomotor cortex of the rabbit with constant and partial reinforcement // J. Neuroscience and Behav. Physiology. 1991. Vol. 20, № 4. P. 339-341.
43. Weinberger N. M. Associative representational plasticity in the auditory cortex: A synthesis of two disciplines // Learn. Mem. 2007. Vol. 14. P. 1-16.
THE NEUROPLASTICITY OF RABBIT'S SOMATOSENSORY CORTEX DURING PAVLOVIAN AVERSIVE LEARNING AND OPERANT CONDITIONING OF SINGLE AND MULTIUNIT ACTIVITY TO NEUROFEEDBACK'S NOCICEPTIVE STIMULATION
V.V. Trubachev
It was found that neuronal activity of the rabbit somatosensory cortex could be operantly conditioned according to the given algorithm of biofeedback control of nociceptive stimulation leading to rising or lowering of firing rate of multiunit activity, or to changes of range of units interspike intervals, or neuronal firing patterns for conditional stimulus, which become operants. Neuronal interactions of its population with feedback and systems of cardiovascular and pain regulation lead to appearance of wave patterns, combining elements to integrative activity by conditioning. Low-frequency oscillations of neuronal assemblies within range of 0,02-0,5 Hz act as operant processor in mechanisms of system plasticity and conditioning.
Keywords: neuroplasticity, neuron's operant, slow 0,02-0,5 Hz neuronal oscillations, multiunit activity, somatosensory cortex, nociceptive neuron's feedback.