48
Автомобильный транспорт, вып. 35, 2014
АВТОТРАНСПОРТНЫЕ СРЕДСТВА
УДК 621.436-55
АДАПТИВНОЕ УПРАВЛЕНИЕ СИЛОВОЙ УСТАНОВКОЙ ГИБРИДНОГО
АВТОМОБИЛЯ
С.А. Сериков, доц., д.т.н., Харьковский национальный автомобильно-дорожный
университет
Аннотация. Рассматривается задача адаптации управления силовой установкой гибридного автомобиля, минимизирующей векторный критерий качества при наличии ограничений на параметры состояния и вектор управления. Приведена формальная постановка задачи, рассмотрено её решение методом нейросетевого управления на основе адаптивной критики.
Ключевые слова: гибридный автомобиль, гибридная силовая установка, искусственная нейронная сеть, нейросетевое управление, адаптивный критик, топливная экономичность, токсичность отработанных газов.
АДАПТИВНЕ УПРАВЛІННЯ СИЛОВОЮ УСТАНОВКОЮ ГІБРИДНОГО
АВТОМОБІЛЯ
С.А. Сєріков, доц., д.т.н., Харківський національний автомобільно-дорожній
університет
Анотація. Розглядається задача адаптації управління силовою установкою гібридного автомобіля, що мінімізує векторний критерій якості за наявності обмежень на параметри стану і вектор управління. Приведено формальну постановку задачі, розглянуто її розв’язання методом нейромережного управління на основі адаптивної критики.
Ключові слова: гібридний автомобіль, гібридна силова установка, штучна нейронна мережа, нейромережне управління, адаптивний критик, паливна економічність, токсичність відпрацьованих газів.
ADОPTIVE CONTROL OF THE HYBRID VEHICLE POWER UNIT
S. Serikov, Assoc. Prof., D. Sc. (Eng.),
Kharkiv National Automobile and Highway University
Abstract. The problem of adaptive control of the hybrid vehicle power unit, which makes it possible to minimize the quality criterion under constraints on the state parameters and the control vector is considered. A formal statement of the optimization problem is given. The solution of this problem by the method of neural network control based on the adaptive criticism is considered.
Key words: hybrid vehicle, hybrid power unit, artificial neural network, neural networks control, adaptive criticism, fuel efficiency, engine emissions.
Введение
Дальнейшее повышение топливной экономичности и экологической безопасности транспортных средств, движущихся без внешнего подвода энергии, связывают с
комбинацией различных физических принципов аккумулирования и преобразования энергии в составе одной энергетической установки. Этот подход предполагает максимально полное использование преимуществ доступных способов аккумулирования и пре-
Автомобильный транспорт, вып. 35, 2014
49
образования энергии на различных тяговоскоростных режимах и взаимную компенсацию их недостатков. Данное направление развивается в рамках концепции гибридного автомобиля.
Силовая установка гибридного автомобиля (ГСУ), как правило, включает в себя, помимо основного двигателя внутреннего сгорания (ДВС), вспомогательный тяговый электродвигатель и контур рекуперации энергии, использующий тяговую аккумуляторную батарею (ТАБ) в качестве накопителя энергии. Подзарядка ТАБ может осуществляться при наличии избытка мощности основного двигателя либо путем рекуперации энергии торможения транспортного средства.
Эффективность гибридного автомобиля решающим образом зависит от стратегии управления ГСУ, определяющей перераспределение потоков мощности между основными её агрегатами в зависимости от тяговоскоростного режима движения и текущего состояния.
Анализ публикаций
Управление силовыми установками большинства современных гибридных автомобилей осуществляется на основании логических правил выбора стратегии [1]. При таком управлении, в основном, не учитываются особенности конкретной дорожной ситуации и характер ездового цикла. Существует достаточно большое количество публикаций, посвящённых совершенствованию данного подхода к управлению ГСУ [2 - 4], однако он не позволяет полностью реализовать потенциал энергоэффективности гибридного автомобиля.
Наиболее полно использовать возможности гибридных технологий в части повышения топливной экономичности и экологической безопасности автомобиля позволяет применение адаптивного управления ГСУ. Однако существенная вычислительная сложность алгоритмов адаптации сдерживает их широкое применение [3-11].
Многими авторами исследовались возможности вычислительного интеллекта при управлении силовыми установками гибридных автомобилей. Управление на основе систем нечёткого вывода применяется в [2-4, 9, 12]. В работе [8] показана возможность при-
менения генетических алгоритмов для настройки систем нечёткого вывода. Использование искусственных нейронных сетей (ИНС) при управлении ГСУ рассматривается в [2, 3, 5, 11]. Совместному использованию ИНС и систем нечёткого вывода посвящена работа [7]. Упомянутые исследования показывают существенный потенциал улучшения эксплуатационных характеристик гибридных автомобилей на основе более эффективного управления ГСУ.
Цель и постановка задачи
Данная работа посвящена одному из наиболее перспективных и неисследованных подходов к реализации адаптивного управления ГСУ - нейроуправлению с использованием нейросетевого адаптивного критика [13, 14]. В этом случае в структурной схеме САУ содержится специальный блок - Критик, оценивающий качество работы всей системы управления с учётом прогноза тяговоскоростного режима движения. Адаптация стратегии управления ГСУ осуществляется на основе концепции обучения ИНС с подкреплением. В отличие от работы [15], в состав адаптивного регулятора ГСУ введена нейросетевая модель объекта управления, что позволило существенно улучшить адаптацию стратегии управления ГСУ к тяговоскоростному режиму движения автомобиля.
Силовая установка гибридного автомобиля как объект управления
Будем рассматривать автомобиль с ГСУ как многомерный управляемый нелинейный стационарный объект вида
Jx (k +1) = x (k) + AT ■ f (x (k), u (k), \ (k))
{У (k) = h (x (k), u (k)),
где x = [ю, 0TAB ]T - вектор состояния, компонентами которого являются текущая угловая скорость вращения ведущих колёс ( ) и
степень заряженности ТАВ (0TAB);
u = [Pd , Pm , Pt , y]T - вектор управления, включающий сигналы управления мощностью ДВС ( Pd ), электромагнитным моментом тягового электродвигателя (Рм ), системой гидравлического торможения (Рт) и передаточное отношение (у) трансмиссии от
50
Автомобильный транспорт, вып. 35, 2014
ДВС к ведущим колесам; \ = [а, S0 ]Т - вектор возмущающих воздействий, в качестве которых выступают уклон дороги (а ) и скорость встречного ветра (&0); y = [V, GT, ET ]Т - вектор выхода, включающий скорость автомобиля (V), часовой расход топлива (GT ) и степень токсичности отработанных газов
ДВС ( ET = fT (CNOx , CCO , CHC ) ), которая является функцией часовой эмиссии оксидов азота, оксида углерода и углеводородов соответственно; AT - шаг дискретизации по времени; f (•) и h(«) - известные непрерывные или кусочно-непрерывные векторфункции.
Множество всех возможных состояний образует двухмерное пространство состояний X
x є X с М+
X =
0 <®<Ш max . 0 < ®TAB < 1 .
на котором можно выделить подмножество эксплуатационных состояний
X
ex
0 < со < со e
< ®TAB < Єє
X.
Выход состояния системы за пределы Xex не желателен, хотя и не ведёт к аварийной ситуации.
Полагаем, что управляющие воздействия должны быть ограничены, т.е. и є U с М4,
хода топлива, уровня токсичности отработанных газов, отклонения степени заряжен-ности ТАБ от оптимальной.
О качестве каждого k -го шага управления, переводящего систему из состояния x (k) в
состояние x (k +1) , можно судить по следующим критериям:
Jvk (k ) = К
NV
\vzd (k +1)-V(k +1))2 v+SV (V (k +1))
\
/
Jek (k ) = K
N Є
(eex.opt - eTAB (k + 1)) +
+Se2 (eTAB (k + 1))
JGk (k) = KngG2t (k) ;
J Ek ( k )= К
NE
2 { \
KENOxCNOx (k) +
+KecoCco (k)
+ KehcChc (k)
где Knv , KNe, Kng , Kne - нормирующие
коэффициенты, обеспечивающие нормирование и приведение критериев качества к безразмерным величинам; eexopt - оптимальная степень заряженности ТАБ; SV, Se -функции штрафа за выход из области эксплуатационных режимов
SV (V )
0, при со < (О
rkol (®-®ex.max ) , при ®>®,
U =
'Pd =—1, 0 <PD < 1
— 1 <Pm < 1 Se (eTAB ) = *
0 < pT < 1
і m II 'Jy | 1
0,
|e .
| ex.mm
при
e < Єтлв < e ,
ex.mm TAB ex.max ’
eTAB|, при
eex.min > eTAB > eex.max ;
Pd = —1 соответствует отключенному состоянию ДВС.
Основной задачей управления ГСУ является поддержание с минимальной ошибкой заданной скорости автомобиля Vzd (k),
k = 0, N при наличии возмущений и ограничений на возможные состояния системы и допустимые управления. Кроме того, процесс управления должен удовлетворять ряду дополнительных условий: минимизации рас-
rkol - радиус качения ведущих колёс; KENOx , KeCo , KehC - коэффициенты токсичности соответствующих компонентов отработанных газов.
Указанные критерии можно рассматривать как компоненты вектора
3(x u, k ) =3(k ) = [JVk, J ek , J Gk, J Ek ]T, характеризующего качество управления на k -м шаге. Функционал качества управления ГСУ при использовании линейной свёртки крите-
Автомобильный транспорт, вып. 35, 2014
51
риев оптимальности для выделения единственного решения оптимизационной задачи из области парето-оптимальных управлений можно представить в виде
ад 4
J sv ц( к ) = £цj •£ K р, -3, (к + j),
j=0 i=1
где ц - дисконтный фактор, учитывающий степень достоверности оценки будущих значений критериев качества, 0 < ц < 1; K -вектор приоритетов, определяющий степень важности отдельных критериев на различных участках ездового цикла
XKp.i = 1, Kp.i > 0, i = 1Т4.
І
Адаптивное управление гибридной силовой установкой
С целью уменьшения вычислительной сложности произведём декомпозицию задачи управления ГСУ на две взаимосвязанные подзадачи. Вначале определим приложенный к ведущим колёсам автомобиля момент вращения ГСУ MGSU.zd Є \MGSU .mm , MGSU .max ] , необходимый для поддержания заданного тягово-скоростного режима Vzd = Vzd (к),
______ N-1
к = 0, N -1 при a = a(к) и U (к) -^min .
к=0
Затем осуществим распределение MGSU zd между основным и вспомогательным двигателями ГСУ, а также системой гидравлического торможения из условия JSVjl min .
Структурная схема САУ ГСУ, соответствующая предложенной декомпозиции задачи управления, приведена на рис. 1. На данной схеме e - ошибка регулирования по скорости; M , Mtr - моменты сил сопротивления
движению и сил трения в элементах трансмиссии, приложенные к ведущим колесам автомобиля; J^rn - суммарный момент инерции вращающихся масс, приведенный к оси вращения ведущих колёс.
Сигнал MGSUzd является выходным сигналом регулятора скорости автомобиля
MGSUzd = fv.rg (V, Vzd ) и входным для адаптивного регулятора ГСУ.
При включенном сцеплении и выбранном передаточном отношении трансмиссии в случае прямолинейного движения без пробуксовывания колес силовая установка автомобиля и непосредственно связанный с ней потребитель мощности (собственно автомобиль) образуют жесткую механическую систему с одной степенью свободы. В этом случае модель гибридного автомобиля, соответствующая первой подзадаче, легко линеаризуется, что облегчает получение оптимального регулятора скорости автомобиля и исследование устойчивости системы.
САУ ГСУ имеет в своём составе блок адаптации, обеспечивающий асимптотическое приближение текущей стратегии управления к оптимальной при t путём настройки параметров регулятора без использования априорной информации о задающих и возмущающих воздействиях.
Для описания перераспределения нагрузки между агрегатами ГСУ введём коэффициент использования электропривода
е = УM ■ MVD ■ MGSU , MGSU ^ 0 ,
где уM - передаточное отношение трансмиссии от тягового электропривода к ведущим колесам; MVD - момент на валу тягового электропривода; MGSU - момент вращения ГСУ, приложенный к ведущим колёсам автомобиля.
В процессе торможения автомобиля, когда MGSU < 0, коэффициент ее [0, 1] характеризует уровень рекуперации энергии торможения. При е = 0 торможение осуществляется исключительно за счёт гидравлической тормозной системы. При е = 1 весь требуемый тормозной момент создаётся тяговым электроприводом в генераторном режиме:
MGSU = УM ' MVD , MVD.min - MVD < 0 , где
MVD min - максимальный тормозной момент
электропривода в режиме генератора. При 0 < е < 1 тормозное усилие создаётся с использованием обеих тормозных систем. При разгоне автомобиля либо равномерном движении, когда MGSU > 0, коэффициент
ее (-оо, 1] характеризует распределение
мощности, производимой ГСУ, между ДВС и тяговым электроприводом. При е < 0 тяго-
52
Автомобильный транспорт, вып. 35, 2014
вый электропривод работает в генераторном режиме и осуществляет подзарядку ТАБ с использованием энергии, вырабатываемой ДВС. Если в = 0 , то для создания тягового усилия используется только ДВС. При
0 < в < 1 тяговое усилие создаётся за счёт совместного использования тягового электропривода и ДВС. При в = 1 используется только тяговый электропривод.
Рис. 1. Система адаптивного управления силовой установкой гибридного автомобиля
Если значение требуемого момента вращения MGSUzd и скорость движения автомобиля V = со rkol известны, то при заданных ограничениях и схеме построения ГСУ коэффициент в полностью определяет вектор управления u = fGsu.rg (в> MGSUzd , V) . Таким образом, задача оптимизации управления ГСУ может быть сведена к задаче определения функции
в(к ) = в( MGSU.zd (к ) , Х (к )) , к = 0 N - U которая минимизирует функционал JSVц на текущем ездовом цикле.
Рассмотрим приведенную на рис. 2 структуру адаптивного регулятора ГСУ, который реализует концепцию нейросетевого управления с нейросетевыми критиком и моделью объекта управления.
В процессе функционирования САУ ГСУ на к -м шаге управления вычисление коэффициента использования электропривода осуществляется нейроконтроллером
в = Fgsu nc (x, MGSU zd ) , который реализован
в виде трёхслойной ИНС прямого распространения, содержащей 12 нейронов в первом скрытом слое и 4 - во втором, с активационной функцией нейронов скрытых слоёв в виде гиперболического тангенса и линейного нейрона выходного слоя:
Nn = 2:(1+exp (-Aii))-1;
Ап = 2( W11 [x (к) MGSU.zd (к)] + B11 ) ;
в(к) = W13 (2: (1 + exp (-А12 ))-1) + B13 ;
А12 = 2(W12N11 + B12 ) ,
где Wij и Bj - матрицы весовых коэффициентов и векторы смещений нейронов j -го слоя i -й ИНС; x , MGSU zd , в - нормированные значения соответствующих величин. Нормирование осуществлялось путём приведения сигналов к нулевому математическому ожиданию и единичному значению дисперсии.
Затем регулятор ГСУ определяет вектор
управления u = fGsU.rg (в. MGSU.zd , x) и
управляющие воздействия подаются на вход объекта управления.
Одновременно нейросетевая
MDVS, ®TAB
-|T
= F
GSU MD
(в, x, Mgsu.zd )
модель на ос-
новании текущего состояния ГСУ и применяемого управления даёт оценку параметров состояния системы на следующем шаге управления, которые критичны с точки зрения оценки функционала J SVц .
Автомобильный транспорт, вып. 35, 2014
53
Нейросетевая модель реализована в виде двухслойной ИНС прямого распространения, содержащей 24 нейрона в скрытом слое с активационными функциями в виде гиперболического тангенса и два линейных нейрона выходного слоя
N2i = 2:(! + exp (-A2i))-1;
ґ 8( к ) Л
A21 = 2 W v У21 X ( к ) + B21
V MGSU.zd (k)_ /
MDVS (к) , ®TAB (k + 1)
= W22N21 + B22 ’
где MDVS, 0TAB - нормированные значения оценки эффективного крутящего момента ДВС и степени заряженности ТАБ.
Адаптивный критик осуществляет оценку функционала качества управления на данном шаге при выбранном управлении и текущем состоянии ГСУ, опираясь на оценку параметров системы, осуществлённой нейросетевой модельЮ: JSVH = FGSU.kr (Mdvs , ®TAB , ®) .
Адаптивный критик реализован в виде ИНС
с архитектурой, подобной ИНС нейросетевой модели
N31 = 2:(1 + exp (-A3i))-1;
ґ MGSU .zd (k) Л
> Ui II ьо W31 ^TAB (k + 1) + B31
ш( к )
V /
JSVn (k) = W32N31 + B32 .
Блок адаптации обеспечивает параметрическую настройку (обучение) ИНС нейроконтроллера, модели и адаптивного критика путём настройки соответствующих матриц весовых коэффициентов и векторов смещений нейронов.
Целью обучения нейроконтроллера является формирование таких управляющих воздействий ГСУ, которые бы способствовали уменьшению квадратичного значения оценки функционала качества управления
ENC = 2 JSVfl ^ min.
Рис. 2. Адаптивный регулятор гибридной силовой установки
54
Автомобильный транспорт, вып. 35, 2014
Обучение производится с использованием сигнала подкрепления, полученного путём обратного распространения ошибки через нейронные сети адаптивного критика и модели. Коррекция параметров ИНС нейроконтроллера осуществляется согласно выражениям
W1( (k +1) = W1( (k) + AWl! (k);
В1г (k +1) = Bi,. (k) + ABb (k), і _ 1,3,
где
AWi, (k)_v^ AWi, (k -1)-
-bnc (1 -vnc)dEnC
5 Wi,
Wii =Wii (k)
- і -й элемент вектора; возведение вектора в квадрат предполагает поэлементное выполнение данной операции.
Целью обучения нейросетевой модели является уточнение прогнозов параметров состояния системы на следующем шаге управления
Emd (k)_ 2
V L
DVS (k) TAB (k + 1)_ MDVS (k)
M 0.
0TAB (k + 1)
]/
• min.
2
где MDVS, 0TAB - нормированные значения эффективного крутящего момента ДВС и степени заряженности ТАБ.
ABii (k ) = v nc ABii (k -1)-
-^NC (I -vNC f EnC
5 Bi
Bii - Bii (k)
Обучение ИНС модели производится методом обратного распространения ошибки. При этом коррекция параметров ИНС осуществляется согласно выражениям
5 Е 5 Е
UJ-"NC_ UL"NC
5 Bi3 5 s
" ( C T r-p /V >
WT v v2i < l-ч $ WT WTJ * *T3i*T32J SV]i *(1-N3i) • 1,2) * >
,*(1 - N2i)
5 Enc _ WT 5 Enc *Л - N2 V s _ W 5B (1 Ni2) ;
5 B
i2
i3
5Enc _ WT 5Enc *Л - N2 V ї i2 5 B ( ii);
5 B
ii
i2
W2, (k +1)_ W2, (k) + AWji (k);
B2, (k +1)_ B2, (k) + AB2, (k), і _ 1,2,
где
AW2, (k)_Vmd AW2, (k -1)-
5 Е
Л /1 -v \Ur'MD
ЛMD (1 v MD )
5 W2
W2i _W2i (k)
AB2, (k)_Vmd AB2, (k -1)-
5 Е
Л /1 -v \Ur'MD ЛMD (1 vMD )
5 B2
B2i _B2i (k)
5Enc _5Enc nt .
5 Wi3 5 Bi3 i2’
5Enc _5Enc nt , 5 Wi2 5 Bi2
5 Е 5 Е
fJJ-^NC_ UJ^NC
5Wii 5Bii
MGSU .zd 0 TAB a
где XNC - коэффициент скорости обучения ИНС нейроконтроллера; vNC - коэффициент инерционности обучения. В приведенных выражениях символ «*» обозначает поэлементное умножение векторов, запись «{•},.»
5 Emd MDVS (k) MDVS (k)
5 B22 B22 _B22 (k) 0TAB (k + 1) 0TAB (k + 1)_
5 Е,
5 B
'MD _ 'W'T 5 Emd *
’22
2i
5 B
22
(1 - N2i);
5 EMD _ 5 EMD nT ,
5 W22 5 B22 2i’
5 Emd _5 Emd Ps x M
"[Є X MQSU zd | ;
5 W2
5 B2
];
Автомобильный транспорт, вып. 35, 2014
55
где 'kMD и vMD - коэффициенты скорости и инерционности обучения ИНС модели соответственно.
я E
яд K
я B
32
B32=В32 (к)
5( к );
Обучение адаптивного критика заключается в том, чтобы итеративно уточнять оценку
функционала качества управления Jsv, .
Выражение для функционала качества управления на к -м шаге может быть записано в виде
со 4
Jsv,(к) = £,;1 Kр, -3, (к + j) =
j=0 І =1
= І K Рл -3, ( к ) + ,• J SV,( к +1)
І=1
Предположим, что функции Vzd = Vzd (к) и а = а (к), к = 0, N -1, определяющие тяговоскоростной режим ГСУ, являются близкими к эргодическим. В этом случае ошибку адаптивного критика можно представить в виде ошибки временной разности [13, 14]
5(к ) = J sv, (к ) -ІK рі 3, (к ) - Д svp (к +1) =
І =1
= J sv, (к -1) - І K Pi 3, (к -1) - ,J sv, (к)
i =1
Коррекция параметров ИНС адаптивного критика осуществляется из условия минимизации квадратичной ошибки
Ekr = 2-152 —> min согласно выражениям
W3, (к +1) = W3, (к) + AW3, (к);
Вз, (к +1) = Вз, (к) + АВз, (к), І = й,
где
AW3, (к) = vkr AW3, (к -1)-
-я kr(1 -v kr )я#
W3 і =W3, (к)
АВ3, (к) = vKR АВ3, (к 1)
-я kr (1 -v kr ">яВ~
Вз І=Вз і (к)
я EKR = WT я Ekr * (1 - N2 )
я В31 W32 Я В32 ( 31)
Я Ekr =Я Ekr nt . я W32 я В32 31 ’
я ek
я W3.
W
31
:W31 (к )
я e
яд K
я В3
В31
В31 (к)
MGSU .zd (к ) ^TAB (к + 1)
(й( к )
где XKR и vKR - коэффициенты скорости и инерционности обучения ИНС адаптивного критика соответственно.
Таким образом, на каждом шаге улучшается закон управления путём обучения нейроконтроллера, а также повышается способность системы оценивать текущую ситуацию вследствие обучения ИНС адаптивного критика и модели. Коррекция параметров нейронных сетей продолжается до тех пор, пока не будет достигнут минимум функционала качества управления Jsv, либо получена приемлемая стратегия управления для заданного ездового цикла.
ИНС нейроконтроллера, модели и адаптивного критика могут быть инициализированы случайными значениями весовых коэффициентов и смещений нейронов, равномерно распределенными в диапазоне [-1, 1].
В этом случае допустимые управления на начальном этапе адаптации при произвольных задающих и возмущающих воздействиях гарантируются учётом ограничений области допустимых режимов в регуляторе ГСУ
U = fGSU.rg (Є, MGSU.zd , V) .
Однако для ускорения адаптации целесообразно провести предварительное «off-line» обучение нейроконтроллера и нейросетевой модели с использованием эталонной модели управления. В качестве эталонной модели может выступать управление с использованием логических правил выбора стратегии.
56
Автомобильный транспорт, вып. 35, 2014
Результаты экспериментальных исследований
Для исследования эффективности управления ГСУ с использованием нейросетевого адаптивного критика проведена серия вычислительных экспериментов с моделью гибридного автомобиля массой 2100 кг с параллельной схемой ГСУ, включающей ДВС с максимальной эффективной мощностью 43,7 кВт, тяговый электропривод на основе вентильного электродвигателя с максимальной мощностью 64 кВт и ТАБ с номинальной ёмкостью 6,5 Ач.
Изучалась работа САУ ГСУ на европейском (NEDC - New European Driving Cycle), городском европейском (UDC - Urban Driving Cycle), североамериканском (FTP-75 - Federal Test Procedure) и японском (10-15 Mode) ездовых циклах.
Предварительное обучение нейроконтроллера, входящего в состав адаптивного регулятора, осуществлялось с использованием массива экспериментальных данных, полученных в результате моделирования движения гибридного автомобиля по европейскому ездовому циклу MNEDC при управлении ГСУ на основе логических правил выбора стратегии при различных начальных значениях степени заряженности ТАБ 9TAB0e [0,4, 0,8]. Затем на том же ездовом
цикле производилось предварительное обучение нейросетевой модели при стратегии управления ГСУ, определяемой нейроконтроллером.
При исследовании процесса адаптации стратегии управления ГСУ к тягово-скоростному режиму движения приняты следующие параметры алгоритма адаптации. Значение дисконтного фактора при вычислении функционала качества управления р = 0,9 . Коэффициенты инерционности обучения нейроконтроллера и адаптивного критика v NC = v KR = 0,1. Коэффициенты скорости
обучения нейроконтроллера и адаптивного критика задавались индивидуально для каждого ездового цикла из условия обеспечения длительности обучения TNC ob и TKRob порядка 20-30 эпох (табл. 1). Под эпохой обучения понимается преодоление автомобилем соответствующего ездового цикла. Такое искусственное увеличение длительности обучения способствует приближению характера задающих и возмущающих воздействий к эргодическому.
На рис. 3 показано изменение нормированного удельного (т.е. отнесённого к количеству шагов процесса управления) значения
функционала качества управления ( JSV р ), а на рис. 4 - нормированных удельных значений расхода топлива (SGt), эмиссии оксидов азота (S nox), оксида углерода (S со) и углеводородов ( Shc ) в процессе обучения нейроконтроллера.
При нормировании данных величин в качестве базовых были использованы значения соответствующих параметров при управлении ГСУ с использованием предварительно обученного нейроконтроллера.
Приведенные зависимости показывают, что наилучшая эффективность адаптации стратегии управления ГСУ к изменяющемуся режиму движения соответствует ездовым циклам UDC и 10-15 Mode, которые не содержат загородных этапов движения. Однородность тягово-скоростного режима позволяет САУ ГСУ точнее определить сигнал подкрепления, который используется для обучения нейроконтроллера. Высокая эффективность адаптации наблюдается также на ездовом цикле MNEDC, который использовался для предварительного обучения нейроконтроллера и нейросетевой модели. Существенно меньшую эффективность система адаптивного управления имеет на ездовом цикле FTP-75, включающем два участка, имитирующих движение по пригородным магистралям.
Таблица 1 Параметры обучения нейроконтроллера и адаптивного критика
Параметр Ездовой цикл
MNEDC UDC FTP-75 10-15 Mode
^ NC 10~6 8,0 • 10“5 2,0 • 10~6 2,0 • 10“5
TNC ob, эпохи обучения 24 20 31 21
^ KR 0,002 4,0 • 10~4 5,0 • 10“5 0,003
TKR ob, эпохи обучения 27 22 26 22
Автомобильный транспорт, вып. 35, 2014
57
Рис. 3. Изменение нормированного удельного значения функционала качества управления ГСУ в процессе обучения нейроконтроллера
а) б)
Рис. 4. Изменение нормированных удельных значений расхода топлива (а), эмиссии оксидов азота (б), оксида углерода (в) и углеводородов (г) в процессе обучения нейроконтроллера
Выводы
Применение адаптивного управления ГСУ с использованием нейросетевого адаптивного критика позволяет преодолеть недостаток априорной информации о параметрах ездового цикла и рельефа подстилающей поверхности, а также низкую точность математических моделей гибридного автомобиля за счёт более полного использования текущей информации. Данный подход предполагает адаптацию стратегии управления ГСУ к тягово-скоростному режиму движения автомо-
биля на основе концепции обучения нейронных сетей с подкреплением.
В процессе адаптации стратегии управления ГСУ средний удельный расход топлива сокращается на 1,5+26,9%, удельная эмиссия оксидов азота - на 7,5+65,9%, оксида углерода на 12,2+36,0% и углеводородов - на 4,6+54,4% в зависимости от текущего ездового цикла. Наибольшая эффективность адаптации соответствует городскому режиму движения, где наиболее полно проявляются преимущества гибридных автомобилей.
58
Автомобильный транспорт, вып. 35, 2014
Литература
1. Синергетичний автомобіль. Теорія і прак-
тика / О.В. Бажинов, О.П. Смирнов, С.А. Сєріков, В.Я. Двадненко. - Х.: ХНАДУ, 2011. - 236 с.
2. Danil V. Prokhorov. Toyota Prius HEV neu-
rocontrol and diagnostics. Neural Networks. - 2008. - Vol. 21, Iss. 2-3, March-April - P. 458-465
3. Arezoo D. Abdollahi, S.K.Nikravesh,
M.B.Menhaj. An Intelligent Control Strategy in a Parallel Hybrid Vehicle: journal of Iranian Association of Electrical and Electronics Engineers. Fall and Winter 2007. -Vo1. 4, №2. - Р. 43-52.
4. Kheir N.A. Emissions and fuel economy
trade-off for hybrid vehicles using fuzzy logic / N.A. Kheir, M.A. Salman, and Schouten N.J // Mathematics and Computers in Simulation. - 2004. - Vol. 66. -Р.155-172.
5. Arsie I. Control Strategy Optimization for
Hybrid Electric Vehicles via Provisional Load Estimate / I. Arsie, M. Graziosi, C. Pianese, G. Rizzo, M. Sorrentino // Review of automotive engineering, Society of Automotive Engineers of Japan (JSAE), 2005. - Р. 341-348.
6. Lin C.C. Driving Pattern Recognition for
Control of Hybrid Electric Trucks / C.C. Lin, S. Jeon, H. Peng, J.M. Lee // Vehicle System Dynamics. - 2004. - Vol. 42. - P. 41-58.
7. Jong-Seob Won. Intelligent Energy Manage-
ment Agent for a Parallel Hybrid Vehicle: dissertation for the degree of doctor of philosophy. Submitted to the Office of Graduate Studies of Texas A&M University / Jong-Seob Won. - May, 2003. - 93 p.
8. Dorri M. Design of an Optimal Control Strat-
egy in a Parallel Hybrid Vehicle in Order to Simultaneously Reduce Fuel Consumption and Emissions / M. Dorri and A. Shamekhi SAE Technical Paper 2011-01-0894, 2011, doi: 10.4271/2011-01-0894.
9. Development of Fuzzy Logic and Neural
Network Control and Advance Emissions Modeling for Parallel Hybrid Vehicles / A. Rajagopalan, G. Washington, G. Riz-zoni, Y. Guezennec. Center for Automotive Research. The Ohio State University Columbus, Ohio. Subcontract Report - December 2003 / Электронные данные. -Режим доступа: http://www.osti.gov/
bridge, свободный. - Загл. с экрана.
10. Сериков С.А. Многокритериальная зада-
ча оптимизации управления силовой установкой гибридного автомобиля / С.А. Сериков // Вестник ХНАДУ: сб. науч. тр. - 2012. - Вып. 55. - С. 37-43.
11. Сериков С.А. Синтез оптимального
управления гибридной силовой установкой / С.А. Сериков // Проблемы управления и информатики. - 2009. - №2. -С.37-47.
12. Zhang Yi. Torque Control Strategy for Par-
allel Hybrid Electric Vehicles using Fuzzy Logic / Zhang Yi, Liu Heping, Wang Huabin // WSEAS Transactions on Systems. - 2011, iss. 4, vol. 10. - Р. 116-125.
13. Редько В.Г. Нейросетевые адаптивные
критики / В.Г. Редько, Д.В. Прохоров // Научная сессия МИФИ-2004. Ч.2. Нейроинформатика-2004. - 2004. - С. 77-84.
14. Ganesh Kumar Venayagamoorthy, Ronald
G. Harley, Donald C. Wunsch. Implementation of Adaptive Critic-Based Neurocontrollers for Turbogenerators in a Multimachine Power System // IEEE Transactions on Neural Networks. - 2003, Sept. -Vol. 14, № 5. - Р. 1047-1064.
15. Сериков С.А. Нейросетевое управление
гибридной силовой установкой на основе метода адаптивной критики / С.А. Сериков // Автомобильный транспорт: сб. науч. тр. - 2012. - Вып. 30. - С. 65-74.
References
1. Bazhynov O.V., Smyrnov O.P., Sjerikov S.A.,
Dvadnenko V.Ja. Synergetychnyj avtomo-bil'. Teorija i praktyka. Kharkov, KhNADU Publ., 2011. 236 p.
2. Danil V. Prokhorov Toyota Prius HEV neuro-
control and diagnostics. Neural Networks, March-April 2008, vol. 21, iss. 2-3. рp. 458-465.
3. Arezoo D. Abdollahi, Nikravesh S.K., Men-
haj M.B. An Intelligent Control Strategy in a Parallel Hybrid Vehicle. Journal of Iranian Association of Electrical and Electronics Engineers, Fall and Winter 2007, vol. 4, iss. 2. рp. 43-52.
4. Kheir N.A., Salman M.A., and Schouten N.J.
Emissions and fuel economy trade-off for hybrid vehicles using fuzzy logic. Mathematics and Computers in Simulation, 2004, vol. 66. рp. 155-172.
5. Arsie I., Graziosi M., Pianese C., Rizzo G.,
Sorrentino M. Control Strategy Optimization for Hybrid Electric Vehicles via Provi-
Автомобильный транспорт, вып. 35, 2014
59
sional Load Estimate. REVIEW OF AUTOMOTIVE ENGINEERING, Society of Automotive Engineers of Japan (JSAE), 2005.pp. 341-348.
6. Lin C.C., Jeon S., Peng H., Lee J.M. Driving
Pattern Recognition for Control of Hybrid Electric Trucks. Vehicle System Dynamics, 2004, vol. 42. pp. 41-58.
7. Jong-Seob Won. Intelligent Energy Manage-
ment Agent for a Parallel Hybrid Vehicle: dissertation for the degree of doctor of philosophy. Submitted to the Office of Graduate Studies of TexasA&MUniversity, May, 2003. p.93.
8. Dorri M. and Shamekhi A. Design of an Op-
timal Control Strategy in a Parallel Hybrid Vehicle in Order to Simultaneously Reduce Fuel Consumption and Emissions. SAE Technical Paper 2011-01-0894, 2011,
doi:10.4271/2011-01-0894.
9. Rajagopalan A., Washington G., Rizzoni G.,
Guezennec Y. Development of Fuzzy Logic and Neural Network Control and Advance Emissions Modeling for Parallel Hybrid Vehicles. Center for Automotive Research.The OhioStateUniversityColum-bus, Ohio. SubcontractReport - December 2003. Elektronnye dannye. Avialable at: http://www.osti.gov/bridge, svobodnyj. -Zagl. s ekrana.
10. Serykov S.A. Mnogokryteryal'naja zadacha
optymyzaii upravlenyja sylovoj ustanovkoj gybrydnogo avtomobylja. Vestnyk
KhNAHU: sb. nauch. tr., 2012, vol. 55. pp.37-43.
11. Serykov S.A. Syntez optymal'nogo upra-vlenyja gybrydnoj sylovoj ustanovkoj.
Problemy upravlenyja v informatike, 2009, vol. 2. pp. 37-47.
12. Zhang Yi, Liu Heping, Wang Huabin Torque Control Strategy for Parallel Hybrid Electric Vehicles using Fuzzy Logic. WSEAS Transactions on Systems, 2011, iss. 4, vol. 10. pp. 116-125.
13. Red'ko V.G., Prohorov D.V. Nejrosetevye
adaptivnye krytyky. Nauchnaja sessyja MYFY-2004. Nejroynformatyka, 2004,
iss. 2. pp. 77-84.
14. Ganesh Kumar Venayagamoorthy, Ronald G. Harley, Donald C. Wunsch. Implementation of Adaptive Critic-Based Neurocontrollers for Turbogenerators in a Multimachine Power System. IEEE Transactions on Neural Networks, Sept, 2003, vol. 14, iss. 5. pp. 1047-1064.
15. Serykov S.A. Nejrosetevoe upravlenye gybrydnoj sylovoj ustanovkoj na osnove metoda adaptyvnoj kritiki. Avtomobyl'nyj transport: sb. nauch. tr., 2012, vol. 30. pp. 65-74.
Рецензент: А.В. Бажинов, пpофессоp, д.т.н.,
ХНАДУ.
Статья поступила в pедакцию 2 июня 2014 г.