Научная статья на тему 'Інший вивід основних співвідношень неперервного варіанту динамічного програмування'

Інший вивід основних співвідношень неперервного варіанту динамічного програмування Текст научной статьи по специальности «Математика»

CC BY
66
14
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Кику Андрей Григорьевич, Белоус Татьяна Ивановна

Предложенный подход к выводу соотношений непрерывного варианта метода динамического программирования, который основан непосредственно на принципе оптимальности и независимости величины показателя качества от точки деления интервала интегрирования на два подинтервала. Рассмотренный подход натуральным способом делит начальную задачу на две подзадачи. Первая подзадача связана с просмотром решения с конца интервала управления к его началу и этим же вносит ясность в сам метод, как и в случае дискретного варианта. Решение же второй подзадачи позволяет реализовать второй этап решения общей задачи, а именно реализовать движение от начала интервала управления к его концу.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The offered approach to conclusion of continuous variant correlations of dynamical programming, which is applied directly to the principle of optimum and independence of qualitative indice value from the point, separating the interval of integration on two subintervals. The reviewed approach separate the source problem on two subproblems naturaly. The first subproblem deals with the review of solution from the end of carrying interval to its begining and so brings the clearance into the method as in the case of discrete variant. Solving the second subproblem allows us to realize the second step of the general problem's solution, namely to realize the movement from the beginning of carrying interval to its end.

Текст научной работы на тему «Інший вивід основних співвідношень неперервного варіанту динамічного програмування»

УДК.621.924.229.86

1НШИЙ ВИВ1Д ОСНОВНИХ СП1ВВ1ДНОШЕНЬ НЕПЕРЕРВНОГО ВАР1АНТУ

ДИНАМ1ЧНОГО ПРОГРАМУВАННЯ

A.T.KiKy, T.i.BiAoyc

Предложенный подход к выводу соотношений непрерывного варианта метода динамического программирования, который основан непосредственно на принципе оптимальности и независимости величины показателя качества от точки деления интервала интегрирования на два подинтервала. Рассмотренный подход натуральным способом делит начальную задачу на две подзадачи. Первая подзадача связана с просмотром решения с конца интервала управления к его началу и этим же вносит ясность в сам метод, как и в случае дискретного варианта. Решение же второй подзадачи позволяет реализовать второй этап решения общей задачи, а именно реализовать движение от начала интервала управления к его концу.

Запропонований тдх1д до виводу стввгдношень неперервно-го варганту методу динамгчного програмування, який засно-ваний безпосередньо на принцип оптимальностг г незалеж-ностг величини показника якостг вгд точки роздглення гнтер-валу гнтегрування на два пгдгнтервала. Розглянутий пгдхгд натуральним способом подгляе початкову задачу на дв1 тдзадачг. Перша тдзадача зв'язана з переглядом розв'язку з кгнця гнтервалу управлгння до його початку г тим самим вносить яснгсть в самий метод, як г у випадку дискретного варганта. Розв'язання ж другоЧ тдзадачг дозволяе реалг-зувати другий етап рШення загальноЧ задачг, а саме реал1-зувати рух вгд початку гнтервалу управлгння до його кгнця.

The offered approach to conclusion of continuous variant correlations of dynamical programming, which is applied directly to the principle of optimum and independence of qualitative indice value from the point, separating the interval of integration on two subintervals. The reviewed approach separate the source problem on two subproblems naturaly. The first subproblem deals with the review of solution from the end of carrying interval to its begining and so brings the clearance into the method as in the case of discrete variant. Solving the second subproblem allows us to realize the second step of the general problem's solution, namely to realize the movement from the beginning of carrying interval to its end.

В основ! методу динам1чного програмування лежить принцип оптимальности який за своею суттю е простим i добре узгодженим 3i здоровим глуздом. Але пльки тсля його доведення Беллманом метод отримав широке розпо-всюдження для розв'язання задач оптимального управлшня, у тому числ! i динам!чних задач. Зокрема, вш дозволив Беллману вивести диференцшне р!вняння, на основ! якого розв'язання ршення задач! оптимального управлшня у вигляд! аналиичного конструювання регулятор!в (АКОР) може бути доведене до кшця.

В статт запропоновано шший шдхщ до виводу основних стввщношень неперервного вар!анту методу динам!чного програмування, заснований за аналопею з дискретним вар!антом безпосередньо на принцип! опти-мальноси ! незалежност величини показника якост вщ точки розподту штервалу штегрування при подШ останнього на два п!д!нтервали.

Нехай задача оптимального управл!ння сформульована у такш постановщ:

min{I[x, u, x(t2)] =

u E U

= Jf(x, u, t)dt +1[x(t2)]}

dx -

— 1 = ^¡(x, u, t )i= 1, n, dt

x (ti) = x, u E U,

(1)

де x = [ x1^xn ]

вектор зм!нних стану,

u = [ u1...un ] - вектор управлшня,

TTD

U - множина допустимих управл!нь, f, 9i - штервально-непреривш функци сво'1'х аргуменпв. Розглянемо показник якост! при конкретно вибраному допустимому управлшш uD (t) на штервал! [ tb t2 ] . Вибе-ремо на цьому штервал! [ t1; t2 ] деяку пром!жну точку т ! подамо (1) таким чином:

t2 Т t2

I = Jf (x, uD, t)dt +1[x( t2)] = Jf(x, uD, t) dt + Jf (x, uD, t)dt +

+1[x(t2)] = Jf(x, uD, t)dt + S(x, uD, т).

D

(2)

Оск!льки показник якост! за його властив!стю не залежить вщ обрано! пром!жно! точки, то мае м!сце таке:

D

d± = fx uD т) + ^(x, uD,T) = 0 d т J dT

(3)

Таким чином (3) e необх!дною умовою незалежност! I в!д точки розпод!лу т .

dS

Подамо — у (3) таким чином: dт

dS _ dS dxi , dS „т , D

Тг = I d^ Тт + dr = Sx ^ u ,т) + Sт, (4)

i = 1

dx1 d т dт

де T - !ндекс операц!' транспонування,

S _ dS s _ dS

xi dxj т d т

t

2

t

t

т

90

ISSN 1607-3274 "Радтелектронжа, !нформатика, управл!ння" № 1, 2001

A.r.Kixy, T.I.Árnoyc: ШШИЙ BÈBIÂ OCHOBHÈX CTIBBIÄHOmEHb HEПEPEPBHOГO BAPIAHTÓ ÂÈHAMI4HOrO ПPOГPAMУBAHHЯ

B peзyльтaтi чoгo ця yмoвa пpиймae нacтyпний вигляд:

aбo

DTD D

f(x, u ,т) + Sx(x, u ,т)ф^, u ,т) + Sт = 0, (5)

T D D D

Sx(x, u , т)ф^, u , т) + S^. = -f(x, u , т). (б)

Tyт зaзнaчимo, щo na функщю S (x, uD, Т) нe m^a-дaютьcя oбмeжeння ïï нeпepepвнoï дифepeнцiйoвaнocтi пo x, u тa t. Бiльш тoгo, якшр, нaпpиклaд, f(x, u, t) aбo

(x, u, t) будуть poзpивними в дeякиx тoчкax x , aбo uP,

aбo tP , тoдi й Sx , St говинш бути тaкoж poзpивними y

вiдпoвiдниx тoчкax, щo й мae мшде, нaпpиклaд, в зaдaчax oптимaльнoï швидкoдiï нa лiнiяx пepeмикaння.

Ocкiльки oтpимaнe вiднoшeння cпpaвeдливe пpи будь-ятаму t = Т , то вoнo мoжe бути зaпиcaнe тaким чинoм:

T D D D

Sx(x, u , т)ф^, u , т) + St = -f(x, u , т) . (7)

min u (т) e UD

т + dt

J f(x*, u, t)dt + J f(x*, u, t)dt + l[x*(t2)]

т + dt

min [f(x*, u, t)dt + S*(т + dt)}.

(10)

u (Т) e U

Biдзнaчимo, щo S*^ + dt) пoтpaпляe пiд зтк oпepaцiï мiнiмiзaцiï пo u(т), ocкiльки вoнa зaлeжить вщ x*(т + dt), який в cвoю чepгy згiднo мoдeлi oб'eктa yпpaвлiння зaлeжить вiд ы*(т) i x*(т) . Пoдaмo в (10) S* (т + dt) y виглядi poзклaдy в pяд Teйлopa в тoчцi Т :

T*

min + f(x*, %т)dt + S*^) + Sx (x*,^^*, u, t)dt + i^e U I

+ S*tdt \ = S*(x).

(ll)

Для визнaчeння фyнкцiï S нeoбxiднo iнтeгpyвaти piвняння y чacткoвиx пoxiдниx (7) пpи yмoвi нa пpaвiй мeжi S(t2) = l[x(t2)] . ^и цьoмy oдepжимo poзв'язoк S,

який зaлeжить вiд x, uD, t. Зayвaжимo, зa oптимaль-

нoгo yпpaвлiння u = u* функщя S пepeтвopюeтьcя в

фyнкцiю Бeллмaнa S* , a piвняння (7) - y дифepeнцiйнe piвняння Бeллмaнa

S*T

(x*, u*, t)q(x*, u*, t) + S* = -f(x*, u*, t).

min

u (т) e UD

Jf(x*, uD, t)dt +1[x*(t2)]

кoтpa пpивoдитьcя дo вигляду:

(8)

Taким чинoм, для визнaчeння функцп Бeллмaнa нeoб-xiднo знaйти oптимaльнe yпpaвлiння.

Знaйдeмo тeпep oптимaльнe yпpaвлiння бeзпocepeдньo na ocнoвi пpинципy oптимaльнocтi Бeллмaнa зa aнaлoгieю з fore визнaчeння y диcкpeтнoмy вapiaнтi динaмiчнoгo пpoгpaмyвaння.

Hexaй зaдaчa (1) "пepeглянyтa" з кiнця iнтepвaлy yпpaв-

лшня дo мoмeнтy. Пpи цьoмy будуть знaйдeнi u* i S* y

виглядi фyнкцiй вiд x*^ + dt) . Aлe x*^ + dt) зaлeжить

вiд нeвiдoмиx x*^) i ы*(т), звiдки випливae, щo пo-тpiбeн пoдaльший пepeгляд piшeння зaдaчi дo пoчaткy iнтepвaлy yпpaвлiння. Змicтимo чac "лiвopyч" нa

дифepeнцiaл чacy dt i нaйдeмo u*^) згiднo з пpинципoм oптимaльнocтi шляxoм poзв'язaння зaдaчi:

OcK^ra y цiй зaдaчi S*(т) пpeдcтaвляe чиcлo, eœe нe

зaлeжнe вщ u*^), тoдi (11) з тoчки зopy визнaчeння oптимaльнoгo yпpaвлiння пpивoдитьcя дo вигляду:

min Jf(x*, %т) + SxT*(x*,т)(p(x*, u, t) \ ^ ^^^^ (12) u (т) e U ) J

Cпiввiднoшeння (12) cпpaвeдливe для бyдь-якoгo t = тe [ tp t2 ] , тoмy вoнo мoжe бути зaпиcaнo тaким чинoм:

min + f(x, u, т) + SSxT*(x*, t)®(x*, u, t). = -S'* . (13) u(т) 1 x il

Ha ocнoвi (13) oптимaльнe yпpaвлiння oтpимaeмo y виглядi фyнкцiï вщ S* , x* й t, тобто

u*(S*, x*, t),

(14)

(9)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

дe apгyмeнт t вкaзye na йoгo нecтaцioнapнicть в зaгaльнoмy випaдкy aлгopитмy (14).

Якщo тeпep в цьoмy aлгopитмi виpaзити S* y виглядi фyнкцiï вiд змiнниx cтaнy x* i чacy t, тo oтpимaeмo пoтpiбнy зaлeжнicть oптимaльнoгo yпpaвлiння вщ oпти-мaльнoï тpaeктopiï. Taким чигом, якщo б знaли пoтoчний oптимaльний cтaн x*(t) в кoжний мoмeнт чacy, тo змoгли б знaйти oптимaльнe yпpaвлiння, a пo x*(t) тa u*(t) змoгли б знaйти x*(t+dt) й тaк дaлi. Пpoтe oптимaльний cтaн x*(t) тpaeктopiï x(t) вiдoмo тiльки для пoчaткoвoгo

1

мoмeнтy чacy t= tl , для яташ x*( tl ) = x . Звщот випли-

вae, щo пpoцec пepeглядy poзв'язaння зaдaчi з кiнця iнтep-вaлy yпpaвлiння пoвинeн бути пpoдoвжeний дo йoгo пoчaткy. Aлe зayвaжимo, rn;o, якби в (14) фyнкцiю S*

x

u

вдалося б виразити у вигляд! залежност вщ x*, u*, t, то на його основ! можна було б вивести алгоритм розв'язання задач! аналиичного конструювання регулятор!в u*=(x*,t). Отримати вказану залежн!сть можливо !нтегруванням р!вняння (7), попередньо п!дставляючи в нього вираз (14) для u*. Зазначимо, що р!вняння (8) розв'язуеться в зво-ротньому час!. Цим по суп замшюеться процес перегляду задач! з к!нця !нтервалу управл!ння до його початку при визначенн! оптимального управл!ння.

Розв'язуючи (8) зазначеним способом, знаходимо функ-щю Беллмана у вигляд!:

S* = S*(x*, u*, t). (15)

Шдставляючи тепер (15) та (14), знаходимо алгоритм оптимального управл!ння

u* = u*(x*, t) . (16)

Запропонований п!дх!д виведення основних сп!вв!дно-шень метода динам!чного програмування для неперервних задач управлшня природним способом подтяе початкову задачу на дв! шдзадачь Перша з них пов'язана з переглядом розв'язку в!д к!нця !нтервалу управл!ння до його початку ! тим самим вносить ясн!сть до самого методу, як ! у випадку дискретного вар!анту. Розв'язання ж друго!' тдзадач!, пов'язано! з визначенням функцп Беллмана, дозволяе реал!зувати другий етап ршення загально' задач!, а саме реал!зувати рух в!д початку штервалу управлшня до його кшця.

У прикшщ зазначимо ще раз, що на функщю

S*(x, uD, t) зпдно (6) не накладаються обмеження i'i' неперервно' диференц!йованост! по x, u та t.

УДК 519.711: 658.562.3

КОНТРОЛЬ ТЕХНОЛОГИЧЕСКОГО ПРОЦЕССА С ИСПОЛЬЗОВАНИЕМ КАРТЫ ХОТЕЛЛИНГА

В.Н.Каячкин

Рассматривается многомерный статистический контроль технологического процесса с использованием карты Хотеллин-га. Анализируется эффективность применения статистики

т2 при многомерном контроле с помощью средней длины серий и интерпретация результатов контроля.

This article presents the multivariate statistical process control (SPC) with Hotelling charts. Its carry out the comparison of

sensitivity of

т2

statistic with average run length (ARL) and interpretation of these charts.

ВВЕДЕНИЕ

Статистический контроль технологических процессов -одно из интенсивно развивающихся направлений всеобщего менеджмента качества, его внедрение - необходимое условие сертификации предприятия на соответствие международным стандартам качества ИС0-9000. Основной инструмент такого контроля - контрольная карта процесса - в большей степени пока еще ориентирована на проведение анализа вручную. Между тем использование компьютерной техники позволяет существенно расширить возможности управления процессом производства, в частности, в ситуации, когда качество изготавливаемого изделия определяется множеством показателей.

ПОСТАНОВКА ЗАДАЧИ

При проведении контроля технологического процесса обыино используются контрольные карты Шухарта для одного показателя качества, наиболее важного с точки

зрения результатов процесса. На практике часто процесс характеризуется совокупностью показателей X = (X^,

X2, ...,XP), имеющих совместное нормальное распределе-2 Р

ние и коррелированных между собой. В этом случае может быть использована карта Хотеллинга [1]: для каждой выборки рассчитывается статистика

т2 = n (Xi - II) TS-1 (Xi - II),

(1)

где n - объем выборки, l - ее номер (l = 1,..., m; m -количество выборок), Xi - вектор средних мгновенной

выборки, |J, - вектор общих средних, S - оценка ковариационной матрицы X .

Статистика т2 имеет распределение Хотеллинга [2], а

статистика

F = [mn - m -p + 1 ] Т2/[pm(n - 1)],

(2)

- нецентральное F-распределение Фишера, поэтому контрольная граница на карте Хотеллинга определяется в зависимости от заданного уровня значимости а с использованием таблицы квантилей F-распределения

T|p= [pm(n- 1)/(mn - m-p+1)] F|-a(p, mn - m -p +1). (3) Если ковариационная матрица X известна, статистика

92

ISSN 1607-3274 "Радтелектронжа, ¡нформатика, управл1ння" № 1, 2001

i Надоели баннеры? Вы всегда можете отключить рекламу.