УДК 519.6 МЯО 62К05
Вестник СПбГУ. Математика. Механика. Астрономия. Т. 4 (62). 2017. Вып. 2
Т-ОПТИМАЛЬНЫЕ ПЛАНЫ ДЛЯ ДИСКРИМИНАЦИИ ДРОБНО-РАЦИОНАЛЬНЫХ И ПОЛИНОМИАЛЬНЫХ МОДЕЛЕЙ*
Р. А. Гученко, В. Б. Мелас
Санкт-Петербургский государственный университет,
Российская Федерация, 199034, Санкт-Петербург, Университетская наб., 7—9
В настоящей статье рассматривается задача аналитического построения планов эксперимента, оптимальных относительно популярного критерия Т-оптимальности, предложенного Аткинсоном и Федоровым в 1975 году, для дискриминации между простейшими дробно-рациональными и полиномиальными регрессионными моделями. Показывается, как классические результаты теории аппроксимации могут быть использованы для получения явных формул, описывающих поведение опорных точек и весов Т-оптимальных планов для различных фиксированных априорных значений параметров. Предоставляется пример прикладной задачи, использующей дробно-рациональные и полиномиальные модели. Также кратко обсуждается численное построение планов, оптимальных относительно робастных аналогов Т-критерия, для некоторых моделей. Библиогр. 10 назв. Ил. 1. Табл. 3.
Ключевые слова: планирование эксперимента, дискриминация моделей, чебышёвская аппроксимация, наилучшее приближение.
1. Введение. В настоящей статье рассматриваются Т-оптимальные планы для дискриминации между регрессионной моделью полиномиального вида и аналогичной моделью, содержащей дополнительное слагаемое в виде одной из простейших дробно-рациональных функций. Такие модели представляют теоретический и практический интерес.
Т-критерий оптимальности был введен в работе [1] и получил широкое распространение в задачах планирования эксперимента для дискриминации регрессионных моделей (см., например, [2, 3] и ссылки в этих работах). Построение Т-оптимальных планов представляет собой весьма сложную математическую задачу минимаксного типа и до 2012 года осуществлялось только численными методами за исключением простейшего случая дискриминации полиномиальных моделей, отличающихся на один порядок. Однако было обнаружено (см., например, [3]), что опорными точками оптимальных планов служат экстремальные точки функции, представляющей собой разность модели из нулевой гипотезы и ее наилучшей чебышёвской аппроксимации альтернативной моделью. На основе этого факта в работе [4] были аналитически построены Т-оптимальные планы для дискриминации полиномиальных моделей, отличающихся на два порядка. В настоящей работе мы используем известные результаты теории аппроксимации для аналитического построения планов дискриминации полиномиальных и некоторых дробно-рациональных моделей. Для этого вводится новый способ построения экстремальных точек упомянутых выше функций, который, возможно, представляет некоторый независимый интерес.
2. Постановка задачи. Пусть результаты эксперимента {у^ }ПГГ к=1 € ^ описываются уравнением
Уг,к = £г,к, « = 1,...,П, к =1 (1)
* Работа выполнена при поддержке СПбГУ (проект 6.38.435.2015) и РФФИ (проект 17-01-00161).
(¡5 Санкт-Петербургский государственный университет, 2017
где х1,...,хп — это условия проведения эксперимента, принадлежащие некоторому множеству X, такие что хг = х^ при г = у; N = ^П=1 тг —общее число доступных измерений; в = (61,... € © —вектор неизвестных параметров; п(х,6) —веще-
ственнозначная функция регрессии; |£г,к 1П=Г1А;=1 —независимые случайные ошибки, имеющие нормальное распределение с нулевым средним и единичной дисперсией.
Совокупность точек х1,... ,хп вместе с соответствующими весами Г1,... ,гп называется точным планом эксперимента. Задача планирования эксперимента в общем виде состоит в том, чтобы выбрать эти точки и веса оптимальным с некоторой точки зрения образом. Точный план эксперимента определяет, при каких условиях и в каком количестве необходимо проводить измерения. В конечном счете мы бы хотели видеть точный план в качестве результата планирования. Следуя Киферу [5], мы, однако, будем использовать более общее определение: приближенным планом эксперимента называется произвольная дискретная вероятностная мера, заданная на х1,... ,хп. Веса этой меры мы будем обозначать Ш1,... ,шп. Приближенные планы обладают рядом удобных свойств. В частности, в классе приближенных планов можно получить аналитическое решение задачи, рассмотрению которой посвящена данная работа. На практике, если необходимо произвести N измерений, для получения целых тг к необязательно целым значениям N1^1 применяют процедуру округления так,
Задачу дискриминации регрессионных моделей можно описать следующим образом. Пусть имеется несколько конкурирующих регрессионных моделей
Необходимо так спланировать эксперимент, чтобы по его результатам можно было бы максимально точно определить, какая из моделей лучше всего аппроксимирует экспериментальные данные. Способ формализации задачи дискриминации, получивший впоследствии широкое распространение, был предложен в работе [1]. Рассмотрим случай, когда конкурирующих моделей всего две: щ(х, 9\) и О2), причем нам известно априорно некоторое приближение 61 для параметров первой модели 61. Будем предполагать, что X и ©2 —компактные множества, а функции гц(х,в1), П2(х, в^) непрерывны по х и непрерывно-дифференцируемы по 61 и 62 соответственно. Предлагается искать такой приближенный план эксперимента , который максимизирует величину
Введенный критерий оптимальности носит название Т-критерия. Его статистическая интерпретация для случая точных планов такова (см. [1]): в случае линейной по параметрам второй модели П2(х, 62) план эксперимента, доставляющий максимум величине (2), также максимизирует нижнюю границу для мощности х2-теста (^-теста, если дисперсия случайных ошибок неизвестна) в задаче проверки простой гипотезы
чтобы N = ^п=1 тг.
Пг(х,6г), х € X, € ©г, г = 1,..., V.
(2)
Н0 : г](х, в) = щ{х, #1)
против сложной альтернативы
Н1 : ф,6)= щ (х, 62), 62 € ©2.
Для нелинейной по параметрам модели 772 {х, $2) выполнено аналогичное утверждение. Из-за того, что критерий (2) зависит от $1, он является локальным критерием в смысле [6].
Известно, что задача нахождения T-оптимальных планов связана с задачей наилучшей чебышёвской аппроксимации (см., например, [3]), в том смысле, что выполняется равенство
sup inf / \щ(х, - щ{х, в2)\2^(<1х) = inf sup \щ(х, в\) - щ(х, 02)|, (3) 5 X Ö2E02 xeX 1
причем опорные точки T-оптимального плана для дискриминации ni(x, $1) и П2(х, $2) совпадают с точками альтернанса для задачи наилучшей чебышёвской аппроксимации функции ni(x, $1) функцией пз(х, $2). В данной работе мы покажем, как благодаря связи с чебышёвской аппроксимацией можно в явном виде найти планы для дискриминации простейших дробно-рациональных и полиномиальных моделей. Заметим, что оптимальный план доставляющий максимум (2), и infg2e02 при £ = являются единственными в силу единственности решения соответствующих задач че-бышёвской аппроксимации.
3. Простейшая дробь и полином. Рассмотрим пару регрессионных моделей
m 1
щ(х,6>i) = yvixi +-,
^^ x — a
i=0 (4)
m
П2 (x, $2 ) = ^ $2,ix\
i=0
заданных на промежутке x G [—1,1], которая в силу (3) сводится к классической задаче теории чебышёвской аппроксимации — нахождению полинома наилучшего приближения для функции 1/(x — a). Естественно предполагать, что a ^ [—1,1]. Без ограничения общности будем считать, что a > 1.
Сформулируем лемму о полиномах Чебышёва первого и второго рода, которая будет использована для доказательства теорем, характеризующих опорные точки оптимального плана.
Лемма 211. Полиномы Чебышёва первого и второго рода имеют следующие комплексные представления:
Tk(x) = Re(vk); Uk(x) =
lm(v)
где v — комплексное число, описывающее верхнюю половину единичной окружности,
т. е. V = х + г у/1 — ж2 при х £ [—1, 1].
Доказательство. Этот факт следует из явных формул для полиномов Чебышёва. □ Следующий результат предлагает решение задачи нахождения опорных точек оптимальных планов при любом т > 1.
Теорема 211. Т-оптимальный план для дискриминации моделей (4) сосредоточен в (m + 2)-х точках из отрезка [-1,1], причем точки ±1 принадлежат плану при любом m, а опорные точки из интервала (-1,1) являются корнями полиномов
^i(x) = Um(x) - 2a.Um_i(x) + a2Um-2(x),
Ф2(x) = (а2 — 1) Tm(x) + (2а — x — a2x) Um_i(x),
m > 2, m > 1,
(5)
(6)
где а = а — \/ а2 — 1.
Доказательство. Пусть а> 1. Введем обозначение
ад = —-рт(х),
х — а
где Рт(х) —это полином степени т с вещественными коэффициентами, наименее уклоняющийся от 1/(х — а). В главе 2 книги [7] была доказана справедливость равенства
Фф =
M
1 — av
+ v_
1 — av
где зависимости между v и x, а и a выражаются уравнениями
1
х = — 2
а константа
1
v + -v
1
а = — 2
1
оН--
а
. - у/а2 - 1,
1 + i\J 1 — ж2,
M=
4ат+2
[1 - а2]5
(7)
есть величина наилучшего приближения.
По теореме Чебышёва [7, стр. 66] число точек в альтернансе функции Ф(х), а значит и число точек в оптимальном плане, не меньше, чем т+2. Найдем экстремальные точки функции Ф(х). Обозначим
1 — av
Так как |v| = 1, то и |z| = 1, поэтому Ф^) можно переписать в виде
M
ад = у
z +
1
M
— [z + z] = MRe(z).
Функция Ф(х) достигает наибольших по модулю значений в точках, где И,е(.г) = ±1, или, что то же самое, !ш(г) = 0. В итоге имеем уравнение для экстремальных точек
Im(z) = Im
1 — av
Im
vm[a — v][1 — av] |1 — av|2
0,
(8)
которое эквивалентно уравнению
Im(2
av- — v- a~v~ *) = 2aIrn(vm) — Im(vm+1) — a2Im(vm-1) = 0. (9)
a — v
m
v
2
a — v
a — v
m
z
a — v
m
v
Таблица 1. Опорные точки Т-оптимального плана для дискриминации моделей (4), полученные с помощью теоремы 3.1, при небольших значениях т
m , . . . , Xn
1 -1, a, 1
2 1 1 + a 1 + a 1 L< 2 2' 2 2'
3 , o-Va2+8 a a + ^a2+8 , Í, 4 , 2 , 4 , Í
4 a-l-^/a2 + 2a + b a+l-^/a2-2a + b a-1 + л/a2 +2a + b a: +1 + л/a2-2a + b , J-> 4 ' 4 ' 4 ' 4 '
Заметим, что (9) выполнено при х = ±1, так как в этом случае 1ш(-у) = 0, следовательно эти точки принадлежат носителю оптимального плана. Если х € (-1,1), то Тш(-у) > 0, поэтому мы можем умножить выражение (9) на 1/!ш(-у):
2a
Im(vm) Im(vm+1)
, Im(v
г-1
Im(v) Im(v)
Im(v)
0.
Пользуясь представлением полиномов Чебышёва второго рода через комплексные числа из леммы 311, получим (5):
2aUm-i(x) — Um(x) — a2Um-2(x) = 0.
Число корней в последнем уравнении не превосходит m. Заметим, что последняя формула верна при m > 2.
Теперь выведем уравнение (6). Учитывая равенство
vm = cos (m arccos(x)) + i sin (m arccos(x))
и уравнение (8), получаем
Im(z) = \J 1-х2
a2 — 1
1 — 2ax + a2
(, . \ 2a x a, x / . . \
maréeosla:) H--rSin marceos i = 0.
V " 1 - 2ax + a2 V У "
Умножим последнее выражение на 1 / д/1 — х2, полагая, что х ^ ±1, и получим формулу для нахождения точек плана внутри промежутка (-1,1), верную при т > 1:
(а2 — 1) Тт(х) + (2а — х — а2х) ит-\(х) =0. □
Опорные точки, полученные с помощью теоремы 3.1, представлены в табл. 1.
4. Дальнейшее исследование. В этом параграфе мы рассмотрим две пары регрессионных моделей. Оказывается, что решать задачу Т-оптимального планирования сразу для обеих пар проще, чем для каждой в отдельности. Итак, пусть у нас имеются следующие пары моделей:
ni(x, 01) = ^ 0i,ixi +
i=о
m
n2(x, 02) = Y1 °2,ixÍ,
1
ni (x, 01) =J2 0i,ixi +
i=0 m
П2 (x, 02) =Y^ 02,ixi,
(10)
¿=0 ¿=0 заданные на промежутке х € [—1,1]. Будем, как и ранее, полагать, что а > 1.
)
a
x
2
2
x~ — a
x — a
Сформулируем результат, который позволяет аналитически решать задачу нахождения опорных точек Т-оптимального плана для моделей (10) в некоторых частных случаях.
Теорема 411. Т-оптимальные планы для моделей (10) сосредоточены в (т+2)-х точках. Если т — нечетное, то опорные точки из интервала (-1,1) плана для левой пары моделей совпадают с корнями полиномов:
*!(*) = ит(ж) - 2а2ит_2(ж) + а4ит_4(ж), т > 4, (11)
Ф2(ж) = 2ж (а4 - 1) Тт_1(ж) + (а4 + 2а2 + 1 - 2ж2[а4 + 1]) ит_2(ж), т > 2, (12)
а если то — четное, то это верно для правой пары. Точки ±1 принадлежат оптимальному плану при любом то. Тут, как и прежде, а = а — Vа2 — 1.
К сожалению, для четных т не удалось получить аналитического решения для левой пары моделей, а для нечетного т — для правой пары, так как мы не нашли соответствующих результатов в работах по теории аппроксимации.
Доказательство. При доказательстве этой теоремы мы тоже воспользуемся результатом из теории аппроксимации. Пусть а > 1. Рассмотрим функцию
-I V2 — а2 -I а2«2 — 1
Ф(ж) = г;"'1 , , " + у1-™^-
а2V2 - 1 V2 - а2
где зависимости между V и ж, а и а выражаются уравнениями 1
2
1
у + -
V
1
а = — 2
1
оН--
а
— \/ а2 — 1, V = х + г\/1 — ж2.
В [8] доказано, что точки экстремума этой функции являются точками альтернанса для задачи наилучшего приближения функции 1/(ж2 - а2) полиномом степени т, если т является нечетным, и функции ж/(ж2 - а2), если т является четным. Введем обозначение
22
а^2 - 1
Заметим, что = 1, так как |V| = 1, поэтому имеем
Ф(ж) = г+ - = г + г = 211е(,г).
Функция Ф(ж) достигает своего наибольшего значения при Ие(г) = ±1 или, что то же самое, при !ш(г) = 0. Проведем ряд эквивалентных преобразований:
1тЫ = 1т = 1т = 0,
^ \ ^ \cp-v'1 — 1| )
1т{:от-1 [о2 - а2] - 1]) = 0, (13)
1ш(2а^т-1 - а4vm_3 - vm_1) = 0. (14)
Из уравнения (14) видно, что точки ±1 принадлежат альтернансу. Умножим уравнение (14) на 1/1ш^), считая, что ж = ±1, и получим следующее уравнение для нахождения опорных точек оптимального плана при ж € (-1, 1):
ит(ж) - 2а2ит_2(ж) + а4ит_4(ж) = 0.
ж
а = а
Таблица 2. Опорные точки Т-оптимального плана для дискриминации моделей (10), полученные с помощью теоремы 4.1, при небольших значениях т
т Х1, . . . , xn
2 -1, а2+1 а2 + 1 2 > 2 > 1
3 -1, 0, v /S !
4 -1, ^4о!2 + Б+1 4 ' ^4о!2 + Б-1 V4q;2 + 6-1 y/4a2 + 5+l i 4 ' 4 ' 4 '
5 -1, V<*2+3 V 2 ' + l n \/«2 + l V«2+3 i 2 ' ' 2 ' 2 '
Вернемся к рассмотрению уравнения (13). Так как справедливо равенство vm-1 = cos ((m — 1) arccos(x)) + i sin ((m — 1) arccos(x)), уравнение (13) переписывается в виде
2x\/l — X2 (а4 — l) cos ((то — 1) arccos(x)) +
+ (a4 + 2a2 + 1 — 2x2 [a4 + 1]) sin ((m — 1) arccos(x)) = 0.
Умножим полученное выражение на 1 / yl—x2, считая, что х ^ ±1. В итоге получим
2х (а4 - 1) Tm-1(x) + (а4 + 2а2 + 1 - 2х2 [а4 + 1]) Um_2(x) = 0.
Последняя формула работает для m > 1. □
Опорные точки, полученные с помощью теоремы 4.1, представлены в табл 2.
5. Пример. Теперь обсудим пример реальной прикладной задачи, для которой, благодаря теореме 3.1, можно получить аналитическое решение. Рассмотрим пару конкурирующих регрессионных моделей
01,3 + x (15)
П2(х, 02) = 02,1 + 02,2x(02,3 - x),
заданных на промежутке х G [0, 500]. Вектор априорных значений для параметров первой модели 01 задается следующим образом:
01 = (01,1,01,2, 01,з) = (60,294,25). Это часть задачи 4.2 из работы [9]. Введем функцию
01 , 2 x
Г/(х, Ъ, 7) = гц{х, 6>i) - щ(х, 02) = 01,1 + -п--- 02,1 - 02,2Х(02,3 - х) =
01,3 + x
01,3 2
= 01,1 + 01,2 — п--- 02,1 — 02,202,ЗХ + 02,2Х =
01,3 + x
2 Y = Ъ 1 + b2x + Ь3х -
x + y
где Ь1 = в 1, 1 + в 1,2 — $2, 1, = —^2,2^2,3, Ьз = $2,2, 7 = в 1,3- Заметим, что выполняется
равенство
эирМ [ г)(х, 6,7)2£(с£е) = эирМ — [ Г1(х^Ъ^)2^(д,х) £ ь ]х £ ь 72 ./X
Мы получили, что пара (15) эквивалентна паре
1
щ(х,в1)= ,
х + 7
П2(х, $2) = Ь 1 + Ь2Х + Ьзх2
(16)
при х € [0, 500] с точки зрения Т-критерия. При этом оптимальный план зависит только от 7 (в нашем случае 7 = = 25) и умножение гц(х,0{) на константу не повлияет на оптимальный план. Чтобы воспользоваться теоремой 3-1, необходимо перевести задачу на промежуток [—1,1]. Заметим, что имеет место взаимно однозначное
соответствие
ЗЫ = —/(х) = —/(250 — 250у),
где »(у) = 1/(у — а) и /(х) = 250/(х + 7)- Если у пробегает отрезок [—1,1] от большего значения к меньшему, то х = 250 — 250у пробегает отрезок [0, 500]. В итоге имеем
»(у) = —/(250 — 250у) = —
250
250 - 250у + 7 у - 1+Ш
250
у—а
(17)
То есть мы получили, что опорные точки Т-оптимального плана для дискриминации моделей (16) совпадают с опорными точками для пары моделей (4) при т = 2 и а = (7 + 250)/250 = 1.1, переведенными на промежуток [0, 500] с помощью соответствия х = 250 — 250у и записанными в обратном порядке. Используя табл. 1, получаем
х? = 0,
х2 = 250 — 250
1 а
2 + 2
х3 = 250 — 250
1а ~2 + 2
Для того чтобы получить веса, воспользуемся равенством
дт{х*,в2)
Ых*М-т{х1в*2)}
¿=1
дв2
х? = 500. (18)
(19)
для любого Т-оптимального плана = {х?,..., х^; ш?,..., }, где в? —решение оптимизационной задачи Мв2ев2 в (2) при £ = £*. Этот факт можно найти, например, в [3, теорема 2.2]. Учитывая соотношение
т(х*,в1)-т(х*,в*2) = - Ы^А) -т(х*+1,в*2)]
% = 1, .. ., п — 1,
(20)
так как опорные точки принадлежат чебышёвскому альтернансу, получаем систему линейных уравнений относительно ш?
Ш? — Ш? + Ш? — Ш? = 0,
ш?х 1 — ш?х2 + ш?хз — ш?х4 = 0, ш?х2 — ш?х2 + ш?хз — ш4х2 = 0, + ш? + ш? + ш4 = 1.
1
1
0
92=9*
Первые три уравнения в системе получаются из (19) и (20), а последнее — это естественное ограничение на веса. Решая систему, получаем
_
Хд — Х4
2,-у»2 _ уу»2
х 1 Хд
1 Хз — Х4
2 Х1 — хз
Х2 — Х4 Х1 — хз
(21)
з 2 1
* 1 *
шА = -~ш2.
Таким образом, формулы (18) и (21) задают искомое аналитическое представление точек и весов Т-оптимального плана для дискриминации моделей (15). Подставляя числовые значения, получаем
£
0 44.782 294.782 500 0.348 0.452 0.152 0.048
Обсудим теперь задачу построения робастных планов для пары моделей (15). Величина
8ирсТ1,2(С,01)'
называемая эффективностью плана показывает, насколько произвольный план £ хуже оптимального при фиксированном в\. Эффективность — это стандартный показатель качества плана, используемый в литературе. Если истинное значение 0Ц1 далеко от выбранного нами приближения 9\, то эффективность 0"), где
£,*(0\) есть оптимальный план, посчитанный при фиксированном 9\, может оказаться низкой. Чтобы компенсировать этот эффект, обычно используют робастные по отношению к выбору 9\ критерии, один из которых мы сейчас рассмотрим. Будем считать, что вместо одного фиксированного значения в\ у нас имеется априорное распределение на множестве ©1 параметров первой модели. Стандартизированным байесовским Т-оптимальным называется план, доставляющий максимум величине Тзв(£), равной интегралу эффективности по априорному распределению.
Пусть априорное распределение сосредоточено в конечном количестве точек и является равномерным. Тогда будем иметь
1
= )•
г=1
Заметим, что критерий (22) эквивалентен критерию
Тр(0 = £ Рч я / [тн(х,о<) - ъ(х,е^)]2а<1х),
(22)
(23)
*
ш
1
2
2
1
з
2
2
2
4
н=
ш
2
2
2
1
з
где V = Н +1, Пг(х, в*) при % = 1,..., Н и матрица Р
П 1 (х, в 1) при % 1
м:
р=-
1,..., Н, 1 (х, вь+1) имеет вид
0 1/8ПРС Т1,2 (С, в( 1 ))'
0 1/8ПРС Т12 (С, в(2) )
0 1/8ПРС Т1,2(С,в(^) ) 00
т(х,в2), е1 = в
(¿)
(24)
Заметим также, что стандартный Т-критерий (2) эквивалентен (23) при V = 2, Р1,2 = 1, Р1,1 = Р2,1 = Р2,2 = 0. Численным алгоритмам для поиска оптимальных относительно критерия (23) планов (Тр-оптимальных планов) посвящены работы [2] и [9]. Основная проблема, мешающая применить методологию из работы [9], состоит в том, чтобы вычислить матрицу Р, которая в данном случае зависит от Н обычных Т-оптимальных планов. В сущности, вир^ ^,2(С, в(г)), % = 1,..., Н, можно вычислить напрямую, но в нашем примере мы можем воспользоваться тем, что эти величины равны квадратам величин наилучшего приближения для соответствующих задач че-бышёвской аппроксимации. Посчитаем стандартизированный байесовский план для дискриминации моделей (16) с равномерным априорным распределением для параметра 7, сосредоточенным на
в1,7 = ($(,),..., в(,0)) = (25, 50, 75,100,125,150,175, 200, 225, 250).
Эта задача соответствует (см. формулу (17)) нахождению стандартизированного плана для моделей (4) с равномерным априорным распределением для а, заданным на
© 1 = (в( ,..., в( ,а)) = (1.1,1.2,1.3,1.4,1.5,1.6,1.7,1.8,1.9, 2.0). В этом случае по формуле (7) для величины наилучшего приближения имеем
вир Т1,2(с,в(:а )=м2 с
М =
4а™+2
=в«—
(¿)
)2 — 1, % = 1,
. , 10.
(25)
Подставим (25) в (24) и воспользуемся алгоритмом из [9], реализованным в пакете [10] для К, чтобы найти оптимальный относительно критерия (23) план для пары (4). Воспользуемся описанным выше способом перевода опорных точек с отрезка [—1,1] на отрезок [0, 500] и перепишем точки и веса оптимального плана в обратном порядке, чтобы получить план для (16). В итоге имеем
£? в
0 75.1663 327.8767 500 0.268 0.410 0.232 0.090
Эффективности стандартизированного байесовского плана £2?в с равномерным априорным распределением на © 1,7 относительно локально оптимальных планов, посчитанных в каждой отдельной точке © 1,7, представлены в табл. 3, где Eff = -^(£,2в, в(г^). Проверку того, что найденные планы и £2?в являются оптимальными относительно (2) и (22) соответственно, можно провести с помощью теоремы эквивалентности (см. [9, теоремы 2.1 и 2.2]). Теорема эквивалентности для критерия (23),
1
1
а
W(x)
500
500
ниеи ками
Иллюстрации к теореме эквивалентности: для (слева), для в (справа). Непрерывной ли-обозначены графики функции Ф(ж,£), пунктирной — значения Тр(£), а заштрихованными точ-— опорные точки оптимальных планов.
Таблица 3. Эффективность байесовского плана в по отношению к локально
оптимальным планам, посчитанным с фиксированными параметрами в
(i) 1,7
25 50 75 100 125 150 175 200 225 250
Eff 0.825 0.942 0.984 0.998 0.999 0.995 0.987 0.979 0.970 0.960
к которому сводятся критерии (2) и (22), может быть сформулирована следующим образом: план является Тр-оптимальным тогда и только тогда, когда для функции
v
= X PiAmfaW-mMj)]2, (26)
где в = в(£) — это значения параметров, на которых достигаются infgi ^в (23), для всех точек x G X выполнено неравенство
Ф(х,Г) < Тр(?), (27)
причем в опорных точках оптимального плана в (27) достигается равенство. На рисунке приводятся иллюстрации к теореме эквивалентности. Из иллюстраций видно, что найденные планы удовлетворяют необходимым и достаточным условиям оптимальности.
Литература
1. Atkinson A. C., Fedorov V. V. The design of experiments for discriminating between two rival models // Biometrika. 1975. Vol.62, N1. P. 57-70.
2. Braess D., Dette H. Optimal discriminating designs for several competing regression models // Ann. Statist. 2013. Vol.41, N2. P.897-922.
3. Dette H., Titoff S. Optimal discrimination designs //Ann. Statist. 2009. Vol.37, N4. P.2056-2082.
4. Dette H., Melas V. B., Shpilev P. Robust T-optimal discriminating designs // Ann. Statist. 2013. Vol.41, N4. P. 1693-1715.
5. Kiefer J. General equivalence theory for optimum designs (approximate theory) // Ann. Statist. 1974. Vol.2. P.849-879.
6. Chernoff H. Locally optimal designs for estimating parameters // Ann. Math. Stat. 1953. Vol. 24. P. 586-602.
7. Ахиезер Н.И. Лекции по теории аппроксимации. М.: Наука, 1965. 406 с.
8. Бернштейн С. Н. Экстремальные свойства полиномов и наилучшее приближение непрерывных функций одной вещественной переменной. Л.; М.: Гостехиздат, 1937. 203 с.
9. Dette H., Melas V.B., Guchenko R. Bayesian T-optimal discriminating designs // Ann. Statist. 2015. Vol.43, N5. P. 1959-1985.
10. Guchenko R. rodd: Optimal Discriminating Designs, 2016, R package version 0.2-1, http: / / CRAN.R-project.org/package=rodd
Статья поступила в редакцию 17 октября 2016 г.; рекомендована в печать 22 декабря 2016 г. Сведения об авторах
Гученко Роман Александрович — аспирант; [email protected]
Мелас Вячеслав Борисович —доктор физико-математических наук, профессор; [email protected]
T-OPTIMAL DESIGNS FOR DISCRIMINATION BETWEEN RATIONAL AND POLYNOMIAL MODELS
Roman A. Guchenko, Viatcheslav B. Melas
St. Petersburg State University, Universitetskaya nab., 7-9, St. Petersburg, 199034, Russian Federation; [email protected], [email protected]
In the current article the problem of constructing analytically experimental designs, optimal according to the popular criterion of T-optimality introduced by Atkinson and Fedorov in 1975, for discrimination between simple rational and polynomial regression models is considered. It is shown how the classical results of approximation theory can be utilized to achieve explicit formulas describing the behavior of support points and weights of T-optimal designs for different fixed prior parameter values. An example of a practical problem with rational and polynomial regression models is provided. Then the numerical calculation of the experimental designs, optimal according to the robust analogs of T-criterion, for the models in the example is briefly discussed. Refs 10. Fig. 1. Tables 3.
Keywords: experimental design, model discrimination, Chebyshev approximation, best approximation.
References
1. Atkinson A.C., Fedorov V.V., "The design of experiments for discriminating between two rival models", Biometrika 62(1), 57-70 (1975).
2. Braess D., Dette H., "Optimal discriminating designs for several competing regression models", Ann. Statist. 41(2), 897-922 (2013).
3. Dette H., Titoff S., "Optimal discrimination designs", Ann. Statist. 37(4), 2056-2082 (2009).
4. Dette H., Melas V. B., Shpilev P., "Robust T-optimal discriminating designs", Ann. Statist. 41(4), 1693-1715 (2013).
5. Kiefer J., "General equivalence theory for optimum designs (approximate theory)", Ann. ¡Statist. 2, 849-879 (1974).
6. Chernoff H., "Locally optimal designs for estimating parameters", Ann. Math. Stat. 24, 586-602 (1953).
7. Ahiezer N. I., Lections on approximation theory (Nauka, Moscow, 1965) [in Russian].
8. Bernshtein S.N., Extremal properties of polynomials and best approximation of continuous functions of one real variable (Gostechizdat, Leningrad, Moscow, 1937) [in Russian].
9. Dette H., Melas V. B., Guchenko R., "Bayesian T-optimal discriminating designs", Ann. Statist. 43(5), 1959-1985 (2015).
10. Guchenko R. rodd: Optimal Discriminating Designs, 2016, R package version 0.2-1, http://CRAN.R-project.org/package=rodd
Для цитирования: Гученко Р. А., Мелас В. Б. T-оптимальные планы для дискриминации дробно-рациональных и полиномиальных моделей // Вестник СПбГУ. Математика. Механика. Астрономия. 2017. Т. 4 (62). Вып. 2. С. 208-219. DOI: 10.21638/11701/spbu01.2017.204
For citation: Guchenko R. A., Melas V. B. T-optimal designs for discrimination between rational and polynomial models. Vestnik SPbSU. Mathematics. Mechanics. Astronomy, 2017, vol. 4(62), issue 2, pp. 208-219. DOI: 10.21638/11701/spbu01.2017.204