Научная статья на тему 'К построению обобщенного критерия согласия на основе энтропии К. Шеннона*'

К построению обобщенного критерия согласия на основе энтропии К. Шеннона* Текст научной статьи по специальности «Математика»

CC BY
48
20
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Янковский Б. Е., Янковская А. Е.

Предлагается обобщенный критерий согласия, позволяющий анализировать любые опытные данные, которые допустимо рассматривать как моделируемые законом Гаусса. Предлагаемый критерий целесообразнее отнести к непараметрическим псевдокритериям. Применение данного критерия позволяет более точно анализировать наборы статистических данных независимо от их вероятностных распределений.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Янковский Б. Е., Янковская А. Е.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «К построению обобщенного критерия согласия на основе энтропии К. Шеннона*»

УДК 519.22

Б.Е. ЯНКОВСКИЙ,

А.Е. ЯНКОВСКАЯ, докт. физ.-мат. наук, профессор

К ПОСТРОЕНИЮ ОБОБЩЕННОГО КРИТЕРИЯ СОГЛАСИЯ НА ОСНОВЕ ЭНТРОПИИ К. ШЕННОНА*

Предлагается обобщенный критерий согласия, позволяющий анализировать любые опытные данные, которые допустимо рассматривать как моделируемые законом Гаусса. Предлагаемый критерий целесообразнее отнести к непараметрическим псевдокритериям. Применение данного критерия позволяет более точно анализировать наборы статистических данных независимо от их вероятностных распределений.

Введение

В публикациях (например, в [1]), рассматривающих вероятностные распределения, кроме подчиняющихся закону Гаусса, отсутствует достаточная адекватность нормальному теоретическому распределению как по точности, так и по информативности. Под точностью понимается оценка близости моделирующего теоретического и моделируемого эмпирического распределений, представленных соответствующими величинами энтропии. Информативность есть показатель равенства с допустимой достоверностью показателей значений энтропии при допустимом неравенстве дисперсий упомянутых распределений. Следуя центральной предельной теореме, ряд направлений теории вероятностей и математической статистики (например, представленных в монографии [1]) исходят из повсеместности закона Муавра-Лапласа-Гаусса. В результате в некоторых практических руководствах нормальное распределение представлено как единственно возможное из всех теоретических. Поэтому в данной статье в дополнение к изложенному в статье [2], где акцентировано отмеченное заблуждение, более подробно представлен обобщенный критерий, позволяющий анализировать любые опытные данные на предмет допустимости рассмотрения подчиненности их закону Гаусса.

Постановка задачи

Для формулирования обобщенного критерия согласия в статье [2] показан способ получения по изучаемым опытным данным среднего квадратического отклонения (СКО) закона распределения вероятностей Гаусса, позволяющего корректно анализировать, оценивать и применять как числовую характеристику этих данных. При этом результирующему СКО, как выражению второго центрального момента, присущи все свойства СКО разнообразных распределений вероятностей. Таким образом, в настоящей статье предлагается обобщенный критерий согласия, позволяющий анализировать любые опытные данные, которые допустимо рассматривать как моделируемые законом Гаусса.

* Работа выполнена при поддержке РФФИ (проект № 04-01-00144).

Предложенный критерий целесообразнее отнести к непараметрическим псевдокритериям. Применение данного критерия позволит более точно анализировать наборы статистических данных независимо от их вероятностных распределений. Так как предлагаемые СКО описывают опытные данные, теперь уже подчиняющиеся закону Гаусса, правомерно использовать их как характеристику именно этого закона распределения вероятностей.

Для получения СКО нормальных распределений в статье [2] был применен редко встречающийся в инженерной практике момент - энтропия К. Шеннона. Основой этому послужил факт минимума СКО именно у нормального закона распределения.

В статье [2] представлена показанная в монографии [3] зависимость коэффициента К = — от величины, обратной корню квадратному из относи-о

тельного четвертого центрального момента

V

а4

^4

где а - СКО; А - половина широты распределения размаха варьирования; ц 4 - четвертый центральный момент; максимум K этой зависимости соответствует нормальному закону распределения вероятностей.

Метод

В данной статье рассматривается построение обобщенного критерия согласия. Воспользуемся методом определения энтропии анализируемой выборки (гистограммы результатов эксперимента), приведенной в статье [2]:

н- = у Al ln NAl, (!)

£ N Ar, ' '

для случаев одинаковых интервалов Ax :

m Ar N

H '* =Y—ln— + ln Ax, (2)

t! N Ar, ’ W

где N - объем выборки; Ar, - высота ,-го столбца гистограммы; m - количество интервалов.

По найденной энтропии [формулы (1), (2)] оценивается любое распределение, т.к. СКО нормального распределения

6 = 0,24197 exp Hнорм , (3)

а Н принимается как энтропия нормального распределения, т.е. Н = Ннорм Такой способ получения СКО расширяет возможности изучаемой выборки и построенной по ней гистограмме, если не выравнивающего данную выборку теоретического распределения, то найденного по ней соответствующего закона распределений Гаусса.

Иллюстративный пример

Рассмотрим взятый из [1, с. 204-212] пример при количестве малых предприятий N = 100 и Ах = 0,11, где Ах - постоянная разность между серединами соседних интервалов.

Определим СКО о эмпирического распределения, приведенного в таблице. При этом будем использовать обозначения, приведенные в [1]: х 0 - коэффициент середины k-го интервала; Xk - коэффициент соотношения заемных и собственных средств предприятий на k-м интервале.

Эмпирические данные

Номера интервалов 1 2 3 4 5 6 7 8

Величины на середине интервала х® 5,03 5,14 5,25 5,36 5,47 5,58 5,69 5,80

Число попаданий ик 2 3 12 19 29 18 13 4

Для данного примера [1, с. 211] вычислены следующие параметры распределения:

- статистическое среднее (математическое ожидание) опытных данных х

8

2 х к ик 54656

х = ----=------— = 5,4656,

Л 100 2ик

к=1

2

- дисперсия 5

2(хк -х) 2805

б2 = ^=Ц-----------= -------= 0,02805,

Л 100

2ик

к=1

- среднеквадратическое отклонение б

б = V0,02805 = 0,167

Вычислим энтропию опыта Н при 8 интервалах

* ^ Агм N , . 2 , 100 3 , 100

Н = 2 — 1п---------+ 1п Ах =---------------------------1п-+-1п-+

^ N Аг, 100 2 100 3

12 , 100 19 , 100 29 , 100 18 , 100

+------1п----+-----1п-----+--------1п----+-------1п---+

100 12 100 19 100 29 100 18

+ — 1п— + — 1п— + 1п 0,11 = -0,39219.

100 13 100 4

Тогда оценка СКО о = 0,24197e 0,39219 = 0,1635 .

В монографии [1] данный пример иллюстрирует нормальное распределение. Следовательно, о = 0,1635 ближе к фактической характеристике опытных данных, чем СКО из монографии [1], равное 0,167 (s = 0,167).

Обобщенный критерий согласия

В статье [2], наряду с вышеуказанным результатом, был получен и результат, по сути дела представляющий собой обобщенный критерий согласия распределений. В самом деле, приняв в качестве модели именно нормальный закон распределения с подсчитанным СКО по значению выборки (гистограммы), мы тем самым осуществили без дополнительных действий и обнаружение не только ближайшего к опытным данным, но и согласующегося с ними моделирующего закона. В связи с отсутствием разности между Ннорм и Н достигнуто точное результирующее преобразование. И, как легко заметить, -с максимальной информативностью, т.к. сравниваются и приравнены два независимых между собой момента (СКО и значения энтропии опытного и теоретического распределения), причем равенство значений энтропии непосредственно характеризуют меры информации сравниваемых распределений. Предложенный подход по информативности выше, чем подход по выявлению однородности дисперсий. В связи с тем, что поиск однородных СКО, описанный в [1] и в ряде других источников, осуществляется не точечно, как при Н = Ннорм, а по принятым интервалам.

Таким образом, при определении СКО нормального закона посредством формулы (3) через найденную по выборке энтропию достигается как высокая точность, так и информативность вычисленных результатов (Ннорм = Н и Ннорм = Н при близких значениях СКО). Поэтому предложенный подход мало отличается от наибольшей однородности определения модели данных опыта. При этом под наивысшей однородностью понимается совпадение принимаемого СКО опытного распределения и нормального распределения

( О оп = О норм) при

Н* Ннорм.

Заключение

В процессе поиска способа получения нормальных распределений, отвечающих неизвестным распределениям результатов опытов, найден обобщенный критерий согласия.

Предложенный критерий целесообразнее отнести к непараметрическим псевдо критериям, поскольку в описанном нами в данной статье методе осуществлено конструктивно посредством несложных вычислений принятие выдвинутой гипотезы о едином теоретическом (нормальном) распределении и точечных оценок в нем вместо получаемых статистик с критическими уровнями (доверительных интервалов).

В связи с тем, что до сих пор имеют место предвзятые попытки проводить выравнивание любых эмпирических распределений распределениями закона Гаусса, а в данной статье разработан путь перехода в любых случаях к СКО именно нормальных теоретических распределений, применение псев-

докритерия позволяет с большей вероятностью анализировать наборы статистических данных независимо от их распределения. При этом наборы статистических данных преобразуются по приведенному в статье [2] алгоритму в СКО нормального закона распределения, характеризующего теперь уже исследуемую выборку.

Авторы приносят свою искреннюю благодарность профессору М.И. Слободскому, рецензировавшему рукопись этой статьи, за конструктивные замечания, позволившие устранить разнообразные недостатки как логического, так и стилистического характера, а также отдельные нечеткости в изложении.

Библиографический список

1. Айвазян, С.А. Теория вероятностей и прикладная статистика / С.А. Айвазян, В.С. Мхита-рян. - М. : ЮНИТИ-ДАНА, 2001. - 656 с.

2. Янковский, Б.Е. Оценивание опытных данных при статистической обработке в управлении качеством / Б.Е. Янковский, А.Е. Янковская // Радиоэлектроника. Информатика. Управление. - 2002. - № 1. - С. 95-98.

3. Новицкий, П.В. Основы информационной теории измерительных устройств / П.В. Новицкий. - Л. : Энергия, 1968. - 248 с.

B.E. YANKOVSKIY, A E. YANKOVSKAYA

ON GENERALIZED GOODNESS-OF-FIT TEST BASED ON SHENNON’S ENTROPY

Generalized goodness-of-fit test for analyzing the experimental data, which can be considered as ones modeled by Gauss law, is proposed in the paper. The prepared goodness-of-fit test can be categorized as non-parametric pseudo test. This test allows to analyze statistical data with higher precision independent on their probable distributions.

УДК 539.37

С.Н. КОЛУПАЕВА, докт. физ.-мат. наук, доцент,

Т.В. НОВИКОВА, ТГПУ,

В.А. СТАРЕНЧЕНКО, докт. физ.-мат. наук, профессор

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ЭВОЛЮЦИИ РАЗОРИЕНТИРОВАННЫХ СТРУКТУР ПЛАСТИЧЕСКОЙ ДЕФОРМАЦИИ В МЕДИ И НИКЕЛЕ

Описана математическая модель, включающая уравнения баланса дислокаций и дислокационных стенок, которая была использована для анализа возможных сценариев развития дефектной подсистемы в процессе пластической деформации. Проведен анализ возможных сценариев развития дефектной подсистемы для меди и никеля в зависимости от взаимного расположения стационарных точек. Исследовано поведение кривых деформационного упрочнения, соответствующих различным фазовым портретам деформационной дефектной подсистемы.

i Надоели баннеры? Вы всегда можете отключить рекламу.