АГРОИНЖЕНЕРИЯ
УДК 631.3
ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ СЕМЯН ПУНКТИРНОЙ СЕЯЛКОЙ
А.Ф. Кошурников, канд. техн. наук, профессор; Д.А. Кошурников, ФГБОУ ВО Пермская ГСХА, ул. Петропавловская, 23, Пермь, Россия, 614990 E-mail: [email protected]
Аннотация. В работе предложено осуществлять выбор количества измерений таким образом, чтобы дисперсия (как основная характеристика равномерности распределения семян) оказалась в установленных (заданных) пределах. С этой целью использованы методы теории вероятностей и математической статистики. Построение доверительного интервала для дисперсии, как правило, основано на использовании ^-распределения (распределения Пирсона), но, строго говоря, этот метод совершенно точен, если изучаемые величины имеют нормальное распределение вероятностей. Кроме этого, $ - распределение не симметричное, и доверительный интервал будет зависеть не только от его параметров, но и от места расположения на числовой оси, что создает дополнительные трудности для оценки точности оценивания дисперсии. Для определения моментов гамма-распределения можно воспользоваться его характеристической функцией ри(х), представляющей преобразование Фурье. Построение доверительных интервалов для числовых характеристик распределения семян при пунктирном посеве, основанное на использовании свойств оценок максимального правдоподобия, позволило обосновать число измерений, необходимых для определения оценок с приемлемой точностью.
Ключевые слова: доверительные интервалы, геометрическое распределение, точность.
Введение. Оценки распределения семян, основанные на сравнительно небольшом количестве измерений, ведут к большим ошибкам и недоразумениям при обсуждении результатов.
Замена параметров распределения случайных величин их точечными оценками а может привести к серьезным ошибкам. В этом случае актуальной становится задача определения точности и надежности полученных оценок. Такая задача в математической стати-
стике решается с помощью построения доверительных интервалов при заданных уровнях доверительной вероятности.
Методика. В работе использованы методы теории вероятностей и математической статистики.
Результаты. Допустим, что для параметра «а» получена из опыта оценка а , значения которой может быть отложено на числовой оси (рис.1).
Рис.1. Схема образования доверительного интервала
С полной вероятностью о положении истинного значения параметра «а» можно сказать, что оно окажется в интервале от -да до +да.
Такая информация является тривиальной, бесполезной. Но если назначить некоторый меньший уровень доверительной вероятности в (например, в = 0,9; 0,95; 0,99), но все-таки такой, чтобы событие можно было бы считать практически достоверным, то интервал возможного отклонения е окажется меньше, и по его значению судят о точности оценки. Впервые это осуществил К. Пирсон [1].
Иными словами, вероятность того, что истинное значение окажется внутри интервала (а - е) и (а + е), будет равна в:
P[(a -s)< а <(а + £■)] = ¡3.
р(хн < х < хе) = F(xe)-F(xH).
f¡=-
' г -ып '
- m) =
■jn
то доверительным интервал для математического ожидания определится пределами:
I¡ =
f~ D ~ D
X t а Л I ; X t 1У л I
¡ V п ¡V п
V
(5)
J
(1)
где Ъ - выборочное значение дисперсии,
Ъ = а2.
При большом числе измерений х находится близко от т, т.е. сравнительно точно определяет т.
Например, пусть среднее расстояние между семенами х = 4 см, коэффициент вариации V = ~, 100 = 60% (откуда ~ = 2,4 см), доверительная вероятность р = 0,95, а число измерений п = 1000.
Коэффициент ¿090 при г = п - 1 = 1000 - 1 = =999 может быть найден по таблицам распределения Стьюдента ¿0,90 = 1,645, тогда
Границами интервала будут точки ан (нижняя), ав (верхняя), а величину всего интервала называют доверительным интервалом.
1р = {а -е); (а + е)} (2)
Вероятность того, что случайная величина х окажется в интервале хн.. ,хв , равна:
= 14 - l,645j^;4 +1,645/-5=76 1 = (3,8*4,12) СМ.
1000
1000
(3)
Таким образом, для построения доверительных интервалов необходимо знать законы распределения выборочных значений ~ и <?2.
Доверительный интервал для математического ожидания еще в 1908 г. английский математик У. Госсет, печатавшийся под псевдонимом «Стьюдент» [2], нашел закон распределения величины:
~ - т г~ (4)
где 1р - коэффициент, зависящий от доверительной вероятности и числа степеней свободы г = п - 1;
т - истинное значение математического ожидания;
~ - оценка математического ожидания. Разность (а - т) и представляет возможное отклонение математического ожидания от его оценки ~, т.е. |(~ - т) < е.
Поскольку из уравнения (4) следует, что
Величина относительной ошибки не превышает
Р0 = 012.100 = 3 %.
0 4
Построение доверительного интервала для дисперсии, как правило, основано на использовании ^-распределения (распределения Пирсона), но, строго говоря, этот метод совершенно точен, если изучаемые величины имеют нормальное распределение вероятностей.
Гамма-распределение может значительно отличаться от нормального. При малых значениях k оно приближается к «чисто случайному» - экспоненциальному с большим размахом.
Кроме этого, $ - распределение не симметричное, и доверительный интервал будет зависеть не только от его параметров, но и от места расположения на числовой оси, что создает дополнительные трудности для оценки точности оценивания дисперсии.
И, наконец, в справочной литературе таблицы $ -распределения учитывают лишь небольшое количество измерений (в основном для п = 30).
Возможен и другой путь решения задачи.
Поскольку оценки дисперсии Dk и плотности Ak гамма-распределения являются оценками максимального правдоподобия[3], то они имеют нормальное распределение [4, 5, 6].
В этом случае доверительный интервал можно построить около выборочного значения дисперсии D~ , так же, как строили его
около математического ожидания.
Доверительный интервал для дисперсии в этом случае строят [7] по уравнению
1. р"(г) пРи х = 0;
тз=- -р"Хх)
Б+, (6)
(к + 1)-(к + 2)-(к + 3) (13)
где а,
(ад
среднеквадратическое откло-
и наконец
нение распределения дисперсии, вычисляемой по результатам выборочного наблюдения.
Дисперсия дисперсии выборочной величины ^ определяется согласно Крамеру [3] и Вентцелю [7] формулой:
= Р' (х) при Х = 0;
_(к + 1)-(к + 2)-(к + 3)-(к + 4) . (14) 4 Л4
Для перехода от начальных моментов к центральным используют формулы
Б
-1 П - 3 Г)2
(Б~) " п М п(п -1) Б
(7)
М = 0 ; М = т2 - т1
2 .
1 '
Для определения моментов гамма-распределения можно воспользоваться его характеристической функцией ри(х), представляющей преобразование Фурье от него
Ри (х) = | /(0- .
(8)
Для композиции к отрезков показательного распределения с плотностью Л
3
М = т - 3щ - т + 2тх;
2 4
М = т - 4щ - т + 6т2 - т1 - 3т1 .
После подстановки начальных моментов в эти формулы центральные моменты гамма-распределения окажутся равными:
м=0; М2=^; Мз=2(к+1);
Ри (х) =
Л
Л- гх
к+1
(9)
М4
Л2
3(к + 1)(к + 3) . : Л4
Л^
(15)
где х - вспомогательный параметр.
Начальные моменты тг(г = 1, 2, 3, 4) могут быть определены достаточно просто
тг =г- -Р(иГ)(х)
(10)
Кроме этого, в целях упрощения расчетов
отношение п - 3 ~ 1, так как число измерений п -1 ~
определяется многими сотнями, тысячами. В этом случае
т.е. нужно найти г-тую производную характеристической функции по х и приравнять х нулю.
Первый начальный момент т = г-1 -р'и (х) при х = 0
1 п
Б(= 1(М4 -М22)'
Б
(Бк )
3(к + 1)(к + 3) (к +1)4
Л4
Л4
т1 = 1(к + 1)Г
г \Л- гх
(к+1)-\ [(Л- х)-0-Л(-г)] _ ' (Л- гх )2 "
После некоторых преобразований можно получить
2(к + 1)(к + 4)
г Л (к +1) ( Л
г уЛ- гх) (Л- ¡х)
к
1
и, соответственно,
п-Л4
(16)
Если х = 0, то
(Бк)
^ = 1
_ 2(к + 1)(к + 4) . (17)
пЛ4
Л (к +1) к +1
Л2
Л
(11)
Второй начальный момент
т2 = ' РРи(х)
при х = 0; (к + 1)-(к + 2). (12)
Точно так же
Когда значение найдено, то доверительный интервал для дисперсии может быть построен по уравнению (6), где величину в зависимости от принятой доверительной вероятности в и числа степеней свободы к = и-1, по таблицам tp - распределения [8, 9].
2
1
п
2
т =
Для условий предыдущего примера (Мк = =4 см; V = 60%; р = 0,95; п=1000) доверительный интервал для дисперсии может быть построен следующим образом:
I
1 1 (
Л =-
Мк = 4 =
V • Мк_ 60 • 4
100 100
= 2,4
см;
Ък = а2к = 2,42 = 5,76 см2;
к = -
ЪЛ
-1 =
1
5,76 • 0,252
-1 = 1,77;
Л = Л • (к +1) = 0,25 • (1,77 +1) = 0,6925; 2(к +1) • (к + 4)
Ъ(Ък) =■
п •Л4
Ъ
5,76
а
(ЪК)
Р(Ък) 2/я
После подстановки этого значения в формулу (17) и некоторых преобразований можно получить
2(к + 1)(к + 4) 2(к + 1)(к + 4) _
п = -
Ъ(Ък~) Л
& 2 (к + 1)(к + 4)
12
'р( Вк)
•Л4
(19)
Если вместо X подставить равное ему значение
Л = Л(к +1), где л = —, то
м.
п =
Ш1(к + 4)
= 2(1,77 +1) •(1,77 + 4) = 0,139 см2; 1000 • 0,69254
*(пк) = 7^ = л/0Д39 = 0,373.
Коэффициент по таблице распределения Стьюдента для р= 0,95 равен ¿095 = 1,96. Тогда
10>95 = (5,76 -1,96 • 0.373; 5,76 +1,96 • 0,373) = = (5,76 - 0,73; 5,76 + 0,73) = (5,03; 6,49) см2.
Относительная ошибка в определении дисперсии оказалась равной
Р = ±^^Дк) •юс = ±^100 = ±12,76%.
1р(Ък) Л (к +1)3
(20)
Т.е. даже при п = 1000 замерах ошибка в определении дисперсии может составить до 25%.
Уравнение (16) можно использовать и для обоснования числа необходимых замеров, при которых относительная ошибка в определении дисперсии е не превысит заданный уровень.
Относительная ошибка е может быть выбрана равной, например, 0,025; 0,05; 0,075; 0,1, что соответствует определению дисперсии с точностью до 2,5.10%.
Доверительный интервал (д^) тогда
может быть представлен как
1р(в~) = 2• е • Ък . (18)
В таком случае из уравнения (6) следует,
что
[ Р( Ък)
По этой формуле можно оценить порядок величины п, подставляя в нее типичные значения входящих параметров.
Пример. Пусть среднее расстояние между семенами Мк = 4 см, коэффициент вариации V = 60%, доверительная вероятность в = 0,95. Требуется определить, при каком количестве измерений дисперсия Бк может быть определена с относительной ошибкой, не превышающей е = 0,05 (т.е. 5%).
Расчет осуществляется достаточно просто:
Л = — =1 = 0,25;
к Мк 4
V V 60 • 4 „ „
ак =-к =-= 2,4 см.
к 100 100
Ъ =а2 = 2,42 = 5,76см2;
к = -
Ък Л
-1 = -
1
5,76 • 0,252
-1 = 1,77
гр = г9Ъ = 1,96, [82];
I ( ) = 2 • е • Ъ = 2 • 0,05 • 5,76 = 0,575см2
р к
п = 2 *р(* + 4) э = 8 •1:962(1,277 + 4) , 6448 1р(пк) -<(к +1)3 0,5762 • 0,252(1,77 +1)
Результаты расчета для других значений коэффициента вариации и желаемой точности в определении дисперсии приведены в табл.1.
а =
к
1
1
Таблица 1
Количество измерений, необходимых для оценки дисперсий с определенной относительной _точностью при шаге посева Мк = 4 см и доверительной вероятности в = 0,95_
Желательная точность в определении дисперсии, % Возможные оценки равномерности распределения семян
V=20% 0=0,64см2 V=40% 0=2,65см2 V=60% 0=5,76см2 V=80% 0=10,24см2 V=100% D= 16см2
2,5 13790 18220 25700 36026 49113
5,0 3442 4560 6448 9220 12278
7,5 1532 2021 2860 4339 5457
10,0 862 1141 1612 2450 3070
12,5 552 729 1031 1561 1965
15,0 383 506 715 1086 1364
Из данных таблицы 1 следует, что для максимального правдоподобия, позволило
повышения точности в определении стати- обосновать число измерений, необходимых
стической дисперсии требуется существен- для определения оценок с приемлемой точно-
ное увеличение числа измерений, во всяком стью. Оказалось, что дисперсия ряда распре-
случае по отношению к рекомендациям А.Л. деления семян, даже при значительных объе-
Миткова, С.В. Кардашевского [10] и П.М. мах выборки, определяется весьма неточно. Василенко [11]. Для повышения доверия к оценкам требу-
Заключение. Построение доверительных ется разработка аппаратуры, позволяющей ве-
интервалов для числовых характеристик рас- сти учет нескольких тысяч расстояний между
пределения семян при пунктирном посеве, ос- семенами и растениями. нованное на использовании свойств оценок
Литература
1. Pearson K. On the sistematic fitting of curves to observations and measurements // Biometrika. 1902. v. 1. 265-276. v2. 1-27.
2. Gösset W. S. "Student" The probable error of a mean // Biometrika. 1908. v. 6. 1-25.
3. Кошурников А. Ф. Оценки максимального правдоподобия для параметров распределения семян пунктирной сеялкой // Пермский аграрный вестник. 2015. № 4 (12) С. 48-53.
4. Саати Т. Элементы теории массового обслуживания и её приложения. М.: 1965-505 с.
5. Соколов Г. А., Гладких И. М.. Математическая статистика. М. : Экзамен, 2004 432 с.
6. Коган А. М., Линник Ю. В., Рао С. Р. Характеризационные задачи математической статистики. М. : Наука, 1972. 656 с.
7. Вентцель Е. С. Теория вероятностей. М. : Высшая школа, 2002. 576 с.
8. Gramer H. Mathematical metods. Princeton University Press. 1946. 648 с.
9. Владимирский Б. М., Горско А. Б., Ерусалимский Я. М. Математика. СПб : Лань, 2008. 980 с.
10. Митков А. Л., Кардашевский С. В. Статистические методы в сельхозмашиностроении. М. : Машиностроение, 1978. 360 с.
11. П. М. Василенко. К оценке технологических показателей работы почвообрабатывающих и посевных машин // Вестник с.-х. науки. 1962. № 7. С. 137-140.
INTERVAL ESTIMATION OF SEEDS DISTRIBUTION PARAMETERS
A.F. Koshurnikov, Cand. Tech. Sci., D.A. Koshurnikov
Perm State Agricultural Academy 23 Petropavlovskaya St., Perm 614990 Russia E-mail: [email protected]
ABSTRACT
The paper proposes to select dimensions number in such a way that dispersion as the basic characteristic of equal seeds distribution appears in specified limits. For this aim, the methods of probability theory and mathematical statistics were applied. Plotting a confidential interval for dispersion is based as a rule on £ -distribution (Pearson distribution); however, this method is absolutely precise when studied values have normal probability distribution. In addition^2 -distribution is asymmetric, and confidential interval will depend both on location at number-scaled
axes and its parameters. That creates additional difficulties for precision estimation of dispersion estimating. To determine gamma-distribution moments we can use its characteristic function quAy), Fourier transformation. Plotting confidential intervals for number characteristics of seeds distribution in single-seed planting, based on application of maximum likelihood features esteems enables explaining dimensions number required for acceptable precision of estimation. Key words: confidential intervals, geometrical distribution, precision.
References
1. Pearson K. On the sistematic fitting of curves to observations and measurements, Biometrika, 1902, Vol. 1, pp. 265-276, Vol. 2, pp. 1-27.
2. Gosset W. S. "Student" The probable error of a mean, Biometrika, 1908, Vol. 6, pp. 1-25.
3. Koshurnikov A. F. Otsenki maksimal'nogo pravdopodobiya dlya parametrov raspredeleniya semyan punktirnoi seyalkoi (Maximum-likelihood estimates for parameters of seeds cumulative distribution curve with single-seed drill), Permskii agrarnyi vestnik, 2015, Issue 12, No. 4, pp. 48-53.
4. Saati T. Elementy teorii massovogo obsluzhivaniya i ee prilozheniya (Elements of theory of waiting lines and its appendices), Moscow, 1965, 505 p.
5. Sokolov G. A., Gladkikh I. M. Matematicheskaya statistika (Mathematical statistics), Moscow : Ekzamen, 2004,
432 p.
6. Kogan A. M., Linnik Yu. V., Rao S. R. Kharakterizatsionnye zadachi matematicheskoi statistiki (Characterization problems in mathematical statistics), Moscow : Nauka, 1972, 656 p.
7. Venttsel' E. S. Teoriya veroyatnostei (Probability theory), Moscow: Vysshaya shkola, 2002, 576 p.
8. Cramer H. Mathematical methods of statistics, Princeton University Press, 1946, 648 p.
9. Vladimirskii B. M., Gorsko A. B., Erusalimskii Ya. M. Matematika (Mathematics), St-Petersburg : Lan, 2008, 980 p.
10. Mitkov A. L., Kardashevskii S. V. Statisticheskie metody v sel'khozmashinostroenii (Statistical methods in agricultural machine building), Moscow : Mashinostroenie, 1978, 360 p.
11. P. M. Vasilenko. K otsenke tekhnologicheskikh pokazatelei raboty pochvoobrabatyvayushchikh i posevnykh mashin (On evaluation of process parameters of tilthers and seeding machinery work), Vestnik s.-kh. nauki, 1962, No.7, pp. 137-140.
УДК 631.311. 631.33
ОЦЕНКА ГЛУБИНЫ ЗАДЕЛКИ СЕМЯН ЗЕРНОВЫХ КУЛЬТУР ПОСЕВНЫМИ КОМПЛЕКСАМИ
П.А. Болоев, д-р техн. наук, профессор;
Г.Н. Поляков, канд. техн. наук, доцент;
С.Н. Шуханов, д-р техн. наук, профессор,
ФГБОУ ВО Иркутский ГАУ имени А.А.Ежевского,
п. Молодежный, Иркутский р-н, Иркутская область, Россия, 664038
E-mail: Shuhanov56 @mail.ru
Аннотация. В Иркутской области изучали распределение семян зерновых культур по глубине заделки при различных сроках посева почвообрабатывающе-посевными комплексами, оборудованными сошниками стрельчатого типа. Производственный эксперимент проведен в ОАО «Белореченское» с применением посевных комплексов «Кузбасс», «Конкорд» и «Омич-ка». Методика включала определение глубины посева по длине осветленной части ростка при появлении второго листа. Измерение глубины посева проводили за одним сошником на каждой секции почвообрабатывающе-посевного комплекса на пути 1 метра. Посев проводили по мелкой дискаторной обработке и по стерне. Посевные машины приводили к нормальному техническому состоянию и настраивали на заданную норму высева 300-400 кг/га и глубину посева в дипазоне 0,03-0,08 м. Установлено, что высокочастотные колебания поддерживаются технологическими случайными процессами основной обработки почвы и посева. При ранних сроках посева и повышенной влажности почвы стрельчатые лапы неустойчиво идут по глубине, только 41-44% семян заделываются в соответствии с агротехническими требованиями. В поздние сроки посева с уменьшением влажности почвы стрельчатые лапы заделывают на заданную глу-