МАСЛИЧНЫЕ КУЛЬТУРЫ. В. В. Гронин,
Научно-технический бюллетень аспирант
Всероссийского научно-исследовательского д. б. Дьяков
института масличных культур кандидат биологических наук
2006, вып. 2 (135)
ГНУ ВНИИ масличных культур
ИСПОЛЬЗОВАНИЕ МАТЕМАТИЧЕСКИХ МЕТОДОВ ДЛЯ ОЦЕНКИ РЕЗУЛЬТАТОВ ИСПЫТАНИЙ СЕЛЕКЦИОННЫХ ДОСТИЖЕНИЙ НА ОТЛИЧИМОСТЬ, ОДНОРОДНОСТЬ И СТАБИЛЬНОСТЬ
УДК 633.854.78:631.52
Наличие специфических отличительных признаков сортов, гибридов и их родительских форм всегда было важно для установления их подлинности, определения сортовой чистоты посевов и наличия примесей при апробации. Выявление уникальных комбинаций апробационно ценных признаков для надёжного описания сортов является важным условием эффективного сортоподдержания с целью обеспечения производства семян высокой генетической чистоты. Без такого контроля смешивание семян разных сортов или их переопыление могут сводить на нет усилия селекционеров. Особенно возрастает значение надежного описания генотипов для поддержания в процессе семеноводства чистоты и идентичности при высоком уровне генетического улучшения, когда уменьшаются сортовые различия, но повышаются требования к генетической чистоте [6]. Еще более актуальным стало выявление надежных отличительных признаков после вступления России в 1998 году в международную организацию по защите прав селекционеров UPOV, так как патентная защита сорта или гибрида невозможна без наличия у него таких признаков.
Организацией иРОУ разработан специальный определитель для проведения оценки на отличимость, однородность и стабильность (ООС) родительских линий и гибридов подсолнечника [7]. В нем указаны качественные (дискретные) и количественные (морфометрические) признаки растений, которые оцениваются визуально. Различия по дискретным признакам, как, например, наличие или отсутствие антоциановой окраски гипокотиля, окраска язычковых цветков, выявляются внешним осмотром и позволяют надежно распознавать принадлежность отдельных растений к соответствующим родительским линиям и межлинейным гибридам. Поэтому качественные признаки наиболее предпочтительны для использования в целях отличимости. Их можно использовать в семеноводстве, например, для поддержания генетической чистоты родительских линий гибридов. В ряде случаев дискретных признаков недостаточно для определения принадлежности растений подсолнечника к конкретным сортообразцам. Поэтому неизбежно использование и количественных признаков определителя, которые подвержены моди-фикационной изменчивости.
Исследования проводились в 2001-2002 гг. Растения 16 родительских линий и 8 межлинейных гибридов подсолнечника выращивались на 5-рядных делянках с тремя учетными рядами и при выдержанной густоте стояния растений - 40 тыс./га. В посеве каждого изученного сортообразца было взято для морфологического описания по 15 растений. Учеты производились на стадиях: всходы, бутонизация, цветение, созревание. Для морфологического описания растений подсолнечника были использованы 34 признака растений из определителя UPOV. Описание семян не производили, так как задача сертификации семян не ставилась.
Все изученные образцы сравнены между собой по 34 морфологическим признакам растений. Между каждой парой изученных линий существуют различия в среднем по 10-25 морфологическим признакам, приведенным в определителе иРОУ. Между простыми гибридами выявлено значительно меньше различий, чем между их родительскими линиями. Каждую пару гибридов различают в среднем 7-16 признаков. Однако не все эти признаки можно использовать как отличительные вследствие их неоднородной вы-
раженности у отдельных сортообразцов, а также нестабильности проявления этих признаков по годам.
Для того чтобы определить, какие признаки можно использовать в целях обеспечения эффективности гибридного семеноводства, а также для определения сортовой чистоты посевов и наличия примесей при апробации, была поставлена задача оценить точность различения сортообразцов подсолнечника с использованием качественных и количественных признаков определителя UPOV, определить вероятность ошибочной идентификации отдельных растений. Для этого необходимо было подобрать соответствующие математические методы.
Подбор методов для оценки точности различения образцов и определения вероятности ошибочной идентификации отдельных растений осуществляли на примере пяти родительских линий межлинейных гибридов: ВК 499, ВК 653, ВК 678, ВК 389 и ВК 392. Поэтому эта модельная группа изучена более подробно.
Вначале у пяти инбредных линий была оценена однородность всех морфологических признаков растения, указанных в определителе иРОУ. Неоднородно выраженные признаки обнаружены у каждой из изученных родительских линий (табл. 1). Для каждой линии по каждому неоднородно выраженному признаку найден процент нетипичных растений. Чтобы определить, насколько точно проценты нетипичных растений в выборке отражают долю нетипичных растений в генеральной совокупности, надо вычислить доверительные интервалы этих процентов. Эта задача решается с использованием биномиального распределения [4], однако эти вычисления очень сложны, поэтому разработаны различные методы приближенного вычисления: нормальное приближение, приближение Пуассона, ^-преобразование Р. А. Фишера. При малых объемах выборки нормальное приближение дает неточные результат [5]. Приближение Пуассона позволяет вычислять границы доверительного интервала более точно при малых выборках, однако оно неприменимо при больших величинах доли (процента) альтернативных вариант (р), поэтому мы использовали ^-преобразование.
Таблица 1 - Неоднородно выраженные морфологические признаки определителя UPOV у пяти инбредных линий подсолнечника
Линия Признак
ВК 499 Размер листа, форма дистальной части листа, зубчатость края, форма поперечного сечения листа, крыльевидные сегменты листа, угол между боковыми жилками листа, густота язычковых цветков, форма листочков обертки, форма стороны с семенами
ВК 653 Размер листа, форма дистальной части листа, «уши» листа
ВК 678 «Уши» листа, крыльевидные сегменты листа
ВК 389 Размер листа, форма дистальной части листа, «уши» листа, зубчатость листа, крыльевидные сегменты листа, опушение вершины стебля, наличие антоциановой пигментации рыльца, форма листочков обертки, зеленый цвет внешней стороны листочка обертки, расположение корзинки в пространстве, форма стороны с семенами у корзинки
ВК 392 Форма поперечного сечения листа, наличие крыльевидных сегментов листа
Величина ср имеет распределение, близкое к нормальному, вычисляется по формуле: (р = 2гксът-у[р , стандартная ошибка этой величины зависит только от объема
выборки (/7): <тф « =. Соответственно, нижняя (д) и верхняя (д,) границы доверительного интервала вычисляются по формулам:
XI V) м
<Р—Г <Р +
■2 ЫП • 2 ЫП
рн — бш —-— и рв- бш —-—, где ир - аргумент нормального распределения, для 95%-ного доверительного интервала ир=1,96, для 99%-ного доверительного интервала ир=2,58.
Таким образом, для каждой родительской линии по каждому неоднородно выраженному признаку вычислены 95%-ные доверительные интервалы для доли нетипичных растений. Например, для линии ВК 653 доверительные интервалы по трем неоднородно выраженным признакам приведены в табл. 2. Из этой таблицы следует, что выборки объемом 15 растений недостаточно, для точного определения доли нетипичных растений, так как разность между верхним и нижним доверительными интервалами достаточно велика (для признаков «размер листа» и «форма дистальной части листа» - 45,7%, для признака «уши» листа» - 38,8%). Чтобы размах 95%-ного доверительного интервала для процента нетипичных растений составил 5%, необходимо брать выборку не менее 384 растений [5, с. 130]. Однако вывод о непригодности признака в качестве отличительного вследствие его неоднородной выраженности можно сделать и по небольшой выборке. Например, из табл. 2 видно, что по признаку «размер листа» в генеральной совокупности соотношение растений с маленькими листьями и растений со средним размером листа в лучшем случае, возможно, будет 12,6% на 87,4%, в худшем -58,3% на 41,7%.
Таблица 2 - Процент нетипичных растений и его доверительные интервалы по неоднородно выраженным признакам у линии ВК 653
Признак Степень выраженности
Р,% Рн, % Рв, % Р,% Рн, % Рв, %
Размер листа Маленький Средний
33,3 12,6 58,3 66,7 41,7 87,4
Форма дистальной части листа Широкая треугольная Узкая треугольная
66,7 41,7 87,4 33,3 12,6 58,3
«Уши» листа Отсутствовали Маленькие
20 4,4 43,2 80 56,8 95,6
После определения процентов неоднородности по каждому признаку изученные родительские линии сравнены между собой по признакам определителя. Каждую пару из данных инбредных линий различают от 15 до 19 признаков. В табл. 3 приведены признаки, по которым различались сравниваемые линии в 2001 г., отдельно отмечены неоднородно выраженные, а также количественные признаки.
Таблица 3 - Сравнение пяти инбредных линий между собой по признакам определителя UPOV (2001 год)
ВК499
ВК653 2 5 7 8
9 10 11 15
17 19 21 24
25 2 7 28 34
ВК653
ВК678
ВК389
ВК678
1 8
3
4
5
9 10 11
12 13 15 21 26 27 28 32 34
1 3
8 9
12 13
24 25
28 32
4 7
10 11
17 19
26 22
34
ВК389
4
5
9 14 24
10 15
26
7 11
17 29
8
13 21 32
2 4
10 11
17 19
26 22
32 34
8 9
13 14
24 25
28 29
1 3
8 9
17 24
29 32
4 7
12 14
22 28
34
ВК392 1 4 5 7
¡11 12 14 15
21 24 25 26
32 33 34
1 9 14 26
33
4 10 17
22
34
5 8
11 12
19 25
28 32
5
10
3 4
8 9
14 24 25
28 32 33
7 1 4 5
13 9 10 12
27 14 17 24
34 29 33 34
8
13 25
Условные обозначения (номера признаков взяты из определителя UPOV):
■ - признак неоднородно выражен у одной из двух линий; I - признак неоднородно выражен у двух линий; 25 - количественный признак.
1 - наличие антоциановой окраски гипокотиля;
2 - интенсивность антоциановой окраски гипокотиля;
3 - размер листа;
4 - форма дистальной части листа;
5 - «уши» листа;
7 - бугристость листа;
8 - зубчатость края листа;
9 - форма поперечного сечения листа;
10 - крыльевидные сегменты листа (мезофилл по краю нижних боковых жилок)
11 - угол между боковыми жилками листа;
12 - высота кончика листа относительно места прикрепления черешка;
13 - опушенность вершины стебля (последние 5 см под корзинкой);
14 - время цветения;
15 - густота язычковых цветков;
17 - расположение язычковых цветков;
19 - цвет язычковых цветков;
21 - наличие антоциановой пигментации рыльца;
24 - форма листочка обертки;
25 - длина верхушки листочка обертки;
26 - зеленый цвет внешней стороны листочка обертки;
27 - естественная высота растения;
28 - положение листочков обертки по отношению к корзинке на стадии созревания;
29 - наличие ветвления;
32 - положение корзинки в пространстве;
33 - размер корзинки;
34 - форма стороны с семенами корзинки
Из табл. 3 видно, что для данной модельной группы линий существует не много признаков, удовлетворяющих требованию однородности. Оказалось, что больше всего отличий по качественным признакам между линиями ВК 678 и ВК 653 - 12 качественных, однородно выраженных признаков. Меньше всего таких отличительных признаков оказалось у пары линий ВК 389 и ВК 499 - только четыре. Во всех остальных парных сравнениях было обнаружено от шести до девяти однородно выраженных качественных признаков.
У этих однородно выраженных в один год исследования качественных признаков оценена стабильность их проявления по годам (2001 и 2002 годы). Оказалось, что у линии ВК 678 все качественные, однородно выраженные признаки одинаково проявляются в разные годы. Линии ВК 392 и ВК 389 имели по одному признаку, неодинаково выраженному в разные годы исследования (табл. 4). Больше всего таких нестабильно
Таблица 4 - Нестабильные по годам признаки у растений родительских линий ВК499, ВК653, ВК678, ВК389 и ВК 392
№ УРОУ Признак 2001 год 2002 год
ВК 392
12 Высота кончика листа относительно места прикрепления черешка Средне Выше
ВК 389
5 «Уши» листа Маленькие Средние
ВК 653
7 Бугристость листовой пластинки Нет Слабая
13 Опушенность вершины стебля Средняя Слабая
17 Расположение язычковых цветков Продольно загнутые Плоские
19 Цвет язычковых цветков Желто-оранжевые Желтые
ВК 499
5 «Уши» листа Очень большие Средние
7 Бугристость листовой пластинки Средняя Сильная
12 Высота кончика листа относительно места прикрепления черешка Выше Средне
13 Опушенность вершины стебля Средняя Слабая
26 Зеленый цвет внешней стороны листочка обертки Темный Средний
проявляющихся по годам признаков обнаружено у линий ВК 653 и ВК 499. Линия ВК 653 имела четыре признака, однородно выраженных в один год исследования, но проявившихся иначе в другой год исследования. У линии ВК 499 обнаружено пять нестабильных по годам, но однородно выраженных качественных признаков (см. табл. 4).
В табл. 5 приведены качественные отличительные признаки для исследуемых линий, которые остались после того, как были отброшены все неоднородно выраженные и нестабильно проявляющиеся по годам признаки. Чтобы точно оценить сходственные отношения по качественным признакам между родительскими линиями исследуемой группы, необходимо было подобрать соответствующий математический метод. Е. С. Смирновым в 1924 г. был предложен точный метод, позволяющий оценивать отношения сходства и различия внутри таксона любого порядка, названный впоследствии таксономическим анализом [3]. Исследования в этом направлении велись также и другими авторами [3, с. 7].
Таблица 5 - Однородно выраженные, одинаково проявляющиеся по годам,
качественные отличительные признаки пяти родительских линий межлинейных гибридов, взятые из определителя UPOV
Линия Признак и его степень выраженности
ВК 499 Антоциановая окраска гипокотиля - имеется, интенсивность антоциановой окраски гипокотиля - сильная, время цветения - среднее, расположение язычковых цветков в пространстве - плоские, положение листочков обертки по отношению к корзинке - слабо обхватывают, положение корзинки в пространстве - полуперевернутое с прямым стеблем
ВК 653 Антоциановая окраска гипокотиля - имеется, интенсивность антоциановой окраски ги-покотиля - слабая, время цветения - среднее, расположение язычковых цветков в пространстве - продольно свернутые боковыми краями на лицевую сторону корзинки, положение листочков обертки по отношению к корзинке - не обхватывают, положение корзинки в пространстве - полуперевернутое с прямым стеблем
ВК 678 Антоциановая окраска гипокотиля - отсутствует, форма дистальной части листа - круглая, форма поперечного сечения листа - слабо выпуклая, время цветения - среднее, расположение язычковых цветков в пространстве - плоские, положение листочков обертки по отношению к корзинке - сильно обхватывают, положение корзинки в пространстве - перевернутое вниз с прямым стеблем, форма стороны с семенами у корзинки - слабо вогнутая
ВК 389 Антоциановая окраска гипокотиля - имеется, интенсивность антоциановой окраски ги-покотиля - сильная, форма поперечного сечения листа - сильно вогнутая, время цветения - раннее, расположение язычковых цветков в пространстве - загнутые назад на тыльную сторону корзинки, положение листочков обертки по отношению к корзинке -слабо обхватывают, наличие ветвления - имеется, положение корзинки в пространстве - вертикальное
ВК 392 Антоциановая окраска гипокотиля - отсутствует, время цветения - позднее, расположение язычковых цветков в пространстве - плоские, положение листочков обертки по отношению к корзинке - слабо обхватывают, положение корзинки в пространстве -вертикальное
Основные понятия таксономического анализа - свойство, признак (или модальность) и фреквенция. В нашем случае свойством будет, например, интенсивность анто-циановой окраски гипокотиля, а признаками этого свойства - слабая, средняя и сильная антоциановая окраска гипокотиля. То есть свойство по Е. С. Смирнову соответствует признаку в системе определителя UPOV, а признаки свойств - соответствуют степеням выраженности. Признаки в рамках таксономического анализа могут быть положительными, то есть имеющимися (они обозначаются прописной буквой), и отрицательными, то есть отсутствующими (они обозначаются строчной буквой). Это необходимо для перевода полимодального распределения изучаемых таксонов в систему бимодальных распределений, так как отсутствие какого-либо одного признака может быть более характерной особенностью, чем наличие другого признака. Фреквенция признака - это число видов (в нашем случае - линий) которые обладают этим признаком, она обозначается соответствующей буквой, заключенной в круглые скобки, например, (E) - фреквенция положительного признака и (ё) - фреквенция отрицательного признака.
Введем буквенные обозначения отличительных признаков, представленных в табл. 5, числовым индексом обозначив модальности свойств: А - наличие антоциановой окраски гипокотиля, В - интенсивность антоциановой окраски гипокотиля (В - сильная, В - слабая), С - круглая форма дистальной части листа, й - форма поперечного сечения листа (А - слабо выпуклая, й - сильно вогнутая, й3 - другая), Е- время цветения (Е\ - раннее, Е2 - среднее, Е3 - позднее), F- расположение язычковых цветков -продольно свернутые боковыми краями на лицевую сторону корзинки, F2 - плоские, -загнутые назад, на тыльную сторону корзинки), в - положение листочков обертки по отношению к корзинке (61 - не обхватывают, 62 - слабо обхватывают, 6 - сильно обхватывают), Н - наличие ветвления, I - положение корзинки в пространстве (I - полуперевернутое с прямым стеблем, /2 - перевернутое вниз с прямым стеблем, 13 -вертикальное), 3 - слабо вогнутая форма стороны с семенами. Таким образом, морфологическое описание изучаемых инбредных линий можно представить в следующей форме:
ВК 499 ВК 653 ВК 678 ВК 389 ВК 392
ABгb2CClгCl2DзeгE2eзfгF2fзgг6gзhIlШ AbгB2Cdгd2DзeгE2eзFгf2fзGгg2gзhIгЩ alhblCD|2d■зelE2eзf\F2fзg\g2GзhkI2kJ AB1b2Cd1DdзE1e2eзflf2Fзgl6gзHЩзj abгb2Cdгd2Dзeгe2EзfíF2fзgí6gзhШзj
Далее было произведено парное сравнение данных линий друг с другом, и вычислены веса совпадений по каждому признаку для каждого сравнения. Вес совпадения
(а)
в положительном признаке равен со^4 = , вес совпадения в отрицательном признаем)
ке вычисляется как соаа = —-. Например, для сравнения линий ВК 499 и ВК 653 по
(а)
признаку А вес совпадения в положительном признаке будет равен ^=2/3=0,67; для сравнения линий ВК 678 и ВК 392 по признаку А вес совпадения в отрицательном признаке будет равен сом=3/2=1,5. Вес несовпадения в любом признаке, как показано Е. С. Смирновым, всегда равен -1 [3, с. 16]. Надежным показателем таксономического
отношения является средний вес: = — , где п- число признаков (в нашем слу-
77
П П
чае п=21), Ш; - вес сравнения по каждому признаку, х и у - сравниваемые таксоны (ин-бредные линии). Таксономическое отношение ^ для межвидового сравнения может
5-2
изменяться от - до -1, где 5- число видов, в нашем случае 1,5>£™>-1. Таксономи-
2
ческое отношение, вычисленное для внутривидового сравнения, то есть сравнения таксона с самим собой, служит показателем оригинальности исследуемой таксономической
единицы. Эта величина обозначается Ьхх, она может варьировать от 5-1 до ——, в нашем примере 4> ¿^>0,25. В табл. 6 приведены таксономические отношения данных пяти родительских линий.
Таблица 6 - Таксономические отношения, полученные при сравнении пяти инбредных линий между собой по признакам определителя УРОУ/
ВК 499 ВК 653 ВК 678 ВК 389 ВК 392
ВК 499 0,4881 0,0317 - 0,2857 - 0,1865 - 0,0476
ВК 653 0,0317 1,0635 - 0,3452 - 0,4444 - 0,3055
ВК 678 - 0,2857 - 0,3452 1,4206 - 0,5635 - 0,2262
ВК 389 - 0,1865 - 0,4444 - 0,5635 1,3214 - 0,1270
ВК 392 - 0,0476 - 0,3055 - 0,2262 - 0,1270 0,7063
По левой диагонали в табл. 6 находятся txx, максимальное значение этой величины у линии ВК 678, так как она имеет наибольшее количество индивидуальных признаков, на втором месте - ВК 389, на третьем - ВК 653, на четвертом - ВК 392. Наименее оригинальной оказалась линия ВК 499, ее значение txx минимально, так как у нее нет индивидуальных признаков. В табл. 7 приведены индивидуальные морфологические признаки для исследуемых родительских линий подсолнечника.
Таблица 7 - Индивидуальные отличительные признаки у пяти инбредных линий подсолнечника
Линия Признак Количество индивидуальных признаков
ВК 499 - 0
ВК 653 B2E2F1G1 4
ВК 678 CC1G3I2J 5
ВК 389 D2E1F3H 4
ВК 392 Ез 1
Из этой таблицы видно, что у изученных линий есть только положительные индивидуальные признаки. Отрицательных индивидуальных признаков, то есть таких, которые имелись бы у четырех линий, но отсутствовали у одной линии, в исследуемом наборе линий не оказалось.
Значения Х представлены в таблице 6 в двойном количестве для удобства обозримости. Из табл. 7 видно, что все они, кроме одного, отрицательны. Это означает, что во всех сравнениях различия преобладают над сходством. Только для сравнения пары линий ВК 499 и ВК 653 получено небольшое положительное значение, значит, в этом сравнении сходство преобладает над различием. Наиболее сильно различаются линии ВК 678 и ВК 389, для этого сравнения получено наибольшее по модулю отрицательное значение Х. Наименьшее по модулю отрицательное значение Х получено для пары линий ВК 499 и ВК 392, значит, между ними различий меньше, чем в других сравнениях, хотя различия все еще перевешивают сходство.
Таким образом, с помощью таксономического анализа можно осуществить точную оценку сходства или различия между любыми инбредными линиями или межлинейными гибридами подсолнечника по качественным морфологическим признакам. Необходимым условием для применения этого математического метода является наличие у сравниваемых образцов одинаково выраженных у всех растений и стабильно проявляющихся по годам качественных признаков.
Возможна ситуация, когда качественных признаков недостаточно для надежного распознавания принадлежности растений подсолнечника к конкретным сортообразцам, как, например, в сравнении линий ВК 499 и ВК 653, где сходство преобладало над различиями (табл. 6). В таких случаях необходимо использовать количественные признаки, однако они подвержены модификационной изменчивости.
Чтобы изучить возможность использования количественных признаков в условиях сильной средовой изменчивости, был заложен опыт, в котором модификационная изменчивость усиливалась варьированием густоты стояния растений: 20, 40, 70 тыс./га. Выращивались растения тех же пяти родительских линий межлинейных гибридов: ВК 499, ВК 653, ВК 678, ВК 389, ВК 392. Изучались следующие количественные признаки, предлагаемые определителем UPOV: размер листа, угол между нижними боковыми жилками листа, длина язычковых цветков, густота язычковых цветков, длина вершины листочка обертки, высота растения, размер корзинки. Все признаки были измерены на 20-ти растениях каждой инбредной линии на каждой густоте в каждый год исследования. Размер листа измерен как длина листовой пластинки, максимальная ширина листовой пластинки, расстояние от максимальной ширины до вершины листовой пластинки и длина черешка, густота язычковых цветков - как число язычковых цветков на 10 см периметра корзинки, а размер корзинки - как диаметр и периметр корзинки. Для каждой инбредной линии по всем признакам вычислены средние величины и их доверительные интервалы, дисперсии и стандартные отклонения на каждой густоте и для совокупности всех густот.
Проведено сравнение исследуемых линий по средним значениям признаков с помощью ¿-критерия Стьюдента [1]. В большинстве случаев выявлены различия, достоверные на 5%, 1% и 0,1%-ном уровнях значимости, величины ¿-критерия для некоторых сравнений приведены в табл. 8.
Построив распределение частот по значениям этих признаков, мы видим, что между сравниваемыми линиями по всем изученным признакам в разной степени наблюдается трансгрессия, что затрудняет надежную идентификацию принадлежности отдельного растения, несмотря на достоверные различия по средним. В качестве примера на рисунке 1 приведены распределения частот по некоторым признакам для линий ВК 499, ВК 653 и ВК 678.
Таблица 8 - Значения -критерия, полученные при сравнении инбредных линий по средним значениям некоторых количественных признаков в разные годы
Признак t
2001 год 2002 год
Линии ВК499 и ВК653
Длина вершины листочка обертки 13,02* 9,18*
Линии ВК653 и ВК678
Длина листовой пластинки 12,37* 10,62*
Длина вершины листочка обертки 14,99* 14,73*
Высота растения 15,75* 9,35*
* - Различия достоверны на 0,1%-ном уровне значимости
Рисунок 1 - Распределения частот по значениям некоторых признаков растений трех инбредных линий подсолнечника, выращенных при разных густотах стояния в разные годы.
Так получается потому, что критерием значимой разницы между средними является средняя ошибка разности, которая зависит от размеров разности, изменчивости в пределах группы, а также от числа исследованных индивидов. Чем число обследованных особей больше, тем ошибка меньше, по этой причине она не может быть использована для установления ценности признака при определении единственной особи. Поэтому была поставлена задача подобрать статистический метод, позволяющий оценить вероятность ошибки при идентификации отдельного растения и не зависящий от числа индивидов. Зная вероятность ошибки при идентификации отдельного растения, можно оценить пригодность количественного признака в целях отличимости, а также для оценок однородности и стабильности.
Проанализировав различные математические методы, позволяющие оценить эффективность различения групп особей, мы остановились на коэффициенте дискриминации (К), который был предложен А. А. Любищевым [2]. Формула коэффициента дискриминации:
_ (X -Х2)2 _ (х1 — х2)
Л — 2 2 ИЛИ А ~~ ~ ,
С71 +СГ2 2 у
где Х1 и Х2 - средние арифметические обеих групп, 0\ и 02 - стандартные отклонения,
у - квадрат общего квадратичного отклонения, вычисленный по формуле Р. А. Фишера или полученный в ходе дисперсионного анализа.
Вероятность ошибочного определения можно вычислить следующим образом: из формулы коэффициента дискриминации следует
2сг V 2 "
Левая часть равенства есть аргумент и нормального распределения (рис. 2). Вероятность ошибочных определений - это доля вариант, лежащих правее абсциссы и. Она вычисляется как Р = 1 - Ф(и) = ^[1 - 0(и)] , где Ф(и) - интеграл вероятности, а
ви) - площадь под кривой нормального распределения в пределах от х-иодо х+ио. Величину вии) можно найти с помощью таблицы [4, 5]. Существуют также таблицы непосредственно для Ф(и). Имея величину . К, вероятность Р можно также вычислить с
V 2
помощью компьютерных программ по статистике, например БТДТ1БТ1СД 6.0.
Из систематики известен морфологический критерий вида: два близких вида должны отличаться хотя бы по одному признаку, не дающему трансгрессии. Амплитуды колебаний данного признака должны быть разделены промежутком. Если обе амплитуды заходят друг за друга, создается область трансгрессии, где пользование этим признаком может привести к ошибкам в определении. Известно, что амплитуда есть величина, зависящая от числа наблюдений: чем больше число наблюдений, тем шире амплитуда. Поэтому при определении очень обширного материала может произойти такое расширение амплитуды, которое приведет к ненадежным или ошибочным определениям. Но и по ограниченной выборке можно составить представление о вероятности подобных ошибок. Критерием является стандартное отклонение о Вместо эмпирических амплитуд можно использовать условные амплитуды, взяв интервал в 3о по обе стороны от среднего арифметического. За пределами этого интервала останется около 0,003 генеральной совокупности.
Рисунок 2 - Кривая плотности нормального распределения (Хр.=0, а=1).
Можно вычислить, какое значение должен иметь коэффициент дискриминации, чтобы признак считался удовлетворительным для различения двух групп особей. Хорошим отличительным признаком считается такой, по которому нет трансгрессии между исследуемыми группами. Если не требовать полного отсутствия трансгрессии и ограничиться требованием трех а, то можно считать удовлетворительным случай, когда кривые распределения отличительного признака расположены так, что минимальная точка между обоими видами находится на расстоянии 3а от обоих средних (предполагая для
_ _ 36о.2
простоты, что а1=а2). Следовательно, х, = бег, а К =-г-= 18. При коэф-
2(7
фициенте дискриминации меньше 18 имеется уже более или менее выраженная трансгрессия.
Для изученных пяти инбредных линий вычислены коэффициенты дискриминации по всем измеренным признакам. Как и ожидалось, ни в одном случае значение А'не превысило 18. В большинстве сравнений А варьировал от 0 до 3, таким значениям соответствует вероятность ошибочного определения от 0,5 до 0,111. Следовательно, неверно идентифицированные растения будут встречаться от 1 раза на 2 растения до 1 на 9 растений. Лишь в отдельных случаях получены более высокие значения К некоторые из них приведены в табл. 9.
Таблица 9 - Значения коэффициента дискриминации (К), вероятности ошибочного определения (Р) и отношения числа неверно идентифицированных растений к общему числу определений (О), полученные при сравнении инбредных линий подсолнечника по некоторым количественным признакам в разные годы
Признак 2001 год 2002 год
К Р О К Р О
Линии ВК499 и ВК653
Длина вершины листочка обертки 3,25 0,101 1:9,9 4,21 0,073 1:13,7
Линии ВК653 и ВК678
Длина листовой пластинки 2,72 0,122 1:8,2 5,64 0,046 1:21,7
Длина вершины листочка обертки 3,93 0,080 1:12,5 10,85 0,010 1:100
Высота растения 4,44 0,068 1:14,7 4,73 0,062 1:16,1
Из табл. 9 видно, что наибольшее значение К получено для линий ВК 653 и ВК 678 по признаку длина вершины листочка обертки в 2002 г., однако в 2001 г. коэффициент дискриминации был почти в 3 раза меньше. Вероятность ошибочного определения изменилась в 8 раз. В остальных случаях коэффициенты дискриминации и вероятности ошибочных определений тоже изменяются по годам. Только по признаку высота растения для линий ВК 653 и ВК 678 величины коэффициента дискриминации и
вероятности ошибочного определения в разные годы почти одинаковы: в 2001 г. К=4,44, Р=0,068, в 2002 г. К=4,73 и Р=0,062. В этом случае одно ошибочное определение будет случаться в среднем на 14-16 растений, такая точность идентификации недостаточна для практического использования признака как отличительного.
Увеличить точность идентификации отдельных растений с помощью количественных признаков можно, используя одновременно два некоррелированных признака, так как в этом случае вероятности ошибочного определения перемножаются. Например, у линии ВК 653 коэффициент корреляции признаков длина вершины листочка обертки и высота растения по данным двух лет равен 0,29; у линии ВК 678 г по тем же признакам равен -0,06. Величины коэффициента дискриминации, вычисленного для линейной комбинации этих двух признаков, были К=5,02 по данным 2001 г. и К=12,40 по данным 2002 г. Соответственно, вероятность ошибки при определении отдельного растения для данных 2001 г. равна 0,056 (одна ошибка на 17,7 испытаний), для данных 2002 г. Р=0,006 (одно ошибочное определение на 156,7 растений).
Количественные признаки, взятые по одному, можно использовать в целях отличимости только при одинаковой густоте стояния сравниваемых сортообразцов. Например, для линий ВК 499 и ВК 653, различающихся по признаку длина вершины листочка обертки, вычислены коэффициенты дискриминации отдельно по каждой, использованной в этом эксперименте, густоте стояния растений (табл. 10).
Таблица 10 - Значения коэффициента дискриминации (К), вероятности ошибочного определения (Р) и отношения числа неверно идентифицированных растений к общему числу определений (О), полученные при сравнении инбредных линий подсолнечника ВК499 и ВК 653 по признаку длина вершины листочка обертки в разные годы на разных густотах стояния растений
2001 год 2002 год
20 тыс./га 40 тыс./га 70 тыс./га 20 тыс./га 40 тыс./га 70 тыс./га
K 2,85 2,08 5,03 7,42 3,21 6,09
P 0,116 0,154 0,056 0,027 0,103 0,040
О 1:8,6 1:6,5 1:17,7 1:37,0 1:9,7 1:24,7
Из табл. 10 видно, что лучше всего данные две линии различаются по признаку длина вершины листочка обертки, если их растения выращивались при густотах стояния 20 и 70 тыс./га.
Таким образом, подобран математический метод, позволяющий оценить вероятность ошибки при идентификации принадлежности отдельного растения к конкретному сортообразцу по количественному признаку. На примере пяти родительских линий гибридов с помощью этого метода измерена вероятность ошибки при идентификации отдельного растения по количественным признакам (в частности, имеющимся в определителе UPOV). На основе полученных данных сделан вывод о непригодности количественных признаков, взятых отдельно, для надежного определения принадлежности одного растения.
Литература
1. Лакин. Г. Ф. Биометрия. - 4-е изд. - М.: Высш. школа, 1990. - 352 с.
2. Любищев А. А. О приложении математической статистики к практической систематике // Прикладная математика в биологии. - М.: Изд-во МГУ, 1979. - С. 12-28.
3. Смирнов Е С. Таксономический анализ. - М.: Изд-во МГУ, 1969. - 188 с.
4. Снедекор Дж. У. Статистические метода в применении к исследованиям в сельском хозяйстве и биологии. - М.: Сельхозиздат, 1961. - 503 с.
5. Урбах В. Ю. Биометрические методы (статистическая обработка опытных данных в биологии, сельском хозяйстве и медицине). - М.: Наука, 1964. - 416 с.
6. Carcia C J. C. Importancia y usos de la descripción varietal en sorgo. Revista Cha-pingo. - 1985. - Vol. 10. - № 47. - 49. - P. 187-193.
7. Guidelines for the conduct of tests for distinctness, uniformity and stability. TG/81/5(proj.) Sunflower, 2000-02-18.