УДК 631.527:004.4
анализ сопряженной изменчивости количественных признаков тритикале
А.Ф. ЧЕШКОВА1, кандидат физико-математических наук, зав. лабораторией (e-mail: anna. cheshkova@sorashn. ru)
А.Ф. АЛЕЙНИКОВ12, доктор технических наук, главный научный сотрудник
П.И. СТЁПОЧКИН3, доктор сельскохозяйственных наук, ведущий научный сотрудник
1Сибирский физико-технический институт аграрных проблем, а/я468, Краснообск, Новосибирский р-н, Новосибирская обл., 630501, Российская Федерация
2Новосибирский государственный технический университет, пр-т. Карла Маркса, 20, Новосибирск, 630092, Российская Федерация
3Сибирский НИИ растениеводства и селекции - филиал ИЦиГ СО РАН, а/я375, Краснообск, Новосибирский р-н, Новосибирская обл., 630501, Российская Федерация
Резюме. Проведены исследования с целью выявления закономерностей сопряженной изменчивости количественных признаков тритикале в условиях Западной Сибири. Для решения поставленной задачи использовали стандартные статистические методы многомерного анализа данных (метод Пирсона с оценкой статистической значимости по t-критерию Стьюдента, метод главных компонент, кластерный анализ по методу Уор-да), реализованные в программной среде R. Материалом для исследования послужили данные полевых опытов СибНИИРС по изучению образцов яровой и озимой тритикале из мировой коллекции ВИР2009 (51 сортяровой тритикале; 103 - озимой) и 2011 гг. (120 - озимой тритикале). Оценку образцов проводили по 12 морфологическим признакам. Выявлен высокий уровень линейных корреляций для 8 пар признаков. Сильная линейная зависимость наблюдается между признаками «число продуктивных побегов с 1 м2» и «общая масса зерен, г/м2». Средняя корреляция установлена между признаками «масса зерен с колоса» и «масса 1000зерен». Такие признаки, как «длина колоса», «число колосков в колосе», «число зерен в колосе» и «масса зерен с колоса» образуют корреляционную группу. Изменчивость количественных признаков определяется 3-4 главными компонентами, на долю которых приходится от 70 до 80% суммарной дисперсии. Во всех трех опытах в первую компоненту с относительно большими коэффициентами нагрузки вошли все признаки, образующие корреляционную группу, что дало основание интерпретировать её как компоненту «продуктивность колоса». Кластерный анализ подтвердил результаты компонентного анализа и позволил выявить корреляционные плеяды признаков. Ключевые слова: тритикале, селекция, изменчивость количественных признаков, многомерный анализ. Для цитирования: ЧешковаА.Ф., Алейников А.Ф., Стёпочкин П.И. Анализ сопряженной изменчивости количественных признаков тритикале // Достижения науки и техники АПК. 2016. Т. 30. № 5. С. 50-52.
Тритикале, удачно сочетающая в себе положительные свойства пшеницы и ржи, с каждым годом находит
ность рекомбинационной селекции растений. При этом необходимо учитывать корреляционные зависимости и закономерности сопряженной изменчивости комплекса хозяйственно-важных признаков и определять среди них ключевые, по которым можно вести отбор с прогнозом эффекта по другим показателям [1].
Анализ научных публикаций показал, что вопросы сопряжения признаков у тритикале изучены недостаточно и ограничиваются либо установлением парных корреляций [2], либо компонентным анализом изменчивости [3].
Цель исследований - определить закономерности сопряженной изменчивости количественных признаков тритикале в условиях Западной Сибири с использованием многомерных методов статистического анализа данных.
Условия, материалы и методы. Исследования проведены в рамках разработки системы информационно-аналитического обеспечения селекции тритикале [4-6]. Материалом для исследования послужили данные полевых опытов СибНИИРС по изучению образцов яровой и озимой тритикале из мировой коллекции ВИР 2009 и 2011 гг. В 2009 г. изучали 51 сорт яровой тритикале и 103 - озимой тритикале, в 2011 г. - 120 образцов озимой тритикале. При проведении эксперимента учитывали 12 морфологических признаков: Х1 - продолжительность периода от всходов до колошения, дн.; Х4 - высота растения, см; Х5 - длина колоса, см; Х6 - число колосков в колосе, шт.; Х8 - число зерен в колосе, шт.; Х9 - масса зерен колоса, г; Х11 - масса 1000 зерен, г; Х14 - натура зерна (масса 1 л зерен), г; Х15 - длина остей, см; Х16 -диаметр шейки, см; Х26 - число продуктивных побегов, шт. /м2; Х27 - общая масса зерен, г/м2.
Расчет парных корреляций осуществляли методом Пирсона с оценкой статистической значимости по ^критерию Стьюдента [7]. Анализ структуры зависимости между признаками выполнен методом главных компонент [8]. При определении количества оставляемых компонент использовали критерий Кайзера (отбирали только компоненты, дисперсия которых больше или равна 1) и критерий «каменистой осыпи» (графический отбор компонент)[8].
Поиск корреляционных плеяд осуществляли на основе кластерного анализа, позволяющего выявить группы тесно связанных между собой признаков. В качестве меры сходства использовали корреляции признаков. Матрицу расстояний между признаками определяли, как D = (1-\г\), (, = 1....т), где г - коэффициенты корреляции между '-м и ¡-м признаками, т - число признаков. Для кластеризации применяли метод Уорда [9].
Математическую обработку данных проводили с помощью статистической программной среды R [10].
более широкое применение как зернофуражная, продовольственная и кормовая культура.
Селекция начинается с изучения многочисленных коллекций и выделения лучшего исходного материала. Тщательный подбор родительских форм для гибридизации во многом определяет результатив-
Таблица 1. Список коррелирующих признаков
Коррели- Яровые 2009 г. Озимые 2009 г. Озимые 2011 г. Озимые 2009-
рующие N=51 N=103 N=120 2011 гг. N=223
признаки r 1 95% ДИ* r 1 95% ДИ* r 1 95%-ДИ* r 95% ДИ*
X26-X27 0,86 0,77-0,92 0,78 0,69-0,84 0,90 0,85-0,93 0,84 0,80-0,88
X9-X11 0,56 0,34-0,72 0,48 0,31-0,61 0,38 0,22-0,52 0,44 0,33-0,54
X5-X6 0,69 0,51-0,81 0,65 0,52-0,75 0,53 0,38-0,65 0,59 0,50-0,67
X5-X8 0,71 0,54-0,82 0,44 0,27-0,59 0,41 0,25-0,55 0,45 0,34-0,55
X5-X9 0,61 0,41-0,76 0,52 0,36-0,65 0,50 0,36-0,63 0,53 0,43-0,62
X6-X8 0,63 0,43-0,77 0,53 0,37-0,65 0,44 0,29-0,58 0,48 0,37-0,57
X6-X9 0,39 0,13-0,60 0,46 0,30-0,60 0,42 0,26-0,56 0,41 0,30-0,52
X8-X9 0,80 0,67-0,88 0,85 0,78-0,89 0,81 0,74-0,86 0,83 0,79-0,87
* ДИ - доверительный интервал коэффициента корреляции
_ Достижения науки и техники АПК. 2016. Т 30. № 5
Таблица 2. коэффициенты нагрузок на главные
результаты и обсуждение. Анализ корреляционных матриц позволил выявить высокий уровень парныхлинейных корреляций, статистически значимых на уровне не
менее 95%, повторяющийся в разных годах исследования для 8 пар признаков (табл. 1).
Можно сделать вывод, что сильная линейная зависимость наблюдается между признаками «число продуктивных побегов с 1 м2» и «общая масса зерен с 1 м2», средняя - между показателями «масса зерен с колоса» и «масса 1000 зерен», а признаки «длина колоса», «число колосков в колосе», «число зерен в колосе» и «масса зерен с колоса» образуют корреляционную группу, так как между всеми парами этих четырех признаков наблюдается высокий уровень корреляционных зависимостей с коэффициентом г^ > 0,4.
В результате компонентного анализа результатов полевых опытов установлено, что изменчивость количественных признаков определяется 3-4 главными компонентами, на долю которых приходится от 70% до 80% суммарной дисперсии (табл. 2).
Во всех трех опытах в первую компоненту с относительно большими коэффициентами нагрузки вошли коррелирующие между собой признаки Х5 - длина колоса, Х6 - число колосков в колосе, Х8 - число зерен в колосе, Х9 - масса зерен колоса, что дает нам основание интерпретировать первую компоненту как «продуктивность колоса». Кроме того, в неё с большой нагрузкой вошли признаки Х27 -общая масса зерен с 1 м2 (яровая, 2009, озимая, 2011), Х16 - диаметр шейки (яровая, 2009, озимая, 2009), Х11 -масса 1000 зерен (озимая, 2011), Х1 - продолжительность периода от всходов до колошения (озимая, 2009). Состав остальных главных компонент сильно различается между опытами, что затрудняет возможность их биологической интерпретации. Следует отметить, что во второй компоненте данных по озимой тритикале в 2009 и 2011 гг. весомы коррелирующие между собой признаки Х26 -число продуктивных побегов с 1 м2 и Х27 - общая масса зерен с 1 м2, в то время как для яровой тритикале в 2009 г. эти признаки находятся в третьей компоненте. Можно предположить, что для озимой тритикале число продуктивных побегов и урожайность в значительной мере определяются фактором перезимовки растения, что объясняет их больший вклад в совокупную изменчивость признаков, в то время как для яровых форм этот фактор отсутствует. Также, прослеживается еще одна закономерность. Во вторую компоненту для яровых тритикале в 2009 г. вошли признаки Х11 - масса 1000 зерен, Х15 - длина остей, Х1 - продолжительность периода от всходов до колошения (с обратным знаком) и Х14 - натура зерна. В третей компоненте озимых в 2009 г. также есть Х11, Х15 и Х1, а в третьей компоненте озимых в 2011 г. присутствуют Х15, Х1 и Х14.
Таким образом, можно сделать вывод, что для яровой и озимой тритикале вторая и третья компоненты схожи, но имеют разную очередность.
компоненты
Признак Коэффициент нагр узки
Сотр.11 Сотр.2\ Сотр.3 Сотр.4
яровая тритикале (2009 г.) Х1 -0,182 -0,436 0,125 -0,173
Х4 -0,250 -0,126 0,370 -0,598
Х5 -0,388 -0,115 -0,169 0,018
Х6 -0,350 -0,239 -0,044 0,178
Х8 -0,364 -0,087 -0,407 0,121
Х9 -0,374 0,199 -0,298 -0,123
Х11 -0,183 0,439 0,091 -0,370
Х14 -0,096 0,486 0,026 -0,241
Х15 -0,051 0,401 -0,306 0,216
Х16 -0,341 -0,168 -0,153 -0,074
X26 -0,262 0,112 0,553 0,490
X27 -0,358 0,216 0,361 0,252
Дисперсия компонент 4,579 2,821 1,422 0,796
Суммарный процент дисперсии 0,38% 0,62% 0,74% 0,80%
озимая тритикале (2009 г.) Х1 -0,317 -0,017 0,367 0,367
X4 0,099 -0,281 0,425 0,425
X5 -0,399 -0,118 0,014 0,014
Х6 -0,403 -0,114 0,283 0,283
Х8 -0,394 -0,179 -0,014 -0,014
X9 -0,380 -0,307 -0,247 -0,247
X11 -0,054 -0,317 -0,504 -0,504
Х14 0,243 -0,370 -0,137 -0,137
X15 -0,056 0,009 -0,462 -0,462
X16 -0,330 0,034 -0,007 -0,007
X26 0,295 -0,414 0,233 0,233
X27 0,085 -0,597 0,048 0,048
Дисперсия компонент 3,702 2,353 1,695 0,884
Суммарный процент дисперсии 0,31% 0,51% 0,65% 0,72%
озимая тритикале (2011 г.) X1 0,245 -0,060 -0,516 -0,043
X4 -0,280 0,266 -0,378 0,282
X5 -0,352 -0,277 -0,103 -0,066
Х6 -0,315 -0,256 -0,350 -0,181
Х8 -0,342 -0,360 0,136 -0,047
X9 -0,463 -0,225 0,052 0,157
X11 -0,308 0,186 -0,208 0,421
Х14 -0,218 0,256 0,361 0,278
X15 -0,116 -0,219 0,436 -0,240
X16 0,030 -0,264 -0,265 -0,322
X26 -0,181 0,484 0,011 -0,506
X27 -0,343 0,389 -0,057 -0,427
Дисперсия компонент 3,107 2,386 1,512 1,219
Суммарный процент дисперсии 0,26% 0,46% 0,58% 0,69%
рис. 1. Распределение комплекса признаков на плоскости главных компонент: а) для яровых, 2009 г.; б) для озимых, 2009 г.; в) для озимых, 2011 г.
рис. 2. Дендрограммы кластерного анализа признаков: а) для яровых, 2009 г.; б) для озимых, 2009 г., в) для озимых, 2011
г.
Для облегчения выявления корреляционных плеяд признаков были построены графики распределения признаков в пространстве первых двух главных компонент, то есть на плоскости (рис. 1). В результате установлена, по крайней мере, одна плеяда, которая повторяется для всех опытов. В нее вошли ранее перечисленные признаки (Х5, Х6, Х8, Х9).
Проведенный кластерный анализ подтвердил результаты компонентного анализа (рис. 2). Исследуемые признаки сформировали 3 кластера. Для всех трех опытов в первый кластер вошли все те же признаки продуктивности колоса (Х5, Х6, Х8, Х9).
выводы. В результате анализа сопряжённой изменчивости 12 количественных признаков тритикале выявлено 8 значимых корреляционных связей. Установлено, что для тритикале наблюдается стабильная взаимосвязь признаков длина колоса, число колосков в колосе, число зерен в колосе и масса зерен колоса, образующих корреляционную группу. Они определяют основную долю совокупной изменчивости комплекса признаков, любой из них можно использовать в качестве ключевого и вести с его помощью отбор при селекции тритикале с прогнозом эффекта по остальным признакам из этой корреляционной плеяды.
Литература.
1. Смиряев А.В., Мартынов С.П., Кильчёвский А.В. Биометрия в генетике и селекции растений. М.: Изд-во МСХА, 1992. 269 с.
2. Мединский А.В. Корреляционные связи элементов урожайности озимой тритикале //Научные исследования и разработки молодых ученых. 2015. № 3. С. 81-83.
3. Никитина В.И., Худенко М.А. Сравнение образцов яровой тритикале коллекции ВИР в условиях Красноярской лесостепи // Вестник КрасГАУ. 2012. № 12. С. 40-45.
4. Программный комплекс для информационно-аналитической поддержки селекции сельскохозяйственных культур / А.Ф. Чешкова, А.Ф. Алейников, П.И. Стёпочкин, И.Г. Гребенникова //Достижения науки и техники АПК. 2015. Т. 29. № 4. С. 80-82.
5. A computer software package for information analytical support of crop breeding / A.F. Cheshkova, A.F. Aleinikov, P.I. Stepochkin, I.G. Grebennikova // Environmentally Friendly Agriculture and Forestry for Future Generations Proceedings of International Scientific XXXVICIOSTA & CIGR Section V Conference. Saint-Petersburg State Agrarian University, IEEP. 2015. P. 153-154.
6. Чешкова А.Ф., Алейников А.Ф., Стёпочкин П.И. Использование программной среды R для разведочного анализа данных в селекционных исследованиях// Информационные технологии, системы и приборы в АПК: Материалы 6-ой Международной научно-практической конференции «АГРОИНФО - 2015». Новосибирск: СибФТИ, 2015. Ч.1. С. 182-187.
7. Доспехов Б.А. Методика полевого опыта (с основами статистической обработки результатов исследований). М.: Агро-промиздат, 1985. 416 с.
8. Андрукович П.Ф. Применение метода главных компонент в практических исследованиях. М.: Изд-во МГУ, 1973. вып. 36. 124 с.
9. Олдендерфер М.С., Блэшфилд Р.К. Кластерный анализ // Факторный, дискриминантныи и кластерный анализ / пер. с англ. Дж.-О. Ким, Ч.У. Мьюллер, У.Р. Клекка и др.; под ред. И.С. Енюкова. М.: Финансы и статистика, 1989. С. 139-201.
10. Мастицкий С.Э., Шитиков В.К. Статистический анализ и визуализация данных с помощью R. URL: http://r-analytics. blogspot.com (дата обращения 16.02.2016).
ANALYSIS OF COVARIATION OF QuANTITATIVE CHARACTERS OF TRITICALE
A.F. Cheshkova1, A.F. Aleynikov12, P.I. Stepochkin3
'Scientific Institution of the Siberian Physical-Technical Institute of Agrarian Problems, Krasnoobsk, Novosibirskiy r-n, Novosibirskaya obl., 630501, Russian Federation
2Novosibirsk State Technikal University, prosp. Karla Marksa, 20, Novosibirsk, 630092, Russian Federation
3Siberian Institute of Plant Growing and Breeding - branch of the Institute of Cytology and Genetics, Krasnoobsk, Novosibirskiy r-n, Novosibirskaya obl., 630501, Russian Federation
Summary. The research was carried out to identify the regularities of covariation of quantitative characters of triticale under conditions of Western Siberia. To solve this problem the standard statistical multivariate data analysis (Pirson's method with the evaluation of statistical significance according to t-test, principle component analysis, Ward cluster analysis), implemented in the software environment R, were used. The material for the study was the data of field experiments of the Siberian Research Institute of Crop Production and Breeding on examination of samples of spring and winter triticale from the world collection of VIR in 2009 (51 varieties of spring triticale and 103 varieties of winter one) and 2011 (120 samples of winter triticale). The evaluation of the samples was carried out on 12 morphological characters. It was revealed the high level of linear correlations for 8 pairs of traits. It was determined a strong linear dependence between the characteristics "number of productive shoots per 1 m2" and "total weight of grain, g/m2". А dependence of medium force was observed between the features "grain weight from a ear" and "1000 grain weight". Such characters as "ear length", "number of spikelets in an ear", "number of grains in a ear" and "grain weight from a ear" form a correlation group. The variability of quantitative characteristics is determined by 3-4 main components, which accounted from 70% to 80% of the total variance. In all three tests all traits from the correlation group were included in the first component with relatively large demand factor, so it can be interpreted as the component "ear productivity". Cluster analysis confirmed the results of the component analysis and made it possible to identify correlated groups of traits. Keywords: triticale, breeding, variability of quantitative characters, multivariate analysis.
Author Details: A.F. Cheshkova, Cand. Sc. (Phys.-Math.), head of laboratory (e-mail: [email protected]); A.F. Aleynikov, D. Sc. (Tech.), chief research fellow; P.I. Stepochkin, D. Sc. (Agr.), leading research fellow.
For citation: Cheshkova A.F., Aleynikov A.F., Stepochkin P.I. Analysis of Covariation of Quantitative Characters of Triticale. Dostizheniya naukii tekhnikiAPK. 2016. Vol. 30. No. 5. Pp. 50-52 (In Russ.).