Агрохимия, 2022, № 3, стр. 81-93
Рекомендации к анализу данных многолетних полевых опытов (проект)
А. С. Фрид *
Всероссийский научно-исследовательский институт фитопатологии
143050 Московская обл., Одинцовский р-н, р.п. Большие Вяземы, ул. Институт, 5, Россия
* E-mail: asfrid@mail.ru
Поступила в редакцию 28.11.2021
После доработки 07.12.2021
Принята к публикации 15.12.2021
- EDN: UYBTQS
- DOI: 10.31857/S0002188122030048
Аннотация
Изложены методические подходы, рекомендуемые для решения основных задач, возникающих при анализе результатов многолетних полевых опытов (как краткосрочных, так и длительных). Рассмотрены задачи: 1) устойчивость по годам эффектов доз факторов опыта, 2) сходство и различие временны́х динамик изученного показателя, 3) наличие многолетнего тренда изученного показателя, 4) сравнение многолетних средних изученного показателя.
ВВЕДЕНИЕ
Хотя задача анализа данных многолетних полевых опытов стала актуальной с момента закладки подобных опытов (как краткосрочных, так и длительных), более или менее ее полноценного общепринятого решения пока не было представлено. В работе [1] был сделан обзор и обоснование возможных методических подходов к решению некоторых типовых задач, а в настоящей работе эти разработки представлены в виде проекта рекомендаций.
Ограничимся решением следующих частных задач, которые считаются наиболее важными: 1) устойчивость по годам эффектов доз факторов опыта, 2) сходство и различие многолетних динамик изученного показателя, 3) наличие многолетнего тренда изученного показателя, 4) сравнение многолетних средних изученного показателя. Поскольку краткосрочные опыты (<10 лет и/или <2-х ротаций севооборота) имеют небольшую длину временно́го ряда, то для них 3-я и 4-я задачи не могут быть адекватно решены.
В качестве экспериментальных примеров используем здесь те же результаты опытов, что и в работе [1]: 3-летний опыт из работы [2] (табл. 1) и фрагмент опыта с формами калийных удобрений на Люберецком опытном поле (ЛОП) НИУИФ, предоставленный В.Г. Граковским (табл. 2). В качестве изученного показателя в обоих опытах взята урожайность культур, но это могут быть и другие ежегодные характеристики, относящиеся к культурам, почвам, экономическим показателям.
Таблица 1.
Вариант | Повторность | Среднее | |||
---|---|---|---|---|---|
1-я | 2-я | 3-я | 4-я | ||
1989 г. | |||||
1. N0Ф0 | 23.9 | 31.9 | 22.6 | 27.8 | 26.6 |
2. N0Ф1 | 32.8 | 25.7 | 28.9 | 24.3 | 27.9 |
3. N60Ф0 | 32.1 | 31.0 | 31.1 | 27.1 | 30.3 |
4. N60Ф1 | 35.5 | 26.8 | 33.3 | 32.0 | 31.9 |
5. N120Ф0 | 34.8 | 32.3 | 32.0 | 32.9 | 33.0 |
6. N120Ф1 | 34.7 | 34.0 | 33.7 | 31.7 | 33.5 |
7. N180Ф0 | 30.4 | 31.8 | 29.1 | 30.6 | 30.5 |
8. N180Ф1 | 41.4 | 41.4 | 29.6 | 31.8 | 36.1 |
за год 31.1 | |||||
1990 г. | |||||
1. N0Ф0 | 25.7 | 21.8 | 23.6 | 27.9 | 24.8 |
2. N0Ф1 | 29.8 | 22.5 | 25.4 | 28.7 | 26.6 |
3. N60Ф0 | 31.5 | 25.3 | 22.5 | 22.4 | 25.4 |
4. N60Ф1 | 35.7 | 33.5 | 27.1 | 30.8 | 31.8 |
5. N120Ф0 | 34.8 | 36.2 | 28.9 | 20.5 | 30.1 |
6. N120Ф1 | 37.8 | 36.6 | 31.2 | 25.0 | 32.7 |
7. N180Ф0 | 29.6 | 31.1 | 32.8 | 27.9 | 30.4 |
8. N180Ф1 | 37.8 | 36.2 | 33.0 | 29.2 | 34.1 |
за год 29.5 | |||||
1991 г. | |||||
1. N0Ф0 | 7.3 | 8.6 | 9.4 | 9.4 | 8.7 |
2. N0Ф1 | 8.3 | 7.3 | 10.2 | 9.9 | 8.9 |
3. N60Ф0 | 21.8 | 18.1 | 19.8 | 24.0 | 20.9 |
4. N60Ф1 | 28.8 | 18.6 | 17.8 | 18.5 | 20.9 |
5. N120Ф0 | 30.0 | 29.9 | 25.0 | 30.6 | 28.9 |
6. N120Ф1 | 29.8 | 33.6 | 34.1 | 32.5 | 32.5 |
7. N180Ф0 | 26.3 | 33.0 | 28.9 | 31.0 | 29.8 |
8. N180Ф1 | 29.6 | 30.8 | 29.5 | 31.4 | 30.3 |
за год 22.7 |
Таблица 2.
Год | Культура | Варианты | Среднее за год | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Контроль (без удобрений) | NP | NP + Kx | ||||||||||||
номера делянок в повторениях | ||||||||||||||
5 | 12 | 29 | 36 | 6 | 13 | 30 | 37 | 1 | 18 | 25 | 32 | |||
1944 | Свекла кормовая | 57 | 60 | 49 | 37 | 78 | 71 | 72 | 96 | 134 | 95 | 82 | 100 | 77.6 |
1945 | Гречиха на зеленое удобрение (ЗУ) | 37 | 39 | 18 | 22 | 76 | 73 | 54 | 74 | 77 | 63 | 56 | 36 | 52.1 |
1946 | Рожь озимая | 6 | 7 | 5 | 3 | 6 | 8 | 3 | 4 | 5 | 8 | 6 | 5 | 5.5 |
1947 | Картофель | 164 | 173 | 161 | 133 | 189 | 190 | 191 | 209 | 194 | 196 | 195 | 156 | 179 |
1948 | Свекла кормовая | 91 | 139 | 129 | 125 | 90 | 143 | 124 | 190 | 188 | 172 | 190 | 143 | 144 |
1949 | Люпин на ЗУ | 331 | 417 | 324 | 374 | 383 | 386 | 376 | 318 | 384 | 390 | 416 | 412 | 376 |
1950 | Рожь озимая | 26 | 31 | 28 | 23 | 27 | 27 | 28 | 24 | 32 | 28 | 30 | 30 | 28 |
1951 | Картофель | 157 | 169 | 154 | 145 | 159 | 165 | 146 | 169 | 164 | 158 | 145 | 122 | 154 |
1952 | Свекла сахарная | 237 | 253 | 184 | 164 | 296 | 284 | 231 | 247 | 351 | 302 | 297 | 178 | 252 |
1953 | Люпин на ЗУ | 111 | 166 | 86 | 60 | 142 | 121 | 89 | 89 | 173 | 129 | 140 | 64 | 114 |
1954 | Рожь озимая | 14 | 16 | 13 | 15 | 24 | 19 | 17 | 18 | 22 | 17 | 18 | 18 | 18 |
1955 | Картофель | 128 | 134 | 115 | 94 | 145 | 148 | 122 | 143 | 153 | 145 | 126 | 100 | 129 |
1956 | Свекла сахарная | 165 | 129 | 186 | 152 | 261 | 272 | 271 | 271 | 315 | 290 | 298 | – | 237 |
1957 | Люпин на ЗУ | 164 | 204 | 159 | 122 | 172 | 181 | 153 | 136 | 206 | 213 | 172 | 139 | 168 |
1958 | Рожь озимая | 46 | 38 | 38 | 35 | 72 | 64 | 87 | 68 | 114 | 82 | 50 | 78 | 64 |
1959 | Картофель | 149 | 168 | 184 | 140 | 148 | 132 | 128 | 128 | 249 | 206 | 213 | 213 | 172 |
1960 | Свекла сахарная | 99 | 97 | 100 | 95 | 128 | 134 | 132 | 135 | 175 | 188 | 173 | 155 | 134 |
1961 | Люпин на семена | 5 | 8 | 9 | 6 | 9 | 6 | 5 | 6 | 16 | 11 | 13 | 11 | 9 |
1962 | Рожь озимая на зеленую массу (ЗМ) | 57 | 88 | 58 | 36 | 110 | 89 | 102 | 137 | 112 | 136 | 133 | 102 | 97 |
1963 | Картофель | 94 | 130 | 100 | 105 | 79 | 65 | 68 | 65 | 204 | 221 | 177 | 176 | 124 |
1964 | Свекла сахарная | 117 | 104 | 110 | 84 | 142 | 131 | 118 | 101 | 177 | 171 | 148 | 121 | 127 |
1965 | Люпин на ЗУ | 462 | 465 | 462 | 446 | 550 | 448 | 468 | 438 | 564 | 539 | 494 | 495 | 486 |
1966 | Рожь на ЗМ | 76 | 82 | 58 | 58 | 115 | 115 | 86 | 111 | 113 | 120 | 121 | 103 | 96.5 |
КРАТКОСРОЧНЫЕ ПОЛЕВЫЕ ОПЫТЫ
Устойчивость по годам эффектов доз факторов опыта. Для каждого года оценивается зависимость урожайности от факторов опыта дисперсионным (ДА) и регрессионным (РА) (если возможно) анализами. По результатам ДА определяется варьирование от года к году доли влияния и уровня значимости факторов и их взаимодействий: чем меньше варьирование, тем более устойчиво влияние изученных факторов. По результатам РА можно увидеть и оценить характер зависимости урожайности от факторов опыта – если ежегодные регрессионные зависимости имеют однотипный характер по структуре уравнений, знакам коэффициентов, то можно говорить об устойчивом влиянии доз факторов, хотя количественно величины коэффициентов могут меняться от года к году.
Для данных табл. 1 результаты ДА представлены в табл. 3. Из нее видно, что первые 2 года, как по влиянию изученных факторов, так и по их значимости, были относительно близкими между собой. А на 3-й год резко увеличилось влияние доз азотных удобрений и уменьшилось влияние фунгицида, несмотря на снижение средней урожайности (табл. 1).
Таблица 3.
Год | Доля влияния | Уровень значимости | ||||
---|---|---|---|---|---|---|
вариантов | доз азота | фунгицида | вариантов | доз азота | фунгицида | |
1989 | 0.49 | 0.35 | 0.075 | 0.01 | 0.025 | 0.10 |
1990 | 0.42 | 0.26 | 0.13 | 0.025 | 0.05 | 0.05 |
1991 | 0.94 | 0.93 | 0.004 | 0.01 | 0.01 | >0.10 |
РА дал следующие результаты:
Все зависимости однотипны по структуре и по знакам коэффициентов регрессии. Общий вывод: влияние факторов опыта, хотя и менялось количественно от года к году, качественно было устойчивым.
Сходство и различие многолетних динамик урожайности. Общее представление о сходстве и различии временны́х динамик для вариантов и делянок можно получить построением дендрограмм сходства и таблиц попарного сходства. Для расчета сходства можно использовать, например, многомерное евклидово расстояние между объектами (вариантами или делянками) k и l
В нашем примере дендрограмма сходства временны́х динамик урожайности для делянок содержит 32 объекта (8 вариантов в 4-х повторениях) (рис. 1). Показано, что даже на уровне сходства 70% (довольно высоком) и выше образующиеся группы делянок, как правило, содержат делянки разных вариантов. Следовательно, временны́е динамики урожайности в данном случае слабо связаны с вариантами опыта и определяются другими факторами (возможно, различием в почвенных свойствах).
Полную таблицу сходств временны́х динамик для всех возможных пар делянок мы не приводим из-за ее громоздкости. Детальное рассмотрение этой таблицы показало, что, используя уровень сходства 80% и выше, получаются 3 группы делянок, сходные динамикой урожайности. К первой группе относятся делянки вариантов 1 (N0Ф0) и 2 (N0Ф1), за исключением делянок 1-2 (вариант 1, 2-е повторение) и 2-1 (вариант 2, 1-е повторение). Ко 2-й группе относятся делянки всех остальных вариантов, за исключением делянок 3‑4 и 5-4; отдельную группу составили делянки 8‑1 и 8-2. Эту картину можно увидеть и на дендрограмме сходства в несколько завуалированном виде.
Дендрограмма сходства временны́х динамик средних величин урожайностей в вариантах показана на рис. 2. На уровне сходства 70% образующиеся группы вариантов сходной динамики (кроме первой с вариантами N0Ф0 и N0Ф1) также неоднородны – в них изменяются дозы обоих факторов. Другими словами, при дозе азота 60 кг/га и выше дозы факторов не определяли сходство временны́х динамик урожайности вариантов.
Полная матрица попарных сходств временны́х динамик средних урожайностей для вариантов показана в табл. 4. Пары вариантов с уровнем сходства 70% и выше получились следующие: 1 и 2 (N0), 5, 6, 7 и примыкающие к ним 4 и 8. Динамика варианта 3 отличалась от других. Это рассмотрение детализирует дендрограмму.
Таблица 4.
Номер варианта | Номер варианта | ||||||
---|---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 | |
2 | 87 | 100 | |||||
3 | 49 | 56 | 100 | ||||
4 | 25 | 35 | 45 | 100 | |||
5 | 21 | 27 | 47 | 74 | 100 | ||
6 | 15 | 19 | 30 | 62 | 81 | 100 | |
7 | 25 | 31 | 50 | 71 | 82 | 68 | 100 |
8 | 12 | 15 | 22 | 49 | 57 | 77 | 41 |
Теперь рассмотрим этот же вопрос сравнения динамик с точки зрения сопряженных выборок. Для этого можно использовать t-критерий [4] и непараметрический критерий Вилкоксона [5]. Эти критерии рассматривают экспериментальный материал с противоположных предыдущему позиций – оцениваются не сходства динамик, а их различия.
Непараметрический критерий в данном примере оказался не применимым, т.к. так 3-х опыто-лет для его применения недостаточно – нужно как минимум 6 лет опыта. Полная таблица при использовании t-критерия для делянок тоже слишком громоздка, поэтому в табл. 5 показаны только значимо отличающиеся временны́е динамики. Из этой таблицы видно следующее. Варианты 1, 2 и 5 имеют делянки, значимо различающиеся по временно́й динамике (делянки 1 и 4 в варианте 1, делянки 6 и 7 в варианте 2, делянки 17 и 19 в варианте 5). Делянки вариантов 7 и 8 не различаются значимо динамикой урожайности; аналогичная ситуация для пар вариантов 1 и 2, 1 и 7, 2 и 3, 2 и 5, 2 и 6, 2 и 7, 4 и 7, 5 и 6.
Таблица 5.
Номера делянок | Номера соответствующих вариантов | Средняя разность | Уровень значимости | Номера делянок | Номера соответствующих вариантов | Средняя разность | Уровень значимости |
---|---|---|---|---|---|---|---|
1 и 4 | 1 и 1 | –2.7 | 0.05 | 10 и 29 | 3 и 8 | –11.5 | 0.01 |
1 и 16 | 1 и 4 | –8.1 | 0.05 | 10 и 30 | 3 и 8 | –11.3 | 0.01 |
1 и 29 | 1 и 8 | –17.3 | 0.05 | 11 и 29 | 3 и 8 | –11.8 | 0.05 |
1 и 30 | 1 и 8 | –17.2 | 0.05 | 11 и 30 | 3 и 8 | –11.7 | 0.01 |
2 и 29 | 1 и 8 | –15.5 | 0.05 | 12 и 17 | 3 и 5 | –8.7 | 0.05 |
3 и 9 | 1 и 3 | –9.9 | 0.05 | 12 и 22 | 3 и 6 | –10.2 | 0.05 |
3 и 13 | 1 и 4 | –14.8 | 0.05 | 12 и 23 | 3 и 6 | –8.5 | 0.05 |
3 и 14 | 1 и 4 | –7.8 | 0.05 | 12 и 26 | 3 и 7 | –7.5 | 0.05 |
3 и 16 | 1 и 4 | –8.6 | 0.01 | 12 и 28 | 3 и 7 | –5.3 | 0.05 |
3 и 17 | 1 и 5 | –14.7 | 0.05 | 12 и 30 | 3 и 8 | –11.6 | 0.05 |
3 и 18 | 1 и 5 | –14.3 | 0.05 | 12 и 32 | 3 и 8 | –6.3 | 0.05 |
3 и 21 | 1 и 6 | –15.6 | 0.05 | 13 и 19 | 4 и 5 | +4.7 | 0.05 |
3 и 29 | 1 и 8 | –17.7 | 0.05 | 15 и 29 | 4 и 8 | –10.2 | 0.05 |
3 и 30 | 1 и 8 | –17.6 | 0.05 | 15 и 30 | 4 и 8 | –10.1 | 0.05 |
4 и 29 | 1 и 8 | –14.6 | 0.05 | 16 и 29 | 4 и 8 | –9.2 | 0.05 |
6 и 7 | 2 и 2 | –3.0 | 0.01 | 16 и 30 | 4 и 8 | –9.0 | 0.05 |
6 и 15 | 2 и 4 | –7.6 | 0.05 | 17 и 19 | 5 и 5 | +4.6 | 0.05 |
6 и 16 | 2 и 4 | –8.6 | 0.05 | 17 и 25 | 5 и 7 | +4.4 | 0.01 |
6 и 29 | 2 и 8 | –17.8 | 0.05 | 19 и 29 | 5 и 8 | –7.6 | 0.05 |
6 и 30 | 2 и 8 | –17.6 | 0.05 | 19 и 30 | 5 и 8 | –7.5 | 0.05 |
7 и 29 | 2 и 8 | –14.8 | 0.05 | 22 и 25 | 6 и 7 | +6.0 | 0.05 |
7 и 30 | 2 и 8 | –14.6 | 0.05 | 22 и 27 | 6 и 7 | +4.5 | 0.01 |
8 и 29 | 2 и 8 | –15.3 | 0.05 | 22 и 31 | 6 и 8 | +4.0 | 0.01 |
9 и 13 | 3 и 4 | –4.9 | 0.05 | 23 и 28 | 6 и 7 | +3.2 | 0.01 |
9 и 29 | 3 и 8 | –7.8 | 0.05 | 23 и 32 | 6 и 8 | +2.2 | 0.05 |
9 и 30 | 3 и 8 | –7.7 | 0.05 |
Если сопряженно по t-критерию сравнивать динамики средних для вариантов, то получим значимое различие для вариантов 6 и 7 (0.01, средняя разница +2.7) и вариантов 3 и 8 (0.05, средняя разница +8.0); это не противоречит данным табл. 5 и рис. 2.
Сравнение методами сходства и различия могут давать и несовпадающие результаты (разные алгоритмы с разными предпосылками), в таком случае выводы должны быть более осторожными.
ДЛИТЕЛЬНЫЕ ПОЛЕВЫЕ ОПЫТЫ
Устойчивость по годам эффектов доз факторов опыта. Подходы здесь те же, что для краткосрочных опытов. Результаты для использованного примера представлены в табл. 6. Регрессионный анализ проводить в этом случае нет особого смысла из-за наличия только 2-х доз удобрений и малого числа вариантов. Так как размещение делянок по организованным повторениям не известно, то оценить вклад организованных повторений не было возможности, и разброс урожайностей в зависимости от делянок соответствовал случайной ошибке.
Таблица 6.
Год | Среднее для варианта, ц/га | Доля влияния вариантов, % | Уровень значимости влияния вариантов | ||
---|---|---|---|---|---|
Контроль | NP | NP + Kx | |||
1944 | 51 | 79 | 103 | 71 | 0.01 |
1945 | 29 | 69 | 58 | 69 | 0.01 |
1946 | 5 | 5 | 6 | 4.8 | – |
1947 | 158 | 195 | 185 | 56 | 0.05 |
1948 | 121 | 137 | 173 | 42 | – |
1949 | 362 | 366 | 401 | 28 | – |
1950 | 27 | 27 | 30 | 36 | – |
1951 | 156 | 160 | 147 | 17 | – |
1952 | 210 | 265 | 282 | 32 | – |
1953 | 106 | 110 | 127 | 6.2 | – |
1954 | 15 | 20 | 19 | 54 | 0.05 |
1955 | 118 | 140 | 131 | 24 | – |
1956 | 158 | 269 | 285 | 88 | 0.01 |
1957 | 162 | 161 | 183 | 13 | – |
1958 | 39 | 73 | 81 | 62 | 0.05 |
1959 | 160 | 134 | 220 | 86 | 0.01 |
1960 | 98 | 132 | 173 | 95 | 0.01 |
1961 | 7 | 7 | 13 | 73 | 0.01 |
1962 | 60 | 110 | 121 | 71 | 0.01 |
1963 | 107 | 69 | 195 | 93 | 0.01 |
1964 | 104 | 123 | 154 | 60 | 0.05 |
1965 | 459 | 476 | 523 | 43 | – |
1966 | 69 | 107 | 114 | 79 | 0.01 |
1944–1955 гг. (3 ротации) – размах доли влияния вариантов 4.8–71% (медиана 34%), влияние вариантов значимо 4 года | |||||
1956–1966 гг. (3 ротации без 1-го года) – размах доли влияния вариантов 13–95% (медиана 73%), влияние вариантов значимо 9 лет |
Данные табл. 6 показали, что влияние вариантов опыта имело тенденцию к изменению во времени: наблюдали рост доли влияния и числа значимых лет влияния от первых 3-х ротаций ко 2-й тройке ротаций. Имелась также четкая тенденция к изменению варианта с наибольшей урожайностью: в первые 3 ротации это могли быть варианты как NP, так и NP + Kx, в последующие годы – только вариант NP + Kx.
Сходство и различие многолетних динамик урожайности. Дендрограмма сходства делянок по многолетним динамикам урожайности для опыта ЛОП показана на рис. 3. В этом случае уровни сходства значительно меньше, чем для опыта из работы [2]. На уровне сходства 60% в каждом варианте лишь по 2 делянки имели сходные динамики урожайности (5 и 29 в контроле, 6 и 13 в варианте NP, 18 и 25 в варианте NP + Kx). Остальные делянки, хотя и группируются с вышеуказанными внутри вариантов (кроме делянки 32), но на еще более низких уровнях сходства. Тем не менее, в отличие от опыта из работы [2], в этом случае варианты более существенно влияли на динамику урожайности (группировка делянок по вариантам в основном выполнялась). Полная матрица парных сходств делянок по динамике урожайностей показана в табл. 7. В данном случае она полностью подтверждает результаты дендрограммы.
Таблица 7.
Номера делянок | Контроль | NP | NP + Kx | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
5 | 12 | 29 | 36 | 6 | 13 | 30 | 37 | 1 | 18 | 25 | 32 | ||
Контроль | 5 | 100 | |||||||||||
12 | 53 | 100 | |||||||||||
29 | 74 | 47 | 100 | ||||||||||
36 | 50 | 30 | 58 | 100 | |||||||||
NP | 6 | 39 | 39 | 29 | 22 | 100 | |||||||
13 | 48 | 49 | 35 | 26 | 62 | 100 | |||||||
30 | 53 | 40 | 47 | 37 | 48 | 53 | 100 | ||||||
37 | 38 | 30 | 33 | 26 | 40 | 52 | 54 | 100 | |||||
NP + Kx | 1 | 19 | 24 | 18 | 13 | 35 | 28 | 24 | 23 | 100 | |||
18 | 27 | 34 | 25 | 17 | 44 | 44 | 33 | 31 | 54 | 100 | |||
11 | 30 | 39 | 30 | 21 | 44 | 46 | 40 | 35 | 45 | 66 | 100 | ||
12 | 34 | 32 | 39 | 33 | 33 | 32 | 46 | 29 | 25 | 34 | 46 | 100 |
Для средних урожайностей в вариантах вообще не получено существенных сходств многолетних динамик (табл. 8). Все же можно отметить, что крайние варианты (контроль и NP + Kx) менее сходны между собой, чем соседние.
Теперь, как и ранее, рассмотрим сравнение многолетних динамик урожайностей с точки зрения сопряженных выборок. Так как в этом случае усредняются и сопоставляются разности урожайностей разных культур, то возникает необходимость перейти к более сопоставимым единицам, например, к зерновым [1]. Если использование t-критерия для сопряженных выборок хорошо известно, то использование непараметрического критерия Вилкоксона следует подробно изложить. Необходимость использовать 2 критерия (параметрический и непараметрический) обусловлена тем, что они имеют разные предпосылки для своего применения, а это повышает надежность результатов, если они совпадают по обоим критериям.
Использование критерия Вилкоксона для сопряженных выборок излагаем по работе [5]. Для конкретности возьмем сравнение делянок 5 и 12 (табл. 9). Сначала считаем разности для каждого года, затем эти разности ранжируем по абсолютной величине от самых маленьких до самых больших числами натурального ряда (1, 2, …). Далее считаем суммы рангов для положительных и отрицательных разностей раздельно. Меньшая сумма рангов представляет собой статистику Вилкоксона для сопряженных пар (выборок). В нашем примере меньшая сумма рангов равна 61. Далее используем таблицу критических величин критерия (табл. 10) [5]. При n = 23 (длина временно́го ряда) величина 61 меньше критической при уровне значимости 0.05 (74), но больше 56 (уровень значимости 0.01), следовательно делянки 5 и 12 различаются по временно́й динамике урожайности на уровне значимости 0.05, но не различаются при уровне значимости 0.01. Если какие-то разности в сопряженных рядах равны нулю, то соответствующие пары исключаются из рассмотрения, и соответственно уменьшается объем выборки.
Таблица 9.
Год | Урожайность, з.е. | Разность | Ранг разности | |
---|---|---|---|---|
делянка 5 | делянка 12 | |||
1944 | 8.55 | 9 | –0.45 | 3 |
1945 | 3.7 | 3.9 | –0.2 | 1 |
1946 | 6 | 7 | –1 | 6 |
1947 | 41 | 43.25 | –2.25 | 9 |
1948 | 13.65 | 20.85 | –7.2 | 20 |
1949 | 25.5 | 32.1 | –6.6 | 19 |
1950 | 26 | 31 | –5 | 18 |
1951 | 39.25 | 42.25 | –3 | 12 |
1952 | 59.25 | 63.25 | –4 | 15 |
1953 | 8.55 | 12.8 | –4.25 | 16 |
1954 | 14 | 16 | –2 | 8 |
1955 | 32 | 33.5 | –1.5 | 7 |
1956 | 41.25 | 32.25 | +9 | 22 |
1957 | 12.9 | 15.7 | –2.8 | 11 |
1958 | 46 | 38 | +8 | 21 |
1959 | 37.25 | 42 | –4.75 | 17 |
1960 | 24.75 | 24.25 | +0.5 | 4 |
1961 | 4.55 | 7.28 | –2.73 | 10 |
1962 | 5.7 | 8.8 | –3.1 | 13 |
1963 | 23.5 | 32.5 | –9 | 23 |
1964 | 29.25 | 26 | +3.25 | 14 |
1965 | 35.6 | 35.8 | –0.2 | 2 |
1966 | 4.6 | 8.2 | –0.6 | 5 |
Сумма рангов положительных разностей = 61 | ||||
Сумма рангов отрицательных разностей = 215 |
Таблица 10.
n | Уровень значимости | Примечания | |
---|---|---|---|
0.05 | 0.01 | ||
6 | 1 | – | 1) Нулевая гипотеза о равенстве сопряженных пар (выборок) отвергается, если рассчитанная сумма рангов меньше критического значения |
7 | 3 | – | |
8 | 5 | 1 | |
9 | 7 | 3 | |
10 | 9 | 4 | |
11 | 12 | 6 | 2) Если n > 25, то можно пользоваться нормальным приближением для критических значений: среднее для суммы рангов Wср = = n(n + 1)/4, дисперсия = σ2 = n(n + + 1)(2n + 1)/24. Нулевая гипотеза не отвергается, если (Wср – W)/σ окажется меньше ψ(1 – α/2), где ψ – обратная функция нормального распределения |
12 | 15 | 8 | |
13 | 18 | 11 | |
14 | 22 | 14 | |
15 | 26 | 17 | |
16 | 31 | 21 | |
17 | 36 | 24 | |
18 | 41 | 29 | |
19 | 47 | 33 | |
20 | 53 | 39 | |
21 | 60 | 44 | |
22 | 67 | 50 | |
23 | 74 | 56 | |
24 | 82 | 62 | |
25 | 90 | 69 |
Итоги сравнения многолетних динамик урожайностей культур для делянок и для вариантов сведены в табл. 11 и 12. Результаты оценки различий динамик для делянок не противоречат картине, полученной при изучении уровней сходства: дополнительно отмечено значительно больше неразличающихся значимо пар делянок. При сравнении динамик вариантов получена однозначная картина: все варианты значимо различаются по обоим критериям, и это соответствует низкому сходству между ними, полученному выше.
Таблица 11.
Вариант | Контроль | NP | NP + Kx | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Номер делянки | 5 | 12 | 29 | 36 | 6 | 13 | 30 | 37 | 1 | 18 | 25 | 32 | |
Контроль | 5 | X | –1.7 | +0.47 | +3.2 | –5.6 | –4.6 | –3.6 | –4.0 | –13.8 | –10.4 | –7.8 | –5.15 |
12 | –/0.05 | X | +2.2 | +4.9 | –3.9 | –2.8 | –1.9 | –2.2 | –12.1 | –8.6 | –6.0 | –3.4 | |
29 | –/– | –/0.05 | X | +2.7 | –6.1 | –5.0 | –4.1 | –4.4 | –14.3 | –10.8 | –8.2 | –5.6 | |
36 | 0.01/0.01 | 0.01/0.01 | 0.01/0.01 | X | –8.8 | –7.8 | –6.8 | –7.2 | –17 | –13.5 | –11 | –8.3 | |
NP | 6 | 0.01/0.01 | –/– | 0.01/0.01 | 0.01/0.01 | X | –1.1 | +2.0 | +1.7 | –8.2 | –4.7 | –2.2 | –0.48 |
13 | 0.01/0.01 | –/– | 0.05/0.01 | 0.01/0.01 | –\– | X | +0.98 | +0.60 | –9.3 | –5.8 | –3.2 | –0.58 | |
30 | –/– | –/– | –/– | 0.05/0.01 | –/0.05 | –/0.05 | X | –0.37 | –10.2 | –6.8 | –4.2 | –1.55 | |
37 | 0.05/0.05 | –/– | 0.05/0.05 | 0.01/0.01 | –/– | –/– | –/– | X | –9.9 | –6.4 | –3.8 | –1.2 | |
NP + Kx | 1 | 0.01/0.01 | 0.01/0.01 | 0.01/0.01 | 0.01/0.01 | 0.01/0.01 | 0.01/0.01 | 0.01/0.01 | 0.01/0.01 | X | +3.5 | +6.1 | +8.7 |
18 | 0.01/0.01 | 0.01/0.01 | 0.01/0.01 | 0.01/0.01 | 0.05/0.01 | 0.01/0.01 | 0.01/0.01 | 0.01/0.01 | 0.05/0.05 | X | +2.6 | +5.2 | |
25 | 0.01/0.01 | 0.01/0.01 | 0.01/0.01 | 0.01/0.01 | –/– | –/0.05 | –/0.01 | –/0.05 | 0.05/0.01 | –/– | X | +2.6 | |
32 | 0.05/0.05 | –/– | 0.05/0.01 | 0.01/0.01 | –/– | –/– | –/– | –/– | 0.01/0.01 | 0.01/0.01 | –/0.01 | X |
Примечание. В верхнем треугольнике матрицы указаны средние разности для временны́х рядов делянок, в нижнем треугольнике – уровни значимости различий: над чертой – по t-критерию, под чертой – по критерию Вилкоксона. Прочерк – незначимость разности временных рядов. То же в табл. 12.
Таблица 12.
Вариант | Контроль | NP | NP + Kx |
---|---|---|---|
Контроль | X | –4.9 | –9.8 |
NP | 0.05/0.01 | X | –4.8 |
NP + Kx | 0.01/0.01 | 0.01/0.01 | X |
Наличие многолетнего тренда урожайности. Сама постановка такой задачи возможна только при изучении длительных многолетних опытов, где эти тренды могут проявиться. Однако и в этом случае задача достаточно неопределенна. В реальных временны́х рядах мы имеем дело с наложением нескольких источников варьирования: природных длиннопериодных циклов, смены культур в севооборотах, смены сортов культур, технологий обработки почвы, агроистощения или повышения обеспеченности растений питательными веществами, смены систем защиты растений, почвоутомления и т.п. На все это накладываются ежегодные изменения как природного, так и антропогенного характера [6].
При анализе длительных опытов обычно не стои́т задача выявить все детали имеющихся изменений, но определить основной тренд и, по возможности, наиболее выраженные циклы необходимо. Эти характеристики важны для сравнения между собой различных длительных опытов, различных вариантов опытов, а их сопоставление с природными процессами и антропогенными воздействиями будет способствовать лучшему пониманию причин получаемой в опытах динамики. Кроме того, как показано ниже, учет наличия временно́го тренда необходим для обоснованной оценки ошибки многолетних средних.
Для временны́х рядов урожайности показатели динамики могут сильно искажаться в зависимости от уровней первого и последнего члена ряда [7, c. 11]. Характерная картина динамики видна на данных ЛОП: динамика урожайностей делянок 2-х крайних вариантов (рис. 4) и динамика средних урожайностей для всех трех вариантов (рис. 5). В обоих случаях можно лишь качественно говорить, что в вариантах с удобрениями по годам с максимальной урожайностью наблюдается параболический тренд (повышение и понижение), а в годы с минимальной урожайностью и в контроле – другая закономерность – чуть ли не снижение урожайности со временем.
С другой стороны, четко видна одинаковая цикличность урожайности как для делянок, так и для вариантов. Сроки между максимумами урожайности составили 2–6 лет, между минимумами урожайности – 2.5–5 лет, а в среднем длина цикла составила ≈4 года. В данном примере это совпало с длительностью ротации, но может быть случайным совпадением. Максимальным урожайностям в основном соответствовали пропашные культуры, но встречались также рожь озимая и люпин. Минимальным урожайностям в основном соответствовал люпин, но встречались также рожь озимая, гречиха и пропашные. Такое разнообразие свидетельствует, вероятно, о влиянии погодных условий разных лет.
Более длительные циклы в данном примере таким же графическим образом оценить невозможно из-за недостаточно большой длины временно́го ряда.
Сравнение многолетних средних для делянок и вариантов опыта. В этом вопросе, как и в предыдущем разделе, желаемые решения носят приближенный характер, т.к. реальные многолетние ряды урожайности могут не всегда соответствовать теоретическим допущениям.
Чтобы сравнивать многолетние средние, надо оценить их ошибки. Для конкретной делянки ошибка связана непосредственно с временны́м изменением урожайности, а для варианта опыта с делянками-повторениями к временно́й ошибке добавляется пространственная. Временну́ю ошибку можно оценить для стационарных рядов; приблизить реальный ряд к стационарности можно, убрав временно́й тренд. В нашей задаче речь может идти о том, чтобы убрать основную (более или менее гладкую) временну́ю тенденцию, а критерием успеха должна служить не значимость самого тренда (если он значим, то это еще лучше), а заметное снижение остаточной дисперсии по сравнению с исходной (без снятия тренда).
Квадратичные модели трендов для отдельных делянок представлены в табл. 13. Все модели оказались незначимы, что не удивительно из-за сильных изменений урожайности от года к году. В то же время стандартные отклонения остатков (sост) были меньше исходных (s0), а средние из разниц между рассчитанными по моделям урожайностям и измеренными в опыте достоверно не отличались от нуля (табл. 14).
Таблица 13.
Вариант | Повторности | |||
---|---|---|---|---|
1-я | 2-я | 3-я | 4-я | |
Контроль | У = –451 + 17.3 год – ‒ 0.156 год2, | У = –443 + 17.2 год – ‒ 0.156 год2, | У = –445.5 + 17.1 год – ‒ 0.153 год2, | У = –375.9 + 14.4 год – ‒ 0.129 год2, |
s0 = 15.8, sост = 15.1, | s0 = 15.3, sост = 14.6, | s0 = 15.0, sост = 14.2, | s0 = 13.3, sост = 12.7, | |
годmax = 55.5 | годmax = 55.2 | годmax = 55.8 | годmax = 55.8 | |
NP | У = –617.8 + 23.6 год – ‒ 0.212 год2, | У = –610.4 + 23.5 год – ‒ 0.213 год2, | У = –632.1 + 24.1 год – ‒ 0.217 год2, | У = –559.8 + 21.7 год – ‒ 0.197 год2, |
s0 = 20.5, sост = 19.5, | s0 = 19.8, sост = 18.7, | s0 = 21.6, sост = 20.6, | s0 = 19.6, sост = 18.8, | |
годmax = 55.7 | годmax = 55.1 | годmax = 55.5 | годmax = 55.0 | |
NP + Kx | У = –812.2 + 30.6 год – ‒ 0.272 год2, | У = –631.3 + 23.8 год – ‒ 0.21 год2, | У = –577.6 + 22.0 год – ‒ 0.196 год2, | У = –550.4 + 20.7 год – ‒ 0.182 год2, |
s0 = 27.6, sост = 26.1, | s0 = 22.8, sост = 21.6, | s0 = 20.1, sост = 19.2, | s0 = 20.4, sост = 19.5, | |
годmax = 56.3 | годmax = 56.7 | годmax = 56.2 | годmax = 56.9 |
Таблица 14.
Вариант | Делянка | Среднее за 23 года | Ошибка среднего |
---|---|---|---|
Контроль | 5 | 2.00 (23.73) | 3.01 |
12 | 1.23 (25.46) | 2.91 | |
29 | –2.18 (23.26) | 2.83 | |
36 | 0.34 (20.54) | 2.53 | |
NP | 6 | –0.22 (29.36) | 3.87 |
13 | –0.13 (28.30) | 3.71 | |
30 | –0.11 (27.33) | 4.10 | |
37 | –1.41 (27.70) | 3.74 | |
NP + Kx | 1 | 1.52 (37.55) | 5.19 |
18 | 0.88 (34.09) | 4.30 | |
25 | 0.63 (31.50) | 3.82 | |
32 | –1.10 (28.88) | 3.68 |
Если принять полученные ряды разниц стационарными, то для них имеются теоретические формулы для оценки ошибки среднего в ряду ([8], с. 136), которые можно было бы принять для наших целей. Эти оценки считают с использованием коэффициентов автокорреляции между членами ряда. Однако в нашем примере рассчитанные таким образом ошибки средних оказываются часто либо близкими к нулю, либо отрицательными, что не имеет физического смысла. Можно предположить, что ряды либо недостаточно длинные, либо они все же не являются стационарными. Поэтому в качестве ошибки средних многолетних для делянок предлагается брать ошибки средних из табл. 14, либо из остаточного стандартного отклонения ($\sqrt {{{s}_{{{\text{ост}}}}}} $) табл. 13. Эти параметры несколько различаются из-за ошибок пересчетов.
Еще одна возможность оценить ошибку непосредственно по ряду разниц – непараметрический подход, один его вариант – через квартили [5]:
А при наличии подходящей компьютерной программы (например, программа KVANT [9]) можно рассчитать величины x, соответствующие квантилям эмпирической функции распределения 0.159 и 0.841, тогда
Эти непараметрические подходы относятся к распределениям, которые не очень сильно отличаются от нормального.
Все полученные оценки стандартного отклонения сведены в табл. 15. Можно видеть, что в данном примере из оценок s по 4-м способам несколько выпадают оценки, рассчитанные через квартили. Поэтому в качестве окончательной оценки s берем среднее из 3-х других способов.
Таблица 15.
Вариант | Делянка | Среднее | Медиана | Стандартное отклонение | Для варианта | ||||
---|---|---|---|---|---|---|---|---|---|
из остатка регрессии | из ряда разниц, параметрически | через квартили | через квантили | усредненное* | |||||
Контроль | 5 | 2.00 | 2.0/1.5 | 15.1 | 14.4 | 13.9 | 15.8 | 15.1 | среднее** = |
12 | 1.23 | 1.25/0.71 | 14.6 | 14.0 | 14.0 | 15.0 | 14.5 | = 23.25 | |
29 | –2.18 | –3.35/–2.04 | 14.2 | 13.6 | 13.8 | 15.9 | 14.6 | s = 14.17 | |
36 | 0.34 | 0.65/0.86 | 12.7 | 12.1 | 13.2 | 13.9 | 12.9 | m = 1.5 | |
NP | 6 | –0.22 | –3.0/–2.9 | 19.5 | 18.6 | 14.5 | 20.8 | 19.6 | среднее** = |
13 | –0.13 | –1.3/–2.2 | 18.7 | 17.8 | 13.2 | 20.2 | 18.9 | = 28.17 | |
30 | –0.11 | –2.4/–2.1 | 20.6 | 19.7 | 13.2 | 21.2 | 20.5 | s = 19.2 | |
37 | –1.41 | –2.7/–3.1 | 18.8 | 18.0 | 12.1 | 20.3 | 19.0 | m = 2.0 | |
NP + Kx | 1 | 1.52 | –1.7/0.16 | 26.1 | 24.9 | 19.2 | 25.4 | 25.5 | среднее** = |
18 | 0.88 | –0.7/0.15 | 21.6 | 20.6 | 16.1 | 22.7 | 21.6 | = 33.01 | |
25 | 0.63 | 1.65/0.45 | 19.2 | 18.3 | 16.2 | 19.7 | 19.1 | s = 21.31 | |
32 | –1.10 | 0.4/–0.73 | 19.5 | 17.7 | 14.9 | 19.3 | 18.8 | m = 2.2 |
Для перехода от ошибок для делянок к ошибкам для вариантов опыта предполагаем, что делянки каждого варианта (повторности) принадлежат к одной генеральной совокупности. Тогда ([10], с. 105–106)
Что и как можно сравнивать в результате? При сравнении многолетних средних арифметических используем известную формулу для t-критерия в общем случае, когда дисперсии средних различаются:
где Mi – сравниваемые средние, mi – ошибки этих средних. Сложность здесь состоит в расчете числа степеней свободы для t-критерия:Сравнивать можно средние многолетние показатели для делянок и вариантов, используя данные табл. 14 и 15. Для примера сравним средние многолетние урожайности для вариантов:
А – Контроль (NP)
уровень значимости получился немного >0.05.Б – Аналогично для вариантов Контроль и NP + Kx получаем t = 3.665, u = 0.317, ν = 38.8, уровень значимости <0.001.
В – Варианты NP и NP + Kx: t = 1.628, u = = 0.452, ν = 43.6; уровень значимости >0.10.
Может представить интерес сравнение средних не для всего срока наблюдения, а для отдельных его периодов (например, в начале, в середине, в конце имеющихся наблюдений). Так как имеются временны́е тренды урожайности, то возникает вопрос, какую надо взять длительность периода, по которой будут рассчитываться среднее и его ошибка? При этом среднее считается по модели тренда, а ошибка среднего как s/$\sqrt n $, где n – длительность выбранного периода, s – из табл. 15 [7]. Заранее предугадать длительность периода затруднительно, поэтому можно провести следующую процедуру: беря длительность периода в 2, 3, 4 и так далее лет, рассчитываем для них средние (по тренду) и ошибки средних. Сравнивая средние (для делянок или вариантов) по t-критерию, находим такую длину периода, где различия средних максимальны и возможно значимы.
Автор с благодарностью примет замечания к этому проекту.
Список литературы
Фрид А.С. Обоснование методических подходов к анализу данных многолетних полевых опытов // Агрохимия. 2013. № 10. С. 75–96.
Ваулин А.В. Определение достоверности средних многолетних показателей краткосрочных полевых опытов при обработке результатов исследований методом дисперсионного анализа // Агрохимия. 1998. № 12. С. 71–75.
Фрид А.С., Надежкина Е.В., Караякова В.И. Влияние газопылевых выбросов предприятий промышленности на различные компоненты биогеоценоза серой лесной почвы лесостепной зоны // Агрохимия. 2007. № 2. С. 32–42.
Доспехов Б.А. Методика полевого опыта (с основами статистической обработки результатов исследований). М.: Агропромиздат, 1985. 351 с.
Благовещенский Ю.Н., Самсонова В.П., Дмитриев Е.А. Непараметрические методы в почвенных исследованиях. М.: Наука, 1987. 95 с.
Дмитриев Е.А. Методы математической обработки материалов стационарных исследований // Принципы организации и методы стационарного изучения почв. М.: Наука, 1976. С. 302–412.
Манелля А.И., Нагнибедова Н.Н., Френкель А.А., Ващуков Л.И. Динамика урожайности сельскохозяйственных культур в РСФСР. М.: Статистика, 1972. 192 с.
Грановский В.А., Сирая Т.Н. Методы обработки экспериментальных данных при измерениях. Л.: Энергоатомиздат, 1990. 288 с.
Алгоритмы и программы для ЭВМ СМ-4 / Сост.: В.А. Рожков, А.С. Фрид, А.Б. Бибернейт, П.А. Тимохин, И.Н. Голикова, С.А. Иваненко, Е.Н. Веселов, Е.П. Веселова. М.: Почвенный ин-т им. В.В. Докучаева, 1985. 108 с.
Дмитриев E.А. Математическая статистика в почвоведении / Под ред. Ю.Н. Благовещенский. М.: Изд-во МГУ, 1995. 320 с.
Дополнительные материалы отсутствуют.