Агрохимия, 2022, № 3, стр. 81-93

Рекомендации к анализу данных многолетних полевых опытов (проект)

А. С. Фрид *

Всероссийский научно-исследовательский институт фитопатологии
143050 Московская обл., Одинцовский р-н, р.п. Большие Вяземы, ул. Институт, 5, Россия

* E-mail: asfrid@mail.ru

Поступила в редакцию 28.11.2021
После доработки 07.12.2021
Принята к публикации 15.12.2021

Полный текст (PDF)

Аннотация

Изложены методические подходы, рекомендуемые для решения основных задач, возникающих при анализе результатов многолетних полевых опытов (как краткосрочных, так и длительных). Рассмотрены задачи: 1) устойчивость по годам эффектов доз факторов опыта, 2) сходство и различие временны́х динамик изученного показателя, 3) наличие многолетнего тренда изученного показателя, 4) сравнение многолетних средних изученного показателя.

Ключевые слова: многолетние полевые опыты, анализ данных, устойчивость влияния факторов, сравнение временны́х динамик, сравнение многолетних средних.

ВВЕДЕНИЕ

Хотя задача анализа данных многолетних полевых опытов стала актуальной с момента закладки подобных опытов (как краткосрочных, так и длительных), более или менее ее полноценного общепринятого решения пока не было представлено. В работе [1] был сделан обзор и обоснование возможных методических подходов к решению некоторых типовых задач, а в настоящей работе эти разработки представлены в виде проекта рекомендаций.

Ограничимся решением следующих частных задач, которые считаются наиболее важными: 1) устойчивость по годам эффектов доз факторов опыта, 2) сходство и различие многолетних динамик изученного показателя, 3) наличие многолетнего тренда изученного показателя, 4) сравнение многолетних средних изученного показателя. Поскольку краткосрочные опыты (<10 лет и/или <2-х ротаций севооборота) имеют небольшую длину временно́го ряда, то для них 3-я и 4-я задачи не могут быть адекватно решены.

В качестве экспериментальных примеров используем здесь те же результаты опытов, что и в работе [1]: 3-летний опыт из работы [2] (табл. 1) и фрагмент опыта с формами калийных удобрений на Люберецком опытном поле (ЛОП) НИУИФ, предоставленный В.Г. Граковским (табл. 2). В качестве изученного показателя в обоих опытах взята урожайность культур, но это могут быть и другие ежегодные характеристики, относящиеся к культурам, почвам, экономическим показателям.

Таблица 1.

Изменение урожайности ячменя (ц/га) под влиянием азотных удобрений и фунгицида (Ф) в ходе 3-летнего полевого опыта

Вариант Повторность Среднее
1-я 2-я 3-я 4-я
 1989 г. 
1. N0Ф0 23.9 31.9 22.6 27.8 26.6
2. N0Ф1 32.8 25.7 28.9 24.3 27.9
3. N60Ф0 32.1 31.0 31.1 27.1 30.3
4. N60Ф1 35.5 26.8 33.3 32.0 31.9
5. N120Ф0 34.8 32.3 32.0 32.9 33.0
6. N120Ф1 34.7 34.0 33.7 31.7 33.5
7. N180Ф0 30.4 31.8 29.1 30.6 30.5
8. N180Ф1 41.4 41.4 29.6 31.8 36.1
          за год 31.1
 1990 г. 
1. N0Ф0 25.7 21.8 23.6 27.9 24.8
2. N0Ф1 29.8 22.5 25.4 28.7 26.6
3. N60Ф0 31.5 25.3 22.5 22.4 25.4
4. N60Ф1 35.7 33.5 27.1 30.8 31.8
5. N120Ф0 34.8 36.2 28.9 20.5 30.1
6. N120Ф1 37.8 36.6 31.2 25.0 32.7
7. N180Ф0 29.6 31.1 32.8 27.9 30.4
8. N180Ф1 37.8 36.2 33.0 29.2 34.1
          за год 29.5
 1991 г. 
1. N0Ф0 7.3 8.6 9.4 9.4 8.7
2. N0Ф1 8.3 7.3 10.2 9.9 8.9
3. N60Ф0 21.8 18.1 19.8 24.0 20.9
4. N60Ф1 28.8 18.6 17.8 18.5 20.9
5. N120Ф0 30.0 29.9 25.0 30.6 28.9
6. N120Ф1 29.8 33.6 34.1 32.5 32.5
7. N180Ф0 26.3 33.0 28.9 31.0 29.8
8. N180Ф1 29.6 30.8 29.5 31.4 30.3
          за год 22.7
Таблица 2.

Многолетняя динамика урожайности (ц/га) культур в севообороте с применением форм калийных удобрений на Люберецком опытном поле НИУИФ (фрагмент)

Год Культура Варианты Среднее за год
Контроль (без удобрений) NP NP + Kx
номера делянок в повторениях
5 12 29 36 6 13 30 37 1 18 25 32  
1944 Свекла кормовая 57 60 49 37 78 71 72 96 134 95 82 100 77.6
1945 Гречиха на зеленое удобрение (ЗУ) 37 39 18 22 76 73 54 74 77 63 56 36 52.1
1946 Рожь озимая 6 7 5 3 6 8 3 4 5 8 6 5 5.5
1947 Картофель 164 173 161 133 189 190 191 209 194 196 195 156 179
1948 Свекла кормовая 91 139 129 125 90 143 124 190 188 172 190 143 144
1949 Люпин на ЗУ 331 417 324 374 383 386 376 318 384 390 416 412 376
1950 Рожь озимая 26 31 28 23 27 27 28 24 32 28 30 30 28
1951 Картофель 157 169 154 145 159 165 146 169 164 158 145 122 154
1952 Свекла сахарная 237 253 184 164 296 284 231 247 351 302 297 178 252
1953 Люпин на ЗУ 111 166 86 60 142 121 89 89 173 129 140 64 114
1954 Рожь озимая 14 16 13 15 24 19 17 18 22 17 18 18 18
1955 Картофель 128 134 115 94 145 148 122 143 153 145 126 100 129
1956 Свекла сахарная 165 129 186 152 261 272 271 271 315 290 298 237
1957 Люпин на ЗУ 164 204 159 122 172 181 153 136 206 213 172 139 168
1958 Рожь озимая 46 38 38 35 72 64 87 68 114 82 50 78 64
1959 Картофель 149 168 184 140 148 132 128 128 249 206 213 213 172
1960 Свекла сахарная 99 97 100 95 128 134 132 135 175 188 173 155 134
1961 Люпин на семена 5 8 9 6 9 6 5 6 16 11 13 11 9
1962 Рожь озимая на зеленую массу (ЗМ) 57 88 58 36 110 89 102 137 112 136 133 102 97
1963 Картофель 94 130 100 105 79 65 68 65 204 221 177 176 124
1964 Свекла сахарная 117 104 110 84 142 131 118 101 177 171 148 121 127
1965 Люпин на ЗУ 462 465 462 446 550 448 468 438 564 539 494 495 486
1966 Рожь на ЗМ 76 82 58 58 115 115 86 111 113 120 121 103 96.5

Примечание. Прочерк – отсутствие данных.

КРАТКОСРОЧНЫЕ ПОЛЕВЫЕ ОПЫТЫ

Устойчивость по годам эффектов доз факторов опыта. Для каждого года оценивается зависимость урожайности от факторов опыта дисперсионным (ДА) и регрессионным (РА) (если возможно) анализами. По результатам ДА определяется варьирование от года к году доли влияния и уровня значимости факторов и их взаимодействий: чем меньше варьирование, тем более устойчиво влияние изученных факторов. По результатам РА можно увидеть и оценить характер зависимости урожайности от факторов опыта – если ежегодные регрессионные зависимости имеют однотипный характер по структуре уравнений, знакам коэффициентов, то можно говорить об устойчивом влиянии доз факторов, хотя количественно величины коэффициентов могут меняться от года к году.

Для данных табл. 1 результаты ДА представлены в табл. 3. Из нее видно, что первые 2 года, как по влиянию изученных факторов, так и по их значимости, были относительно близкими между собой. А на 3-й год резко увеличилось влияние доз азотных удобрений и уменьшилось влияние фунгицида, несмотря на снижение средней урожайности (табл. 1).

Таблица 3.

Результаты ДА урожайности ячменя (опыт [2])

Год Доля влияния Уровень значимости
вариантов доз азота фунгицида вариантов доз азота фунгицида
1989 0.49 0.35 0.075 0.01 0.025 0.10
1990 0.42 0.26 0.13 0.025 0.05 0.05
1991 0.94 0.93 0.004 0.01 0.01 >0.10

Примечание. Размах НСР05 по годам – 4.1–5.4 ц/га, среднее арифметическое НСР05 = 4.8 ц/га.

РА дал следующие результаты:

$\begin{gathered} 1989\;{\text{г}}. \\ {\text{У}} = 26.1 + 0.082{\text{N}}--0.00027{{{\text{N}}}^{2}} + 2.3{\text{Ф}}, \\ {{R}^{2}} = 0.43; \\ \end{gathered} $
$\begin{gathered} 1990\;{\text{г}}. \\ {\text{У}} = 23.8 + 0.064{\text{N}}--0.00015{{{\text{N}}}^{2}} + 3.6{\text{Ф}}, \\ {{R}^{2}} = 0.39; \\ \end{gathered} $
$\begin{gathered} 1991\;{\text{г}}. \\ {\text{У}} = 7.9 + 0.28{\text{N}}--0.00089{{{\text{N}}}^{2}} + 1.1{\text{Ф}}, \\ {{R}^{2}} = 0.92. \\ \end{gathered} $

Все зависимости однотипны по структуре и по знакам коэффициентов регрессии. Общий вывод: влияние факторов опыта, хотя и менялось количественно от года к году, качественно было устойчивым.

Сходство и различие многолетних динамик урожайности. Общее представление о сходстве и различии временны́х динамик для вариантов и делянок можно получить построением дендрограмм сходства и таблиц попарного сходства. Для расчета сходства можно использовать, например, многомерное евклидово расстояние между объектами (вариантами или делянками) k и l

${{d}_{{kl}}} = {{\left[ {\frac{1}{n}\sum\limits_{i = 1}^n {{{{({{x}_{{ki}}} - {{x}_{{li}}})}}^{2}}} } \right]}^{{1/2}}}$
и меру (степень) сходства ckl = 100/(100 + dkl), %, где dkl – расстояние между рядами динамики объектов k и l, n – число лет, xki и xli – величины урожайности для i-го года объектов k и l. Если изученный показатель – фракционный состав (для почв или растений), то расстояния между объектами можно рассчитать по формуле из работы [3], а если необходимо использовать совокупность разнородных показателей, то их предварительно нормируют (переводят в относительные единицы). Для облегчения расчетов имеются соответствующие программы для компьютера в различных статистических пакетах.

В нашем примере дендрограмма сходства временны́х динамик урожайности для делянок содержит 32 объекта (8 вариантов в 4-х повторениях) (рис. 1). Показано, что даже на уровне сходства 70% (довольно высоком) и выше образующиеся группы делянок, как правило, содержат делянки разных вариантов. Следовательно, временны́е динамики урожайности в данном случае слабо связаны с вариантами опыта и определяются другими факторами (возможно, различием в почвенных свойствах).

Рис. 1.

Дендрограмма сходства (%) временных динамик урожайностей на делянках опыта [2].

Полную таблицу сходств временны́х динамик для всех возможных пар делянок мы не приводим из-за ее громоздкости. Детальное рассмотрение этой таблицы показало, что, используя уровень сходства 80% и выше, получаются 3 группы делянок, сходные динамикой урожайности. К первой группе относятся делянки вариантов 1 (N0Ф0) и 2 (N0Ф1), за исключением делянок 1-2 (вариант 1, 2-е повторение) и 2-1 (вариант 2, 1-е повторение). Ко 2-й группе относятся делянки всех остальных вариантов, за исключением делянок 3‑4 и 5-4; отдельную группу составили делянки 8‑1 и 8-2. Эту картину можно увидеть и на дендрограмме сходства в несколько завуалированном виде.

Дендрограмма сходства временны́х динамик средних величин урожайностей в вариантах показана на рис. 2. На уровне сходства 70% образующиеся группы вариантов сходной динамики (кроме первой с вариантами N0Ф0 и N0Ф1) также неоднородны – в них изменяются дозы обоих факторов. Другими словами, при дозе азота 60 кг/га и выше дозы факторов не определяли сходство временны́х динамик урожайности вариантов.

Рис. 2.

Дендрограмма сходства (%) временны́х динамик средних урожайностей для вариантов опыта [2].

Полная матрица попарных сходств временны́х динамик средних урожайностей для вариантов показана в табл. 4. Пары вариантов с уровнем сходства 70% и выше получились следующие: 1 и 2 (N0), 5, 6, 7 и примыкающие к ним 4 и 8. Динамика варианта 3 отличалась от других. Это рассмотрение детализирует дендрограмму.

Таблица 4.

Попарное сравнение 3-летних временны́х динамик средних урожайностей ячменя для вариантов по уровню сходства, %

Номер варианта Номер варианта
1 2 3 4 5 6 7
2 87 100          
3 49 56 100        
4 25 35 45 100      
5 21 27 47 74 100    
6 15 19 30 62 81 100  
7 25 31 50 71 82 68 100
8 12 15 22 49 57 77 41

Теперь рассмотрим этот же вопрос сравнения динамик с точки зрения сопряженных выборок. Для этого можно использовать t-критерий [4] и непараметрический критерий Вилкоксона [5]. Эти критерии рассматривают экспериментальный материал с противоположных предыдущему позиций – оцениваются не сходства динамик, а их различия.

Непараметрический критерий в данном примере оказался не применимым, т.к. так 3-х опыто-лет для его применения недостаточно – нужно как минимум 6 лет опыта. Полная таблица при использовании t-критерия для делянок тоже слишком громоздка, поэтому в табл. 5 показаны только значимо отличающиеся временны́е динамики. Из этой таблицы видно следующее. Варианты 1, 2 и 5 имеют делянки, значимо различающиеся по временно́й динамике (делянки 1 и 4 в варианте 1, делянки 6 и 7 в варианте 2, делянки 17 и 19 в варианте 5). Делянки вариантов 7 и 8 не различаются значимо динамикой урожайности; аналогичная ситуация для пар вариантов 1 и 2, 1 и 7, 2 и 3, 2 и 5, 2 и 6, 2 и 7, 4 и 7, 5 и 6.

Таблица 5.

Попарное сравнение временны́х динамик урожайности делянок по t-критерию для сопряженных выборок опыта [2]

Номера делянок Номера соответствующих вариантов Средняя разность Уровень значимости Номера делянок Номера соответствующих вариантов Средняя разность Уровень значимости
1 и 4 1 и 1 –2.7 0.05 10 и 29 3 и 8 –11.5 0.01
1 и 16 1 и 4 –8.1 0.05 10 и 30 3 и 8 –11.3 0.01
1 и 29 1 и 8 –17.3 0.05 11 и 29 3 и 8 –11.8 0.05
1 и 30 1 и 8 –17.2 0.05 11 и 30 3 и 8 –11.7 0.01
2 и 29 1 и 8 –15.5 0.05 12 и 17 3 и 5 –8.7 0.05
3 и 9 1 и 3 –9.9 0.05 12 и 22 3 и 6 –10.2 0.05
3 и 13 1 и 4 –14.8 0.05 12 и 23 3 и 6 –8.5 0.05
3 и 14 1 и 4 –7.8 0.05 12 и 26 3 и 7 –7.5 0.05
3 и 16 1 и 4 –8.6 0.01 12 и 28 3 и 7 –5.3 0.05
3 и 17 1 и 5 –14.7 0.05 12 и 30 3 и 8 –11.6 0.05
3 и 18 1 и 5 –14.3 0.05 12 и 32 3 и 8 –6.3 0.05
3 и 21 1 и 6 –15.6 0.05 13 и 19 4 и 5 +4.7 0.05
3 и 29 1 и 8 –17.7 0.05 15 и 29 4 и 8 –10.2 0.05
3 и 30 1 и 8 –17.6 0.05 15 и 30 4 и 8 –10.1 0.05
4 и 29 1 и 8 –14.6 0.05 16 и 29 4 и 8 –9.2 0.05
6 и 7 2 и 2 –3.0 0.01 16 и 30 4 и 8 –9.0 0.05
6 и 15 2 и 4 –7.6 0.05 17 и 19 5 и 5 +4.6 0.05
6 и 16 2 и 4 –8.6 0.05 17 и 25 5 и 7 +4.4 0.01
6 и 29 2 и 8 –17.8 0.05 19 и 29 5 и 8 –7.6 0.05
6 и 30 2 и 8 –17.6 0.05 19 и 30 5 и 8 –7.5 0.05
7 и 29 2 и 8 –14.8 0.05 22 и 25 6 и 7 +6.0 0.05
7 и 30 2 и 8 –14.6 0.05 22 и 27 6 и 7 +4.5 0.01
8 и 29 2 и 8 –15.3 0.05 22 и 31 6 и 8 +4.0 0.01
9 и 13 3 и 4 –4.9 0.05 23 и 28 6 и 7 +3.2 0.01
9 и 29 3 и 8 –7.8 0.05 23 и 32 6 и 8 +2.2 0.05
9 и 30 3 и 8 –7.7 0.05        

Примечание. Делянки имеют сплошную нумерацию во всех вариантах. Указаны только значимые различия.

Если сопряженно по t-критерию сравнивать динамики средних для вариантов, то получим значимое различие для вариантов 6 и 7 (0.01, средняя разница +2.7) и вариантов 3 и 8 (0.05, средняя разница +8.0); это не противоречит данным табл. 5 и рис. 2.

Сравнение методами сходства и различия могут давать и несовпадающие результаты (разные алгоритмы с разными предпосылками), в таком случае выводы должны быть более осторожными.

ДЛИТЕЛЬНЫЕ ПОЛЕВЫЕ ОПЫТЫ

Устойчивость по годам эффектов доз факторов опыта. Подходы здесь те же, что для краткосрочных опытов. Результаты для использованного примера представлены в табл. 6. Регрессионный анализ проводить в этом случае нет особого смысла из-за наличия только 2-х доз удобрений и малого числа вариантов. Так как размещение делянок по организованным повторениям не известно, то оценить вклад организованных повторений не было возможности, и разброс урожайностей в зависимости от делянок соответствовал случайной ошибке.

Таблица 6.

Результаты ДА урожайности культур опыта ЛОП

Год Среднее для варианта, ц/га Доля влияния вариантов, % Уровень значимости влияния вариантов
Контроль NP NP + Kx
1944 51 79 103 71 0.01
1945 29 69 58 69 0.01
1946 5 5 6 4.8
1947 158 195 185 56 0.05
1948 121 137 173 42
1949 362 366 401 28
1950 27 27 30 36
1951 156 160 147 17
1952 210 265 282 32
1953 106 110 127 6.2
1954 15 20 19 54 0.05
1955 118 140 131 24
1956 158 269 285 88 0.01
1957 162 161 183 13
1958 39 73 81 62 0.05
1959 160 134 220 86 0.01
1960 98 132 173 95 0.01
1961 7 7 13 73 0.01
1962 60 110 121 71 0.01
1963 107 69 195 93 0.01
1964 104 123 154 60 0.05
1965 459 476 523 43
1966 69 107 114 79 0.01
1944–1955 гг. (3 ротации) – размах доли влияния вариантов 4.8–71% (медиана 34%), влияние вариантов значимо 4 года
1956–1966 гг. (3 ротации без 1-го года) – размах доли влияния вариантов 13–95% (медиана 73%), влияние вариантов значимо 9 лет

Примечание. Пробел – незначимость влияния вариантов.

Данные табл. 6 показали, что влияние вариантов опыта имело тенденцию к изменению во времени: наблюдали рост доли влияния и числа значимых лет влияния от первых 3-х ротаций ко 2-й тройке ротаций. Имелась также четкая тенденция к изменению варианта с наибольшей урожайностью: в первые 3 ротации это могли быть варианты как NP, так и NP + Kx, в последующие годы – только вариант NP + Kx.

Сходство и различие многолетних динамик урожайности. Дендрограмма сходства делянок по многолетним динамикам урожайности для опыта ЛОП показана на рис. 3. В этом случае уровни сходства значительно меньше, чем для опыта из работы [2]. На уровне сходства 60% в каждом варианте лишь по 2 делянки имели сходные динамики урожайности (5 и 29 в контроле, 6 и 13 в варианте NP, 18 и 25 в варианте NP + Kx). Остальные делянки, хотя и группируются с вышеуказанными внутри вариантов (кроме делянки 32), но на еще более низких уровнях сходства. Тем не менее, в отличие от опыта из работы [2], в этом случае варианты более существенно влияли на динамику урожайности (группировка делянок по вариантам в основном выполнялась). Полная матрица парных сходств делянок по динамике урожайностей показана в табл. 7. В данном случае она полностью подтверждает результаты дендрограммы.

Рис. 3.

Дендрограмма сходства (%) временны́х динамик урожайностей на делянках опыта ЛОП.

Таблица 7.

Матрица парных сходств (%) временны́х динамик урожайностей для делянок опыта ЛОП

Номера делянок Контроль NP NP + Kx
5 12 29 36 6 13 30 37 1 18 25 32
Контроль 5 100                      
12 53 100                    
29 74 47 100                  
36 50 30 58 100                
NP 6 39 39 29 22 100              
13 48 49 35 26 62 100            
30 53 40 47 37 48 53 100          
37 38 30 33 26 40 52 54 100        
NP + Kx 1 19 24 18 13 35 28 24 23 100      
18 27 34 25 17 44 44 33 31 54 100    
11 30 39 30 21 44 46 40 35 45 66 100  
12 34 32 39 33 33 32 46 29 25 34 46 100

Для средних урожайностей в вариантах вообще не получено существенных сходств многолетних динамик (табл. 8). Все же можно отметить, что крайние варианты (контроль и NP + Kx) менее сходны между собой, чем соседние.

Таблица 8.

Матрица парных сходств (%) временны́х динамик средних урожайностей для вариантов опыта ЛОП

  Контроль NP NP + Kx
Контроль 100    
NP 43 100  
NP + Kx 25 37 100

Теперь, как и ранее, рассмотрим сравнение многолетних динамик урожайностей с точки зрения сопряженных выборок. Так как в этом случае усредняются и сопоставляются разности урожайностей разных культур, то возникает необходимость перейти к более сопоставимым единицам, например, к зерновым [1]. Если использование t-критерия для сопряженных выборок хорошо известно, то использование непараметрического критерия Вилкоксона следует подробно изложить. Необходимость использовать 2 критерия (параметрический и непараметрический) обусловлена тем, что они имеют разные предпосылки для своего применения, а это повышает надежность результатов, если они совпадают по обоим критериям.

Использование критерия Вилкоксона для сопряженных выборок излагаем по работе [5]. Для конкретности возьмем сравнение делянок 5 и 12 (табл. 9). Сначала считаем разности для каждого года, затем эти разности ранжируем по абсолютной величине от самых маленьких до самых больших числами натурального ряда (1, 2, …). Далее считаем суммы рангов для положительных и отрицательных разностей раздельно. Меньшая сумма рангов представляет собой статистику Вилкоксона для сопряженных пар (выборок). В нашем примере меньшая сумма рангов равна 61. Далее используем таблицу критических величин критерия (табл. 10) [5]. При n = 23 (длина временно́го ряда) величина 61 меньше критической при уровне значимости 0.05 (74), но больше 56 (уровень значимости 0.01), следовательно делянки 5 и 12 различаются по временно́й динамике урожайности на уровне значимости 0.05, но не различаются при уровне значимости 0.01. Если какие-то разности в сопряженных рядах равны нулю, то соответствующие пары исключаются из рассмотрения, и соответственно уменьшается объем выборки.

Таблица 9.

Сравнение динамик урожайностей делянок 5 и 12 по критерию Вилкоксона для сопряженных выборок

Год Урожайность, з.е. Разность Ранг разности
делянка 5 делянка 12
1944 8.55 9 –0.45 3
1945 3.7 3.9 –0.2 1
1946 6 7 –1 6
1947 41 43.25 –2.25 9
1948 13.65 20.85 –7.2 20
1949 25.5 32.1 –6.6 19
1950 26 31 –5 18
1951 39.25 42.25 –3 12
1952 59.25 63.25 –4 15
1953 8.55 12.8 –4.25 16
1954 14 16 –2 8
1955 32 33.5 –1.5 7
1956 41.25 32.25 +9 22
1957 12.9 15.7 –2.8 11
1958 46 38 +8 21
1959 37.25 42 –4.75 17
1960 24.75 24.25 +0.5 4
1961 4.55 7.28 –2.73 10
1962 5.7 8.8 –3.1 13
1963 23.5 32.5 –9 23
1964 29.25 26 +3.25 14
1965 35.6 35.8 –0.2 2
1966 4.6 8.2 –0.6 5
Сумма рангов положительных разностей = 61
Сумма рангов отрицательных разностей = 215
Таблица 10.

Критические величины критерия Вилкоксона для сопряженных пар (выборок)

n Уровень значимости Примечания
0.05 0.01
6 1 1) Нулевая гипотеза о равенстве сопряженных пар (выборок) отвергается, если рассчитанная сумма рангов меньше критического значения
7 3
8 5 1
9 7 3
10 9 4
11 12 6 2) Если n > 25, то можно пользоваться нормальным приближением для критических значений: среднее для суммы рангов Wср = = n(n + 1)/4, дисперсия = σ2 = n(n + + 1)(2n + 1)/24. Нулевая гипотеза не отвергается, если (WсрW)/σ окажется меньше ψ(1 – α/2), где ψ – обратная функция нормального распределения
12 15 8
13 18 11
14 22 14
15 26 17
16 31 21
17 36 24
18 41 29
19 47 33
20 53 39
21 60 44
22 67 50
23 74 56
24 82 62
25 90 69

Итоги сравнения многолетних динамик урожайностей культур для делянок и для вариантов сведены в табл. 11 и 12. Результаты оценки различий динамик для делянок не противоречат картине, полученной при изучении уровней сходства: дополнительно отмечено значительно больше неразличающихся значимо пар делянок. При сравнении динамик вариантов получена однозначная картина: все варианты значимо различаются по обоим критериям, и это соответствует низкому сходству между ними, полученному выше.

Таблица 11.

Различия временны́х динамик урожайностей делянок как сопряженных выборок для опыта ЛОП

Вариант   Контроль NP NP + Kx
Номер делянки 5 12 29 36 6 13 30 37 1 18 25 32
Контроль 5 X –1.7 +0.47 +3.2 –5.6 –4.6 –3.6 –4.0 –13.8 –10.4 –7.8 –5.15
12 –/0.05 X +2.2 +4.9 –3.9 –2.8 –1.9 –2.2 –12.1 –8.6 –6.0 –3.4
29 –/– –/0.05 X +2.7 –6.1 –5.0 –4.1 –4.4 –14.3 –10.8 –8.2 –5.6
36 0.01/0.01 0.01/0.01 0.01/0.01 X –8.8 –7.8 –6.8 –7.2 –17 –13.5 –11 –8.3
NP 6 0.01/0.01 –/– 0.01/0.01 0.01/0.01 X –1.1 +2.0 +1.7 –8.2 –4.7 –2.2 –0.48
13 0.01/0.01 –/– 0.05/0.01 0.01/0.01 –\– X +0.98 +0.60 –9.3 –5.8 –3.2 –0.58
30 –/– –/– –/– 0.05/0.01 –/0.05 –/0.05 X –0.37 –10.2 –6.8 –4.2 –1.55
37 0.05/0.05 –/– 0.05/0.05 0.01/0.01 –/– –/– –/– X –9.9 –6.4 –3.8 –1.2
NP + Kx 1 0.01/0.01 0.01/0.01 0.01/0.01 0.01/0.01 0.01/0.01 0.01/0.01 0.01/0.01 0.01/0.01 X +3.5 +6.1 +8.7
18 0.01/0.01 0.01/0.01 0.01/0.01 0.01/0.01 0.05/0.01 0.01/0.01 0.01/0.01 0.01/0.01 0.05/0.05 X +2.6 +5.2
25 0.01/0.01 0.01/0.01 0.01/0.01 0.01/0.01 –/– –/0.05 –/0.01 –/0.05 0.05/0.01 –/– X +2.6
32 0.05/0.05 –/– 0.05/0.01 0.01/0.01 –/– –/– –/– –/– 0.01/0.01 0.01/0.01 –/0.01 X

Примечание. В верхнем треугольнике матрицы указаны средние разности для временны́х рядов делянок, в нижнем треугольнике – уровни значимости различий: над чертой – по t-критерию, под чертой – по критерию Вилкоксона. Прочерк – незначимость разности временных рядов. То же в табл. 12.

Таблица 12.

Различия временны́х динамик средних урожайностей вариантов как сопряженных выборок для опыта ЛОП

Вариант Контроль NP NP + Kx
Контроль X –4.9 –9.8
NP 0.05/0.01 X –4.8
NP + Kx 0.01/0.01 0.01/0.01 X

Наличие многолетнего тренда урожайности. Сама постановка такой задачи возможна только при изучении длительных многолетних опытов, где эти тренды могут проявиться. Однако и в этом случае задача достаточно неопределенна. В реальных временны́х рядах мы имеем дело с наложением нескольких источников варьирования: природных длиннопериодных циклов, смены культур в севооборотах, смены сортов культур, технологий обработки почвы, агроистощения или повышения обеспеченности растений питательными веществами, смены систем защиты растений, почвоутомления и т.п. На все это накладываются ежегодные изменения как природного, так и антропогенного характера [6].

При анализе длительных опытов обычно не стои́т задача выявить все детали имеющихся изменений, но определить основной тренд и, по возможности, наиболее выраженные циклы необходимо. Эти характеристики важны для сравнения между собой различных длительных опытов, различных вариантов опытов, а их сопоставление с природными процессами и антропогенными воздействиями будет способствовать лучшему пониманию причин получаемой в опытах динамики. Кроме того, как показано ниже, учет наличия временно́го тренда необходим для обоснованной оценки ошибки многолетних средних.

Для временны́х рядов урожайности показатели динамики могут сильно искажаться в зависимости от уровней первого и последнего члена ряда [7, c. 11]. Характерная картина динамики видна на данных ЛОП: динамика урожайностей делянок 2-х крайних вариантов (рис. 4) и динамика средних урожайностей для всех трех вариантов (рис. 5). В обоих случаях можно лишь качественно говорить, что в вариантах с удобрениями по годам с максимальной урожайностью наблюдается параболический тренд (повышение и понижение), а в годы с минимальной урожайностью и в  контроле – другая закономерность – чуть ли не снижение урожайности со временем.

Рис. 4.

Временна́я динамика урожайности делянок для вариантов Контроль (делянки 5–36) и NP + Kx (делянки 1–32), опыт ЛОП.

Рис. 5.

Временна́я динамика средних урожайностей вариантов, опыт ЛОП.

С другой стороны, четко видна одинаковая цикличность урожайности как для делянок, так и для вариантов. Сроки между максимумами урожайности составили 2–6 лет, между минимумами урожайности – 2.5–5 лет, а в среднем длина цикла составила ≈4 года. В данном примере это совпало с длительностью ротации, но может быть случайным совпадением. Максимальным урожайностям в основном соответствовали пропашные культуры, но встречались также рожь озимая и люпин. Минимальным урожайностям в основном соответствовал люпин, но встречались также рожь озимая, гречиха и пропашные. Такое разнообразие свидетельствует, вероятно, о влиянии погодных условий разных лет.

Более длительные циклы в данном примере таким же графическим образом оценить невозможно из-за недостаточно большой длины временно́го ряда.

Сравнение многолетних средних для делянок и вариантов опыта. В этом вопросе, как и в предыдущем разделе, желаемые решения носят приближенный характер, т.к. реальные многолетние ряды урожайности могут не всегда соответствовать теоретическим допущениям.

Чтобы сравнивать многолетние средние, надо оценить их ошибки. Для конкретной делянки ошибка связана непосредственно с временны́м изменением урожайности, а для варианта опыта с делянками-повторениями к временно́й ошибке добавляется пространственная. Временну́ю ошибку можно оценить для стационарных рядов; приблизить реальный ряд к стационарности можно, убрав временно́й тренд. В нашей задаче речь может идти о том, чтобы убрать основную (более или менее гладкую) временну́ю тенденцию, а критерием успеха должна служить не значимость самого тренда (если он значим, то это еще лучше), а заметное снижение остаточной дисперсии по сравнению с исходной (без снятия тренда).

Квадратичные модели трендов для отдельных делянок представлены в табл. 13. Все модели оказались незначимы, что не удивительно из-за сильных изменений урожайности от года к году. В то же время стандартные отклонения остатков (sост) были меньше исходных (s0), а средние из разниц между рассчитанными по моделям урожайностям и измеренными в опыте достоверно не отличались от нуля (табл. 14).

Таблица 13.

Временны́е тренды урожайности (ц з.е./га) для отдельных делянок длительного опыта на ЛОП

Вариант Повторности
1-я 2-я 3-я 4-я
Контроль У = –451 + 17.3 год – ‒ 0.156 год2, У = –443 + 17.2 год – ‒ 0.156 год2, У = –445.5 + 17.1 год – ‒ 0.153 год2, У = –375.9 + 14.4 год – ‒ 0.129 год2,
s0 = 15.8, sост = 15.1, s0 = 15.3, sост = 14.6, s0 = 15.0, sост = 14.2, s0 = 13.3, sост = 12.7,
годmax = 55.5 годmax = 55.2 годmax = 55.8 годmax = 55.8
NP У = –617.8 + 23.6 год – ‒ 0.212 год2, У = –610.4 + 23.5 год – ‒ 0.213 год2, У = –632.1 + 24.1 год – ‒ 0.217 год2, У = –559.8 + 21.7 год – ‒ 0.197 год2,
s0 = 20.5, sост = 19.5, s0 = 19.8, sост = 18.7, s0 = 21.6, sост = 20.6, s0 = 19.6, sост = 18.8,
годmax = 55.7 годmax = 55.1 годmax = 55.5 годmax = 55.0
NP + Kx У = –812.2 + 30.6 год – ‒ 0.272 год2, У = –631.3 + 23.8 год – ‒ 0.21 год2, У = –577.6 + 22.0 год – ‒ 0.196 год2, У = –550.4 + 20.7 год – ‒ 0.182 год2,
s0 = 27.6, sост = 26.1, s0 = 22.8, sост = 21.6, s0 = 20.1, sост = 19.2, s0 = 20.4, sост = 19.5,
годmax = 56.3 годmax = 56.7 годmax = 56.2 годmax = 56.9

Примечание. У – урожайность, год = (календарный год – 1900), s0 – среднее квадратическое (стандартное) отклонение в исходном ряду урожайностей, sост – остаточное стандартное отклонение регрессионного анализа, годmax – рассчитанные по уравнению тренда годы максимальной урожайности культур.

Таблица 14.

Средние величины и ошибки средних для разниц между фактическими показателями урожайности (ц з.е./га) и рассчитанными по моделям тренда для делянок опыта ЛОП

Вариант Делянка Среднее за 23 года Ошибка среднего
Контроль 5 2.00 (23.73) 3.01
12 1.23 (25.46) 2.91
29 –2.18 (23.26) 2.83
36 0.34 (20.54) 2.53
NP 6 –0.22 (29.36) 3.87
13 –0.13 (28.30) 3.71
30 –0.11 (27.33) 4.10
37 –1.41 (27.70) 3.74
NP + Kx 1 1.52 (37.55) 5.19
18 0.88 (34.09) 4.30
25 0.63 (31.50) 3.82
32 –1.10 (28.88) 3.68

Примечание. В скобках приведены фактические средние многолетние урожайности для делянок (з.е.).

Если принять полученные ряды разниц стационарными, то для них имеются теоретические формулы для оценки ошибки среднего в ряду ([8], с. 136), которые можно было бы принять для наших целей. Эти оценки считают с использованием коэффициентов автокорреляции между членами ряда. Однако в нашем примере рассчитанные таким образом ошибки средних оказываются часто либо близкими к нулю, либо отрицательными, что не имеет физического смысла. Можно предположить, что ряды либо недостаточно длинные, либо они все же не являются стационарными. Поэтому в качестве ошибки средних многолетних для делянок предлагается брать ошибки средних из табл. 14, либо из остаточного стандартного отклонения ($\sqrt {{{s}_{{{\text{ост}}}}}} $) табл. 13. Эти параметры несколько различаются из-за ошибок пересчетов.

Еще одна возможность оценить ошибку непосредственно по ряду разниц – непараметрический подход, один его вариант – через квартили [5]:

$s \approx 0.674[{{x}_{n}}\left( {0.75} \right)--{{x}_{n}}\left( {0.25} \right)].$

А при наличии подходящей компьютерной программы (например, программа KVANT [9]) можно рассчитать величины x, соответствующие квантилям эмпирической функции распределения 0.159 и 0.841, тогда

$s \approx 0.5[x\left( {0.841} \right)--x\left( {0.159} \right)].$

Эти непараметрические подходы относятся к распределениям, которые не очень сильно отличаются от нормального.

Все полученные оценки стандартного отклонения сведены в табл. 15. Можно видеть, что в данном примере из оценок s по 4-м способам несколько выпадают оценки, рассчитанные через квартили. Поэтому в качестве окончательной оценки s берем среднее из 3-х других способов.

Таблица 15.

Оценки средних многолетних и стандартных отклонений в рядах разниц для делянок и вариантов опыта ЛОП, ц з.е./га

Вариант Делянка Среднее Медиана Стандартное отклонение Для варианта
из остатка регрессии из ряда разниц, параметрически через квартили через квантили усредненное*
Контроль 5 2.00 2.0/1.5 15.1 14.4 13.9 15.8 15.1 среднее** =
12 1.23 1.25/0.71 14.6 14.0 14.0 15.0 14.5 = 23.25
29 –2.18 –3.35/–2.04 14.2 13.6 13.8 15.9 14.6 s = 14.17
36 0.34 0.65/0.86 12.7 12.1 13.2 13.9 12.9 m = 1.5 
NP 6 –0.22 –3.0/–2.9 19.5 18.6 14.5 20.8 19.6 среднее** =
13 –0.13 –1.3/–2.2 18.7 17.8 13.2 20.2 18.9 = 28.17
30 –0.11 –2.4/–2.1 20.6 19.7 13.2 21.2 20.5 s = 19.2
37 –1.41 –2.7/–3.1 18.8 18.0 12.1 20.3 19.0 m = 2.0 
NP + Kx 1 1.52 –1.7/0.16 26.1 24.9 19.2 25.4 25.5 среднее** =
18 0.88 –0.7/0.15 21.6 20.6 16.1 22.7 21.6 = 33.01
25 0.63 1.65/0.45 19.2 18.3 16.2 19.7 19.1 s = 21.31
32 –1.10 0.4/–0.73 19.5 17.7 14.9 19.3 18.8 m = 2.2 

Примечание. В графе “Медиана” над чертой – расчет ручным способом, под чертой – расчет по компьютерной программе со сглаживанием по Парзену. *Усреднение по 3-м оценкам (без оценки через квартили). **Средние относятся к исходным величинам урожайности.

Для перехода от ошибок для делянок к ошибкам для вариантов опыта предполагаем, что делянки каждого варианта (повторности) принадлежат к одной генеральной совокупности. Тогда ([10], с. 105–106)

${{Y}_{{{\text{вар}}}}} = \frac{1}{N}\sum\limits_{i = 1}^k {({{n}_{i}}{{Y}_{{{\text{ср}}i}}}),} $
$S_{{{\text{вар}}}}^{2} = \frac{1}{{N - 1}}\left\{ {\sum\limits_{i = 1}^k {[s_{i}^{2}({{n}_{i}} - 1)]} + \sum\limits_{i = 1}^k {[{{n}_{i}}{{{({{Y}_{{{\text{вар}}}}} - {{Y}_{{{\text{ср}}}}})}}^{2}}]} } \right\},$
где Yвар – средняя многолетняя урожайность для варианта опыта, N – сумма лет опыта по всем делянкам (повторностям) варианта, k – число делянок (повторностей) в варианте, ni – число лет для i-й делянки, Yсрi – средняя многолетняя урожайность для i-й делянки, $S_{{{\text{вар}}}}^{2}$ – дисперсия урожайности для варианта, $s_{i}^{2}$ – дисперсия урожайности для i-й делянки. Степень свободы для дисперсии варианта – N – 1. Результаты расчетов статистических показателей для вариантов также показаны в табл. 15.

Что и как можно сравнивать в результате? При сравнении многолетних средних арифметических используем известную формулу для t-критерия в общем случае, когда дисперсии средних различаются:

$t = ({{M}_{1}}--{{M}_{2}}){\text{/}}{{(m_{1}^{2} + m_{2}^{2})}^{{1/2}}},$
где Mi – сравниваемые средние, mi – ошибки этих средних. Сложность здесь состоит в расчете числа степеней свободы для t-критерия:
$\nu = \frac{1}{{\frac{{{{u}^{2}}}}{{{{n}_{1}} - 1}} + \frac{{{{{(1 - u)}}^{2}}}}{{{{n}_{2}} - 1}}}},\quad u = \frac{{m_{1}^{2}}}{{m_{1}^{2} + m_{2}^{2}}},$
где ni – объемы сравниваемых выборок. Если объемы выборок одинаковы и равны n, то

$\nu = \frac{{n - 1}}{{2u(u - 1) + 1}}.$

Сравнивать можно средние многолетние показатели для делянок и вариантов, используя данные табл. 14 и 15. Для примера сравним средние многолетние урожайности для вариантов:

А – Контроль (NP)

$t = \frac{{\left| {23.25 - 28.17} \right|}}{{{{{({{{1.5}}^{2}} + {{2}^{2}})}}^{{1/2}}}}} = 1.968;$
$u = \frac{{{{{1.5}}^{2}}}}{{{{{1.5}}^{2}} + {{2}^{2}}}} = 0.36;$
$\nu = \frac{{22}}{{2 \times 0.36(0.36 - 1) + 1}} = 40.7;$
уровень значимости получился немного >0.05.

Б – Аналогично для вариантов Контроль и NP + Kx получаем t = 3.665, u = 0.317, ν = 38.8, уровень значимости <0.001.

В – Варианты NP и NP + Kx: t = 1.628, u = = 0.452, ν = 43.6; уровень значимости >0.10.

Может представить интерес сравнение средних не для всего срока наблюдения, а для отдельных его периодов (например, в начале, в середине, в конце имеющихся наблюдений). Так как имеются временны́е тренды урожайности, то возникает вопрос, какую надо взять длительность периода, по которой будут рассчитываться среднее и его ошибка? При этом среднее считается по модели тренда, а ошибка среднего как s/$\sqrt n $, где n – длительность выбранного периода, s – из табл. 15 [7]. Заранее предугадать длительность периода затруднительно, поэтому можно провести следующую процедуру: беря длительность периода в 2, 3, 4 и так далее лет, рассчитываем для них средние (по тренду) и ошибки средних. Сравнивая средние (для делянок или вариантов) по t-критерию, находим такую длину периода, где различия средних максимальны и возможно значимы.

Автор с благодарностью примет замечания к этому проекту.

Список литературы

  1. Фрид А.С. Обоснование методических подходов к анализу данных многолетних полевых опытов // Агрохимия. 2013. № 10. С. 75–96.

  2. Ваулин А.В. Определение достоверности средних многолетних показателей краткосрочных полевых опытов при обработке результатов исследований методом дисперсионного анализа // Агрохимия. 1998. № 12. С. 71–75.

  3. Фрид А.С., Надежкина Е.В., Караякова В.И. Влияние газопылевых выбросов предприятий промышленности на различные компоненты биогеоценоза серой лесной почвы лесостепной зоны // Агрохимия. 2007. № 2. С. 32–42.

  4. Доспехов Б.А. Методика полевого опыта (с основами статистической обработки результатов исследований). М.: Агропромиздат, 1985. 351 с.

  5. Благовещенский Ю.Н., Самсонова В.П., Дмитриев Е.А. Непараметрические методы в почвенных исследованиях. М.: Наука, 1987. 95 с.

  6. Дмитриев Е.А. Методы математической обработки материалов стационарных исследований // Принципы организации и методы стационарного изучения почв. М.: Наука, 1976. С. 302–412.

  7. Манелля А.И., Нагнибедова Н.Н., Френкель А.А., Ващуков Л.И. Динамика урожайности сельскохозяйственных культур в РСФСР. М.: Статистика, 1972. 192 с.

  8. Грановский В.А., Сирая Т.Н. Методы обработки экспериментальных данных при измерениях. Л.: Энергоатомиздат, 1990. 288 с.

  9. Алгоритмы и программы для ЭВМ СМ-4 / Сост.: В.А. Рожков, А.С. Фрид, А.Б. Бибернейт, П.А. Тимохин, И.Н. Голикова, С.А. Иваненко, Е.Н. Веселов, Е.П. Веселова. М.: Почвенный ин-т им. В.В. Докучаева, 1985. 108 с.

  10. Дмитриев E.А. Математическая статистика в почвоведении / Под ред. Ю.Н. Благовещенский. М.: Изд-во МГУ, 1995. 320 с.

Дополнительные материалы отсутствуют.