Геомагнетизм и аэрономия, 2021, T. 61, № 1, стр. 124-134

Использование функций связи при прогнозировании амплитуды Dst-индекса адаптивными методами

И. Н. Мягкова 1*, В. Р. Широкий 1, В. В. Калегаев 1, О. Г. Баринов 1, С. А. Доленко 1

1 Научно-исследовательский институт ядерной физики им. Д.В. Скобельцына Московского государственного университета им. М.В. Ломоносова (НИИЯФ МГУ)
г. Москва, Россия

* E-mail: irina@srd.sinp.msu.ru

Поступила в редакцию 02.03.2020
После доработки 14.05.2020
Принята к публикации 21.05.2020

Полный текст (PDF)

Аннотация

Исследуются возможности прогнозирования временнóго ряда геомагнитного индекса Dst при помощи искусственных нейронных сетей – классических многослойных персептронов, с использованием функций связи (coupling functions). Базовый прогноз осуществляется по параметрам солнечного ветра и межпланетного магнитного поля, измеренным в точке либрации L1 в эксперименте на космическом аппарате АСЕ. Показано, что наибольший вклад в улучшение качества прогноза вносят функции Bs и vBs, а также использование одновременно нескольких функций связи.

1. ВВЕДЕНИЕ

Прогнозирование магнитных бурь (геомагнитных возмущений) становится все более актуальным с развитием космических и других высоких технологий [Cole, 2003; Bothmer et al., 2007; Schrijver et al., 2015]. Причины практической потребности в возможно более точном и долгосрочном прогнозе геомагнитных возмущений достаточно очевидны – на Земле, особенно в высоких широтах, магнитные бури могут вызывать нарушения в работе телеграфных линий и радиосвязи, магистральных трубопроводов, линий электропередач и энергосетей [Лазутин, 2012]. Магнитные бури также опосредованно влияют на состояние околоземного космического пространства, поскольку после примерно половины магнитных бурь поток релятивистских электронов внешнего радиационного пояса Земли (РПЗ) возрастает на порядок и более [например, Kataoka et al., 2008; Мягкова и др., 2013 и ссылки там]. Быстрый и сильный рост потоков электронов внешнего РПЗ является серьезной проблемой для космической отрасли, поскольку экстремально высокие потоки электронов могут привести к сбоям в электронных микросхемах аппаратуры, находящейся на борту космических аппаратов, [например, Белов и др., 2004].

Геомагнитную активность принято характеризовать специальными индексами. Одним из наиболее распространенных геомагнитных индексов, характеризующих геомагнитную активность, является Dst-индекс (сокращение от Disturbance storm-time), введенный М.Сугиурой в 1964 году [Sugiura, 1964]. Dst-индекс является мерой изменения магнитосферного магнитного поля во внутренней магнитосфере [Newell et al., 2007], его прогнозированию посвящена данная работа.

Причиной, которая вызывает возмущения в магнитосфере Земли, в подавляющем большинстве случаев являются потоки ионизованных частиц от Солнца – так называемый солнечный ветер (СВ) [Akasofu et al., 1974]. Поэтому естественными выглядят попытки множества научных групп найти так называемые “функции связи” (в англоязычной литературе coupling functions) между параметрами межпланетного магнитного поля (ММП) и СВ и геомагнитными индексами.

Например, как хорошо известно, необходимым условием возникновения магнитных бурь на Земле является продолжительное (более 2 ч) наличие южной (отрицательной, т.е. Bz < 0) компоненты ММП. При отрицательном Bz магнитосфера Земли становится “открытой” для поступления в нее энергии солнечного ветра, например, [Feldstein et al., 2003]. Поэтому физический смысл функции связи Вs, где Bs = Bz при Bz < 0 и Bs = 0 при Bz > 0, вполне прозрачен.

В стационарном СВ Bz-компонента мала, поэтому магнитные бури связаны с возмущенными типами СВ. Источниками возмущений магнитосферы Земли являются корональные выбросы массы (КВМ), сопровождающие солнечные вспышки, которые достигают орбиты Земли, и высокоскоростные потоки солнечного ветра (ВСП СВ), например, [Ермолаев и др., 2009]. ВСП СВ играют основную роль в периоды минимумов солнечной активности, когда нет ни вспышек, ни, соответственно, КВМ. Вариации скорости СВ приводят к изменениям динамического воздействия на магнитосферу и являются вторым важным фактором развития геомагнитных возмущений. С учетом этого факта были введены дополнительные функции связи для скорости СВ (v): динамическое давление СВ (npv 2/2) и электрическое поле СВ (vBz) [Newell et al., 2007].

Геомагнитные индексы, и Dst-индекс в том числе, имеют долговременную историю наблюдения. Это дает возможность исследовать связь геомагнитной активности с процессами в межпланетном пространстве, солнечном ветре и магнитосфере Земли и строить модели прогноза Dst на основе наблюдаемых взаимосвязей [Lindsay et al., 1999; Pallochia et al., 2006; Patra et al., 2011; Podladchikova et al., 2012]. Большинство из названных работ основано на формуле Бартона (Burton) [Burton et al., 1975], которая связывает буревую депрессию магнитного поля во внутренней магнитосфере с электрическим полем солнечного ветра.

Альтернативным подходом к прогнозированию Dst-индекса является применение методов машинного обучения, в том числе искусственных нейронных сетей (ИНС) [Wu et al., 1997; Barkhatov et al., 2000; Stepanova et al., 2000; Revallo et al., 2014]. Сравнение качества прогнозирования разными моделями выполнено в работе [Amata et al., 2008].

Авторами данной работы – сотрудниками Лаборатории адаптивных методов обработки данных НИИЯФ МГУ в более ранних работах было показано, что лучшее качество прогноза Dst-индекса достигается при построении нейросетевой модели, использующей в качестве входных данных как историю Dst-индекса, так и параметры СВ (скорость) и ММП (компонента Bz) [Dolenko et al., 2005]. В относительно недавних работах лаборатории [Myagkova et al., 2017, Ефиторов и др., 2018] каждый пример содержал среднечасовые значения нескольких основных параметров СВ и ММП и значения самого прогнозируемого параметра – индекса Dst также за последние 24 ч, что позволило улучшить качество прогноза на 1…12 ч вперед. Использование такого подхода стало возможным только в последние годы, когда накопились достаточно длинные однородные временны́е ряды спутниковых измерений параметров СВ и ММП, полученные в экспериментах на космическом аппарате (КА) АСЕ. В работе [Ефиторов и др., 2018] было получено, что при прогнозировании амплитуды Dst-индекса при помощи ИНС двух разных типов – классических персептронов и рекуррентных сетей типа LSTM, а также комитетов прогнозирующих моделей, наилучшие результаты достигаются при использовании гетерогенных комитетов на основе ИНС обоих типов.

Отдельного упоминания заслуживает вопрос об отборе и преобразовании входных признаков задачи, который является весьма существенным. Популярный метод анализа главных компонент (ГК) при наличии существенного уровня шумов в данных (что справедливо и для рассматриваемой в данной работе задачи) неэффективен – комплект выделяемых ГК, даже если отобрать их по уровню 99% описанной дисперсии, теряет часть релевантной решаемой задаче информации, а нейронная сеть, на входы которой вместо исходных данных подаются значения отобранных ГК, демонстрирует более низкие качественные показатели прогноза, чем нейронная сеть, натренированная на исходных данных. Более убедительные результаты показывает метод частичных наименьших квадратов (метод проекций на латентные структуры) – согласованный анализ ГК в пространствах входных и выходных признаков задачи, например, [Мягкова и др., 2017, Efitorov et al., 2015]. Однако и этот метод машинного обучения, как правило, показывает результаты хуже, чем нейронная сеть в исходном пространстве входных признаков. Наиболее эффективными при нейросетевом моделировании, как правило, являются методы адаптивного отбора наиболее существенных признаков, а также методы преобразования признаков, основанные на переходе в пространство вейвлет-коэффициентов. В любом случае, выбор наиболее эффективных методов отбора и преобразования признаков – отдельное масштабное исследование, которое осознанно было оставлено за рамками настоящей работы, однако проведение которого применительно к рассматриваемой задаче планируется авторами в будущем.

В связи с тем, что наши предыдущие исследования показали, что прогнозирование с помощью ИНС типа многослойный персептрон дает лучшие или близкие по качеству прогнозирования результаты по сравнению с другими методами машинного обучения (рекуррентные нейронные сети, градиентный бустинг, случайный лес), в данной работе мы решили ограничиться использованием многослойных персептронов.

Целью данной работы является исследование возможности улучшения прогноза благодаря применению функций связи в качестве дополнительных входных параметров при обучении прогностических нейросетевых моделей. Несмотря на свойство универсальной аппроксимации, т.е. способность ИНС аппроксимировать любую нелинейную зависимость, прямая подача на входы ИНС физически оправданных нелинейных функций исходных физических признаков может упростить решаемую ИНС задачу аппроксимации и улучшить качество прогноза.

2. ИСТОЧНИКИ ДАННЫХ ПРОГНОЗИРОВАНИЯ Dst-ИНДЕКСА ПРИ ПОМОЩИ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ

При использовании данных измерений, полученных на космическом аппарате, в качестве входных данных для ИНС необходимо, чтобы осуществляющий измерения параметров СВ и ММП КА постоянно находился в одной и той же точке, неподвижной как относительно Земли, так и относительно Солнца. Это возможно при нахождении КА в так называемой точке Лагранжа L1 между Солнцем и Землей, на расстоянии около 1.5 млн. км от Земли. В настоящее время в этой точке, на гало-орбитах вокруг нее, находятся несколько КА, в том числе КА ACE (Advanced Composition Explorer – ACE), осуществляющий измерение и передачу на Землю в реальном времени параметров СВ и ММП. В своих исследованиях мы использовали данные с КА ACE. Такой выбор обусловлен достаточно высоким качеством данных, а также тем, что миссия КА ACE началась в 1997 г. и планируется к продлению до 2024 г.

Нами используются данные о параметрах СВ (скорость v и плотность протонов np) и ММП (компоненты ММП в системе GSM By, Bz и |B| – модуль ММП) с КА ACE, полученные при помощи приборов SWEPAM (Solar Wind Electron Proton Alpha Monitor) и MAG (http://www.srl.caltech.edu/ ACE/Browse Data), а также значения геомагнитного индекса Dst с сайта Мирового Центра данных в Киото (http://wdc.kugi.kyoto-u.ac.jp).

Следует отметить, что, как и в предыдущих исследованиях нашей группы [Myagkova et al., 2017, Ефиторов и др., 2018], для данной работы нами использовались не предобработанные и очищенные данные 2-го уровня (Level 2 Data), предназначенные для научных исследований, а оперативные данные (Browse Data). Так было сделано потому, что разрабатываемая авторами система прогнозирования Dst-индекса предназначена для работы в режиме онлайн, в котором качество получаемых данных соответствует оперативным данным, а данные Level 2 недоступны; поэтому машинное обучение следует проводить для работы с данными качества Browse Data. Кроме того, данные Level 2 имеют значительно большее число пропусков, что затрудняет применение методов машинного обучения, в особенности, принимая во внимание необходимость учета предыстории временнóго ряда путем подачи его предыдущих значений на вход прогнозирующего алгоритма [Farmer and Sidorowich, 1987]. В настоящей работе применялся учет предыдущих значений всех входных данных на глубину в 24 ч, то есть на вход алгоритма, помимо текущих значений 6 указанных выше физических входных величин, подавались их предыдущие значения, измеренные за 1, 2, 3, …, 23, 24 ч до текущего значения. Такая глубина учета предыстории представляется достаточной для работы с данными, имеющими часовое временнóе разрешение. Хотя это и приводит к 25-кратному увеличению размерности входных данных, которая в результате составила от 154 для базового комплекта входов без функций связи до 379 при одновременном использовании всех функций связи, это допустимо, т.к. количество примеров в тренировочном наборе данных составляло около 5600. Определение оптимальной глубины учета предыстории для каждой физической входной величины было оставлено за пределами настоящей работы, и планируется в будущем.

В данном исследовании был использован массив данных с ноября 1997 г. (со времени начала поступления данных с КА ACE) по декабрь 2019 года включительно. Массив был разбит на обучающую выборку и тестовый набор данных. Обучающая выборка использовалась для обучения алгоритма (подстройки настраиваемых параметров модели), тестовый набор – для независимой оценки результатов обучения. Обучающая выборка дополнительно разбивалась на тренировочный и валидационный наборы данных. Тренировочный набор использовался для подстройки весов при обучении ИНС, валидационный набор – для периодической проверки в процессе обучения с целью предотвращения переучивания. Для тренировочного и валидационного наборов использовались данные с ноября 1997 г. по декабрь 2016 года включительно, тренировочный и валидационный наборы делились случайным образом в соотношении 80% к 20%. Тестовый набор, который не предъявлялся сети при обучении, и на котором проверялось качество модели, составляли данные с 2017 по 2019 год. В данном исследовании итоговый прогноз является усредненным значением прогнозов пяти сетей с идентичной архитектурой (1 скрытый слой с 32 нейронами), отличавшихся лишь инициализацией весовых коэффициентов.

Следует отдельно отметить, что для данной архитектуры максимальное количество весов нейронной сети (при 379 входных признаках) составило (379 + 1) × 32 + (32 + 1) × 1 = 12 193, а количество примеров в тренировочном наборе – около 5600. При таком соотношении добиться эффективной работы нейронной сети на независимых данных без переучивания удается только благодаря использованию ранней остановки обучения по минимуму функционала ошибки на валидационном наборе данных и низкого значения скорости обучения. Понижение размерности входных данных путем отбора или преобразования входных признаков может привести к улучшению качества прогнозирования, однако эта часть работы осталась за рамками настоящей статьи.

3. МОДЕЛЬ ИНС ДЛЯ ПРОГНОЗИРОВАНИЯ Dst-ВАРИАЦИИ

Искусственная нейронная сеть (ИНС) – это математическая модель, а также ее программное или аппаратное воплощение, построенная по принципу организации и функционирования биологических нейронных сетей нервных клеток живого организма. Данный термин возник при изучении и попытке моделирования процессов, протекающих в мозге. В данной работе использовалась классическая архитектура – нейронные сети типа многослойный персептрон [Хайкин, 2006; Горбань, 1990; Bishop, 1995], обучаемые по алгоритму обратного распространения ошибки методом стохастического градиентного спуска.

Следует отметить, что в последнее время применение методов машинного обучения становится все более востребованным для решения задач в области космической погоды – см. сборник [“Machine learning techniques for space weather”, 2018].

4. ФУНКЦИИ СВЯЗИ ДЛЯ ПРОГНОЗИРОВАНИЯ Dst-ИНДЕКСА ПРИ ПОМОЩИ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ

При попытке улучшить нейросетевой прогноз амплитуды Dst-индекса в данной работе нами использовались функции связи, которые количественно описывают физические процессы, ответственные за динамику магнитосферы: сжатие магнитосферы солнечным ветром, магнитное пересоединение на магнитопаузе, крупномасштабную магнитосферную конвекцию и перенос энергии солнечного ветра через магнитопаузу.

В данном исследовании на входы ИНС, помимо стандартного набора параметров ММП (покомпонентно (By, Bz) и |B| – модуль ММП) и СВ (скорость СВ (v), плотность протонов (np)), а также значений самого Dst-индекса и информации о часе суток и сутках года, представленной в виде значений синуса и косинуса с суточным и годовым периодами, делающей привязку к определенной фазе цикла однозначной [Ефиторов и др., 2018] (базовый вариант модели), дополнительно подавались по одной функции связи (coupling functions). В выполненных численных экспериментах использовались следующие 8 функций связи, отобранные из набора, представленного в работе [Newell et al., 2007]. Кратко объясним их физический смысл:

p = npv2/2 – динамическое давление СВ (1)

Вs – южная компонента ММП, Bs = Bz (Bz < 0); Bs = 0 (Bz ≥ 0) (2)

vВ – электрическое поле солнечного ветра (3)

vВs – геоэффективная y-компонента электрического поля солнечного ветра в направлении “утро–вечер” (half-wave rectifier), параметр модели Бартона [Burton et al., 1975], описывающий интенсивность магнитосферной конвекции (4)

Е_KL = vBt sin2c/2), Bt = (By 2 + Bz2)1/2, θc = = arctg(By/Bz) электрическое поле из работы [Kan and Lee, 1979] (5)

Е_KLV = v 4/3Bt sin2c/2)p1/6 электрическое поле из работы [Vasyliunas et al., 1982] (6)

Е_KТ = n1/2v2Bt sin6c/2) электрическое поле из работы [Temerin and Li, 2006] (7)

dФMP/dt = v 4/3Bt2/3 sin8/3c/2) – магнитный поток через магнитопаузу [Newell et al., 2007] (8).

Отбор именно этих функций связи был выполнен исходя из значений коэффициента корреляции каждой функций связи с Dst-индексом. Были отобраны те функции, корреляции для которых составила не менее 1/e в интервале временнóго сдвига каждой из функций связи относительно Dst-индекса от 0 до 24 ч. К перечисленным выше восьми функциям в качестве девятой функции связи нами был добавлен логарифм давления солнечного ветра, показавший достаточно высокий коэффициент кореляции с Dst-индексом. Помимо этого, рассматривался вариант набора входных параметров, когда на вход нейронной сети подавались все 9 вышеперечисленных функций связи одновременно. Для выяснения вклада каждой из функций связи в прогноз, в качестве референсного результата (“точки отсчета”) использовался результат описанного выше базового варианта ИНС модели (без функций связи). Он был разработан нашей группой ранее – см., например, [Myagkova et al., 2017].

Важно понимать, что функции связи количественно описывают физические процессы, ответственные за динамику магнитосферы: сжатие магнитосферы солнечным ветром, магнитное пересоединение на магнитопаузе, крупномасштабную магнитосферную конвекцию и перенос энергии солнечного ветра через магнитопаузу. Эффективность использования конкретной функции связи при построении нейросетевой модели может позволить как улучшить качество прогнозирования Dst-индекса, так и сделать косвенные выводы о значимости физических процессов, описываемых данной функцией связи, в формировании состояния магнитосферы Земли.

5. РЕЗУЛЬТАТЫ

Прежде, чем перейти к изложению полученных результатов, опишем статистические показатели, изпользуемые в настоящей работе для численной оценки качества прогноза.

Среднеквадратичное отклонение (СКО) – квадратный корень из среднего по выборке квадрата отклонения значения прогноза от истинного значения прогнозируемой величины:

${\text{СКО}} = \sqrt {\frac{{\sum\limits_{i = 1}^N {{{{\left( {{{d}_{i}} - {{p}_{i}}} \right)}}^{2}}} }}{N}} ,$
где N – количество примеров в выборке, di – истинное значение прогнозируемой величины для i-го примера, pi – значение прогноза этой величины для i-го примера.

Коэффициент множественной детерминации R 2 сравнивает сумму квадратов отклонений значения прогноза оцениваемой модели от истинного значения прогнозируемой величины с аналогичной суммой для тривиальной модели, прелставлющей собой среднее по выборке значение прогнозируемой величины:

${{R}^{2}} = 1 - \frac{{\sum\limits_{i = 1}^N {{{{\left( {{{d}_{i}} - {{p}_{i}}} \right)}}^{2}}} }}{{\sum\limits_{i = 1}^N {{{{\left( {{{d}_{i}} - \bar {d}} \right)}}^{2}}} }},$

где $\bar {d}$ – среднее по выборке значение прогнозируемой величины, остальные обозначения – такие же, как в предыдущей формуле.

В отличие от СКО, имеющего размерность прогнозируемой величины и зависящего от нормировки и диапазона изменения данных, показатель R 2 – безразмерный и не зависит от нормировки, что позволяет ориентироваться на значение его величины при оценке качества самых разных моделей. Так, R 2 = 1 соответствует модели, прогноз которой дает нулевую погрешность для всех примеров выборки, а R 2 = 0 – модели, качество прогноза которой столь же низкое, как и у тривиальной модели – среднего по выборке. При R 2 < 0 модель следует отбросить как непригодную; для практического использования, как правило, пригодны модели с R 2 не менее 0.7.

На рисунке 1 показан прирост коэффициента множественной детерминации R 2 относительно базовой модели для моделей, на вход которых добавлены по одной разные функции связи, и для моделей, на вход которых добавлены все 9 перечисленных выше функций связи сразу. Рассматриваемые модели предназначены для прогнозирования Dst-индекса с разными горизонтами прогноза (результаты для разных горизонтов показаны разной штриховкой). R 2 рассчитан на независимых данных – с января 2017 по декабрь 2019 г.

Рис. 1.

Прирост коэффициента множественной детерминации R2 на тестовом наборе данных относительно базовой модели для моделей с разными функциями связи, предназначенными для прогнозирования Dst-индекса. Цифрами в скобках над шкалой Х указан номер функции связи.

Из рисунка 1 хорошо видно, что как добавочные одиночные функции на всех горизонтах лучше всех сработали Вs и vВs, а максимальный прирост дает одновременное дополнительное применение всех рассматриваемых функций связи (группа dst_base + all_cf). ИНС с дополнительными входами Вs и vВs в дальнейшем выбраны нами для демонстрационных примеров прогнозирования на событиях из тестового набора данных.

Из рисунка 1 также видно, что более существенное улучшение наблюдается для горизонта 6 ч – оно максимально везде, кроме динамического давления СВ, его логарифма и электрического поля СВ. Для трех оставшихся функций связи – Е_KL, Е_KLV и Е_KТ улучшение наблюдается для 6 и 3 ч, хотя для 3 оно существенно меньше. В целом же следует констатировать, что увеличение R 2 даже при применении всех функций связи одновременно относительно невелико. Можно предположить, что полученный эффект связан с тем, что функции связи лучше работают во время событий, то есть магнитных бурь, когда амплитуда Dst-индекса достаточно велика, но доля таких данных в тестовом наборе, с 2017 по 2019 год включительно, относительно мала.

Уровень качества базовой ИНС модели прогнозирования Dst-индекса с горизонтом от 1 до 6 ч можно оценить, исходя из значений коэффициента множественной детерминации R 2 и среднеквадратичного отклонения (СКО), рассчитанных на экзаменационном наборе, которые представлены на рис. 2. Из приведенной гистограммы видно, что с увеличением горизонта R 2 ожидаемо постепенно спадает – от 0.951 для горизонта 1 ч до 0.681 для шести ч, а СКО растет – от 2.23 нТл до 5.22 нТл. Само по себе такое ухудшение статистик не является критичным, но, как известно из более ранних работ, на больших горизонтах существенную роль начинает играть эффект запаздывания.

Рис. 2.

Значения коэффициента множественной детерминации и среднеквадратичного отклонения (СКО) на тестовом наборе данных как показателей качества прогнозирования Dst-индекса при помощи базовой нейросетевой модели в сравнении с тривиальным прогнозом.

Следует отметить, что в пространствах высокой размерности имеет место эффект концентрации меры, в соответствии с которым почти весь объем многомерого тела находится в малой окрестности границы тела. Этот эффект имеет несколько интересных следствий, одно из которых состоит в том, что малая окрестность медианного уровня любой функции, непрерывной на многомерной сфере, содержит почти всю сферу. Поэтому с точки зрения наблюдателя, измеряющего значения такой функции, она представляется практически постоянной [Зорич, 2014]. Иными словами, любой нелинейный многомерный предиктор должен давать прогноз, близкий к тривиальному (инерционному), смысл которого в контексте прогнозирования временны́х рядов – равенство прогнозируемого значения последнему известному значению прогнозируемого временнóго ряда. Ясно, что практическая ценность такого тривиального прогноза равна нулю, поэтому любой прогноз в пространствах высокой размерности следует сравнивать по его статистическим показателям с тривиальным. На рисунке 2 это сделано для статистических показателей базовой нейросетевой модели. Видно, что с увеличением горизонта прогноза преимущество нейросетевого прогноза над тривиальным возрастает. При этом есть основания ожидать, что с уменьшением размерности пространства входных признаков и связанным с этим ослаблением эффекта концентрации меры это преимущество может дополнительно увеличиться.

С целью сравнения работы прогностических моделей с разными дополнительными функциями связи для разных горизонтов прогноза на рис. 3 приведены прогнозы на 1 ч (а) и 3 ч (б) за период с 24 по 29 августа 2018 года включительно. Измеренное значение Dst-индекса на рис. 3 показано толстой серой сплошной линией, базовый ИНС прогноз при помощи среднего по 5 идентичным сетям – тонкой сплошной черной линией с кружочками, базовый прогноз с добавлением Bs – тонкой черной штриховой линией с косыми крестами, базовый прогноз с добавлением vBs – темно-серой линией с квадратами с прямыми крестами внутри. Данный период времени был выбран для примера, поскольку 25–26 августа наблюдалась самая сильная геомагнитная буря за период тестового набора данных – январь 2017–декабрь 2019. Максимальная амплитуда Dst-индекса составила 175 нТл. Причиной данной магнитной бури стал КВМ, достигший орбиты Земли. Уже при визуальном анализе можно сказать, что положительный вклад функций связи невелик, и разница при добавлении Bs или vBs мала. Также очевидно, что качество прогноза ухудшается с ростом горизонта, усиливается эффект запаздывания.

Рис. 3.

Пример прогнозирования значения Dst-индекса в период сильной магнитной бури в период с 24 августа по 29 августа 2018 г. включительно на один и три часа с использованием функций связи Вs и vBs и сравнение с базовой моделью и результатами измерений. 1 – измеренные значения, 2 – прогноз модели, построенной на базовом наборе входных признаков, 3 – с добавление функции связи Bs, 4 – с добавлением функции связи vBs.

Для примера прогнозирования бури с более сложным профилем на рис. 4 и 5 приведены прогнозы ИНС, обучавшихся с добавлением Bs и vBs на вход, для умеренной бури 9–16 сентября 2018 г. включительно, вызванной приходом к Земле высокоскоростного потока СВ. На рис. 4а и 4б изображен прогноз на 1 и 2 ч соответственно, на рис. 5а и 5б – на 3 и 4 ч. Видно, что даже сложный профиль главной фазы хорошо прогнозируется для горизонта 1 ч, за исключением недопрогноза на несколько нТл в максимуме. Также прогноз достаточно хорош для 2 ч, хотя несовпадений в мелких деталях, которые, к сожалению не исправило добавление Bs или vBs, становится больше, по сравнению с горизонтом 1 ч. Для горизонта 3 ч качество прогноза этой конкретной магнитной бури остается еще приемлемым, а для 4 ч, несмотря на R 2 = 0.771, прогноз уже заметно ухудшается.

Рис. 4.

То же для умеренной бури с 9 по 16 сентября 2018 г. включительно для горизонтов 1 и 2 ч.

Рис. 5.

То же для умеренной бури с 9 по 16 сентября 2018 г. включительно для горизонтов 3 и 4 ч.

6. ЗАКЛЮЧЕНИЕ

В настоящей работе исследована возможность улучшения результатов прогнозирования амплитуды Dst-индекса по параметрам солнечного ветра и межпланетного магнитного поля, измеренным в эксперименте на КА АСЕ, и значениям самого Dst-индекса, при помощи искусственных нейронных сетей типа многослойный персептрон, благодаря использованию функций связи (coupling functions) в качестве дополнительных входных признаков. Показано, что нейросетевые модели позволяют с приемлемой точностью прогнозировать значения Dst-индекса на несколько часов вперед. При этом наибольший вклад в улучшение качества прогноза вносят функции Bs и vBs, а также использование одновременно нескольких функций связи. Горизонт хорошей точности прогноза на независимых данных составляет при этом 2 ч, удовлетворительной точности – 3 ч, минимально приемлемой точности – 6 ч.

В процессе настройки (обучения) нейросетевые модели формируют из входных признаков путем их нелинейного преобразования некоторые композитные признаки, наиболее релевантные решаемой задаче. Полученные результаты свидетельствуют о том, что приямое использование по крайней мере некоторых из функций связи, которые представляют собой физически обоснованные нелинейные функции преобразования входных признаков, позволяет упростить процесс настройки нейросетевой модели, и повысить качество аппроксимации, которое она обеспечивает.

Хотя полученное улучшение качества прогноза невелико, оно открывает перспективу дальнейших исследований в этом направлении. Негативный эффект увеличения входной размерности задачи, возникающий при добавлении функций связи к числу входных признаков, может быть частично скомпенсирован. В частности, планируется для каждой из сетей осуществить работы по определению оптимального способа понижения размерности входных данных путем отбора и преобразования входных признаков. Одним из аспектов отбора может являеться определение оптимальной глубины учета предыстории для каждой физической входной переменной рассматриваемой задачи. Ожидается, что при одновременном использовании функций связи и понижения входной размерности удастся добиться более существенного увеличения качества прогноза Dst-индекса.

Список литературы

  1. Белов А.В., Виллорези Дж., Дорман Л.И., Ерошенко Е.А., Левитин А.Е., Паризи М., Птицына Н.Г., Тясто М.И., Чиженков В.А., Юччи Н., Янке В.Г. Влияние космической среды на функционирование искусственных спутников Земли // Геомагнетизм и аэрономия. Т. 44. № 4. С. 502–510. 2004.

  2. Горбань А.Н. Обучение нейронных сетей. М.: СП “ПараГраф”, 159 с. 1990.

  3. Ермолаев Ю.И., Ермолаев М.Ю. Солнечные и межпланетные источники геомагнитных бурь: Аспекты космической погоды // Геофизические процессы и биосфера. Т. 8. № 1. С. 5–35. 2009.

  4. Ефиторов А.О., Мягкова И.Н., Широкий В.Р., Доленко С.А. Прогнозирование Dst-индекса, основанное на методах машинного обучения // Космич. исслед. Т. 56. № 6. С. 353–364. 2018.

  5. Зорич В.А. Многомерная геометрия, функции очень многих переменных и вероятность // Теория вероятностей и ее применения. Т. 59. Вып. 3. С. 436–451. 2014.

  6. Лазутин Л.Л. Мировые и полярные магнитные бури. М.: МГУ, 214 с. 2012.

  7. Мягкова И.Н., Шугай Ю.С., Веселовский И.С., Яковчук О.С. Сравнительный анализ влияния рекуррентных высокоскоростных потоков солнечного ветра на радиационное состояние околоземного космического пространства в апреле-июле 2010 г. // Астрон. вестн. Т. 47. № 2. С. 141–155. 2013.

  8. Мягкова И.Н., Доленко С.А., Ефиторов А.О. и др. Прогнозирование потока релятивистских электронов внешнего радиационного пояса Земли на геостационарной орбите с помощью адаптивных методов // Геомагнетизм и аэрономия. Т. 57. № 1. С. 10–18. 2017.

  9. Хайкин С. Нейронные сети: полный курс. М.: Вильямс, 1104 с. 2006.

  10. Akasofu S.-I., Chapman S. Solar-Terrestrial Physics. Oxford: Clarendon Press, 889 p. 1972.

  11. Amata E., Pallocchia G., Consolini G., Marcucci M.F., Bertello I. Comparison between three algorithms for Dst predictions over the 2003–2005 period // J. Atmos. Sol-Terr. Phys. V. 70. P. 496–502. 2008.

  12. Barkhatov N.A., Bellustin N.S., Levitin A.E., Sakharov S.Y. Comparison of efficiency of artificial neural networks for forecasting the geomagnetic activity index Dst // Radiophysics and Quantum Electronics. V. 43. № 5. P. 347–355. 2000.

  13. Bishop C.M. Neural networks for pattern recognition. Oxford: Clarendon press, 482 p. 1996.

  14. Bothmer V., Daglis I.A. Space weather- physics and effects. Berlin: Springer, 438 p. 2007. https://doi.org/10.1007/978-3-540-34578-7

  15. Burton R.K., McPherron R.L., Russel C.T. An empirical relationship between interplanetary conditions and Dst // J. Geophys. Res. V. 80. P. 4204–4214. 1975.

  16. Cole D.G. Space weather: Its effects and predictability // Space Sci. Rev. V. 107. P. 295–302. 2003.

  17. Dolenko S.A., Yu.V. Orlov I.G. Persiantsev, Shugai Ju.S. Neural network algorithm for events forecasting and its application to space physics data // Lecture Notes in Computer Science. V. 3697. P. 527–532. 2005.

  18. Efitorov A.O., Burikov S.A., Dolenko T.A. et al. Comparison of the quality of solving the inverse problems of spectroscopy of multi-component solutions with neural network methods and with the method of projection to latent structures. Optical Memory and Neural Networks (Information Optics). V. 24. № 2. P. 93–101. 2015.

  19. Farmer J.D., Sidorowich J.J. Predicting Chaotic Time Series // Phys. Rev. Lett. V. 59. № 8. P. 845–848. 1987.

  20. Feldstein Y.I., Dremukhina L.A., Levitin A.E., Mall U., Alexeev I.I., Kalegaev V.V. Energetics of the magnetosphere during the magnetic storm // Sol-Terr. Phys. V. 65. № 4. P. 429–446. 2003.

  21. Kan J.R., Lee L.C. Energy coupling and the solar wind dynamo // Geophys. Res. Lett., V. 6. P. 577–580. 1979

  22. Kataoka R., Miyoshi Y. Average profiles of the solar wind and outer radiation belt during the extreme flux enhancement of relativistic electrons at geosynchronous orbit // Ann. Geophys. V. 26. P. 1335–1339. 2008.

  23. Lindsay G.M., Russell C.T., Luhmann J.G. Predictability of Dst index based upon solar wind conditions monitored inside 1 AU // J. Geophys. Res. V. 104. P. A510,335–10,344. 1999.

  24. Myagkova I., Shiroky V., Dolenko S. Prediction of geomagnetic indexes with the help of artificial neural networks. E3S Web of Conferences, 20:art.02011. 2017. https://doi.org/10.1051/e3sconf/20172002011

  25. Newell P.T., Sotirelis T., Liou K., Meng C.-I., Rich F.J. A nearly universal solar wind-magnetosphere coupling function inferred from 10 magnetospheric state variables // J. Geophys. Res. V. 112. P. A01206. 2007. https://doi.org/10.1029/2006JA012015

  26. Pallochia G., Amata E., Consolini G., Marcucci M.F., Bertello I. Geomagnetic Dst index forecast based on IMF data only. // Ann. Geophys. V. 24. P. 989–999. 2006.

  27. Patra S., Spencer E., Horton W., Sojka J. Study of Dst/ring current recovery times using the WINDMI model // J. Geophys. Res. V. 116. P. A02212. 2011. https://doi.org/10.1029/2010JA015824

  28. Podladchikova T.V., Petrukovich A.A. Extended geomagnetic storm forecast ahead of available solar wind measurements // Space Weather: The International Journal of Research and Applications. V. 10. CiteID S07001. 2012. https://doi.org/10.1029/2012SW000786

  29. Revallo M., Valach F., Hejda P., Bochníčeket J. Modeling of CME and CIR driven geomagnetic storms by means of artificial neural networks // Contributions to Geophysics and Geodesy. V. 45. № 1. P. 53–65. 2015.

  30. Schrijver C.J., Kauristie K., Aylward A.D. et al. Understanding space weather to shield society: A global road map 772 for 2015–2025 commissioned by COSPAR and ILWS // Adv. Space Res. V. 55. P. 2745–2807. 2015.

  31. Stepanova M.V., Perez P. Autoprediction of Dst index using neural network techniques and relationship to the auroral geomagnetic indices // Geofisica Intern. V. 39. № 1. P. 143–146. 2000.

  32. Sugiura M. Hourly values of equatorial Dst for the IGY // Ann. Int. Geophys. Year. V. 35. P. 9–45. Oxford: Pergamon Press, 1964.

  33. Temerin M., Li X. Dst model for 1995–2002 // J. Geophys.Res. V. 111. P. A04221. 2006. https://doi.org/10.1029/2005JA011257

  34. Vasyliunas V.M., Kan J.R., Siscoe G.L., Akasofu S.-I. Scaling relations governing magnetospheric energy transfer // Planet. Space Sci. V. 30. P. 359–365. 1982.

  35. Wu J.-G., Lundstedt H. Geomagnetic storm predictions from solar wind data with the use of dynamic neural networks // J. Geophys. Res. V. 102. P. A714,255–14,268. 1997.

  36. − Machine Learning Techniques for space weather. Ed. by Camporeale E., Wing S., Johnson J.R. Elsevier Inc. 454 p. 2018. https://doi.org/10.1016/C2016-0-01976-9

Дополнительные материалы отсутствуют.