Геомагнетизм и аэрономия, 2023, T. 63, № 2, стр. 247-256

Прогнозирование функциональной зависимости числа солнечных пятен в цикле солнечной активности на основе ИНС Элмана

И. В. Крашенинников 1*, С. О. Чумаков 1

1 Институт земного магнетизма, ионосферы и распространения радиоволн им. Н.В. Пушкова РАН (ИЗМИРАН)
Москва, Троицк, Россия

* E-mail: krash@izmiran.ru

Поступила в редакцию 28.10.2022
После доработки 27.11.2022
Принята к публикации 28.11.2022

Полный текст (PDF)

Аннотация

Анализируется возможность прогнозирования функции временнóй зависимости числа солнечных пятен (SSN) в цикле солнечной активности на основе применения платформы искусственной нейронной сети Элмана к историческому ряду данных наблюдений. Предложен метод нормализации исходных данных для предварительного обучения алгоритма ИНС, в котором строится последовательность виртуальных идеализированных циклов, используя масштабируемые коэффициенты по длительности и значения максимумов в солнечных циклах. Корректность метода анализируется в численном эксперименте, основанном на моделировании временнóго ряда солнечных пятен. Оценены интервалы изменения адаптируемых параметров в работе ИНС и предложен математический критерий для выбора решения. Характерным свойством построенной функциональной зависимости в цикле числа солнечных пятен является значительная асимметрия ее восходящей и спадающей ветвей. Представлен прогноз временнóго хода на текущий 25-й цикл солнечной активности и обсуждается его корректность в сравнении с другими результатами прогнозирования и имеющимися данными обсерваторских наблюдений.

1. ВВЕДЕНИЕ

Долгосрочный прогноз солнечной активности является одним из важнейших факторов космической погоды [Bothmer and Daglis, 2007]. Как ключевой управляющий фактор, прогнозные данные солнечной активности (СА) в виде числа солнечных пятен (solar sunspot number – SSN) и потока солнечного радиоизлучения (solar radioflux – F10.7), входят в прогностические ионосферные модели, на основе которых, в частности, осуществляется долгосрочное планирование работы ионосферных радиокоммуникационных систем. Традиционно требуемый долгосрочный прогноз солнечной активности для условий прохождения радиоволн охватывает временнóй интервал от одного месяца до 2‒3 лет вперед. Наиболее известной его реализацией являются экстраполяционные методы, в частности, метод Вальдмайера [Bondar et al., 1995] и его современные версии (например, Combined Method [Podladchikova and Van der Linden, 2012]), используемые как официальный прогноз в мировом центре солнечных данных – SIDC (Solar Influences Data Analysis Center, Brussel). На рис. 1 в верхней части левой панели приведен пример применения данного подхода в ноябре 2019 г. к сглаженным среднемесячным данным числа пятен – Rm (представлены кривыми) и видно существенное расхождение с апостериорными экспериментальными данными (полые треугольники). В частности, прогнозируемый минимум СА для пятен (начало 25-го цикла) смещен примерно на один год вперед от его фактического значения (начало 2020 г.). И соответственно смещается максимум, который по прогнозу приходится на 2022 г. Однако, еще более непростая ситуация с другим индикатором СА – потоком радиоизлучения F10.7. Как видно из рис. 1 (нижняя часть левой панели), прогнозные значения F10.7 в системе контроля космической погоды SWPC (Space Weather Prediction Center, Boulder), по-видимому, единственном источнике долгосрочной прогнозной информации по солнечному радиоизлучению, уходят ниже минимально возможной величины для данного параметра. И, более того, отсутствует какая-либо видимая корреляция в поведении этих двух индикаторов одного процесса – вариаций СА (рис. 1, верхняя и нижние части левой панели). Т.е. традиционные методы прогнозирования могут в сложных ситуациях давать совершенно некорректные результаты.

Рис. 1.

Прогноз параметров солнечной активности (среднемесячные данные): традиционный подход (3 года) на ноябрь 2019 г. (левая панель) и с переходом на полный цикл на январь 2021 г. (правая панель). Полыми треугольниками отмечены экспериментальные данные.

Квазипериодический характер временнóй зависимости числа солнечных пятен дает возможность применить различные математические методы выделения базовой закономерности, как основы прогнозирования, в данных наблюдений. В частности, это может быть метод искусственной нейронной сети (ИНС) в анализе временны́х рядов данных. Первые попытки применения ИНС к долгосрочному прогнозированию солнечной активности были рассмотрены в работе [Macpherson, 1993]; в дальнейшем данный подход получил развитие в ряде работ (обзор в Pesnell, 2012) и активно развивается в настоящее время, например, [Бархатов и др., 2001; Pala and Atici, 2019; Benson et al., 2020], и может рассматриваться как применение элементов искусственного интеллекта в поиске скрытой закономерности во временнóм ряде экспериментальных данных. Другим направлением решения данной задачи является нелинейный динамический анализ в хаосе, например, работы [Sello, 2001; Sarp et al., 2018]. Также следует отметить исследования по возможности прогнозирования максимума SSN в цикле на основе прекурсоров в предыдущем цикле (циклах), в частности, основываясь на интенсивности геомагнитных возмущений [Thompson, 1993; Hathaway and Wilson, 2006; Wang and Sheeley, 2009] в данных дневного Ap-индекса.

С 2021 г. SWPC переходит на другую основу в долгосрочном прогнозировании солнечной активности (рис. 1, правая панель), по-видимому, опираясь на результаты применения нейросетевого подхода к целому циклу СА, как базовому объекту в данных временнóй периодической последовательности наблюдений.

В настоящей работе, на основе платформы рекуррентной ИНС, рассматривается возможность долгосрочного прогнозирования на масштабе цикла солнечной активности временнóй функции SSN, используя технологию нормализации исходного временнóго ряда данных. Оценивается эффективность предлагаемого метода прогнозирования на примере предыдущих четырех циклов солнечной активности, с 21-го по 24-й, и строится прогноз на текущий 25-й цикл.

2. ИНС ЭЛМАНА

В настоящее время существует более 20 платформ реализаций общей методологии ИНС для различных приложений. В применении к временны́м рядам данных часто используются рекуррентные нейронные сети (recurrent networks), характеризующиеся как прямым (feed forward), так и обратным (feed back) распространением информации и наличием обратных связей, по которым передаются результаты обработки сетью данных на предыдущем этапе. В результате этого входом рекуррентной нейронной сети в каждый фиксированный момент времени является вектор входных данных и результаты обработки информации сетью на предыдущем этапе. Обучение таких сетей базируется на алгоритме обратного распространения ошибки [Головко, 2001; Головко и Краснопрошин, 2017]. Так же, для задач предсказания временны́х рядов применяются алгоритмы глубокого (глубинного) обучения (deep learning) для многослойных персептронов прямого распространения, например, [Fessant et al., 1996; Pala and Atici, 2019].

В данной работе, как и в работе [Бархатов и др., 2001], использовалась рекуррентная нейронная сеть Элмана [Elman, 1990], разработанная для выявления внутренних закономерностей (структур) во временны́х рядах данных. Квазипериодическая структура солнечных данных является подходящей кандидатурой для такой платформы. Общая схема такой ИНС приведена на рис. 2. Рекуррентными нейронными сетями называются конфигурации, в которых выходы нейронных элементов последующих слоев имеют синаптические соединения (связи) с нейронами предшествующих слоев. Это приводит к возможности создания моделей ИНС, обладающих памятью, т.е. возможностью запоминать процесс. Т.о. строится ИНС, ответ которой зависит не только от входного сигнала, подаваемого в данный момент на вход ИНС, но и от тех сигналов, которые обрабатывались нейросетью в предшествующие моменты времени. Такая ИНС обладает нелинейной внутренней памятью, заключенной в петле обратной связи, что позволяет накапливать и использовать информацию о предыстории процесса. Рекуррентные сети могут использоваться как для решения задач прогнозирования, так и управления [Головко, 2001; Головко и Краснопрошин, 2017]. Временны́е ряды индексов солнечной активности представляют собой квазипериодические процессы, и, следовательно, для выделения главной части процесса и последующей экстраполяции на будущее необходима внутренняя память.

Рис. 2.

ИНС Элмана – рекуррентная сеть с обратными связями от нейронов скрытого слоя.

В ИНС Элмана выходы нейронных элементов промежуточного (скрытого или внутреннего) слоя соединяются с нейронами контекстного слоя, выходы которых снова подаются на входы нейронов внутреннего слоя. И т.о., нейроны скрытого слоя имеют помимо синаптических связей с нейронами входного слоя также и обратные связи с контекстными нейронами. Число нейронов скрытого слоя, как правило, совпадает с числом нейронов контекстного слоя. Тогда взвешенная сумма i-го нейронного элемента промежуточного слоя [Головко, 2001; Головко и Краснопрошин, 2017]:

(1)
${{S}_{i}}(t) = \sum\limits_{j{\kern 1pt} = {\kern 1pt} 1}^n {{{w}_{{ji}}}{{x}_{j}}(t)} + \sum\limits_{k{\kern 1pt} = {\kern 1pt} 1}^m {{{w}_{{ki}}}{{c}_{k}}(t - 1)} - {{T}_{i}},$
где n – число нейронов входного слоя или размерность вектора входных данных xj(t), wji – весовой коэффициент между j-м нейроном входного и i-м нейроном промежуточного слоев (его величина определяет силу синоптической связи между соответствующими нейронами); m – число нейронов промежуточного слоя, wki – весовой коэффициент между k-м контекстным нейроном и i-м нейроном промежуточного слоя, ck(t – 1) выходное значение k-го нейрона внутреннего (промежуточного или скрытого) слоя на предыдущем шаге вычисления его значения, которое сохраняется в k-ом контекстном нейроне; Ti – пороговое значение i-го нейронного элемента промежуточного слоя. Выходное значение i-го нейрона промежуточного слоя определяется следующим образом:
${{c}_{i}}(t) = F({{S}_{i}}(t)),$
где в качестве функции нелинейного преобразования F (или функции активации нейронов скрытого слоя) обычно используется гиперболический тангенс или сигмоидная функция. Применение обеих функций анализировалось в процессе численного моделирования и, в конечном счете, была выбрана функция гиперболического тангенса. В выходном слое сеть имеет один нейрон с линейной функцией активации, т.е. значением выходного нейрона является линейная комбинация значений нейронов скрытого слоя:
(2)
$y(t) = \sum\limits_{k{\kern 1pt} = {\kern 1pt} 1}^m {{{\nu }_{k}}{{c}_{k}}} (t) - T,$
где νk – весовой коэффициент между k-м нейроном скрытого слоя и выходным нейроном, ck(t) выходное значение k-го нейрона скрытого слоя, T – пороговое значение нейрона выходного слоя. Для обучения рекуррентной нейронной сети применяется алгоритм обратного распространения ошибки [Головко, 2001; Головко и Краснопрошин, 2017].

Общими моментами работы ИНС, помимо выбора рабочей платформы в применении к конкретной задаче, являются следующие необходимые этапы:

– подбор топологии нейронной сети (выбор оптимального соотношения чисел нейронов в каждом слое);

– нормализация исходных данных под выбранную нейросеть;

– обучение ИНС при помощи алгоритма обратного распространения ошибки;

– экспериментальный подбор управляющих параметров;

– тестирование на модельных задачах и реальных данных с известным результатом.

Следует отметить, что процесс обучения ИНС является итерационной процедурой нахождения глобального или приемлемого локального минимума целевой функции в многомерном пространстве весовых коэффициентов: wji, wki, νk, Ti, T (формулы (1), (2)) для всего набора тренировочных данных. Целевой функцией в данном случае является сумма квадратов отклонений значений SSN(t) от оценочных результатов y(t) на всем наборе тренировочных данных.

Топология нейросети была выбрана, как и в [Бархатов и др., 2001] в следующей конфигурации: число нейронов входного слоя равнялось 6, число нейронов скрытого слоя и число контекстных нейронов равнялось 10, выходной слой состоял из единственного нейрона с линейной функцией активации. Это означает, что для прогнозирования индекса Rm – значения сглаженного числа солнечных пятен на данный момент необходимо подать на вход обученной ИНС значения этого индекса за 6 предыдущих временны́х интервалов. Методика нормализации исходных данных и тестирование алгоритма рассмотрены в ходе численного моделирования и далее применены к реальным данным. Здесь отметим только, что в данной работе под нормализацией данных понимается не стандартная нормировка данных в теории ИНС, когда весь временнóй ряд, предназначенный для обучения ИНС, нормируется на единственный нормировочный коэффициент, а локальная нормировка при которой данные чисел солнечных пятен в каждом отдельном цикле солнечной активности (СА) нормировались на соответствующий максимум этого солнечного цикла, и в результате в каждом отдельном солнечном цикле максимум нормализованных значений SSN равнялся единице.

3. ЧИСЛЕННОЕ МОДЕЛИРОВАНИЕ

Особенностью нейросетевого подхода к прогнозированию временны́х рядов является проблема устойчивости построения решения – нахождения глобального или приемлемого локального минимума целевой функции в итерационном процессе обучения ИНС. Как правило, не удается выбрать постоянные управляющие параметры ИНС в итерационном процессе обучения в различных условиях (на различных временны́х интервалах) реальных данных или построить аналитическую адаптивную процедуру их подбора. Для сети Элмана такими параметрами являются скорость и инерция (момент) обучения в итерационном процессе поиска решения [Головко, 2001; Головко и Краснопрошин, 2017], интервалы изменения которых можно оценить в процессе численного моделирования для конкретной задачи. Для модельных задач в численных экспериментах с выбранной моделью ИНС в качестве базовой функции формирования цикла солнечной активности использовалось следующее представление

(3)
$\begin{gathered} {{R}_{m}}(t) = \\ = \left\{ \begin{gathered} {{{{A}_{0}}} \mathord{\left/ {\vphantom {{{{A}_{0}}} 2}} \right. \kern-0em} 2}\left( {1 + \sin \left( {\frac{{\pi t}}{{{{T}_{1}}}} - \frac{\pi }{2}} \right)} \right),\,\,\,\,{{T}_{1}} \geqslant t \geqslant 0 \hfill \\ {{{{A}_{0}}} \mathord{\left/ {\vphantom {{{{A}_{0}}} 2}} \right. \kern-0em} 2}\left( {1 + \sin \left( { - \frac{{\pi (t - {{T}_{1}})}}{{{{T}_{2}}}} + \frac{\pi }{2}} \right)} \right),\,\,\,\,{{T}_{2}} \geqslant t \geqslant {{T}_{1}} \hfill \\ \end{gathered} \right\}, \\ \end{gathered} $
где ${{T}_{1}}$ и ${{T}_{2}}$ – длительности восходящей и спадающей ветвей в цикле (${{T}_{1}} \leqslant {{T}_{2}}$), ${{T}_{0}} = {{T}_{1}} + {{T}_{2}}$ – длительность всего цикла, ${{A}_{0}}$ – амплитуда индекса в цикле. Параметры ${{A}_{0}}$ и ${{T}_{0}}$ модулировались псевдослучайной последовательностью с ${{\delta {{A}_{0}}} \mathord{\left/ {\vphantom {{\delta {{A}_{0}}} {{{A}_{0}}}}} \right. \kern-0em} {{{A}_{0}}}}\sim 0.5,$ ${{\delta T} \mathord{\left/ {\vphantom {{\delta T} {{{T}_{0}}}}} \right. \kern-0em} {{{T}_{0}}}}\sim 0.1$ и сохранением соотношения ${{{{T}_{1}}} \mathord{\left/ {\vphantom {{{{T}_{1}}} {{{T}_{2}}}}} \right. \kern-0em} {{{T}_{2}}}} \sim 0.5$ для каждого цикла. Выбор параметров достаточно близок к усредненным значениям циклической последовательности SSN [Hathaway, 2015; Willamo et al., 2020], с интегральным коэффициентом асимметрии $\gamma \simeq 0.35,$ что близко к приведенному в [Willamo et al., 2020] значению для Солнца $\gamma \simeq 0.39.$ Пример временнóго ряда синтезированной последовательности циклов, моделирующей исторический ряд данных СА, представлен на рис. 3 (верхняя часть верхней панели), на которой различимы вариации амплитуды, длительности циклов и асимметрия функциональной зависимости индекса. Несмотря на достаточно высокую степень идеализации циклической последовательности исходных данных, прямое применение ИНС к прогнозированию конкретного цикла имеет довольно низкую устойчивость результата, который зачастую просто некорректен с точки зрения цикличности процесса с близким к нулю минимумом. На этапе нормализации исходных данных под ИНС был разработан метод введения абстрагированного представления цикла, имеющего единичную амплитуду и стандартную длительность в 132 условных единицы (месяца). Т.е., для каждого цикла вводились коэффициенты трансформации: ${1 \mathord{\left/ {\vphantom {1 {A_{0}^{i}}}} \right. \kern-0em} {A_{0}^{i}}}$ и ${{{{T}_{N}}} \mathord{\left/ {\vphantom {{{{T}_{N}}} {T_{0}^{i}}}} \right. \kern-0em} {T_{0}^{i}}},$ где i-индекс цикла, ${{T}_{N}}$ – нормализованная длительность цикла, т.е. ${{T}_{N}} = 132 = 11\,\,{\text{лет}} \times 12\,\,{\text{мес}}.$ Нижняя часть верхней панели на рис. 3 отображает такую нормализованную временнýю зависимость синтезированных данных (в условных месяцах). Кроме того, как и в работе [Бархатов и др. 2001], было применено прореживание данных с коэффициентом 5 (в [Бархатов и др., 2001] он равнялся 6) и, таким образом, были сформированы нормализованные данные для процесса обучения ИНС. В нижней части рис. 3 представлены результаты прогнозирования методом ИНС для 23-го синтезированного цикла СА. Базовый прогноз ИНС в форме идеализированного (абстрактного) цикла с прореженными данными отмечен пустыми кружочками на фоне исходной кривой (1) (левая нижняя панель). В обратной трансформации к реальному масштабу времени из прогноза ИНС с известными нормировочными коэффициентами получаем прогноз с реальными значениями Rm – правая нижняя панель.

Рис. 3.

Модельное представление временнóго хода среднемесячных сглаженных чисел солнечных пятен (верхняя панель) и прогнозирование 23-го цикла СА: нормализованные данные (левая нижняя панель) и исходные синтезированные данные (нижняя правая панель). Сплошными линиями представлены истинные кривые, а полыми кружочками отмечен результат прогноза ИНС.

Следует отметить кардинальное повышение устойчивости результата оценки функциональной зависимости SSN внутри цикла при уменьшении степеней свободы задачи – разделении общего процесса прогнозирования солнечного цикла на парциальные части: амплитуду, длительность и временнóй ход индекса внутри цикла. Исследовалась возможность работы с исходными данными в динамическом режиме, т.е. с фазовым сдвигом циклического интервала предсказания ${{T}_{0}},$ и погрешность прогнозирования в нормализованном пространстве оставалась на уровне статического режима. Была исследована принципиальная особенность ИНС Элмана – существование оптимальных значений для базовых параметров итерационного процесса обучения ИНС: скорости и инерции обучения, оцениваемых как 0.005 и 0.5, что соответствует общим интервалам изменений этих параметров: [0.001–0.01] для скорости обучения и [0.1–1.0] для инерции (момента) обучения, приведенными в [Головко, 2001].

4. НОРМАЛИЗАЦИЯ ДАННЫХ И ПРОГНОЗИРОВАНИЕ

Реальные данные SSN имеют сложную структуру, как в периодичности, так и в вариациях максимумов в периодах, в частности, имеет место слабовыраженный переход циклов со значительными вариациями индекса SSN в минимуме солнечной активности. Корректная работа ИНС требует строгого математического разделения циклов – определения начала и конца цикла и более отчетливо выраженного переходного процесса. Для этого применялась процедура аппроксимации данных в окрестности минимума на интервале ±12 мес. от текущего минимального значения SSN (близкого к астрономическому переходу), определялась квадратичная (параболическая) зависимость – ${{R}_{P}}(t)$ и далее само математическое положение минимума, которое приписывалось концу цикла. Следующая за минимумом точка ряда считалась началом нового цикла и характеризовалась положительной временнóй производной. Далее выполнялась регуляризация хода ${{R}_{m}}(t)$ в окрестности минимума

$\begin{gathered} {{R}_{m}}(t) = w{{R}_{P}}(t) + (1 - w){{R}_{m}}(t), \\ w(t) = \exp \left\{ {{{{{{(t - {{t}_{{\min }}})}}^{2}}} \mathord{\left/ {\vphantom {{{{{(t - {{t}_{{\min }}})}}^{2}}} {\Delta {{t}^{2}}}}} \right. \kern-0em} {\Delta {{t}^{2}}}}} \right\}, \\ \end{gathered} $
где $\Delta t$ = 6 мес., что позволяло выделить переход циклов и избежать скачков ${{R}_{m}}(t)$ в области стыковки во временнóм ходе цикла (рис. 4, верхняя панель). На следующем этапе нормализации данных выполнялось преобразование в последовательность абстрагированных циклов с коэффициентами трансформации: ${1 \mathord{\left/ {\vphantom {1 {A_{0}^{i}}}} \right. \kern-0em} {A_{0}^{i}}}$ и ${{{{T}_{N}}} \mathord{\left/ {\vphantom {{{{T}_{N}}} {T_{0}^{i}}}} \right. \kern-0em} {T_{0}^{i}}},$ где i-индекс цикла, которая и служила основой для обучения ИНС. Введение идеализированных циклов с общими краевыми значениями: положительная производная в начале и нулевая в конце цикла позволяет осуществить выбор решения в вариационном процессе нахождения глобального минимума целевой функции ИНС. Корректной оценкой функции будет рассматриваться решение, которое удовлетворяет общим свойствам нормализованных данных на концах прогнозируемого интервала (рис. 4, левая нижняя панель): положительная производная в начале, близкая к нулю в конце цикла и максимальное значение функции близко к единице. Устойчивость процесса нахождения такого решения демонстрируется на рис. 5, левая панель, где результирующая функция представлена жирной линией.

Рис. 4.

Временнóй ход среднемесячных сглаженных чисел солнечных пятен (верхняя панель) и прогнозирование 21‑го цикла: нормализованные данные (полые кружочки, левая нижняя панель) и реальные данные (нижняя правая панель). Заполненными точками (синий) представлены данные наблюдений, пунктирная линия – усредненные за предыдущие циклы результаты, а сплошными линиями – прогноз методом ИНС.

Рис. 5.

Вариационный подход для ИНС в построении прогнозного решения для функциональной зависимости SSN в 22-м цикле солнечной активности при изменении вспомогательного параметра процесса – инерции обучения ИНС (левая панель) и вариации нормализованных функций в 22–25 циклах СА (правая панель).

Как пример применения рассмотренного метода, результат предсказания функциональной зависимости SSN в 21-м цикле СА приведен на рис. 4, где также нанесена и усредненная временнáя зависимость по предыдущим циклам ряда данных (кривые 1). Усреднение на идеализированных циклах является корректной операцией, поскольку все нормализованные данные имеют одинаковый масштаб и размерность по координатам. Виден достаточно большой разброс временнóго хода нормализованных данных в циклах, что проявляется в величинах доверительных интервалов (рис. 4, правая нижняя панель), приведенных для нескольких точек на графике SSN. Сопоставление полученных методом ИНС и средних зависимостей для числа солнечных пятен показывает общую характерную асимметрию восходящей и спадающей ветвей цикла и синхронность кривых достаточно высокая, что говорит о достаточно корректном нахождении главной части в периодическом процессе. В то же время, прогноз ИНС отличается от средней кривой, что отражает индивидуальные свойства конкретного цикла – сравнение кривых в четырех последних циклах приведено на рис. 5, правая панель (жирной линией отмечен прогноз для 25-го солнечного цикла).

Таблица 1 иллюстрирует итоговые результаты анализа солнечных данных в последних четырех циклах: с 21-го по 24-й. Хорошо виден большой разброс параметров ИНС (скорости и инерции обучения) от цикла к циклу в полученном решении, что свидетельствует об очень значительной индивидуальности нахождения динамики SSN внутри цикла. Численная характеристика изменчивости приведена как показатель эффективности предсказания в цикле

$PE = 1 - {{\sum\limits_{i{\kern 1pt} = {\kern 1pt} 1}^N {\left| {R_{p}^{i} - R_{m}^{i}} \right|} } \mathord{\left/ {\vphantom {{\sum\limits_{i{\kern 1pt} = {\kern 1pt} 1}^N {\left| {R_{p}^{i} - R_{m}^{i}} \right|} } {\sum\limits_{i{\kern 1pt} = {\kern 1pt} 1}^N {R_{m}^{i},} }}} \right. \kern-0em} {\sum\limits_{i{\kern 1pt} = {\kern 1pt} 1}^N {R_{m}^{i},} }}$
где $R_{p}^{i}$ – прогнозное, $R_{m}^{i}$ – экспериментальное значения SSN. Более низкие значения эффективности предсказания для 23-го и 24-го циклов, по-видимому, связаны с “двугорбым” характером динамики ${{R}_{m}}$ внутри данных временны́х интервалов, что проявляется в прогнозе н на последующий – 25-й цикл (рис. 6). Прогнозная кривая ИНС в нормализованном представлении (рис. 6, левая панель) имеет выраженный перегиб на спадающей ветви, т.е. предсказывается возможность формирования слаборазвитого “двугорбого” распределения по циклу. Также, как и для 21-го цикла, видна близость кривой ИНС к усредненной зависимости за предыдущие периоды временнóго ряда данных. Следует отметить значительное отличие в прогнозных кривых: SWPC (кривая 0) и ИНС (кривая 1) в реальном масштабе времени (рис. 6, правая панель). Значение максимума для прогноза ИНС взято в 120 единиц и период в 132 мес. (официальный прогноз NOAA от января 2022 г. и прогноз SIDC от сентября 2022 г.). В первую очередь это касается положения максимального значения SSN в цикле – для функции прогноза рассмотренным методом ИНС это конец 2023 г., тогда как для базового прогноза CWPC – середина 2025 г. Экспериментальные данные (среднемесячные) отмечены полыми треугольниками и на октябрь 2022 г. имеет место существенная предпочтительность прогноза, построенного предложенным методом ИНС. Большое отклонение от официального прогноза CWPC отмечается и в бюллетенях NOAA (National Oceanic and Atmospheric Administration).

Таблица 1.  

Характерные параметры применения метода ИНС к данным SSN

Номер цикла Скорость обучения Инерция обучения RMS (норм.) RMS (эксп.) Эффективность предсказания
21 0.005 0.75 0.06 14.97 0.91
22 0.005 0.5 0.05 12.65 0.9
23 0.0095 0.2 0.05 21.37 0.79
24 0.001 0.1 0.07 12.85 0.79
Среднее     0.06 15.46 0.85
Рис. 6.

Прогноз динамики числа солнечных пятен на 25-й цикл солнечной активности. Нормализованные данные (левая панель): полые кружочки – результат ИНС, пунктирная линия с доверительными интервалами – усредненные результаты за предыдущие циклы. В реальном масштабе данных (правая панель): полые треугольники – текущие данные наблюдений (среднемесячные), сплошная линия (кривая 1) – результат ИНС, сплошная линия (кривая 0) – долгосрочный прогноз SWPC (Boulder), пунктирная линия – результат усреднения за предыдущие циклы с доверительными интервалами.

5. ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Рассмотренный в данной работе метод имеет своей целью прогноз временнóй зависимости SSN внутри цикла, основываясь на уменьшении степеней свободы предсказания солнечного цикла в целом на основе данных исторического ряда наблюдений. Это позволило повысить устойчивость и корректность нахождения решения в методике использования классической рекуррентной ИНС, в нашем случае, ИНС Элмана. В частности, введение нормализованного пространства представления данных, в отличие от других подходов в применении ИНС к долгосрочному предсказанию СА, позволило построить функцию, имеющую явную асимметрию восходящей и спадающей ветвей внутри цикла и, в какой-то степени, отражающей особенности хода предыдущих циклов. Сравнение прогнозных кривых SWPC (рис. 6, правая панель, кривая 0) и полученной в [Benson et al., 2020] методом глубинного обучения многослойной нейронной сети (с двумя скрытыми слоями нейронов, но без обратной связи, рис. 7) показывает их большое сходство, в частности, очень слабую асимметрию ветвей внутри цикла. Практически она отсутствует, что плохо согласуется с общими представлениями о периодическом характере солнечной активности [Hathaway et al., 1994; Hathaway, 2015; Willamo et al., 2020]. Что касается максимума в 25-м цикле, то результаты предсказаний сильно расходятся – от очень малых ~80 (применение методики [Thompson, 1993]) до больших значений в ~160, что отражает сложность связи внутрисолнечных процессов и наблюдаемых SSN [Nandy et al., 2021], и неоднозначность результатов прогнозирования на одних и тех же данных. Так метод глубинного обучения многослойной нейронной сети прямого распространения [Benson et al., 2020] дает оценку максимума СА представленной числом SSN в 106 единиц и локализацию этого максимума СА во времени на 2025 г. В работе [Sarp et al., 2018], на основе нелинейного динамического анализа данных, максимум оценивается в 154 и ожидается в начале 2023 г. (2023.02), что в, значительной мере, соответствует результату нашего анализа (2023.10) [Крашенинников и Чумаков, 2021] и рис. 6. В общем случае представляется, что для оценки максимума солнечного цикла более перспективным является анализ тонкой структуры процессов на Солнце, чем, по-видимому, нейросетевой подход к временнóму ряду наблюдений SSN.

Рис. 7.

Прогноз для числа среднемесячных данных по солнечным пятнам на 25-й цикл солнечной активности (метод глубокой нейронной сети – deep neural networks).

Предлагаемый метод построения функциональной зависимости SSN в цикле на основе анализа методом ИНС имеет высокую степень математической формализации и может быть основой как для долгосрочного прогнозирования в масштабе цикла, в совокупности с независимым прогнозом максимума, так и для интервала в 2‒3 года, используя соотношение общего и частного. Как представляется, в обоих случаях имеется возможность подстраивания (адаптации) под ежемесячно поступающие данные регистрации индексов СА, варьируя значения амплитуды ${{A}_{0}}$ и длительности ${{T}_{0}}$ прогнозируемого цикла в небольших пределах изменений. Критерием является достижение минимальных отклонений расчетных и экспериментальных данных в общей области существования в статическом и динамическом режимах работы. Программная реализация рассматриваемого метода выполнена на независимой от коммерческих математических пакетов основе и может усовершенствоваться по мере практического применения.

7. ЗАКЛЮЧЕНИЕ

Таким образом, на основе рекуррентной ИНС Элмана показана возможность долгосрочного прогнозирования временнóй функции числа солнечных пятен на масштабе цикла, применяя метод нормализации исходного временнóго ряда данных. Предложенный подход, основанный на уменьшении размерности задачи, имеет достаточную устойчивость и эффективность прогнозирования, показанную на примере предыдущих четырех циклов, с 21-го по 24-й. Построенный прогноз на 25-й цикл солнечной активности характеризуется более высокой степенью соответствия текущим солнечным данным, имеющимися на вторую половину 2022 г., чем прогноз службы SWPC. В целом, метод можно рассматривать как основу для долгосрочного прогнозирования числа солнечных пятен в интервале 2–4 лет и на масштабе цикла в качестве индикаторов космической погоды, в частности, в задачах планирования работы радиотехнических систем, использующих ионосферное распространение радиоволн.

Список литературы

  1. Бархатов Н.А., Королёв А.В., Пономарев С.М., Сахаров С.Ю. Долгосрочное прогнозирование индексов солнечной активности методом искусственных нейронных сетей // Изв. Вузов. Радиофизика. Т. XLIV. № 9. С. 806–814. 2001.

  2. Головко В.А. Нейронные сети: обучение, организация и применение // Минск: ИПРЖР. 255 с. 2001.

  3. Головко В.А., Краснопрошин В.В. Нейросетевые технологии обработки данных // Минск: БГУ. 263 с. 2017.

  4. Крашенинников И.В., Чумаков С.О. Метод ИНС в задаче долгосрочного прогнозирования индексов солнечной активности // Физика плазмы в солнечной системе. 16-я ежегодная конференция. М.: ИКИ РАН. С. 264. 2021.

  5. Benson B., Pan W.D., Prasad A., Gary G.A., Hu Q. Forecasting Solar Cycle 25 Using Deep Neural Networks // Sol. Phys. V. 295(65). 2020. https://doi.org/10.1007/s11207-020-01634-y

  6. Bothmer V., Daglis I.A. Space weather: physics and effects. Springer, Dordrecht. 476 p. 2007.

  7. Elman J.L. Finding structure in time // Cogn. Sci. V. 14. P. 179–211. 1990. https://doi.org/10.1207/s15516709cog1402_1

  8. Fessant F., Bengio S., Collobert D. On the prediction of solar activity using different neural network models // Ann. Geophys. V. 14(1). P. 20–26. 1996.

  9. Hathaway D.H., Wilson R.M., Reichmann E.J. The shape of the sunspot cycle // Sol. Phys. V. 151. P. 177–190. 1994. https://doi.org/10.1007/BF00654090

  10. Hathaway D.H., Wilson R.M. Geomagnetic activity indicates large amplitude for sunspot cycle 24 // Geophys. Res. Lett. 33(L18101). 2006. https://doi.org/10.1029/2006GL027053

  11. Hathaway D.H. The Solar Cycle. // Living Rev. Sol. Phys. 2015. 12:4. https://doi/org/https://doi.org/10.1007/lrsp-2015-4

  12. Macpherson K. Neural network computation techniques applied to solar activity prediction // Adv. Space Res. V. 13. № 9. P. 375–450. 1993. https://doi.org/10.1016/0273-1177(93)90518-G

  13. Nandy D., Martens P.C.H., Obridko V., Dash S., Georgieva K. Solar evolution and extrema: current state of understanding of long-term solar variability and its planetary impacts // Space Sci. Rev. V. 217. № 3. 2021. https://doi.org/10.1007/s11214-021-00799-7

  14. Bondar T.N., Rotanova N.M., Obridko V.N. Stochastic autoregression modeling and forecasting of the Wolf-number time series // Astron. Rep. V. 39. P. 115–122. 1995.

  15. Pala Z., Atici R. Forecasting Sunspot Time Series Using Deep Learning Methods // Sol. Phys. V. 294(50). 2019. https://doi.org/10.1007/s11207-019-1434-62019

  16. Pesnell W.D. Solar cycle predictions (invited review) // Sol. Phys. V. 281. № 1. P. 507–532. 2012. https://doi.org/10.1007/s11207-012-9997-5

  17. Podladchikova T., Van der Linden, Kalman R.A Filter Technique for Improving Medium-Term Predictions of the Sunspot Number // Sol. Phys. V. 277. P. 397–416. 2012. https://doi.org/10.1007/s11207-011-9899-y

  18. Sarp V., Kilcik A., Yurchyshyn V., Rozelot J.P., Ozguc A. Prediction of solar cycle 25: a non-linear approach // MNRA-S. V. 481. P. 2981–2985. 2018. https://doi.org/10.1093/mnras/sty2470

  19. Sello S. Solar cycle forecasting: a nonlinear dynamics approach // A & A. V. 377. P. 312–320. 2001.

  20. Thompson R.J. A Technique for Predicting the Amplitude of the Solar Cycle // Sol. Phys. V. 148. №. 2. P. 383–388. 1993.

  21. Wang Y.M., Sheeley N.R. Understanding the geomagnetic precursor of the solar cycle // Astrophys. J. V. 694. P. L11–L15. 2009.

  22. Willamo T., Hackman T., Lehtinen J.J. et al. Shapes of stellar activity cycles // A & A. V. 638. A69. 2020. https://doi.org/10.1051/0004-6361/202037666

Дополнительные материалы отсутствуют.