Известия РАН. Серия географическая, 2023, T. 87, № 1, стр. 192-206

Распознавание образов в задачах картографирования рельефа суши

С. В. Харченко ab*

a Московский государственный университет имени М.В. Ломоносова
Москва, Россия

b Институт географии РАН
Москва, Россия

* E-mail: xar4enkkoff@yandex.ru

Поступила в редакцию 04.04.2022
После доработки 31.10.2022
Принята к публикации 03.11.2022

Полный текст (PDF)

Аннотация

В статье рассмотрено современное состояние методов распознавания образов для автоматического и полуавтоматического составления геоморфологических карт. В настоящее время среди специалистов в области морфометрии и математического моделирования рельефа широко распространено мнение, что экспертные знания и правила, используемые для создания таких карт, могут быть описаны количественно и представлены алгоритмически. Основные нерешенные пока удовлетворительно проблемы автоматизации картографирования рельефа: распознавание морфологически идентичных форм разного генезиса, выработка критериев перехода от морфологических к возрастным и генетическим характеристикам поверхностей, превентивный подбор оптимальной детальности данных дистанционного зондирования (не всегда наиболее детальные данные оказываются эффективнее всего в модели), выбор и обоснование весовых коэффициентов количественных переменных. Приведены примеры использования нескольких методов распознавания образов в геоморфологии вообще и геоморфологическом картографировании: обобщенных линейных моделей, классификаций деревьев решений, искусственных нейронных сетей и некоторых других методов, включая “компьютерное зрение”. Показано, что точность различных моделей в отношении распознавания форм рельефа (равно как и геологических структур) составляет порядка 50–70%, реже больше. В то же время распознавание конкретных форм, в зависимости от исходных данных и степени выраженности на них признаков данных форм рельефа, может иногда быть даже абсолютной (100%), но чаще всего точность при тестировании находится в пределах 90%.

Ключевые слова: распознавание образов, геоморфологическое картографирование, классификация с обучением, анализ изображений

ВВЕДЕНИЕ

Составление геоморфологических карт, общих и частных, как правило, базируется на использовании информации геологических изысканий, т.е. изучения субстрата (данные бурения, разведка геофизическими методами, геохимический анализ проб), анализа топографического устройства территории и истории развития рельефа и ландшафтов (в том числе с привлечением методов датирования). Создание геоморфологических карт в обычно используемой хроно-морфо-генетической легенде (Спиридонов, 1974) – сложный процесс, иногда, с большой долей неопределенности в проведении итоговых границ разными специалистами. Элемент творчества в картографировании рельефа можно рассматривать и как его сильную сторону, и как недостаток экпертно-мануального подхода в изучении земной поверхности. Ярким примером однозначного отношения к элементу творчества можно считать работы А.Н. Ласточкина (1987; Lastochkin, 2018), посвященные его концепции морфодинамического анализа. В своих трудах этот исследователь призывает формализовать членение земной поверхности на элементы и вести геоморфологический (или, скорее, морфологический) анализ в их границах, а также акцентировать внимание на пространственную сопряженность элементов (точек, линий и граней) разных типов. С осторожным одобрением о попытках таких формализаций высказывался Д.А. Тимофеев (1984), в том числе в заметке к (Лобанов, 1988).

Многие другие специалисты, изучающие рельеф, понимая неоднозначность традиционного геоморфологического картографирования (далее – ГК), тем не менее, кажется, не видят возможности воспроизводить карты рельефа, составленные в традиционных легендах, автоматическими или полуавтоматическими методами. Действительно, многообразие форм земной поверхности, созданных одним и тем же процессом, но претерпевших последующую переработку [явления геоморфологической конвергенции и гомологии (Гаврилов, 2016; Лопатин, 2007; Тимофеев, 2006)], заставляет увериться в невозможности даже частичной автоматизации создания геоморфологических карт.

В то же время активно развивается автоматизированное частное геоморфологическое картографирование, в первую, очередь, морфометрическое. За рубежом сформировалось относительно новое научное направление – “геоморфометрия”, в России развиваемое преимущественно П.А. Шарым (MacMillan and Shary, 2009; Shary et al., 2002), И.В. Флоринским (Florinsky, 2016; Florinsky et al., 2002) и др. Разные исследователи продолжают предпринимать попытки все более тонкого и осмысленного выделения элементов рельефа, отдельных форм и даже генетических типов. Все эти работы базируются на использовании методов распознавания образов. Здесь и далее под распознаванием образов понимается выделение качественных группировок объектов (кластеров, классов, типов) по входным количественным или качественным переменным. Ряд авторов (например, (Anders et al., 2011)) высказывают мнение, что “экспертные знания” о принципах проведения геоморфологических границ можно преобразовать в последовательности математических правил, которые позволят любому конечному пользователю получать цифровые карты поверхности Земли в автоматическом или полуавтоматическом режиме.

В данной статье автор пытается показать современное состояние автоматического и полуавтоматического картографирования рельефа, проблемы их дальнейшего развития и перспективы. Среди всех методов распознавания образов акцент в статье сделан на наиболее перспективной, на наш взгляд, группе методов – классификации с обучением. Именно методы этой группы позволяют формализовать, пусть даже в неявном виде, экспертные правила проведения геоморфологических границ.

ПРОБЛЕМЫ И ПЕРСПЕКТИВЫ РАСПОЗНАВАНИЯ ОБРАЗОВ В ГЕОМОРФОЛОГИИ

Применимость методов автоматизированного картографирования рельефа ограничивается доступными исходными данными. Если в перечне доступных исходных данных – только, например, цифровые модели рельефа, то из них принципиально невозможно извлечь иную информацию о рельефе и отложениях, которая не отражается в морфологии земной поверхности. А вот что именно отражается в морфологии поверхности – остается открытым вопросом. Существуют работы, в том числе далеко не последних лет, с суждениями по морфологическим индикаторам о возрасте, например, ледниковой и водно-ледниковой морфоскульптуры. Подобное осуществлено Л.Р. Серебрянным и И.Н. Чукленковой (1973), где первичную и вторичную моренные равнины северо-запада тогдашнего СССР авторы пытаются разделить по параметру плотности замкнутых озерных понижений, не соединенных эрозионной сетью. Нужно понимать, что морфологическими индикаторами являются не только стандартные морфометрические параметры, но и морфографические характеристики (которые, несмотря на традиционное понимание их как “качественных”, все же формализуемы и количественно), параметры текстуры расчленения, спектра поля высот, разнопорядковых базисных и вершинных поверхностей и многие другие. Обычно все индикаторы сводятся единую таблицу, где один из столбцов – распознаваемый класс объекта, а все прочие – заполнены количественными или качественными значениями независимых переменных.

Учет других данных (космических снимков в различных диапазонах съемки, аэрофотосъемки, моделей смещения отметок поверхности за разные временные срезы, терморазведки и т.д.) и использование новых методов (например, методов компьютерного зрения, которые “распознают” образы в буквальном смысле, пытаясь уподобить результат визуальному восприятию человеком окружающих его объектов) и гибридных ансамблей методов – позволяет существенно усилить эффективность создаваемых математических моделей.

Число проблем в области автоматизированного ГК с годами не уменьшается – по мере того как решение находят одни проблемы, появляются новые. Тем не менее, предсказательный потенциал описываемых в статьях моделей распознавания геоморфологических границ (а, следовательно, и элементов, и форм, и типов рельефа, разделяемых этими границами) неуклонно растет.

Одна из ключевых проблем, не находящая пока своего решения – геоморфологическая конвергенция (морфологически подобные формы рельефа разного генезиса) и гомология (формы рельефа с многообразием визуальных очертаний, создаваемые одним и тем же процессом). В (Харченко, 2020) мы называем среди возможных подходов к разделению конвергентных форм учет парагенезиса (геоморфологического окружения) самой формы, в частности катенарные пространственные отношения. Отдельный подход – рассмотрение осложняющих ту или иную форму рельефа более мелких форм, наличие которых может быть классификационным признаком.

Иначе ставит вопрос известный британский геоморфолог Я. Эванс (Evans, 2012). Он рассуждает о том, каково сейчас содержание категории “форма рельефа”, если поверхности с идентичной морфологией можно называть различными формами. Эванс полагает, что сейчас наблюдаются тенденции 1) на упрощение легенд геоморфологических карт с некоторым отказом от параметров рельефа, не находящих отражение в морфологии и 2) на сдвиг интереса исследователей от дискретного подхода с картографированием отдельных геоморфологических единиц к континуальному подходу, при котором характеризуется непрерывное поле высот. Так или иначе, указывается на постепенно снижающееся внимание к характеристикам рельефа, не извлекаемым из морфометрических данных.

Очевидно, отказ от картографирования генетических и возрастных характеристик рельефа не может быть оправдан, однако, возможно, следует сконцентрировать внимание на разработке сложных морфометрических параметров, коррелирующих с этими характеристиками. Простой пример такого перехода от морфологии к возрасту – работы В.П. Солоненко (1977) по морфологическим характеристикам сейсмотектонических рвов, образовавших вертикальные уступы в породах с различными прочностными свойствами, и тенденциям изменения их профиля в зависимости от времени землетрясения.

Один из аспектов проблемы поиска репрезентативных морфометрических характеристик состоит в сравнительной оценке важности переменных (т.е. определения их весов). Очень показательна в этом отношении работа И. Денга с соавторами (Deng et al., 2006), осуществившими нечеткую k-means кластеризацию типов почв в зависимости от характеристик рельефа, назначая входным переменным разные комбинации весов (всего 102 разных сочетаний весов), и показавшими, что наилучшей надежности результаты кластеризации достигаются именно при тонкой настройке весовых коэффициентов. Было продемонстрировано, например, что прогноз типа почв достигает максимальной эффективности при придании параметрам крутизны склона и топографического индекса увлажнения повышенных весов (3–5) на фоне прочих характеристик. По сути, примененный подход – некий гибрид кластеризации и классификации с обучением, ведь использованная техника подразумевает подгонку весов при условии максимизации качества предсказания – а для этого требуется обучающая выборка.

Другая проблема – поиск оптимальных характеристик (в частности разрешающей способности) данных дистанционного зондирования для выделения по ним геоморфологических граница разного ранга. С. Кавацци с соавторами (Cavazzi et al., 2013), исследуя потенциал ЦМР различного разрешения для предсказания физико-механических свойств почв (морфометрические характеристика рельефа – часто используемые ковариаты свойств почвы) провели следующий эксперимент. С использованием двух распространенных методов классификации с обучением – искусственных нейронных сетей и случайного леса – оценена эффективность прогноза типа почв на трех ключевых участках в Ирландии по морфометрическим данным с разной подробностью. Исходная модель высот разрешением 20 м сглаживалась скользящим окном размерами 3 × 3, 5 × 5, …, 21 × 21 ячеек. Затем каждая из результирующих моделей была передискретизована до разрешений 30, 40, …, 260 м. В результате авторы имели 143 модели поля высот, с разной подробностью характеризующих реальный рельеф. По ним были рассчитаны 11 морфометрических характеристик поверхности, имеющих связь с характером почвенного покрова: от уклона и экспозиции до глубины долин и относительных позиций конкретных точек на фасетках склонов (верхняя– средняя–нижняя часть склона). Эффективность классификации типов почвы по различным исходным данным упомянутыми двумя методами менялась от 35 до 60%. Всего в эксперименте были задействованы три ключевые участка – наилучшие результаты по ним были получены, как ни странно, не при максимальной детальности и минимальном сглаживании ЦМР, а, например, при размерах ячейки 260 м и сглаживании окном 19 × 19 ячеек. Проблема предварительного определения оптимальных параметров исходных данных остается открытой.

Но сам факт, что по 11 базовым морфометрическим характеристикам рельефа (без привлечения космических снимков, сложных метрик текстуры рельефа, методов анализа изображений) удается достичь 60% точности воспроизводства экспертно установленных почвенных границ – очень показателен. Думается, применение методов классификации с обучением в геоморфологии и смежных областях имеет большие перспективы.

Активно предпринимаются попытки адаптации сверточных сетей для более сложной задачи картографирования литологических разностей, т.е., по сути, составления готовых геологических карт. Так, в (Brandmeier and Chen, 2019) по свободно распространяемым снимкам Aster и Sentinel-2A с применением открытой технологии U-Net построена геологическая карта участка размерами 20 × 50 км на северо-востоке провинции Южная Австралия. Итоговая точность воспроизводства литологических границ на дневной поверхности, установленных по данным полевых геологических съемок, составила 75%. В геоморфологическом картографировании сверточные нейронные сети применялись до сих пор лишь для выделения отдельных более или менее однообразных форм рельефа – кратеры, вулканические конусы, меандрирующие русла и т.д. (Li and Hsu, 2020).

Сегодня передовые технологии распознавания образов решают задачу не только классификации, но еще и обнаружения (detection) и проведения границ (segmentation). Классификация в ГК призвана ответить на вопрос: форма(ы) рельефа какого(их) типов вероятно встречае(ю)тся на территории? Детектирование или обнаружение нацелено на определение позиций (центроид и некая очерчивающая геометрия, чаще всего – прямоугольник) для форм рельефа, модель распознавания которых используется. Сегментация – наиболее трудоемкая и наименее разработанная технология, особенно в приложении к составлению карт – позволяет разделить изображение на части, посредством делимитации границ различных форм. Здесь под изображением понимаются крупномасштабные цифровые модели рельефа, мультиспектральные аэро- и космические снимки и т.д., а также комбинированные стеки (пакеты) этих данных.

ПРИМЕНЕНИЕ РАЗЛИЧНЫХ МЕТОДОВ РАСПОЗНАВАНИЯ ОБРАЗОВ В ГЕОМОРФОЛОГИЧЕСКОМ КАРТОГРАФИРОВАНИИ

Одной из первых и наиболее известных работ по автоматизированным классификациям форм рельефа является отчет Р. МакМиллана (MacMillan and Pettapiece, 2000) по рельефу десяти разных генетических типов на 26 ключевых участках в провинции Альберта (Канада). Назначение данной классификации было сугубо прикладное – последующая разработка систем точного земледелия для различных типов рельефа. Авторами используется разработанная им же так называемая landform segmentation model (LSM) (MacMillan et al., 2000), представляющая собой усовершенствованную классификацию Д. Пеннока (Pennock et al., 1987). Все эти классификации, по существу, представляют собой классификации без обучения или кластеризации (на основе правил нечеткой логики – (метод fuzzy k-means), когда по ряду входных морфометрических переменных устанавливаются их характерные комбинации, соответствующие той или иной форме рельефа или элементу сложных форм. К сожалению, наиболее распространенные методы кластеризации не в состоянии воспроизвести нечеткие границы классов, а потому в задачах геоморфологического картографирования могут не быть эффективны (в зависимости от того, насколько удачно подобран набор переменных).

Более мощными являются методы с применением обучения, т.е. “априорного” экспертного знания о принадлежности той или иной поверхности различным формам рельефа. Даже если характерные интервалы входных переменных у объектов разных классов (скажем, глубина расчленения в низко- и среднегорьях) пересекаются, методы классификации с обучением позволяют установить наиболее надежный класс для каждой конкретной величины входной переменной или комбинации нескольких из них (непараметрические методы) или даже оценить вероятность отнесения к каждому из возможных классов (параметрические методы, основанные на допущениях о характере статистических распределений входных переменных).

Рассмотрим основные методы классификации с обучением, применяемые в геоморфологии [по (Marmion et al., 2008; Miska and Jan, 2005; и др.)].

Обобщенные линейные модели (ОЛМ/GLM) являются расширением классической линейной регрессии, когда устанавливается характер зависимости между независимой количественной переменной (предиктором) и зависимым количественным же “откликом”. Канонические примеры линейной связи – падение температуры воздуха с подъемом, увеличение степени окатанности галек с ростом их размера (Крамбейн, 1969). Обобщенные линейные модели, во-первых, схожи с множественной линейной регрессией, так как могут принимать в качестве входных данных целый набор предикторов, во-вторых, могут опираться как на количественные, так и на качественные переменные, в-третьих, могут иметь качественный биномиальный отклик (да/нет, опасно/безопасно). Наиболее известным методом в группе ОЛМ является так называемая логистическая регрессия, когда в зависимости от некого набора переменных предсказывается отношение шансов позитивного и негативного исходов (допустим, отношение шансов, что участок потенциально оползневой, а не безопасный (Atkinson et al., 1998; Ayalew and Yamagishi, 2005); что наносы накапливались в глубоководных фациальных условиях, а не в мелководных (Link, 1964)).

Деревья классификации (частный случай деревьев решений) является альтернативой методам регрессии. Этот непараметрический метод основан на последовательном бинарном разбиении данных (на каждом этапе построения дерева по какой-то одной переменной и конкретной ее пороговой величине), которое наилучшим образом сепарирует объекты в классы. Построение деревьев решений напоминает использование справочников-определителей растений, когда требуется последовательно отвечать на поставленные вопросы “да” или “нет” и в качестве результата получать вид или род искомого растения. При успешном использовании дерева иногда удается строго разделить классы объектов (формы рельефа по морфометрическим индикаторам) в различные ветви этого дерева. Но, во-первых, не всегда классы оказываются разделимы, а, во-вторых, слишком сложные деревья совершенно не интерпретируемы исследователем, трудно сказать, какие переменные в итоге являются репрезентативными для автоматического распознавания тех или иных форм рельефа. Сейчас разработаны специальные критерии нахождения оптимума сложности и информативности дерева.

Интересный пример использования деревьев классификации представлен в (Sutfin et al., 2014), где авторы обучают статистическую модель распознавать пять различных типов русел временных водотоков в пустынях штата Аризона. Среди входных параметров: отношение ширины к глубине (W/D), уклон русла (S), напряжение сдвига для пород, выстилающих русло (τ), энергия потока (Q) и удельная энергия потока на единицу длины водотока (го). Созданная модель схематично показана на рис. 1. Наилучшим из возможных разделителей (т.е. таким, который сразу же с минимальной ошибкой позволяет отчленить русла хотя бы одного типа от остальных) на первой итерации модели оказывается отношение ширины русла к глубине, при значении этого параметра W/D > 118 все русла в выборке гарантированно многорукавные – BD, что не удивительно. На второй итерации оставшиеся объекты наилучшим образом сепарируются по различиям напряжения сдвига τ, зависящего от гидравлического радиуса, уклона русла и размерности преобладающей фракции обломочного материала. На этом этапе в отдельную группу обособляются преимущественно врезанные в коренные породы русла как без выстилания аллювием – BK, так и, в гораздо меньшей степени, с ним – BA. В оставшуюся часть дерева попадают остальные типы русел. Параметр для сепарации и его пороговое значение выбираются на каждом этапе таким образом, чтобы в ветвях дерева ниже момента разделения – объекты каждого класса были разделены с как можно меньшей дисперсией, в идеальном случае, 100% объектов каждого класса в своей ветви. Построение дерева классификации, основанного на гидравлических характеристиках эфемерных водотоков, позволяет авторам решать обратную задачу – от дешифрирования морфологического типа пересохшего русла к динамическими характеристикам потока, который это русло создал.

Рис. 1.

Дерево классификации русел временных водотоков в пустынях штата Аризона, США. Примечание: В процентах показаны частоты встречаемости русел разных типов (BK bedrock/врезанные в коренные породы без аллювиального заполнения; BA bedrock with alluvium/врезанные в коренные породы с аллювиальным заполнением вреза; IA incised alluvium/врезанные в переуглубления долин, выполненные древним аллювием; BD – braided/многорукавные; PH – piedmont headwater/предгорные маловодные истоки рек) в том или ином “узле” дерева, с присущими этому узлу гидравлическими параметрами). Гидравлические параметры: W/D – отношение ширины к глубине русла, S – уклон русла, Ω – энергия потока, τ – напряжение сдвига. Составлено по (Sutfin et al., 2014), упрощено автором.

Метод случайного леса (RF) основан на множественном применении деревьев решений к одним и тем же данным (Breiman, 2001). Для построения модели случайного леса из исходного выборки для обучения многократно извлекаются подвыборки, по каждой из которых строится дерево классификации. Затем отдельные деревья, обученные на различных подвыборках, получают веса в зависимости от их эффективности. При приложении созданного случайного леса к новым данным происходит следующее: эти данные классифицируются по каждому из сотен или тысяч входящих в модель деревьев, итоговый класс объекта определяется “голосованием” деревьев, либо простым большинством, либо с учетом весов деревьев, в разных модификациях данного метода. Дерево обновляется из каждого доступного варианта обучения. По состоянию десятилетней давности случайный лес в решении геоморфологических задач вообще не применялся (Marmion, 2008), но уже сейчас случайный лес, как один из наиболее эффективных методов классификации, становится стандартом в том числе и в геоморфологии.

Так, в (Veronesi and Hurni, 2014) по Швейцарским Альпам случайный лес использовался для автоматической классификации коренных склонов, осыпных шлейфов, пролювиальных конусов и днищ долин по данным Swisstopo (ЦМР и аэрофотоснимки). Veronesi и Hurni обучали и калибровали модель на участке к северо-востоку от города Сьон, а применяли ее для классификации на другом участке – к югу от города Альдорф на расстоянии более 100 км от первого участка. Итоговая степень сходства с ранее созданными геоморфологическими картами составила более 70%.

Однако метод случайного леса способен изыскивать в данных и более тонкие закономерности (при значительном размере выборки), нежели различение по фототону аэроснимков и морфометрическим характеристикам ЦМР таких разнородных объектов как склоны, днища долин и разного рода аккумулятивные тела – непосредственно у подножия склона (шлейфы) или же у устьевых точек локальных микроводосборов (конусы). Например, нами была предпринята попытка обучения модели случайного леса для распознавания границ 13 различных типов рельефа Кольского полуострова, выделенных на геоморфологической карте, составленной М.К. Граве (Геоморфологический …, 1971) (рис. 2).

Рис. 2.

Обучающая выборка (цветные точки) для классификации рельефа Кольского п-ова по морфометрическим индикаторам (а), результат классификации рельефа (качественный фон) (б). Надтипы (типы) рельефа: 1–3 – денудационно-тектонический (средневысотные глыбовые горы, низкие глыбовые горы, грядово-холмистый рельеф), 4 ‒ структурный (пластовые возвышенные равнины), 5–8 – денудационный (цокольные равнины с древовидным расчленением, увалистые цокольные равнины, плоские цокольные равнины с экзарационной обработкой, плоские цокольные равнины с абразионной обработкой), 9–10 – водно-аккумулятивный (озерные и морские аккумулятивные равнины), 11 – долины крупных рек.

При подобной мультиномиальной классификации точность “нулевой модели” (референ-са) составляет в первом приближении 1/n, где n ‒ число выделяемых классов. Примерно такая точность может быть достигнута при случайном выделении на карте границ типов рельефа. При том, что часть выделяемых типов морфологически схожи – например, цокольные возвышенные равнины с разным рисунком расчленения – требуется учет “узких”, специфические черт морфологического рисунка рельефа территории. Для обучения модели случайного леса использовались морфометрические характеристики рельефа только около 1.3% территории, при этом взаимная пространственная позиция наблюдений (отдельных точек местности), принадлежащих к разным типам рельефа, никак не учитывалась. Таким образом, точки с неизвестной принадлежностью к типу рельефу не могли быть классифицированы по географической близости к точкам с известной принадлежностью (чтобы классификация не превращалась в простую интерполяцию). В пределе, при использовании неудачной модели классификации игнорирование пространственной позиции точек наблюдений может привести к полностью хаотичной “картине” распределения классов, а не к выделению сколько-нибудь обширных, территориально единых группировок. Общая точность полученной модели составила почти 82%, что выше точности референса в 10.7 раз. При этом по отдельным типам рельефа частные точности достигают 90–95%, а по ряду наименее удачно распознаваемых типов – лишь 60–65% (табл. 1).

Таблица 1.  

Фрагмент матрицы неточностей (confusion matrix) классификации рельефа Кольского полуострова методом случайного леса на базе (Kharchenko, 2021)

  Предсказание
Факт. тип рельефа 1 2 4 5a 8 9  Ошибка
1 3383 4 136 5 1 0 0.05
2 19 2302 82 30 0 131 0.21
4 180 61 3067 66 0 1 0.13
5a 77 98 402 2163 104 3 0.39
8 0 4 0 36 3206 3 0.09
9 20 220 72 37 1 2706 0.21

Протестирована эффективность классических локальных морфометрических переменных, рассчитываемых средствами ГИС SAGA, а также в сравнении фокальных текстурных характеристик, отвечающих тем или иным чертам (“текстуре”) рисунка расчленения в некоторой окрестности точки, но относимых непосредственно к ней самой. В качестве фокальных величин были рассчитаны так называемые спектральные характеристики рельефа (Харченко, 2017), извлекаемые из двухмерного ряда Фурье, в который разлагается цифровая модель рельефа. Спектральные характеристики рельефа отвечают особенностям периодичности поля высот, его рисунка. Установлено, что точность классификации могла бы составить 65.3% при использовании стандартных морфометрических характеристик, 75.1% при задействовании исключительно спектральных характеристик рельефа и 78.1% при использовании их же с добавлением параметра абсолютной высоты. Таким образом, почти все стандартные морфометрические характеристики, чаще всего локальные, “рассчитываемые в точке”, дают прирост точности менее чем в 4% (от 78.1 до 82%).

Именно с применением случайного леса (неотъемлемый элемент которого – оценка репрезентативности переменных по тому, насколько хорошо справляются с классификацией отдельные деревья с разным набором входных параметров) была установлена неочевидная закономерность: результаты разложения ЦМР в ряды Фурье являются более показательными для автоматизированной геоморфологической классификации земной поверхности в морфогенетических легендах, нежели другие, более распространенные морфометрические параметры рельефа. Сама подобная оценка (сравнить переменные по показательности/эффективности) – ценный результат, однако гораздо более важным преимуществом метода кажется то, что он не требует ни предварительного выбора “правильных” переменных, ни придания им каких-либо весов.

Классические искусственные нейронные сети (ANN), применяемые в решении задач распознавания образов в геоморфологии и картографии еще с конца 1990-х годов (Leverington, 1997), активно стали внедряться в практику ГК лишь последние несколько лет. Нейронные сети как метод нацелен на воспроизводство связей между входными и выходной переменными при условии, что эти связи неизвестны заранее (даже сама их форма, линейная ли или какая угодно из нелинейных). Нейронная сеть содержит три различных типа слоев: входной слой (в который вводятся переменные среды), скрытые слои и выходной слой. Каждый промежуточный слой содержит так называемые нейроны (числовые комбинации входных переменных с различными весами); первоначально веса назначаются случайно, а затем подгоняются к оптимуму при условии минимизации ошибки прогноза. В (Luoto and Hjort, 2005) была оценена надежность искусственных нейронных сетей для геоморфологического картографирования. Л. Эрмини с соавторами (Ermini et al., 2005) применили нейронные сети для оценки устойчивости склонов, а И. Жу с коллегами (Zhu, 2007) сделали оценку потенциальных объемов взвешенных наносов по водотокам бассейна верхней Янцзы, Браун искал границы последнего ледникового максимума на территории штата Мичиган по ЦМР (Brown, 1998). Как видно из приведенного перечня примеров, спектр применения нейронных сетей в геоморфологии широк, они используются в решении задач как пространственной классификации, так и прогнозирования динамических параметров геоморфологических процессов и явлений. Зачастую с их помощью решаются комбинированные задачи – к классу таковых относится, например, оценка “оползневой восприимчивости” (landslide susceptibility) территории. Подобная классификация позволяет ответить на вопрос – является ли данный фрагмент территории потенциально опасным в отношении возможных проявлений оползней, по аналогии с объектами в обучающей выборке (т.е. подход и пространственный, и кинематический одновременно).

Для территории пос. Красная Поляна, курорта Роза-Хутор и их окрестностей (Краснодарский край, Россия) с использованием обучаемых самоорганизующихся сетей Кохонена (в первоначальной форме это метод классификации без обучения – кластеризации) нами была спрогнозирована оползневая опасность (рис. 3). В качестве данных для обучения использована неопубликованная геоморфологическая карта территории горного кластера зимней Олимпиады-2014, составленная С.В. Шваревым (не опубликована). С нее взяты контуры стенок оползней мелкого заложения, различимые на местности при проведении полевых маршрутов. Независимой переменной здесь выступает биномиальная величина – участок оползневой (да/1) или участок (пока) не оползневой (нет/0). В качестве зависимых переменных – морфометрические параметры, рассчитанные как в SAGA GIS, так и с помощью авторского алгоритма расчета спектральных характеристик.

Рис. 3.

Прогнозирование оползневой опасности для территории пос. Красная Поляна, курорта Роза-Хутор и их окрестностей (Краснодарский край, Россия) с использованием обучаемых самоорганизующихся сетей Кохонена: (а) положение реальных оползневых участков; прогноз потенциально оползневых участков с тремя наборами переменных: (б) стандартные морфометрические переменные, рассчитываемые в современных ГИС, (в) спектральные морфометрические переменные, (г) все переменные.

Поскольку эта классификация нацелена на “узнавание” как фактически, так и потенциально оползневых участков, использование метрики “точность” как критерия качества модели не целесообразно. Процесс обучения будет заключаться в подгонке весов входных переменных для максимально эффективной сепарации фактически оползневых и фактически не оползневых участков, однако последние включают и потенциально оползневые участки, из-за чего реальное качество модели будет переоценено. Более корректной метрикой качества здесь будет выступать “чувствительность” (sensitivity) – отношение верно предсказанных оползневых позиций к общему числу фактически оползневых ячеек; в результате модель не обучается распознавать как “безопасные” те ячейки сетки, где условия в принципе удовлетворяют протеканию оползневого процесса, но он там пока не происходит или не замечен в ходе полевого обследования. Такой подход – прогнозирование принадлежности территории по потенциальной динамике рельефа – отличает применение методов классификации, например, к космическим снимкам (где требуется автоматически классифицировать уже наблюдаемое явление – тип с/х культуры, объекты инфраструктуры или др.) и к цифровым моделям рельефа.

Все перечисленные методы – обобщенные линейные модели, деревья классификации, случайный лес и нейронные сети – решают задачи классификации (строго говоря, ОЛМ – регрессионный метод, который может быть адаптирован для классификации) без учета пространственного контекста, т.е. на вход они принимают табличные данные, а не картографические изображения. Единственный способ учета в таких моделях конкретных черт топографического рисунка – это использование фокальных морфометрических характеристик, так или иначе характеризующих окрестность точки, например, спектральных характеристик рельефа (Харченко, 2017). Однако упомянутые уже выше сверточные нейронные сети или методы объектно-ориентированного анализа изображений способны распознавать характер “текстуры рельефа”.

В некоторых работах можно встретить гибридные подходы к автоматизации ГК на основе классификаций с обучением и методов анализа изображений. Так, И. Рашид (Rashid et al., 2016) для бассейна р. Фероцпора (приток р. Джелам в системе Инда) использовал две независимые классификации рельефа: 1) на основе ЦМР по индексу топографической позиции (TPI) (Weiss, 2001), 2) на основе снимков LandSat 8 методами анализа изображений (On-Screen Image Interpretation). В то время как каждая классификация в отдельности дала точность соответственно 45.6 и 77.8%, сочетание двух результатов позволило добиться сходства с геоморфологической картой 91.5%. Строго говоря, тот перечень объектов, которые были выбраны для классификации в данной работе, не является какой-либо генетической классификацией форм рельефа и излишне упрощен, а сами объекты выделены по разным классификационным признакам (табл. 2). Тем не менее нужно признать, что автоматизация разграничения подобных объектов не так давно казалось мало реальной.

Таблица 2.

Оценка точности классификации методами TPI, OSII и гибридным для геоморфологического картографирования в (Rashid et al., 2016)

Картографируемая единица Контроль-ные точки Метод Точность классификации
TPI OSII Гибрид TPI OSII Гибрид
Узкие U-образные речные долины 40 23 25 36 57.50 62.50 90.00
Ледовая поверхность 3 0 3 3 0.00 100.0 100.0
Холмы 18 9 13 17 50.00 72.22 94.44
Озерно-ледниковые равнины 31 0 28 28 0.00 90.32 90.32
Среднегорные структурные долины 4 3 0 3 75.00 0.00 75.00
Среднегорные вершинные поверхности 16 12 9 14 75.00 56.25 87.50
Речные террасы 25 0 22 22 0.00 88.00 88.00
Педименты 11 7 9 10 63.63 81.81 90.91
Аллювиальные равнины 40 35 36 39 87.50 90.00 97.50
Пологие склоны 28 24 19 26 85.71 67.86 92.86
Водно-болотные угодья 12 0 11 11 0.00 91.66 91.66
ИТОГО 228 113 175 209 45.56 77.82 91.53

Примечание. Жирным шрифтом выделены максимальные значения точности для каждой картографируемой единицы.

Пожалуй, даже более эффективно срабатывают методы объектноориентированного анализа изображений в специальном ГК, т.е. при поиске конкретных специфичных форм рельефа. Показательны здесь работы (Clark et al., 2009; d’Oleire-Oltmanns et al., 2013) с распознаванием контуров отдельных друмлинов. Результаты их автоматизированного выделения по ЦМР в работе К. Кларка показаны на рис. 4.

Рис. 4.

Сравнение результатов полевого и автоматического по ЦМР картографирования друмлинов на водосборе озера Лох-Ломонд, Шотландия: (а) результаты полевой съемки Дж. Роуза (Smith and Clark, 2005); (б) результаты полуавтоматического выделения друмлинов по модели высот NEXTMap DEM. Примечание. Черной заливкой показаны друмлины, имеющиеся и на карте Дж. Роуза, белой – отсутствующие на ней формы. По (Clark et al., 2009).

Несмотря на то, что автоматизированное распознавание конкретных форм рельефа с типовыми морфологическими чертами в целом проще и эффективнее планарного подхода – сегментации территории на формы рельефа – думается, типологическое и общее геоморфологическое картографирование на основе автоматических алгоритмов не противоречат друг другу.

ВЫВОДЫ

В настоящее время идет активное развитие методов распознавания образов, в том числе в связи с их приложением к задачам автоматизации геоморфологического картографирования по дистанционным данным. Для дальнейшего продвижения в данном направлении требуют обсуждения и, по возможности, решения такие проблемы как распознавание морфологически идентичных форм разного генезиса (нужна выработка критериев и требований к исходных данным для разделения хотя бы стандартных примеров конвергентных форм рельефа), переход от морфологических к возрастным и генетическим характеристикам поверхностей, предварительный подбор оптимальной детальности данных дистанционного зондирования (не всегда наиболее детальные данные – эффективнее всего в модели, что рядом исследователей проверено экспериментально), выбор и обоснование весовых коэффициентов количественных переменных.

Важная проблема создания эффективных моделей автоматизированной классификации рельефа с обучением – выбор метрики качества модели. Зачастую наиболее стандартная метрика – точность (accuracy) не отвечает задаче исследователя, поэтому требуется обоснование выбора конкретной метрики. Так, в задачах классификации территории по вероятности протекания тех или иных экзогенных процессов (в частности, оползневых, селевых и т.д.) более разумно использовать вместо точности чувствительность модели, а именно шансы на успешное выявление положительного “отклика” – т.е. того, что участок подвержен протеканию рассматриваемого процесса.

Спектр методов, применяемых в попытках автоматизации составления геоморфологических карт, чрезвычайно разнообразен, хотя явное предпочтение пока еще отдается классификации с обучением. Чаще других применяются обобщенные линейные модели (так, для предсказания бинарного отклика используется логистическая регрессия – например, при моделировании оползневой опасности), различные виды дискриминантного анализа. Но со временем все большую популярность приобретают непараметрические методы, не опирающиеся на априорные допущения о характере связи (линейной или иной другой) исходных переменных и качественной зависимой переменной, например, “класса” форм рельефа.

Апробация различных методов и моделей автоматизированной классификации рельефа по морфологическим индикаторам при условии, что прогнозируемые классы (отдельные формы или генетические типы рельефа) несут генетическую или возрастную информацию, показывает, что наиболее информативными оказываются морфометрические переменные, отражающие текстуру расчленения рельефа, в частности спектральные характеристики. При их включении в модель в качестве предикторов, рост точности классификации относительно использования стандартных морфометрических переменных и индексов, рассчитываемых в распространенных ГИС (например, SAGA GIS, но также и другие) достигает порядка 10%.

В последние годы появляются примеры использования методов компьютерного зрения, которые оказываются, как правило, точнее, чем методы классификации с обучением, не учитывающие взаимное расположение объектов (географический контекст), а только лишь их параметры, сведенные в таблицу. Еще более высокую точность прогноза дают гибридные модели: стандартные методы, подкрепленные методами компьютерного зрения.

Список литературы

  1. Гаврилов А.А. О природе явлений геоморфологической конвергенции и гомологии // Вестн. Моск. ун-та. Сер. 5: География. 2016. № 4. С. 3–12.

  2. Геоморфологическая карта Мурманской области / сост. М.К. Граве, Л.М. Граве / Атлас Мурманской области. М.: ГУГК, 1971. С. 8.

  3. Крамбейн У., Грейбилл Ф. Статистические модели в геологии. М.: Мир, 1969. 400 с.

  4. Ласточкин А.Н. Морфодинамический анализ. Ленинград: Недра, 1987. 256 с.

  5. Лобанов В.В. Еще раз об “элементарной морфологической единице”, ее содержании и методике установления // Геоморфология. 1988. № 4. С. 29–34.

  6. Лопатин Д.В. О полиморфизме в геоморфологии // Геоморфология. 2007. № 3. С. 22–23.

  7. Серебрянный Л.Р., Чукленкова И.Н. Густота озер как показатель возраста гляцигенной морфоскульптуры (опыт применения морфометрического анализа в северо-западных районах Русской равнины) // Геоморфология. 1973. № 4. С. 79–85.

  8. Солоненко В.П. Сейсмогенные деформации и палеосейсмогеологический метод // Сейсмическое районирование Восточной Сибири и его геолого-геофизические основы. Новосибирск: Наука, 1977. С. 5–47.

  9. Спиридонов А.И. Геоморфологическое картографирование. М.: Недра, 1974. 184 с.

  10. Тимофеев Д.А. О полиморфизме как общем свойстве земной поверхности // Геоморфология. 2006. № 2. С. 3–6.

  11. Тимофеев Д.А. Элементарные морфологические единицы как объект геоморфологического анализа // Геоморфология. 1984. № 1. С. 19–29.

  12. Харченко С.В. К вопросу о применении гармонического анализа при количественной характеристике рельефа // Геоморфология. 2017. № 2. С. 14–24.

  13. Харченко С.В. Новые задачи морфометрии рельефа и автоматизированные морфологические классификации в геоморфологии // Геоморфология. 2020. № 1. С. 3–21.

  14. Anders N.S., Seijmonsbergen A.C., Bouten W. Segmentation optimization and stratified object-based analysis for semi-automated geomorphological mapping // Rem. Sens. of Environ. 2011. Vol. 115. № 12. P. 2976–2985. https://doi.org/10.1016/j.rse.2011.05.007

  15. Atkinson J., Jiskoot H., Massari R., Murray T. Generalized linear modelling in geomorphology // Earth Surface Proc. and Landforms. 1998. № 23. P. 1185–1195. https://doi.org/10.1002/(SICI)1096-9837(199812)23: 13%3C1185::AID-ESP928%3E3.0.CO;2-W

  16. Ayalew L., Yamagishi H. The application of GIS-based logistic regression for landslide susceptibility mapping in the Kakuda-Yahiko Mountains, Central Japan // Geomorphology. 2005. Vol. 65. № 1–2. P. 15–31. https://doi.org/10.1016/j.geomorph.2004.06.010

  17. Brandmeier M., Chen Y. Lithological classification using multi-sensor data and convolutional neural networks // Int. Archives of the Photogrammetry, Remote Sens. & Spatial Inform. Sci. 2019. https://doi.org/10.5194/isprs-archives-XLII-2-W16-55-2019

  18. Breiman L. Random Forests // Machine Learning. 2001. № 45. P. 5–32. https://doi.org/10.1023/A:1010933404324

  19. Brown D.G., Lusch D.P., Duda K.A. Supervised classification of types of glaciated landscapes using digital elevation data // Geomorphology. 1998. Vol. 21. № 3–4. P. 233–250. https://doi.org/10.1016/S0169-555X(97)00063-9

  20. Cavazzi S., Corstanje R., Mayr T., Hannam J., Fealy R. Are fine resolution digital elevation models always the best choice in digital soil mapping? // Geoderma. 2013. Vol. 195. P. 111–121. https://doi.org/10.1016/j.geoderma.2012.11.020

  21. Clark C.D., Hughes A.L., Greenwood S.L., Spagnolo M., Ng F.S. Size and shape characteristics of drumlins, derived from a large sample, and associated scaling laws // Quat. Sci. Rev. 2009. Vol. 28. № 7–8. P. 677–692. https://doi.org/10.1016/j.quascirev.2008.08.035

  22. Deng Y., Wilson J., Sheng J. Effects of variable attribute weights on landform classification // Earth Surface Proc. and Landforms. 2006. № 31. P. 1452–1462. https://doi.org/10.1002/esp.1401

  23. d’Oleire-Oltmanns S., Eisank C., Drăgut L., Blaschke T. An object-based workflow to extract landforms at multiple scales from two distinct data types // IEEE Geosci. and Rem. Sens. Lett. 2013. Vol. 10. № 4. P. 947–951. https://doi.org/10.1109/LGRS.2013.2254465

  24. Ermini L., Catani F., Casagli N. Artificial natural networks applied to landslide susceptibility assessment // Geomorphology. 2005. Vol. 66. P. 327–343. https://doi.org/10.1016/j.geomorph.2004.09.025

  25. Evans I.S. Geomorphometry and landform mapping: What is a landform? // Geomorphology. 2012. Vol. 137. P. 94–106. https://doi.org/10.1016/j.geomorph.2010.09.029

  26. Florinsky I.V., Eilers R.G., Manning G.R., Fuller L.G. Prediction of soil properties by digital terrain modeling // Environ. Modelling & Software. 2002. № 17 (3). P. 295–311. https://doi.org/10.1016/S1364-8152(01)00067-6

  27. Florinsky I.V. Digital terrain analysis in soil science and geology. Academic Press, 2016. 506 p.

  28. Kharchenko S. Automated recognition of the landforms origin for the Kola Peninsula based on morphometric variables / EGU General Assembly 2021 (19–30 April 2021) EGU21-15564. https://doi.org/10.5194/egusphere-egu21-15564

  29. Lastochkin A.N., Zhirov A.I., Boltramovich S.F. System-morphological approach: Another look at morphology research and geomorphological mapping // Geomorphology. 2018. Vol. 303. P. 486–503. https://doi.org/10.1016/J.GEOMORPH.2017.10.022

  30. Leverington D., Duguay C. A neural network method to determine the presence or absence of permafrost near Mayo, Yukon Territory, Canada // Permafrost and Periglacial Proc. 1997. № 8. P. 205–215. https://doi.org/10.1002/(SICI)1099-1530(199732)8:23.0.CO;2-5

  31. Li W., Hsu C.Y. Automated terrain feature identification from remote sensing imagery: a deep learning approach // Int. J. Geographical Inform. Sci. 2020. № 34 (4). P. 637–660. https://doi.org/10.1080/13658816.2018.1542697

  32. Link A.J. A physic-chemical and textural study of carbonate sedimentation in a lagoonal environment. Evanston, IL: Northwestern Univ., 1964.

  33. Luoto M., Hjort J. Evaluation of current statistical approaches for predictive geomorphological mapping // Geomorphology. 2005. № 67. P. 299–315. https://doi.org/10.1016/j.geomorph.2004.10.006

  34. MacMillan R.A., Pettapiece W.W., Nolan S.C., Goddard T.W. A generic procedure for automatically segmenting landforms into landform elements using DEMs, heuristic rules and fuzzy logic // Fuzzy Sets and Systems. 2000. № 113. P. 81–109. https://doi.org/10.1016/S0165-0114(99)00014-7

  35. MacMillan R.A., Shary P.A. Landforms and landform elements in geomorphometry // Geomorphometry: Concepts, Software, Applications. Developments in soil science – 33 / T. Hengl, H.I. Reuter (Eds.). 2009. Vol. 33. P. 227–254. https://doi.org/10.1016/S0166-2481(08)00009-3

  36. MacMillan R.A., Pettapiece W.W. Alberta Landforms: Quantitative morphometric descriptions and classification of typical Alberta landforms / Technical Bul. № 2000-2E. Research Branch, Agriculture and Agri-Food Canada, Semiarid Prairie. Agricultural Research Centre, Swift Current, SK, 2000. 118 p.

  37. Marmion M., Hjort J., Thuiller W., Luoto M. A comparison of predictive methods in modelling the distribution of periglacial landforms in Finnish Lapland // Earth Surface Proc. and Landforms. 2008. № 33. P. 2241–2254. https://doi.org/10.1002/esp.1695

  38. Miska L., Jan H. Evaluation of current statistical approaches for predictive geomorphological mapping // Geomorphology. 2005. Vol. 67. № 3–4. P. 299–315. https://doi.org/10.1016/j.geomorph.2004.10.006

  39. Pennock D.J., Zebarth B.J., De Jong E. Landform classification and soil distribution in hummocky terrain, Saskatchewan, Canada // Geoderma. 1987. Vol. 40. № 3–4. P. 297–315. https://doi.org/10.1016/0016-7061(87)90040-1

  40. Rashid I., Romshoo S.A., Hajam J.A., Abdullah T. A semi-automated approach for mapping geomorphology in mountainous terrain, Ferozpora watershed (Kashmir Himalaya) // J. Geological Soc. of India. 2016. Vol. 88. № 2. P. 206–212. https://doi.org/10.1007/s12594-016-0479-5

  41. Shary P.A., Sharaya L.S., Mitusov A.V. Fundamental quantitative methods of land surface analysis // Geoderma. 2002. Vol. 107. № 1–2. P. 1–32. https://doi.org/10.1016/S0016-7061(01)00136-7

  42. Smith M.J., Clark C.D. Methods for the visualization of digital elevation models for landform mapping // Earth Surface Proc. and Landforms. 2005. Vol. 30. № 7. P. 885–900. https://doi.org/10.1002/esp.1210

  43. Sutfin N.A., Shaw J.R., Wohl E.E., Cooper D.J. A geomorphic classification of ephemeral channels in a mountainous, arid region, southwestern Arizona, USA // Geomorphology. 2014. № 221. P. 164–175. https://doi.org/10.1016/j.geomorph.2014.06.005

  44. Veronesi F., Hurni L. Random Forest with semantic tie points for classifying landforms and creating rigorous shaded relief representations // Geomorphology. 2014. Vol. 224. P. 152–160. https://doi.org/10.1016/j.geomorph.2014.07.020

  45. Weiss A.D. Topographic positions and landforms analysis (Conference Poster). ESRI Int. User Conference. San Diego, CA July 9–13 2001.

  46. Zhu Y.M., Lu X.X., Zhou Y. Suspended sediment flux modeling with artificial neural network: An example of the Longchuanjiang River in the Upper Yangtze Catchment, China // Geomorphology. 2007. № 84. P. 111–125. https://doi.org/10.1016/j.geomorph.2006.07.010

Дополнительные материалы отсутствуют.