Доклады Российской академии наук. Математика, информатика, процессы управления, 2023, T. 514, № 2, стр. 225-234
SPIDERNET: ПОЛНОСВЯЗНАЯ СВЕРТОЧНАЯ НЕЙРОННАЯ СЕТЬ ДЛЯ ОБНАРУЖЕНИЯ МОШЕННИЧЕСТВА
С. В. Афанасьев 1, *, А. А. Смирнова 1, **, Д. М. Котерева 1, ***
1 Сбер
Москва, Россия
* E-mail: SVlAfanasyev@sberbank.ru
** E-mail: AnAndreeSmirnova@sberbank.ru
*** E-mail: DMKotereva@sberbank.ru
Поступила в редакцию 14.08.2023
После доработки 18.08.2023
Принята к публикации 15.10.2023
- EDN: FREGCN
- DOI: 10.31857/S2686954323601136
Аннотация
В этой работе мы представляем архитектуру сверточной нейронной сети SpiderNet, разработанную для решения задач детектирования мошенничества. Мы заметили, что принципы работы пулинговых и сверточных слоев в нейронных сетях похожи на методы работы аналитиков при проведении расследований. Кроме того, применяемые в нейронных сетях пропускные соединения позволяют использовать признаки различной силы. Наши эксперименты показали, что SpiderNet дает лучшее качество по сравнению с Random Forest, CNN, DenseNet и адаптированной под антифрод F‑DenseNet. В этой работе мы также предлагаем новые подходы для разработки антифрод-правил – Б-тесты и W-тесты. Программный код SpiderNet доступен по ссылке: https://github.com/aasmirnova24/SpiderNet
1. ВВЕДЕНИЕ
Развитие современных технологий способствует не только росту мировых экономик, но и развитию мошенничества, что приводит к ежегодным потерям миллиардов долларов во всем мире.
В 2018 г. восемь индийских банков понесли убытки в размере 1.3 миллиарда долларов по делу о мошенничестве11. В другом случае сельскохозяйственный банк Китая потерял 497 миллионов долларов на партнерском мошенничестве22. Другая нарастающая угроза – социальная инженерия, ударившая по россиянам, которые по официальной статистике потеряли 13.4 млрд руб. в 2022 г.33, что в 14 раз выше аналогичных потерь в 2017 г.44
Инструменты противодействия мошенничеству можно разделить на директивные, превентивные и детективные.
Директивные инструменты, такие как инструкции и запреты, работают по принципу “пугала”. Превентивные инструменты позволяют предотвратить мошенничество, однако мошенники адаптируются и находят способы, как их обойти. Детективные инструменты позволяют выявлять мошенничество. Для разработки детективных инструментов применяются статистические подходы и методы машинного обучения, однако в этой области есть ряд нерешенных проблем со стабильностью и низкой обобщающей способностью моделей, а также закрытость экспертной области [1]. С другой стороны, в последние годы мы стали свидетелями выдающихся достижений в области глубокого обучения и успешного применения нейронных сетей в задачах компьютерного зрения [2, 3] и обработке естественного языка [4, 5].
В этой работе представлена новая архитектура нейронной сети SpiderNet для выявления мошенничества. В основе SpiderNet лежат операции сверток и пулингов, которые похожи на методы работы антифрод-аналитиков при проведении расследований. В архитектуре SpiderNet также используются остаточные связи [3], позволяющие подавать на вход признаки различной мощности, включая готовые фрод-скоринги от внешних провайдеров. Мы показываем, что SpiderNet обеспечивает лучшее качество по сравнению с Random Forest и адаптированными под фрод-моделирование сверточными архитектурами 1D-CNN и F-DenseNet (рис. 1). В этой работе мы также предлагаем новые подходы для разработки антифрод-правил Б-тесты и W-тесты, основанные на идеях выявления манипуляций с помощью закона Бенфорда [6]. Мы обобщаем Б-тесты и W-тесты на все типы данных, где неприменим закон Бенфорда. Для оценки качества моделей мы используем метрики AUC ROC и AUC PR, а также разработанную нами бизнес-метрику PL, позволяющую оценить спасенные от внутреннего мошенничества денежные средства.
Рис. 1.
Архитектуры сверточных нейронных сетей, адаптированные для выявления мошенничества: (а) 1D-CNN, (б) F-DenseNet, (в) SpiderNet.

Мы сравниваем SpiderNet с другими моделями на двух наборах данных – приватном и общедоступном. Приватный набор содержит данные о кредитах и внутреннем мошенничестве со стороны POS-партнеров банка, входящего в топ-50 российских банков по размеру активов. Общедоступный набор взят с конкурса по выявлению мошенничества с онлайн-платежами, организованного Ant Financial Services Group55.
2. ОБЗОР ЛИТЕРАТУРЫ
CNN архитектуры
За последнее десятилетие сверточные нейронные сети (CNN) совершили прорыв в задачах компьютерного зрения [7]. Принципы работы CNN были позаимствованы из работ Хьюбела и Визеля, исследовавших зрительную кору головного мозга [8]. Первая архитектура CNN была предложена ЛеКуном в конце 1980-х гг. [9]. Прорыв в обучении CNN произошел в 2012 г. на соревнованиях по компьютерному зрению ILSVRC, где в задачах классификации изображений победила сверточная нейронная сеть AlexNet [2]. В 2014 г. команда Google представила на ILSVRC архитектуру GoogLeNet [10], особенностью которой стали Inception-блоки с battleneck и свертками 1 × 1, которые позволили увеличивать количество сверточных каналов. В 2015 г. команда из Microsoft Research предложила архитектуру ResNet [3], в которой использовались пропускные соединения, создающие неявный эффект ансамблирования. В 2019 г. команда из Google Research предложила подход EfficientNet [11], позволяющий масштабировать глубокие CNN, за счет подбора оптимальной комбинации depth, width и resolution в сверточных сетях.
Нейросети для выявления мошенничества
С началом бума глубокого обучения нейронные сети стали вытеснять классические методы машинного обучения в исследованиях по выявлению мошенничества [12]. Вайс и Омлин [13] предложили использовать LSTM-сеть для выявления мошеннических транзакций. Фу и соавт. [14] решили аналогичную задачу выявления карточного мошенничества, обучив архитектуру сверточной нейронной сети LeNet-5. Для этого авторы представили транзакции в виде прямоугольных матриц признаков, которые подавались на вход CNN как двумерные картинки. Хериади и Варнарс [15] попытались объединить CNN c LSTM, предложив гибридную архитектуру CNN-LSTM. Однако эксперименты показали, что простая CNN выявляет мошенничество лучше, чем гибридная сеть.
В последующих работах Ли и соавт. [16] применили DenseNet для выявления кражи электроэнергии в Китае. Чен и Лю [17] доработали архитектуру DenseNet, добавив в начало сети модуль Inception и дополнительные пропускные соединения между Inception-слоем и Dense-блоками. Ченг и соавт. [18] предложили основанную на внимании трехмерную сверточную сеть STAN. На задаче выявления транзакционного мошенничества STAN показала лучшее качество по сравнению с градиентным бустингом, CNN, LSTM и др. В задачах выявления организованного мошенничества на интернет-сайтах (фейковые отзывы, боты, спам и пр.) на сегодняшний день набирают популярность графовые нейронные сети, позволяющие извлекать признаки для взаимосвязанных объектов [19].
3. SpiderNet
Постановка задачи
При разработке архитектуры нейронной сети для выявления мошенничества мы исходим из того, что разработанные экспертами антифрод-правила являются своего рода цифровыми уликами. При этом антифрод-правила, как и улики, имеют различный уровень доказательности и могут использоваться в сочетании друг с другом, усиливая доказательную базу. Эта интуиция говорит нам о том, что наиболее подходящими инструментами для комбинирования антифрод-правил и отбора сильных комбинаций являются операции свертки и пулинга, применяемые в CNN. С другой стороны, если комбинация правил, полученная на скрытых слоях, обладает высокой предсказательной способностью, то мы хотим ее использовать сразу на выходном слое, перебрасывая с помощью пропускных соединений (skip-connection). Эта интуиция отражает лучшие практики расследований мошенничества и может быть реализована с помощью полносвязной сверточной нейронной сети, которую мы назвали SpiderNet (рис. 1).
Spider-блок
SpiderNet состоит из блоков, которые связаны друг с другом с помощью пропускных соединений. Таким образом каждый блок получает информацию от всех предыдущих блоков и после обработки передает ее на все последующие блоки. Поскольку мы хотим иметь на выходе только самые сильные функции, то наиболее отдаленные от выхода блоки должны содержать несколько слоев пулинга для отсеивания слабых функций. И, наоборот, чем ближе блок находится к выходу сети, тем меньше слоев пулинга он содержит, принимая на вход отфильтрованные сильные функции. Общая архитектура Spider-блока показана на рис. 2.
Функционально k-тый Spider-блок определяется рекурсивной формулой:
(1)
${{y}_{k}} = {{\mathcal{F}}_{k}}\left( {{{y}_{{k - 1}}} \oplus \ldots \oplus {{y}_{1}}} \right) = {{\mathcal{F}}_{k}}\left( {\sum\limits_{i = 1}^{k - 1} \oplus {{y}_{i}}} \right),$$ \circ $ ${{\mathcal{F}}_{k}}\left( \cdot \right)$ – оператор k-го блока, объединяющий функции dropout, convolution, batch normalization, ReLU и Max-pooling;
$ \circ $ $ \oplus $ – оператор конкатенации входящих векторов;
$\sum \oplus $ – короткая запись конкатенации векторов;
$ \circ $ ${{y}_{i}}$ – выходной вектор i-го блока, подаваемый на вход k-го блока $\left( {1 \leqslant i < k} \right)$.
В последнем блоке SpiderNet для уменьшения размерности каналов добавлена операция Global Average Pooling. Поле этих преобразований вектор подается на два полносвязных слоя с операциями dropout и SoftMax для бинарной классификации. Формула (1) показывает математическую интуицию – SpiderNet работает как ансамбль нейронных сетей.
4. ГЕНЕРАЦИЯ ПРАВИЛ
Б-тесты
Обобщая идеи закона Бенфорда [6] для числовых и категориальных типов данных, мы предлагаем методику Б-тестов, которая заключается в сравнении характеризующего объект распределения с распределением всех объектов. Применение Б-тестов базируется на том, что данные о деятельности мошенников отличаются от среднестатистического поведения (рис. 3).
Б-тест рассчитывается как разница площадей для двух дискретных распределений (мошеннического и совокупного):
где ${{a}_{i}}$ и ${{b}_{i}}$ – сравниваемые распределения;$ \circ $ $n$ – количество квантилей.
Количество квантилей $n$ и пороговое значение $S$ зависят от количества наблюдений в выборках и могут настраиваться как гиперпараметры [20].
W-тесты
Для расчета W-теста используется метрика Вассерштейна:
(3)
${{W}_{p}}\left( {\mu ,\nu } \right) = \mathop {\inf }\limits_{\gamma \in \Gamma \left( {\mu ,\nu } \right)} {{E}_{{\left( {x,y} \right) \sim \gamma }}}\left[ {{\text{||}}x - y{\text{||}}} \right],$Метрика Вассерштейна решает проблему маленьких данных в выборках, к которой чувствительны Б-тесты. Однако метрика Вассерштейна применима только к числовым типам данных.
5. ЭКСПЕРИМЕНТ
Данные
Мы обучили и сравнили SpiderNet с другими моделями на двух наборах данных – приватном и общедоступном (табл. 1).
Таблица 1.
Характеристики приватного и общедоступного набора данных
| Приватный набор | Общедоступный набор | |
|---|---|---|
| Источник | Российский банк, топ-50 | Ant Financial Services Group |
| Тип данных | POS-кредиты | Платежи |
| Вид мошенничества | Внутреннее | Транзакционное |
| Период наблюдений | 03.2014–10.2019 | 09.2017–11.2017 |
| Наблюдений, # | 1 880 499 | 990 006 |
| Fraud-наблюдений, # | 5327 | 12 122 |
| Исходных признаков, # | 509 | 297 |
| Отобранных признаков, # | 163 | 128 |
Приватный набор. Приватный набор содержит данные о кредитах POS-партнеров банка, входящего в топ-50 российских банков по размеру активов. Согласно внутренней процедуре банка, убыточные POS-партнеры помечены как мошеннические, прибыльные – как не мошеннические. Общая задача сводится к прогнозированию внутреннего мошенничества на основе данных о действиях POS-партнера.
Общедоступный набор. Общедоступный набор взят из конкурса выявления мошенничества в онлайн-платежах, организованного Ant Financial Services Group. Набор содержит признаки по платежам и бинарную целевую переменную. Для формирования обучающих выборок мы провели предварительную обработку данных, удалив пустые и коррелированные признаки.
Архитектуры нейронных сетей
Для оценки качества SpiderNet мы сравнили несколько архитектур и моделей:
1. Random Forest – базовая модель, надежный алгоритм и отраслевой стандарт для моделирования на табличных данных. Для настройки гиперпараметров мы использовали перекрестную проверку на 5-fold и библиотеку Optuna;
2. 1D-CNN – одномерная сверточная сеть;
3. 1D-DenseNet – архитектура DenseNet [21] для одномерных векторов;
4. F-DenseNet – адаптированный DenseNet для выявления мошенничества с двумя полносвязными сверточными блоками;
5. SpiderNet – наша нейронная сеть (рис. 4).
При обучении нейросетей мы использовали L2-регуляризацию, BatchNorm и ReLU в сверточных слоях, dropout в полносвязных слоях. В блоках F-DenseNet и SpiderNet для пропускных соединений между блоками мы использовали dropout после объединения входных векторов (рис. 2). Мы также использовали технику fraud-rate leveling, чтобы решить проблему отсутствия мошеннических наблюдений в батчах. Наборы данных были стратифицировано разделены на обучающую $(80\% )$, валидационную $(10\% )$ и тестовую $(10\% )$ выборки. Настройка гиперпараметров нейросетей проводилась на валидационной выборке с использованием Grid-Search и метода ранней остановки.
Метрики качества
Оценка качества моделей осуществлялась с помощью метрики AUC ROC и нечувствительной к дисбалансу метрики AUC PR [22]. Для оценки качества моделей на приватном наборе мы разработали метрику PL (предотвращенные потери), которая показывает, какой объем потерь от внутреннего мошенничества предотвращает модель. Показатель PL рассчитывается через предотвращенные потери для каждого POS-партнера:
(5)
$P{{L}^{{\left( i \right)}}} = {{P}_{{({{T}_{l}} - {{T}_{a}})}}} \cdot \frac{{DR - D{{R}_{0}}}}{{1 - D{{R}_{0}}}},$$ \circ $ $k$ – количество первых k партнеров с самым высоким fraud-скором (для нашего банка $k = 40$);
$ \circ $ ${{b}_{i}}$ – бинарная переменная для i-го партнера: 1 – мошенник, 0 – не мошенник;
$ \circ $ ${{T}_{l}}$ – весь период потерь;
$ \circ $ ${{T}_{a}}$ – период, на котором работает модель;
$ \circ $ $\left( {{{T}_{l}} - {{T}_{a}}} \right)$ – период, на котором рассчитываются убытки до вызревания триггерных показателей просрочки;
$ \circ $ $DR$ – уровень кредитной просрочки партнера на периоде $\left( {{{T}_{l}} - {{T}_{a}}} \right)$;
$ \circ $ $D{{R}_{0}}$ – точка безубыточности для уровня просрочки;
$ \circ $ ${{P}_{{({{T}_{l}} - {{T}_{a}})}}}$ – сумма выданных партнером кредитов за период $\left( {{{T}_{l}} - {{T}_{a}}} \right)$.
Общая сумма PL рассчитывается исходя из предположения, что расходы банка на сотрудников службы безопасности не увеличиваются (k = 40).
6. РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТОВ
Подбор гиперпараметров моделей проводился с помощью метрики AUC PR. Для всех нейросетей мы использовали оптимизатор Adam. Гиперпараметры всех моделей содержатся в прилагаемом программном коде. Результаты экспериментов представлены в табл. 2.
Таблица 2.
Качество моделей для обнаружения внутреннего мошенничества (приватный набор) и транзакционного мошенничества (общедоступный набор): лучшие результаты выделены жирным; в скобках – 95% доверительные интервалы
| 2Модель | Приватный набор (тестовая выборка) | Публичный набор (тестовая выборка) | ||
|---|---|---|---|---|
| AUC PR | AUC ROC | AUC PR | AUC ROC | |
| Random Forest | 0.0650 $( \pm 0.00112)$ | 0.9371 $( \pm 0.0093)$ | 0.4881 $( \pm 0.003114)$ | 0.9709 $( \pm 0.00357)$ |
| CNN3 | 0.0527 $( \pm 0.00101)$ | 0.9339 $( \pm 0.0130)$ | 0.4462 $( \pm 0.003096)$ | 0.9670 $( \pm 0.00467)$ |
| CNN6 | 0.0644 $( \pm 0.00111)$ | 0.9385 $( \pm 0.0114)$ | 0.4908 $( \pm 0.003114)$ | 0.9711 $( \pm 0.00478)$ |
| CNN8 | 0.0708 $( \pm 0.00116)$ | 0.9288 $( \pm 0.0096)$ | 0.5099 $( \pm 0.003114)$ | 0.9718 $( \pm 0.00451)$ |
| DenseNet6 | 0.0646 $( \pm 0.00111)$ | 0.9315 $( \pm 0.0091)$ | 0.4757 $( \pm 0.003111)$ | 0.9669 $( \pm 0.00494)$ |
| DenseNet8 | 0.0691 $( \pm 0.00115)$ | 0.9310 $( \pm 0.0106)$ | 0.4854 $( \pm 0.003113)$ | 0.9686 $( \pm 0.00466)$ |
| FDenseNet6 | 0.0732 $( \pm 0.00118)$ | 0.9263 $( \pm 0.0145)$ | 0.5092 $( \pm 0.003114)$ | 0.9708 $( \pm 0.00508)$ |
| FDenseNet8 | 0.0575 $( \pm 0.00105)$ | 0.9186 $( \pm 0.0158)$ | 0.4968 $( \pm 0.003114)$ | 0.9704 $( \pm 0.00478)$ |
| SpiderNet6 | 0.0948$( \pm 0.00133)$ | 0.9484$( \pm 0.0080)$ | 0.5375$( \pm 0.003106)$ | 0.9721$( \pm 0.00476)$ |
| SpiderNet8 | 0.0680 $( \pm 0.00114)$ | 0.9277 $( \pm 0.0096)$ | 0.5160 $( \pm 0.003113)$ | 0.9684 $( \pm 0.00474)$ |
Мы видим, что при увеличении количества пропускных соединений растет качество нейросетей. Это подтверждает нашу гипотезу о том, что сильные признаки должны передаваться с разных уровней сети на выходные слои за счет пропускных соединений. С другой стороны, мы видим, что DenseNet-8 работает хуже, чем CNN-8, у которого нет пропускных соединений. Это может объясняться тем, что для табличных данных bottleneck между блоками в DenseNet не позволяют сильным признакам напрямую передаваться на выход сети.
Оценка моделей внутреннего мошенничества на приватном наборе данных показала значимый экономический эффект (табл. 3). Поскольку показатель PL не нормализован, в табл. 3 также приведены PL для случайного и идеального классификаторов. Мы видим, что по показателю PL на приватном наборе SpiderNet-6 уступил CNN-6. Это может быть связано с тем, что гиперпараметры сетей подбирались по интегральной метрике AUC PR, в то время как метрика PL является пороговой и охватывает небольшое количество мошеннических партнеров. С другой стороны, SpiderNet-6 превосходит CNN-6 по количеству выявленных мошеннических партнеров, однако проигрывает CNN3 по этому же показателю. При этом по 5 другим метрикам SpiderNet-6 выигрывает у CNN-3 и CNN-6. Статистическая значимость полученного преимущества SpiderNet-6 была оценена через знаковый тест, результаты которого представлены в табл. 4.
Таблица 3.
Качество моделей для обнаружения внутреннего мошенничества: лучшие результаты выделены жирным шрифтом
| # | Модель | Приватный набор (тестовая выборка) | |
|---|---|---|---|
| Fraud, # | PL | ||
| Random classifier | 208 | $2 079 527 | |
| 1 | Random Forest | 48 | $325 604 |
| 2 | CNN-3 | 312 | $2 235 707 |
| 3 | CNN-6 | 280 | $2 753 821 |
| 4 | CNN-8 | 280 | $2 337 297 |
| 5 | DenseNet-6 [3, 3 ] | 240 | $2 324 181 |
| 6 | DenseNet-8 [4, 4 ] | 288 | $2 433 914 |
| 7 | F-DenseNet-6 [3, 3 ] | 240 | $2 297 848 |
| 8 | F-DenseNet-8 [4, 4 ] | 272 | $2 402 470 |
| 9 | SpiderNet-6 | 304 | $2 570 014 |
| 10 | SpiderNet-8 | 264 | $2 379 977 |
| Perfect classifier | 888 | $4 659 439 | |
Таблица 4.
Знаковый тест для двух пар результатов: CNN-3 и Spider Net-6, CN-6 и SpiderNet-6 (показатели PL и количества мошенничества нормализованы в соответствии с идеальным классификатором)
| CNN3 | SpiderNet6 | CNN6 | SpiderNet6 | |
|---|---|---|---|---|
| Приватный набор: | ||||
| AUC PR | 0.0527 | 0.0948 | 0.0644 | 0.0948 |
| AUC ROC | 0.9339 | 0.9484 | 0.9385 | 0.9484 |
| PL (recall) | 0.4798 | 0.5516 | 0.5910 | 0.5516 |
| Fraud (recall) | 0.3514 | 0.3423 | 0.3153 | 0.3423 |
| Публичный набор: | ||||
| AUC PR | 0.4462 | 0.5375 | 0.4908 | 0.5375 |
| AUC ROC | 0.9670 | 0.9721 | 0.9711 | 0.9721 |
| p-value | 0.015625 | 0.015625 | ||
Мы также проверили эффективность Б-тестов и W-тестов, обучив модели на двух выборках:
1. Полная выборка – 24 Б-теста, 15 W-тестов и 124 экспертных правила;
2. Усеченная выборка – 124 экспертных пра- вила.
Полученные результаты показали высокую эффективность Б/W-тестов (рис. 5).
Результаты экспериментов также показали, что наш метод экспоненциального dropout между сверточными слоями обеспечивает значительный прирост качества по сравнению с константным или нулевым dropout (рис. 6).
7. ВЫВОДЫ
В этой работе мы исследовали новую архитектуру нейронной сети SpiderNet для выявления мошенничества, основанную на идеях пропускных соединений [3] и на принципах работы антифрод-экспертов. Мы также предложили новые методы разработки антифрод-правил – Б-тесты и W-тесты. Отметим, что SpiderNet не решает всех проблем антифрод-моделирования, сформулированных Болтоном, Хэндом, Провостом и Брейманом [1]. В частности, для обучения моделей мы по-прежнему используем экспертные правила. Наши B/W-тесты частично решают эту проблему, но существуют и другие методы для разработки антифрод-правил, такие как графовые [19], методы изменения энтропии [14] и другие. Мы планируем исследовать эту тему в наших будущих работах. Важной компонентой SpiderNet является skip-соединение, которое перенаправляет сильные признаки на выходные слои, решая проблему локальности в свертках и чувствительности к перестановке признаков. Однако текущая реализация SpiderNet не полностью решает проблему перестановки признаков, поэтому наша будущая работа будет сосредоточена на этой проблеме.
Список литературы
Bolton R.J., Hand D.J. Statistical Fraud Detection: A Review // Statistical Science. 2002. V. 17. № 3. P. 235–255, 1999. https://doi.org/10.1214/ss/1042727940
Krizhevsky A., Sutskever I., Hinton G.E. ImageNet Classification with Deep Convolutional Neural Networks. 2012. http://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf
He K., Zhang X., Ren S., Sun J. Deep Residual Learning for Image Recognition // Microsoft Research. 2015. https://arxiv.org/pdf/1512.03385v1.pdf
Van den Oord A., Dieleman S., Heiga Zen, Karen Simonyan, Oriol Vinyals, Alex Graves, Nal Kalchbrenner, Andrew Senior, Koray Kavukcuoglu. Wavenet: A generative model for raw audio. 2016. arXiv preprint arXiv:1609.03499
Paulus R., Caiming Xiong, Richard Socher. A deep reinforced model for abstractive summarization. 2017. arXiv preprint arXiv:1705.04304
Benford F. The law of anomalous numbers // Proc. Am. Philos. Soc. March 1938. V. 78. № 4. P. 551–572. https://doi.org/10.2307/984802
Raghu M., Schmidt E. A Survey of Deep Learning for Scientific Discovery. 2020. arxiv.org/abs/2003.11755
Hubel D.H., Wiesel T.N. Receptive fields, binocular interaction and functional architecture in the cat’s visual cortex” // J. Physiol. 1962. V. 160. P. 106–154. https://doi.org/10.1113/jphysiol.1962.sp006837
LeCun Y., Boser B., Denker J.S., Henderson D., Ho-ward R.E., Hubbard W., Jackel L.D. Backpropagation applied to handwritten zip code recognition // Neural computation, 1989. https://doi.org/10.1162/neco.1989.1.4.541
Szegedy C., Liu W., Jia Y., Sermanet P., Reed S., Anguelov D., Erhan D., Vanhoucke V., Rabinovich A. Going deeper with convolutions. Google Inc. 2014. https://arxiv.org/pdf/1409.4842v1.pdf
Tan M., QuocV.Le. EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks. 2019. arxiv.org/abs/1905.11946
Kanika, Dr Jimmy Singla. A Survey of Deep Learning based Online Transactions Fraud Detection Systems. 2020. https://doi.org/10.1109/ICIEM48762.2020.9160200
Wiese B.J., Omlin C. Credit Card Transactions, Fraud Detection, and Machine Learning: Modelling Time with LSTM Recurrent Neural Networks. // Innovations in Neural Information Paradigms and Applications. Springer, 2007. P. 231–268. https://doi.org/10.1007/978-3-642-04003-0
Fu K., Cheng D., Tu Y., Zhang L. Credit Card Fraud Detection Using Convolutional Neural Networks // In: (eds) Neural Information Processing. ICONIP 2016. Lecture Notes in Computer Science, vol 9949. Springer, Cham, 2016. https://doi.org/10.1007/978-3-319-46675-053
Heryadi Y., Harco Leslie Hendric Spits Warnars. Learning temporal representation of transaction amount for fraudulent transaction recognition using CNN, Stacked LSTM, and CNN-LSTM // IEEE International Conference on Cybernetics and Computational Intelligence (CyberneticsCom). 2017. https://doi.org/10.1109/CYBERNETICSCOM.2017. 8311689
Li B., Xu K., Xiaoyan Cui, Yiheng Wang, Xinbo Ai, Yan-bo Wang. Multi-Scale DenseNet-Based Electricity Theft Detection. 2018. researchgate.net/publication/ 344779530_Multi-scale_DenseNet-Based_Electricity_Theft_Detection
Chen Z., Liu G. DenseNet+Inception and Its Application for Electronic Transaction Fraud Detection. 2019. https://doi.org/10.1109/HPCC/SmartCity/DSS.2019.00357
Cheng D., Xiang S., Shang C., Zhang Y., Yang F., Zhang L. Spatio-Temporal Attention-Based Neural Network for Credit Card Fraud Detection. 2020. https://doi.org/10.1609/aaai.v34i01.5371
Dou Y., Liu Z., Sun L., Deng Y., Peng H., Yu P.S. Enhancing Graph Neural Network-based Fraud Detectors against Camouflaged Fraudsters. 2020. https://doi.org/10.1145/3340531.3411903
Afanasiev S. and Smirnova A. Predictive fraud analytics: B-tests. 2018. https://doi.org/10.21314/JOP.2018.213
Huang G., Liu Z., Laurens van der Maaten, Kilian Q. Weinberger. Densely Connected Convolutional Networks. 2018. arxiv.org/abs/1608.06993https://doi.org/10.1109/CVPR.2017.243
Saito T., Rehmsmeier M. The Precision-Recall Plot Is More Informative than the ROC Plot When Evaluating Binary Classifiers on Imbalanced Datasets. // PLoS ONE. 2015. V. 10. № 3. e0118432, March 2015. https://doi.org/10.1371/journal.pone.0118432
Дополнительные материалы отсутствуют.
Инструменты
Доклады Российской академии наук. Математика, информатика, процессы управления







