Поверхность. Рентгеновские, синхротронные и нейтронные исследования, 2020, № 7, стр. 89-97
Анализ доверительных областей для параметров регрессионной модели на основе закона Фаулера–Нордгейма
Н. В. Егоров a, *, А. Ю. Антонов a, М. И. Вараюнь a
a Санкт-Петербургский государственный университет
199034 Санкт-Петербург, Россия
* E-mail: robby7@mail.ru
Поступила в редакцию 17.12.2019
После доработки 22.01.2020
Принята к публикации 24.01.2020
Аннотация
В работе рассматривается двухпараметрическая регрессионная модель на основе классической для области полевой электронной эмиссии формулы Фаулера–Нордгейма. Оптимальные значения параметров определяются методом наименьших квадратов. В рамках статистического эксперимента проводится оценка характеристик доверительных областей. Уделяется внимание точности оценок параметров, границам индивидуальных доверительных интервалов, совместным доверительным эллипсам. Для значений напряжения используются два вида планов эксперимента. Погрешность измерений силы тока формируется с помощью модели шума специального вида. В ходе компьютерного эксперимента данные подвергаются тесту Шапиро–Уилка, проверяющего нормальность их распределения, а регрессионная модель проходит проверку на значимость. Выявляется процент выборок, которые могут не удовлетворять указанным критериям.
ВВЕДЕНИЕ
Приборы и устройства, одним из основных элементов которых является полевой электронный источник, продолжают рассматриваться как крайне перспективные [1]. Не в последнюю очередь этому способствует тот факт, что время запаздывания отклика на изменение напряжения $V$ между катодом и анодом является ничтожно малым. Упомянутое обстоятельство позволяет рассматривать полевые эмиссионные катоды как близкие к совершенным системы управления.
Конечно, для работы систем в режиме полевой электронной эмиссии (ПЭЭ) необходимо выполнение некоторых условий, ограничивающих область их применения. Ясно, что помимо напряжения на отклик влияют и другие факторы, например, температура $T$ и значение работы выхода $\Phi .$ И если влиянием температуры часто пренебрегают, хотя она обеспечивает свой вклад в ширину энергетического спектра, то даже очень малых вариаций работы выхода вполне достаточно, чтобы отметить изменение силы тока $I$ и даже провести косвенный анализ коэффициента прохождения электронами потенциального барьера на границе катода [2]. В связи с такой чувствительностью рабочей поверхности полевого источника для его эксплуатации необходим высокий уровень вакуума. Есть основания считать, что новые материалы позволят расширить диапазон давления, при котором станет возможным стабильное и легко управляемое функционирование катодных узлов такого рода [3].
Основным законом, который используется для описания зависимости силы тока от напряжения, остается формула Фаулера–Нордгейма [4]:
где параметры $A$ и $B$ можно считать постоянными величинами только для определенной, рассматриваемой в ходе эксперимента системы. Дело в том, что, являясь интегральными характеристиками, $A$ и $B$ зависят и от распределения работы выхода по поверхности, и от геометрии данной поверхности. Попытки придать данным параметрам вполне четкую связь с работой выхода $\Phi $ [5], площадью эмиссии $S$ [6] или геометрическим фактором поля $\beta $ [7] являются одной из основных задач анализа вольт-амперных характеристик (ВАХ). Впрочем, трудно представить, что двухпараметрическая модель (1) способна дать исчерпывающее описание источника, особенно после того, как эксперимент существенно отошел от предпосылок, заложенных в теорию Фаулера–Нордгейма. При этом отклонения от линейной зависимости выражения $\lg ({I \mathord{\left/ {\vphantom {I {{{V}^{2}}}}} \right. \kern-0em} {{{V}^{2}}}}),$ как функции обратного напряжения ${1 \mathord{\left/ {\vphantom {1 V}} \right. \kern-0em} V}$ [7–9], не анализируются с использованием других моделей, например с трехпараметрической моделью, рассмотренной в [10 и 11].Тем не менее, какая бы модель не применялась при анализе ВАХ, необходимо представлять, с какой точностью экспериментатор способен оценить ее параметры. Дать не только точечную, но и интервальную оценку позволяет математический аппарат, заложенный в регрессионном анализе. Но поскольку результат такой оценки зависит от конкретной выборки измеренных значений напряжения и силы тока, выводы, сделанные на их основе, могут касаться только рассматриваемого образца.
В связи с вышеизложенным, целью настоящей работы является выявление зависимости точности статистических оценок для параметров регрессионной модели на основе закона Фаулера–Нордгейма. Чтобы получить представление о поведении оценок в среднем, а не на основе одной серии наблюдений, для получения выборки значений напряжения и силы тока используется математическое моделирование и компьютерный эксперимент.
МАТЕМАТИЧЕСКАЯ МОДЕЛЬ
Ранее [11] было показано, что задача параметрической идентификации сигнала полевой электронной эмиссии может быть сформулирована в рамках как линейной, так и нелинейной постановки. Здесь под сигналом понимается значение силы тока $I,$ полученное при заданном значении напряжения $V$. Классическая двухпараметрическая ($p = 2$) модель предлагается на основе (1) в виде:
(2)
$\begin{gathered} I = I\left( {V;{\mathbf{q}}} \right) = {{I}_{0}}A{{\left( {\frac{V}{{{{V}_{0}}}}} \right)}^{2}}\exp \left[ { - B\frac{{{{V}_{0}}}}{V}} \right], \\ {\mathbf{q}} = \left( {{{q}_{1}},{{q}_{2}}} \right) = \left( {A,B} \right) \in Q, \\ Q = \left\{ {\left( {{{q}_{1}},{{q}_{2}}} \right):{{q}_{1}} > 0,{{q}_{2}} > 0} \right\}, \\ \end{gathered} $Введем обозначения:
(3)
$X = \frac{{{{V}_{0}}}}{V},\,\,\,\,Y = \lg \left[ {\frac{I}{{{{I}_{0}}}}\frac{{V_{0}^{2}}}{{{{V}^{2}}}}} \right].$В регрессионном и дисперсионном анализе величина $X$ называется фактором, а $Y$ – откликом сигнала. Уже упоминалось, что преобразование (3) приводит к линейной зависимости между фактором и откликом (такая модель носит название простой [12]):
(4)
$\begin{gathered} Y = \varphi \left( {X;{\mathbf{\theta }}} \right) = {{{\mathbf{\theta }}}^{T}}{\mathbf{g}}\left( X \right) = \sum\limits_{j = 1}^p {{{\vartheta }_{j}}} {{g}_{j}}\left( X \right) = A{\kern 1pt} '\, + B{\kern 1pt} 'X, \\ {\mathbf{\theta }} = {{\left( {{{\vartheta }_{1}},{{\vartheta }_{2}}} \right)}^{T}} = {{\left( {A{\kern 1pt} ',B{\kern 1pt} '} \right)}^{T}} \in \Theta , \\ \Theta = \left\{ {\left( {{{\vartheta }_{1}},{{\vartheta }_{2}}} \right):{{\vartheta }_{1}} \in \mathbb{R},\,\,{{\vartheta }_{2}} < 0} \right\}, \\ A{\kern 1pt} ' = \lg A,\,\,\,\,B{\kern 1pt} ' = - {B \mathord{\left/ {\vphantom {B {\ln 10}}} \right. \kern-0em} {\ln 10}}, \\ {\mathbf{g}}\left( X \right) = {{\left( {{{g}_{1}}\left( X \right),\,\,{{g}_{2}}\left( X \right)} \right)}^{T}} = {{\left( {1,X} \right)}^{T}}. \\ \end{gathered} $Цель работы может быть достигнута только после проведения серии статистических испытаний. Исходя из этого, будем считать зависимость (2) точной, а погрешности ${{\varepsilon }_{I}}$ – гауссовскими случайными величинами с нулевым математическим ожиданием и среднеквадратичным отклонением, пропорциональным $I{\text{:}}$
(5)
$\begin{gathered} {{{\tilde {I}}}_{i}} = {{I}_{i}} + {{\varepsilon }_{{I,i}}} = {{I}_{i}} + {{I}_{0}}{{\varepsilon }_{i}} = {{I}_{i}}(1 + \delta \varepsilon _{i}^{'}), \\ i = 1,2,...,N, \\ \end{gathered} $(6)
$\begin{gathered} J\left( {{\mathbf{\hat {\theta }}}} \right) = \mathop {\min }\limits_{{\mathbf{\theta }}\, \in \,{\Theta }} J\left( {\mathbf{\theta }} \right) = \sqrt {\frac{1}{N}\sum\limits_{i\, = \,1}^N {\hat {e}_{i}^{2}} } ,\,\,\,\,{{{\tilde {y}}}_{i}} = {{{\hat {y}}}_{i}} + {{{\hat {e}}}_{i}}, \\ {{{\hat {y}}}_{i}} = f\left( {{{x}_{i}};{\mathbf{\hat {\theta }}}} \right). \\ \end{gathered} $1. ${{\hat {e}}_{i}}$ являются независимыми случайными величинами;
2. ${{\hat {e}}_{i}}$ одинаково распределены по нормальному закону с нулевым средним и постоянными дисперсиями.
В нашем случае (математическое моделирование) величины ${{\hat {e}}_{i}}$ формируются посредством независимых реализаций $\varepsilon _{i}^{'},$ что дает основания считать первое свойство выполненным. В рамках натурного эксперимента наличие этого свойства подлежит анализу. Например, можно воспользоваться тестом Дарбина–Уотсона на проверку наличия или отсутствия автокорреляции [12]. Такое исследование вынесено за рамки настоящей работы и будет проведено позднее.
Второе свойство асимптотически выполнено при $\delta \to 0,$ что установлено ранее [11], причем равенство нулю выборочного среднего для величин ${{\hat {e}}_{i}}$ достигается согласно способу их построения. Но опять же единичная выборка наблюдений $\left\{ {{{X}_{i}},{{{\tilde {Y}}}_{i}}} \right\}_{{i\, = \,1}}^{N}$ приводит к своей конкретной оптимальной оценке ${\mathbf{\hat {\theta }}}$ (и, как следствие, к ${\mathbf{\hat {q}}}$), являющейся случайной величиной, и конкретной совокупности остатков ${{\hat {e}}_{i}}.$ Эта совокупность должна пройти тесты на принадлежность нормальному закону распределения и гомоскедастичность (равенство дисперсий при различных значениях фактора $X$). Выбор критериев проверки остается за исследователем, но некоторые из них могут потребовать серий наблюдений отклика $\tilde {Y}$ для каждого значения $X.$ Построенные таким образом вольтамперные характеристики (ВАХ) трудно найти в литературе – как привило, наблюдения приводятся единичные (возможно, усредненные).
Если есть основания считать оба свойства для остатков ${{\hat {e}}_{i}}$ выполненными, то оптимальная оценка ${\mathbf{\hat {\theta }}}$ окажется случайной величиной с нормальным законом распределения и математическим ожиданием равным ${\mathbf{\theta }}{\text{*}}.$ Также она будет обеспечивать максимум функции правдоподобия [13]. С помощью указанных свойств гораздо удобнее становится процедура построения доверительных областей для значений параметра ${\mathbf{\hat {\theta }}}.$ Если хотя бы одно требование не является выполненным, то квадратичный функционал перестает иметь какое-либо значительное преимущество перед другими, за исключением простоты.
СТАТИСТИЧЕСКИЕ ОЦЕНКИ
Оценка МНК (6) для значений параметров линеаризованной модели (4) получается аналитически в виде:
где матрица ${\mathbf{M}}$ формируется на основе значений факторов анализируемой выборки и функций регрессионной модели ${{g}_{j}}\left( X \right)$ по следующей формуле:Пусть остатки ${{\hat {e}}_{i}}$ линеаризованной регрессионной модели удовлетворяют упомянутым в предыдущем разделе условиям. Тогда индивидуальные значения параметров ${{\vartheta }_{j}}$ на уровне значимости $\alpha $ укладываются в интервалы:
(8)
$\begin{gathered} \vartheta _{j}^{L} \leqslant {{\vartheta }_{j}} \leqslant \vartheta _{j}^{R},\,\,\,\,\vartheta _{j}^{L} = {{{\hat {\vartheta }}}_{j}} - {{\Delta {{\vartheta }_{j}}} \mathord{\left/ {\vphantom {{\Delta {{\vartheta }_{j}}} 2}} \right. \kern-0em} 2}, \\ \vartheta _{j}^{R} = {{{\hat {\vartheta }}}_{j}} + {{\Delta {{\vartheta }_{j}}} \mathord{\left/ {\vphantom {{\Delta {{\vartheta }_{j}}} 2}} \right. \kern-0em} 2},\,\,\,\,\Delta {{\vartheta }_{j}} = \vartheta _{j}^{R} - \vartheta _{j}^{L} = \\ = 2{{t}_{{{{1\, - \,\alpha } \mathord{\left/ {\vphantom {{1\, - \,\alpha } 2}} \right. \kern-0em} 2}}}}\left( {{{k}_{2}}} \right)\sqrt {{{s}^{2}}{{{\tilde {m}}}_{{jj}}}} ,\,\,\,\,{{s}^{2}} = \frac{1}{{{{k}_{2}}}}\sum\limits_{i\, = \,1}^N {{{{\hat {e}}}^{2}}} , \\ {{k}_{2}} = N - p, \\ \end{gathered} $Параметры ${{\vartheta }_{j}}$ не являются независимыми, поскольку оцениваются по одним и тем же измерениям. Совместная доверительная область для вектора ${\mathbf{\theta }}$ представляет собой в общем случае внутренность $p$-мерного эллипсоида:
(9)
${{\left( {{\mathbf{\theta }} - {\mathbf{\hat {\theta }}}} \right)}^{T}}{\mathbf{M}}\left( {{\mathbf{\theta }} - {\mathbf{\hat {\theta }}}} \right) \leqslant p{{s}^{2}}{{F}_{{1 - \alpha }}}\left( {{{k}_{1}},{{k}_{2}}} \right),\,\,\,\,{{k}_{1}} = p - 1,$(10)
${{S}_{{\mathbf{\theta }}}} = \frac{{\pi p{{s}^{2}}{{F}_{{1\, - \,\alpha }}}\left( {{{k}_{1}},{{k}_{2}}} \right)}}{{\sqrt {\det {\mathbf{M}}} }}.$(11)
$\Delta {{q}_{1}} = {{10}^{{\vartheta _{1}^{R}}}} - {{10}^{{\vartheta _{1}^{L}}}},\,\,\,\,\Delta {{q}_{2}} = \Delta {{\vartheta }_{2}}\ln 10.$ПОДГОТОВКА СТАТИСТИЧЕСКОГО ЭКСПЕРИМЕНТА
Как отмечалось ранее, точечные и интервальные оценки параметров регрессионной модели, а также любые статистики, связанные с единичной выборкой, являются случайными величинами. Чтобы установить их усредненное поведение в зависимости от уровня шума $\delta $ и количества наблюдений $N,$ необходимо провести серию экспериментов по анализу ${{N}_{{{\text{stat}}}}}$ выборок $\left\{ {{{X}_{i}},{{{\tilde {Y}}}_{i}}} \right\}_{{i\, = \,1}}^{N}.$ Авторы также решили обратить внимание на расположение значений факторов. Действительно, если положить измерения напряжения ${{V}_{i}}$ равноотстоящими, то величины ${{X}_{i}}$ в линеаризованной модели уже не будут таковыми. В связи с этим обстоятельством рассматривалось два способа. Первый способ (прямой, fV) подразумевал построение сетки ${{V}_{i}}$ (плана эксперимента) с постоянным шагом – рис. 1:
(14)
${{V}_{i}} = {{V}_{{\min }}} + \frac{{{{V}_{{\max }}} - {{V}_{{\min }}}}}{{N - 1}}\left( {i - 1} \right),\,\,\,\,i = 1,2,...,N.$(15)
${{V}_{i}} = \frac{{{{V}_{{\max }}}{{V}_{{\min }}}\left( {N - 1} \right)}}{{{{V}_{{\max }}}\left( {N - i} \right) + {{V}_{{\min }}}\left( {i - 1} \right)}},\,\,\,\,i = 1,2,...,N.$(16)
$\begin{gathered} W = \frac{1}{{{{s}^{2}}\left( {N - p} \right)}}{{\left( {\sum\limits_{i\, = \,1}^{N{\kern 1pt} '} {{{a}_{{N\, + \,1\, - \,i}}}\left( {{{{\hat {e}}}_{{(N\, + \,1\, - \,i)}}} - {{{\hat {e}}}_{{(i)}}}} \right)} } \right)}^{2}}, \\ N{\kern 1pt} ' = \left\lfloor {\frac{N}{2}} \right\rfloor , \\ \end{gathered} $В случае, когда значение уровня шума $\delta $ является существенным, а объем анализируемой выборки достаточно мал, может реализоваться ситуация, при которой оценки ${\mathbf{\hat {\theta }}}$ выходят за пределы области возможных значений $\Theta .$ Такое поведение обусловлено наличием так называемых “выбросов” – сильно отклоняющихся от среднего значения величин (рис. 1, 2). При визуальном анализе данных эксперимента ситуация с аномальными наблюдениями сразу же выделяется в отдельное рассмотрение. В ходе же статистического эксперимента из большого количества испытаний такой подход практически исключен. Здесь разумно допускать для формирования общей статистики те данные, регрессионные модели которых прошли проверку на значимость [14]. По этой причине проводилось вычисление статистики:
(17)
$F = \frac{{{{k}_{2}}}}{{{{k}_{1}}}}\frac{{\sum\limits_{i\, = \,1}^N {{{{\left( {\bar {Y} - {{{\hat {Y}}}_{i}}} \right)}}^{2}}} }}{{\sum\limits_{i\, = \,1}^N {{{{\left( {{{{\tilde {Y}}}_{i}} - {{{\hat {Y}}}_{i}}} \right)}}^{2}}} }},\,\,\,\,\bar {Y} = \frac{1}{N}\sum\limits_{i\, = \,1}^N {{{{\tilde {Y}}}_{i}}} ,$На рис. 1 треугольниками представлены данные $\left( {N = 20} \right),$ которые не прошли $W$-тест на нормальность величин ${{\hat {e}}_{i}}.$ При этом $F$-тест не поставил под сомнение значимость линеаризованной модели (4). Квадратами на том же рисунке изображены отклики $\left( {N = 10} \right),$ которые не удовлетворили обоим критериям. На рис. 2 ромбами показаны “измерения” $\left( {N = 10} \right)$, которые прошли $W$-тест, но регрессионная модель не была признана значимой. Наконец, оставшиеся точки (шарики) соответствуют примеру удовлетворительных данных $\left( {N = 30} \right),$ которые были использованы для дальнейшего анализа. При этом везде уровень шума составлял $\delta = 20\% .$ Можно заключить, что $F$-тест позволяет обнаруживать если не все, то некоторые ситуации с аномальными наблюдениями.
РЕЗУЛЬТАТЫ КОМПЬЮТЕРНОГО ЭКСПЕРИМЕНТА
Компьютерный статистический эксперимент предполагал анализ данных на основе ${{N}_{{{\text{stat}}}}} = {{10}^{7}}$ совокупности выборок, остатки которых прошли тест на нормальность в смысле величины (16) и регрессионные модели которых были признаны значимыми в смысле величины (17). Рассматривались три уровня шума $\delta {\text{:}}$ 0.05, 0.1 и 0.2. Объемы анализируемых выборок $N$ принимали значения: 10, 20, 30. При моделировании полагалось: ${{V}_{0}} = 1.0,$ ${{I}_{0}} = 1.0,$ ${{V}_{{\min }}} = 1.0,$ ${{V}_{{\max }}} = 10.0$ (единицы измерения в нашем случае роли не играют). Значения напряжений ${{V}_{i}}$ вычислялись по формулам (14) и (15). При формировании токового отклика ${{I}_{i}}$ согласно (2) использовались значения $A* = 2.0$ и $B{\kern 1pt} * = 4.0.$ Реализации нормально распределенных случайных величин $\varepsilon _{i}^{'}$ проводились на основе генератора псевдослучайных величин Mersenne Twister MT19937 [16] с использованием алгоритма, приведенного в [17]. Можно отметить, что поскольку сила тока предполагается положительной величиной, то моделирование ее флуктуаций требует усечения нормального распределения слева [18]. Альтернативный вариант генерирования шума может быть проведен на основе метода Монте-Карло, как в [19]. Проверка всех гипотез и построение доверительных областей проводились на уровне значимости $\alpha = 0.05$ (с доверительной вероятностью 95%).
Значения точечных и интервальных оценок на основе (7), (8) и (11) для исходных параметров нелинейной модели (2) при равноотстоящих значениях напряжения (сетка fV) приведены в табл. 1. В ней же указаны усредненные значения показателей (10), (12) и (13). Видно, что увеличение количества наблюдений и уменьшение уровня шума позволяет уменьшать доверительные области определения параметров, что полностью согласуется со здравым смыслом. При этом средние значения для точечных оценок оказываются предельно близкими к данным, заложенным в модель сигнала. Это позволяет в дальнейшем рассчитывать на тот факт, что если оценки и получаются смещенными при рассматриваемой модели шума специального вида, то величина этого смещения является сравнительно малой. Последняя колонка табл. 1 отражает процент выборок, которые были отбракованы на основе статистики (16). Здесь можно обратить внимание на тот факт, что характеристика ${{W}_{{{\text{rej}}}}}$ коррелирует с уровнем шума, и чем меньше число наблюдений, тем лояльнее “отношение” критерия к гипотезе о нормальности. При этом процент наблюдений, которые не прошли $F$-тест, оказался настолько мал (менее десятой процента), что ему было решено не уделять внимания.
Таблица 1.
$N$ | $\delta $ | $\langle {\mathbf{\hat {q}}}\rangle $ | $\left[ {\langle {{{\mathbf{q}}}^{L}}\rangle ,\langle {{{\mathbf{q}}}^{R}}\rangle } \right]$ | $\bar {\gamma }_{j}^{{(1)}}$ | $\bar {\gamma }_{j}^{{(2)}}$ | $\left\langle {{{S}_{{\mathbf{\theta }}}}} \right\rangle $ | ${{W}_{{{\text{rej}}}}},\,\% $ |
---|---|---|---|---|---|---|---|
10 | 5 | $\langle \hat {A}\rangle = {\text{1}}{\text{.998}}$ $\langle \hat {B}\rangle = 4.{\text{000}}$ |
$\left[ {{\text{1}}{\text{.895,}}\,{\text{2}}{\text{.107}}} \right]$ $\left[ {{\text{3}}{\text{.865,}}\,{\text{4}}{\text{.135}}} \right]$ |
${\text{9}}{\text{.756}} \times {{10}^{{ - 2}}}$${\text{7}}{\text{.958}} \times {{10}^{{ - 4}}}$ | ${\text{10}}{\text{.61}}$ ${\text{6}}{\text{.733}}$ | ${\text{6}}{\text{.018}} \times {{10}^{{ - 3}}}$ | ${\text{5}}{\text{.065}}$ |
10 | $\langle \hat {A}\rangle = {\text{1}}{\text{.992}}$ $\langle \hat {B}\rangle = 4.{\text{000}}$ |
$\left[ {{\text{1}}{\text{.792,}}\,{\text{2}}{\text{.217}}} \right]$ $\left[ {{\text{3}}{\text{.729,}}\,{\text{4}}{\text{.271}}} \right]$ |
${\text{3}}{\text{.932}} \times {{10}^{{ - 1}}}$${\text{1}}{\text{.988}} \times {{10}^{{ - 3}}}$ | ${\text{21}}{\text{.37}}$ ${\text{13}}{\text{.56}}$ |
${\text{2}}{\text{.443}} \times {{10}^{{ - 2}}}$ | ${\text{5}}{\text{.621}}$ | |
20 | $\langle \hat {A}\rangle = {\text{1}}{\text{.970}}$ $\langle \hat {B}\rangle = 4.{\text{001}}$ |
$\left[ {{\text{1}}{\text{.590,}}\,{\text{2}}{\text{.449}}} \right]$ $\left[ {{\text{3}}{\text{.447,}}\,{\text{4}}{\text{.555}}} \right]$ |
${\text{1}}{\text{.524}}$${\text{1}}{\text{.693}} \times {{10}^{{ - 2}}}$ | ${\text{44}}{\text{.04}}$ ${\text{27}}{\text{.84}}$ |
${\text{1}}{\text{.033}} \times {{10}^{{ - 1}}}$ | ${\text{8}}{\text{.214}}$ | |
20 | 5 | $\langle \hat {A}\rangle = {\text{1}}{\text{.998}}$ $\langle \hat {B}\rangle = 4.{\text{000}}$ |
$\left[ {{\text{1}}{\text{.926,}}\,{\text{2}}{\text{.072}}} \right]$ $\left[ {{\text{3}}{\text{.896,}}\,{\text{4}}{\text{.104}}} \right]$ |
${\text{1}}{\text{.097}} \times {{10}^{{ - 1}}}$${\text{3}}{\text{.326}} \times {{10}^{{ - 4}}}$ | ${\text{7}}{\text{.328}}$ ${\text{5}}{\text{.201}}$ | ${\text{2}}{\text{.943}} \times {{10}^{{ - 3}}}$ | ${\text{5}}{\text{.753}}$ |
10 | $\langle \hat {A}\rangle = {\text{1}}{\text{.991}}$ $\langle \hat {B}\rangle = 4.{\text{000}}$ |
$\left[ {{\text{1}}{\text{.850,}}\,{\text{2}}{\text{.144}}} \right]$ $\left[ {{\text{3}}{\text{.791,}}\,{\text{4}}{\text{.209}}} \right]$ |
${\text{4}}{\text{.326}} \times {{10}^{{ - 1}}}$${\text{3}}{\text{.601}} \times {{10}^{{ - 3}}}$ | ${\text{14}}{\text{.75}}$ ${\text{10}}{\text{.47}}$ |
${\text{1}}{\text{.192}} \times {{10}^{{ - 2}}}$ | ${\text{7}}{\text{.439}}$ | |
20 | $\langle \hat {A}\rangle = {\text{1}}{\text{.967}}$ $\langle \hat {B}\rangle = {\text{4}}{\text{.002}}$ |
$\left[ {{\text{1}}{\text{.694,}}\,{\text{2}}{\text{.285}}} \right]$ $\left[ {{\text{3}}{\text{.576,}}\,{\text{4}}{\text{.428}}} \right]$ |
${\text{1}}{\text{.666}}$${\text{5}}{\text{.169}} \times {{10}^{{ - 2}}}$ | ${\text{30}}{\text{.15}}$ ${\text{21}}{\text{.37}}$ |
${\text{4}}{\text{.973}} \times {{10}^{{ - 2}}}$ | ${\text{15}}{\text{.02}}$ | |
30 | 5 | $\langle \hat {A}\rangle = {\text{1}}{\text{.998}}$ $\langle \hat {B}\rangle = {\text{4}}{\text{.000}}$ |
$\left[ {{\text{1}}{\text{.939,}}\,{\text{2}}{\text{.059}}} \right]$ $\left[ {{\text{3}}{\text{.912,}}\,{\text{4}}{\text{.088}}} \right]$ |
${\text{1}}{\text{.147}} \times {{10}^{{ - 1}}}$${\text{4}}{\text{.154}} \times {{10}^{{ - 4}}}$ | ${\text{6}}{\text{.000}}$ ${\text{4}}{\text{.419}}$ | ${\text{1}}{\text{.980}} \times {{10}^{{ - 3}}}$ | ${\text{5}}{\text{.365}}$ |
10 | $\langle \hat {A}\rangle = {\text{1}}{\text{.991}}$ $\langle \hat {B}\rangle = {\text{4}}{\text{.000}}$ |
$\left[ {{\text{1}}{\text{.874,}}\,{\text{2}}{\text{.115}}} \right]$ $\left[ {{\text{3}}{\text{.822,}}\,{\text{4}}{\text{.178}}} \right]$ |
${\text{4}}{\text{.544}} \times {{10}^{{ - 1}}}$${\text{2}}{\text{.310}} \times {{10}^{{ - 3}}}$ | ${\text{12}}{\text{.07}}$ ${\text{8}}{\text{.891}}$ | ${\text{8}}{\text{.020}} \times {{10}^{{ - 3}}}$ | ${\text{7}}{\text{.907}}$ | |
20 | $\langle \hat {A}\rangle = {\text{1}}{\text{.965}}$ $\langle \hat {B}\rangle = {\text{4}}{\text{.002}}$ |
$\left[ {{\text{1}}{\text{.739,}}\,{\text{2}}{\text{.222}}} \right]$ $\left[ {{\text{3}}{\text{.640,}}\,{\text{4}}{\text{.364}}} \right]$ |
${\text{1}}{\text{.744}}$${\text{4}}{\text{.401}} \times {{10}^{{ - 2}}}$ | ${\text{24}}{\text{.63}}$ ${\text{18}}{\text{.13}}$ |
${\text{3}}{\text{.336}} \times {{10}^{{ - 2}}}$ | ${\text{19}}{\text{.82}}$ |
В табл. 2 сведены абсолютно те же характеристики статистического эксперимента, но при равноотстоящих значениях фактора $X$ (сетка bV). Выводы относительно динамики их зависимости от числа наблюдений и уровня шума остаются неизменными – как и в предыдущем случае. Это же касается и процента данных, не прошедших тесты на нормальность остатков и значимость линеаризованной регрессионной модели (4). Важно отметить, что на сетке bV (15) точнее в смысле доверительного интервала осуществляется оценка параметра $B,$ отвечающего за наклон ВАХ в координатах Фаулера–Нордгейма, по которому чаще всего судят о величине работы выхода [4, 5]. Сетка fV (14), напротив, позволяет точнее судить о параметре $A.$ Такой вывод, впрочем, можно было прогнозировать априори. Авторы акцентируют внимание на том, что планированию экспериментов [20] в области ПЭЭ можно уделить и большее внимание, чем это делается в современной литературе.
Таблица 2.
$N$ | $\delta $ | $\langle {\mathbf{\hat {q}}}\rangle $ | $\left[ {\langle {{{\mathbf{q}}}^{L}}\rangle ,\langle {{{\mathbf{q}}}^{R}}\rangle } \right]$ | $\bar {\gamma }_{j}^{{(1)}}$ | $\bar {\gamma }_{j}^{{(2)}}$ | $\left\langle {{{S}_{{\mathbf{\theta }}}}} \right\rangle $ | ${{W}_{{{\text{rej}}}}},\,\% $ |
---|---|---|---|---|---|---|---|
10 | 5 | $\langle \hat {A}\rangle = {\text{1}}{\text{.999}}$ $\langle \hat {B}\rangle = 4.{\text{000}}$ |
$\left[ {{\text{1}}{\text{.852,}}\,{\text{2}}{\text{.158}}} \right]$ $\left[ {{\text{3}}{\text{.877,}}\,{\text{4}}{\text{.123}}} \right]$ |
${\text{6}}{\text{.502}} \times {{10}^{{ - 2}}}$$7.681 \times {{10}^{{ - 4}}}$ | $15.32$ $6.167$ | ${\text{5}}{\text{.514}} \times {{10}^{{ - 3}}}$ | ${\text{4}}{\text{.516}}$ |
10 | $\langle \hat {A}\rangle = {\text{1}}{\text{.995}}$ $\langle \hat {B}\rangle = 4.{\text{000}}$ |
$\left[ {{\text{1}}{\text{.712,}}\,{\text{2}}{\text{.328}}} \right]$ $\left[ {{\text{3}}{\text{.752,}}\,{\text{4}}{\text{.248}}} \right]$ |
${\text{2}}{\text{.633}} \times {{10}^{{ - 1}}}$${\text{1}}{\text{.575}} \times {{10}^{{ - 3}}}$ | ${\text{30}}{\text{.95}}$ ${\text{12}}{\text{.42}}$ |
${\text{2}}{\text{.240}} \times {{10}^{{ - 2}}}$ | ${\text{4}}{\text{.936}}$ | |
20 | $\langle \hat {A}\rangle = {\text{1}}{\text{.979}}$ $\langle \hat {B}\rangle = 4.{\text{000}}$ |
$\left[ {{\text{1}}{\text{.451,}}\,{\text{2}}{\text{.721}}} \right]$ $\left[ {{\text{3}}{\text{.752,}}\,{\text{4}}{\text{.248}}} \right]$ |
${\text{1}}{\text{.038}}$${\text{1}}{\text{.180}} \times {{10}^{{ - 3}}}$ | ${\text{64}}{\text{.58}}$ ${\text{25}}{\text{.57}}$ |
${\text{9}}{\text{.557}} \times {{10}^{{ - 2}}}$ | ${\text{6}}{\text{.881}}$ | |
20 | 5 | $\langle \hat {A}\rangle = {\text{1}}{\text{.998}}$ $\langle \hat {B}\rangle = 4.{\text{000}}$ |
$\left[ {{\text{1}}{\text{.897,}}\,{\text{2}}{\text{.105}}} \right]$ $\left[ {{\text{3}}{\text{.915,}}\,{\text{4}}{\text{.085}}} \right]$ |
${\text{9}}{\text{.321}} \times {{10}^{{ - 2}}}$${\text{6}}{\text{.335}} \times {{10}^{{ - 5}}}$ | ${\text{10}}{\text{.44}}$ ${\text{4}}{\text{.250}}$ | ${\text{2}}{\text{.405}} \times {{10}^{{ - 3}}}$ | ${\text{5}}{\text{.563}}$ |
10 | $\langle \hat {A}\rangle = {\text{1}}{\text{.993}}$ $\langle \hat {B}\rangle = 4.{\text{000}}$ |
$\left[ {{\text{1}}{\text{.794,}}\,{\text{2}}{\text{.213}}} \right]$ $\left[ {{\text{3}}{\text{.829,}}\,{\text{4}}{\text{.171}}} \right]$ |
${\text{3}}{\text{.721}} \times {{10}^{{ - 1}}}$${\text{1}}{\text{.530}} \times {{10}^{{ - 4}}}$ | ${\text{21}}{\text{.04}}$ ${\text{8}}{\text{.550}}$ | ${\text{9}}{\text{.741}} \times {{10}^{{ - 3}}}$ | ${\text{7}}{\text{.131}}$ | |
20 | $\langle \hat {A}\rangle = {\text{1}}{\text{.971}}$ $\langle \hat {B}\rangle = 4.{\text{000}}$ |
$\left[ {{\text{1}}{\text{.593,}}\,{\text{2}}{\text{.442}}} \right]$ $\left[ {{\text{3}}{\text{.651,}}\,{\text{4}}{\text{.349}}} \right]$ |
${\text{1}}{\text{.452}}$${\text{7}}{\text{.109}} \times {{10}^{{ - 4}}}$ | ${\text{43}}{\text{.19}}$ ${\text{17}}{\text{.47}}$ |
${\text{4}}{\text{.075}} \times {{10}^{{ - 2}}}$ | ${\text{14}}{\text{.42}}$ | |
30 | 5 | $\langle \hat {A}\rangle = {\text{1}}{\text{.998}}$ $\langle \hat {B}\rangle = 4.{\text{000}}$ |
$\left[ {{\text{1}}{\text{.915,}}\,{\text{2}}{\text{.084}}} \right]$ $\left[ {{\text{3}}{\text{.931,}}\,{\text{4}}{\text{.069}}} \right]$ |
${\text{1}}{\text{.031}} \times {{10}^{{ - 1}}}$${\text{2}}{\text{.773}} \times {{10}^{{ - 4}}}$ | ${\text{8}}{\text{.466}}$ ${\text{3}}{\text{.457}}$ | ${\text{1}}{\text{.549}} \times {{10}^{{ - 3}}}$ | ${\text{5}}{\text{.279}}$ |
10 | $\langle \hat {A}\rangle = {\text{1}}{\text{.992}}$ $\langle \hat {B}\rangle = 4.{\text{000}}$ |
$\left[ {{\text{1}}{\text{.829,}}\,{\text{2}}{\text{.169}}} \right]$ $\left[ {{\text{3}}{\text{.861,}}\,{\text{4}}{\text{.139}}} \right]$ |
${\text{4}}{\text{.130}} \times {{10}^{{ - 1}}}$${\text{5}}{\text{.684}} \times {{10}^{{ - 5}}}$ | ${\text{17}}{\text{.05}}$ ${\text{6}}{\text{.956}}$ | ${\text{6}}{\text{.276}} \times {{10}^{{ - 3}}}$ | ${\text{7}}{\text{.767}}$ | |
20 | $\langle \hat {A}\rangle = 1.{\text{968}}$ $\langle \hat {B}\rangle = 4.{\text{000}}$ |
$\left[ {{\text{1}}{\text{.656,}}\,{\text{2}}{\text{.340}}} \right]$ $\left[ {{\text{3}}{\text{.717,}}\,{\text{4}}{\text{.283}}} \right]$ |
${\text{1}}{\text{.608}}$${\text{5}}{\text{.238}} \times {{10}^{{ - 4}}}$ | ${\text{34}}{\text{.87}}$ ${\text{14}}{\text{.18}}$ |
${\text{2}}{\text{.612}} \times {{10}^{{ - 2}}}$ | ${\text{19}}{\text{.52}}$ |
Совместные доверительные области (9) в поле параметров ${\mathbf{\theta }} = {{\left( {A{\kern 1pt} ',B{\kern 1pt} '} \right)}^{T}}$ представлены на рис. 3. Результаты приведены для количества наблюдений равных 10, 20 и 30 точкам с уровнем шума 20%. Сплошную заливку имеют эллипсы для сетки bV, работа с которой обеспечивает дополнительно меньшую среднюю площадь $\left\langle {{{S}_{{\mathbf{\theta }}}}} \right\rangle .$
Из табл. 1 и 2 можно сделать вывод о том, что величины $\bar {\gamma }_{j}^{{(1)}}$ также оказались меньшими для сетки наблюдений bV. Поэтому эволюция средних, минимальных и максимальных показателей качества параметрической идентификации сигнала ПЭЭ была построена только для равноотстоящих значений факторов $X$ – рис. 4–6. Впрочем, сетка fV дает схожие иллюстрации поведения $\bar {\gamma }_{j}^{{(1)}},$ $\bar {\gamma }_{j}^{{(2)}},$ $\left\langle {{{S}_{{\mathbf{\theta }}}}} \right\rangle $ и их экстремальных значений в зависимости от количества статистических испытаний ${{N}_{{{\text{stat}}}}}.$
Рис. 4 демонстрирует не очень удачное поведение характеристики $\bar {\gamma }_{j}^{{(1)}}$ в силу особенности ее построения. Можно наблюдать ситуацию, когда текущее значение относительной погрешности усредненного результата оказалось меньше минимальной из не усредненных. Впрочем, данная величина позиционировалась как имеющая смысл только для компьютерного эксперимента, что, возможно, позволяет простить ей такого рода недостатки.
На рис. 5 можно видеть прогресс характеристики $\bar {\gamma }_{j}^{{(2)}}.$ Здесь усредненное должным образом отношение ширины индивидуального доверительного интервала к точечной оценке параметра ведет себя более предсказуемо. Можно отметить, что при ${{N}_{{{\text{stat}}}}} \geqslant {{10}^{2}}$ значение $\bar {\gamma }_{j}^{{(2)}}$ перестает меняться ощутимо.
На рис. 6 представлена зависимость площади совместной доверительной области для параметров ${\mathbf{\theta }} = {{\left( {A{\kern 1pt} ',B{\kern 1pt} '} \right)}^{T}}.$ Выход на стабильное усредненное значение наблюдается при том же объеме статистических испытаний: ${{N}_{{{\text{stat}}}}} \geqslant {{10}^{2}}.$ По всей видимости, показатели $\bar {\gamma }_{j}^{{(2)}}$ и $\left\langle {{{S}_{{\mathbf{\theta }}}}} \right\rangle $ лучше отражают результаты компьютерного эксперимента. Что касается экстремальных значений, то, как видно из представленных данных, для одной случайной выборки данных можно получить как очень хорошие, так и крайне далекие от исходных значений параметров оценки. С ростом ${{N}_{{{\text{stat}}}}}$ вероятность наличия таких выборок, естественно, повышается.
ЗАКЛЮЧЕНИЕ
В работе проанализирована регрессионная модель с двумя параметрами на основе закона Фаулера–Нордгейма. Для оценки усредненных характеристик доверительных областей при оценке параметров зависимости отклика от напряжения проведен статистический эксперимент. Построены границы индивидуальных доверительных интервалов и их центры, совместные доверительные области и их площади, относительная погрешность определения значений параметров, характеристика качества интервальной оценки. Для значений напряжения были использованы планы двух типов. В качестве погрешности значений силы тока была рассмотрена модель шума специального вида. Для формирования статистик были использованы только те данные, остатки которых прошли тест Шапиро–Уилка на принадлежность нормальному закону распределения, и регрессионные модели для которых можно считать значимыми. Все статистические заключения проведены на уровне значимости 5% (с доверительной вероятностью 95%). На основе полученных результатов можно сделать вывод о том, что для представления об усредненных значениях площади доверительной области (10) и качества интервальной оценки (13) вполне достаточно сотни испытаний. Также в рамках модели погрешности специального вида (для “постоянного” значения отношения интенсивностей сигнал/шум) можно ожидать формирования таких наблюдений, которые не будут удовлетворять тесту на нормальность. Процент таких выборок примерно соответствует уровню шума в откликах.
Список литературы
Егоров Н.В., Шешин Е.П. // Поверхность. Рентген., синхротр. и нейтрон. исслед. 2017. № 3. С. 5.
Antonov A.Yu., Denissov V.P. // Physica Scripta. 1999. V. 59. P. 235.
Шешин Е.П. Структура поверхности и автоэмиссионные свойства углеродных материалов. Москва: Издательство МФТИ: Физматкнига, 2001. 288 с.
Егоров Н.В., Шешин Е.П. Автоэлектронная эмиссия. Принципы и приборы. Долгопрудный: Издательский Дом “Интеллект”, 2011. 704 с.
Фоменко В.С. Эмиссионные свойства материалов. Справочник. Изд. 4-е, перераб. и дополн. Киев: Наукова Думка, 1981. 340 с.
Forbes R.G. // J. Vac. Sci. Technol. B. 1999. V. 17. № 2. P. 526.
Giubileo F., Di Bartolomeo A., Iemmo L. et al. // Nanomaterials. 2017. V. 7. № 9. 275. P. 1.
Rawal I., Kumar L., Tripathi R.K., Panwar O.S. // ACS Omega. 2017. V. 2. P. 7515.
Ramaneti R., Sankaran K.J., Korneychuk S. et al. // APL Materials. 2017. V. 5. 066102. P. 1.
Антонов А.Ю., Вараюнь М.И., Егоров Н.В. // Нано- и микросистемная техника. 2019. Т. 21. № 2. С. 103.
Егоров Н.В., Антонов А.Ю., Вараюнь М.И. // Поверхность. Рентген., синхротр. и нейтрон. исслед. 2018. № 10. С. 72.
Дрейпер Н., Смит Г. Прикладной регрессионный анализ. Изд. 2-е, перераб. и дополн. М.: Финансы и статистика, 1986. 366 с.
Демиденко Е.З. Линейная и нелинейная регрессии. Москва: Финансы и статистика, 1981. 304 с.
Буре В.М., Парилина Е. М., Седаков А.А. Методы прикладной статистики в R и Excel. Санкт-Петербург: Лань, 2016. 152 с.
Хан Г., Шапиро С. Статистические модели в инженерных задачах / Хан Г., Шапиро С. Москва: Мир, 1969. 395 с.
Matsumoto M., Nishimura T. // ACM T. Model. Comp. S. 1998. V. 8. № 1. P. 3.
Press W.H., Teukolsky S.A., Vetterling W.T., Flannery B.P. Numerical Recipes. The Art of Scientific Computing. 3rd ed. Cambridge University Press, 2007. 1256 p.
Вадзинский Р.Н. Справочник по вероятностным распределениям. Санкт-Петербург: Наука, 2001. 295 с.
Antonov A.Y., Rusina Y.I., Varayun’ M.I. // 14th International Baltic Conference on Atomic Layer Deposition (BALD). St. Petersburg, 2016. P. 38.
Ермаков С.М., Жиглявский А.А. Математическая теория оптимального эксперимента. Москва: Наука, 1987. 320 с.
Дополнительные материалы отсутствуют.
Инструменты
Поверхность. Рентгеновские, синхротронные и нейтронные исследования