Радиационная биология. Радиоэкология, 2021, T. 61, № 6, стр. 563-606

Критерии причинности в медико-биологических дисциплинах: история, сущность и радиационный аспект. Сообщение 3, ч. 2: Последние четыре критерия Хилла: использование и ограничения

А. Н. Котеров 1*

1 Федеральный медицинский биофизический центр им. А.И. Бурназяна ФМБА России
Москва, Россия

* E-mail: govorilga@inbox.ru

Поступила в редакцию 23.12.2020
После доработки 18.02.2021
Принята к публикации 24.02.2021

Полный текст (PDF)

Аннотация

Сообщение 3 посвящено истории, сути и ограничениям эпидемиологических критериев причинности (“критерии Хилла”). На материале из оригинальных публикаций ведущих исследователей причинности (A.B. Hill, M.W. Susser, K. Rothman и др.; 1950-e гг. – 2019 г.), из десятков современных пособий по эпидемиологии и канцерогенезу, из документов международных и имеющих международный авторитет организаций (НКДАР ООН, BEIR, USEPA, IARC и пр.), а также из множества прочих источников, в части 2 сообщения рассмотрены последние четыре критерия Хилла: биологическое правдоподобие, согласованность с текущими фактами и теоретическими знаниями, эксперимент и аналогия. Изложены теоретические и практические аспекты для каждого критерия: история появления, терминология, философская и эпидемиологическая суть, применимость в различных дисциплинах и ограничения. Приведены фактические примеры в рамках каждого из критериев, включая данные из радиационной эпидемиологии и радиационной медицины.

Ключевые слова: критерии причинности, критерии Хилла, биологическое правдоподобие, согласованность с текущими фактами и теоретическими знаниями, эксперимент, аналогия

ВВЕДЕНИЕ

Состоящее из двух частей третье (предпоследнее) сообщение цикла посвящено сути и ограничениям критериев причинности (“критерии Хилла” [1]). Если первые два сообщения [2, 3] могут быть названы вводными (второе – в том числе в историческом плане), то третье нацелено на конкретику и должно отразить все положения в рамках критериев, необходимые для методологии установления причинности эффектов от воздействий. Два предыдущих сообщения в рамках цикла [2, 3], равно как представлявшиеся необходимыми пять наших публикаций-преамбул к сообщениям 3 и 4 (по критериям “Сила связи” [4, 5], “Временная зависимость” [6], “Биологическое правдоподобие” [7] и “Эксперимент контрафактический” [8]) детализированы настолько, насколько это было возможно (т.е. введен весь имевшийся на тему материал, даже косвенный). Сообщения 3 выполнить в подобной форме было нереально. Поэтому материал как в части 1, так и в представленной части 2, изложен, по возможности, в относительно сжатой форме, с максимальным использованием ссылок на предыдущие работы [28] (хотя информация с момента опубликования последних здесь несколько дополнена). Но тематический охват, как можно надеяться, от этого не пострадал. В то же время объем материала не позволил выполнить Сообщение 3 в виде единой, даже сильно сжатой, версии. В части 1 Сообщения 3 [9] были рассмотрены первые пять критериев Хилла: сила связи, постоянство ассоциации, специфичность, временная зависимость и биологический градиент (зависимость “доза–эффект”). Цель части 2 Сообщения 3 – развернутое изложение материала по оставшимся четырем критериям Хилла в различных аспектах. Рассмотрены биологическое правдоподобие; согласованность с текущими фактами и теоретическими знаниями; эксперимент и аналогия.

БИОЛОГИЧЕСКОЕ ПРАВДОПОДОБИЕ (BIOLOGICAL PLAUSIBILITY) [7]

Подробно этот критерий, с иллюстрациями в том числе из дисциплин радиационного профиля, рассмотрен в нашем обзоре [7].

История критерия “Biological plausibility”. Перекрывание смыслов с критерием “Coherence” [7]

Впервые подходящий пункт появляется в 1950-е – начале 1960-х годов (Wynder E.L., 1956; Lilienfeld A.M., 1957 (введен термин); Lilienfeld A.M., 1959; Sartwell P.E., 1960 [7]). В Сообщении Главного врача США о последствиях курения от 1964 г. [10] данный пункт был заменен критерием Coherence – согласованностью с известными фактами из природной истории и биологии заболевания.

В 1965 г. A.B. Hill [1] добавил к Biological plausibility, вероятно, из работ Lilienfeld A.M., 1957; 1959 [7], пункт Coherence, вероятно, из Сообщения о последствиях курения от 1964 г. [10]. При этом первый критерий у Хилла получил несколько иной смысл, а именно собственно правдоподобие зависимости в широком биологическом плане.

M.W. Susser, по крайней мере с 1977 г. [11], развивал критерий Coherence, включающий “Биологическое правдоподобие”.

Далее критерий “Coherence” в ряде источников был вытеснен критерием “Biological plausibility”. Отметим к тому же, что смысл “Биологического правдоподобия” порой совпадает с тем, что понимают ныне и под критерием “Эксперимент” [12, 13] (см. ниже).

В модифицированных для экоэпидемиологии критериях Хилла “Biological plausibility” и “Coherence” заменены на “Biological concordance” (“Биологическая согласованность”) [13].

Сущность критерия – интеграция данных из различных дисциплин [7]

Тема внедрения в эпидемиологические доказательства данных из биологии, медицины (“биомедицинские знания”), токсикологии, фармакологии, экологии и иных дисциплин, равно как и обратный подход, – поверка биологических фактов эпидемиологическими закономерностями, весьма широка:

“Эпидемиология, молекулярная патология (в том числе химия, биохимия, молекулярная биология, молекулярная вирусология, молекулярная генетика, эпигенетика, геномика, протеомика и другие молекулярные подходы), а также эксперименты на животных и клетках in vitro, должны рассматриваться как важная интеграция доказательств в определение канцерогенных эффектов для человека” (Институт рака США, 2012) [14] (оригинал цитаты см. в [7]).

Приведенные перечни показывают, что данные из почти любой сферы медико-биологических и молекулярно-клеточных дисциплин могут внести важный вклад в поиск доказательств для эпидемиологических изысканий какой угодно практической значимости. Это, ясно, придает практическую значимость и самим исследованиям любой кажущейся фундаментальности и теоретичности.

Суть критерия [7]:

• Соответствие общенаучным знаниям (научные факты и законы, которые имеют отношение к предполагаемой причинно-следственной связи; научное правдоподобие ассоциации).

• Поддержка лабораторными экспериментами in vitro и на животных.

• Наличие биологических и социальных моделей, механизмов, объясняющих связь. Рассматриваются на разных уровнях биологической и социальной организации, от молекулярно-клеточного до популяционного (например, на уровне поведенческих реакций, способствующих канцерогенности фактора – “социальное”).

Биологическое правдоподобие отражает согласование/несогласование теории, объясняющей, как или почему воздействие вызывает заболевание, с другими известными механизмами причинности этого заболевания. Например, показано ли, что агент или метаболит вообще достигает целевого органа? (см. в [7]).

Три уровня достижения биологического правдоподобия по D.L. Weed. Названы в Weed D.L., Hursting S.D., 1998 [15] (см. также в Weed D.L., 2004 [16] и в [7]):

1) Когда для ассоциации можно предположить разумный механизм, но никаких биологических доказательств не существует.

2) Когда к механизму можно добавить факты из области молекулярной биологии и молекулярной эпидемиологии (дополним: в том числе данные о “суррогатных endpoints”, т.е. биомаркерах).

3) Если имеются доказательства того, как причинный фактор влияет на известный механизм патологии. Это наиболее строгий из трех подходов к биологическому правдоподобию. В Weed D.L., 2000 [17] указано, что, хотя трудно предложить эмпирическое правило для определения биологического правдоподобия, тем не менее, если представляющий интерес фактор является ключевым в биологическом механизме или на его проводящих путях (pathways), то более вероятно, что зависимость будет причинной. Механизмы или пути демонстрируются с помощью лабораторных экспериментов и молекулярной эпидемиологии [17].

В конечном счете степень достижения биологического правдоподобия – вопрос суждения: достаточно ли собрано свидетельств, чтобы исключить альтернативные объяснения (“Вес свидетельств”; “Weight of Evidence”; WoE) [7].

Четыре уровня достижения биологического правдоподобия по M.W. Susser. Изложены в работах [18, 19] (1986). Критерий отражает ранее существовавшие теорию и знания (“Coherence”), и трактуется широко, включая следующие элементы согласованности: 1) с теоретическим правдоподобием (названо также в [20]), 2) с фактами, 3) с биологическими знаниями (т.е. “Биологическое правдоподобие”) и 4) со статистическими закономерностями, включающими зависимость “доза–эффект” (см. также ниже; подробнее весь комплекс критериев M.W. Susser запланировано рассмотреть в Сообщении 4).

Согласно философу науки J. Worrall (Великобритания), рассмотревшему в 2002–2011 гг. принципы доказательной медицины и рандомизированных контролируемых испытаний (RCT), при исследуемом вмешательстве существует много возможных альтернативных причинных факторов, но “базовые знания” (“background knowledge”) свидетельствуют, какие из них являются правдоподобными [2123].

Как указано для “Биологического правдоподобия” в пособии Власов В.В., 2006 [24]: «Фактически этот признак – вариант признака “объяснимость связи”».

Важность интеграции данных эпидемиологии с биологией и другими дисциплинами на многих цитатах из весомых источников была отражена нами в обзоре [7]. Основанный на совокупности данных из разных дисциплин систематический подход называют “Байесовским анализом” (или “Байесовским мета-анализом” = Confidence Profile Method = Bayesian method). Он опирается на вес свидетельств (доказательств), а не на одно конкретное исследование, следуя тем же принципам, что и принятие решений по Байесу [7].

Интеграция данных для доказательства причинности касается и дисциплин радиационного профиля (ссылки и оригиналы цитат см. в [7]):

“Эксперты по радиационной защите, как законодатели, так и практикующие специалисты, поддерживают понимание нынешних знаний в области радиобиологии и эпидемиологии, чтобы подкреплять соответствующие решения” (2009).

“Когда эпидемиология достигает своих пределов, она зовет радиобиологию на помощь!” (2000).

“Тандем радиационной эпидемиологии и радиобиологии для практики радиационной защиты” (2010).

“Интеграция фундаментальной радиобиологии и эпидемиологических исследований: почему и как”. “Большое значение придается использованию основных данных радиобиологии при разработке [методов] оценки радиационного риска” (2015).

Наш анализ распространенности “Biological plausibility” среди критериев Хилла в тех исследованиях, где они использовались как метод доказательности (35 публикаций за 2013–2019 гг.), показал, что критерий по встречаемости находится на четвертом месте.

Неабсолютность критерия: что биологически правдоподобно – зависит от текущих биологических знаний [7]

Это заключение есть в Hill A.B., 1965 [1], но появилось ранее в работах Lilienfeld A.M., 1957; 1959 и затем развивалось в Sartwell P.E., 1960 (цитаты см. в [7]). В [7] нами со ссылками были приведены соответствующие исторические примеры, которые упоминаются в обзорах и пособиях по эпидемиологии. Ниже к перечню из [7] добавлены дополнительные сведения [25, 26]:

• John Graunt, 1662 г.: факторы риска чумы в Лондоне. Все четыре совета (избегать “зараженного воздуха, привезенного судами в порту”, скученности, контакта с животными и больными) оказались конструктивными, несмотря на отсутствие каких-либо биологических теорий.

• Percival Pott, 1776 г.: учащение рака мошонки у английских трубочистов. Выявлено за 150 лет до начала исследований химических канцерогенов.

• Domenico Rigoni-Stern, 1842 г.: заметил по статистическим данным для Вероны, что смертность от рака шейки матки была более характерна для замужних, чем для одиноких женщин, что указывало на влияние сексуальной или репродуктивной активности. Истинная причина (папилловирус; HPV) была открыта, однако, только в 1980-х гг., в связи с развитием метода ДНК-гибридизации.

• William Farr, 1848–1849 гг.: выявление обратной ассоциации между высотой проживания выше уровня моря и смертностью от холеры в Лондоне. Факт соответствовал теории “миазмов” и был истолкован как правдоподобный. Позже обнаружилось, что и согласно микробной теории ситуация оказалась такой же.

• John Snow, 1849–1854 гг.: идентификация в Лондоне связи между загрязнением питьевой воды и заболеваемостью холерой. Гипотеза шла вразрез с принятой тогда теорией “миазмов”. Когда появилась микробная теория, то связь стала научно обоснованной.

• В Париже в 1840-х гг. терапия на основе гомеопатии уменьшала смертности при некоторых патологиях намного успешнее, чем очистительные и рвотные средства, традиционно применяемые здесь аллопатами [26].

• David W. Cheever (США), 1861 г.: предупреждая об опасности “бессмысленных корреляций”, указывал, что было бы смешно приписывать тиф, которым заразился некто, проведя ночь на эмигрантском судне, паразитам на телах больных. Это просто совпадение.

• Датчанин Johannes Fibiger получил Нобелевскую премию в 1927 г. за исследование, свидетельствующее, что нематода Spiroptera carcinoma вызывает рак желудка у крыс. Позднее данный вывод был отвергнут, хотя эта работа и сыграла свою роль в развитии экспериментальных исследований рака [25].

• На заре изучения СПИДа его причины связали с употреблением гомосексуалистами амилнитритов (“попперсов” – стимуляторы). При этом относительный риск (RR) составил очень высокую величину –12.3 [27].

Эволюционировали понятия о биологическом правдоподобии и в области радиационной эпидемиологии, и радиобиологии. В [7] было представлено развитие мировых норм радиационной безопасности (НРБ) по материалам из [28]. Допустимая доза уменьшилась на два порядка за менее чем 70 лет (с 1560 мЗв/год в 1925 г. до 10–20 мЗв/год в 1990-х гг.) Пока господствовала концепция пороговой безвредности излучения, представления о его эффектах носили, на современный взгляд, анекдотичный характер [7]:

• Рентгенологи времен Первой мировой войны просвечивали грудную клетку пациента, стоя прямо за его спиной и держа рентгеновскую пленку в руках.

226Ra и 228Ra вводили в питьевую воду, в кремы и различный парфюм, в ректальные свечи, зубную пасту, шоколадки, капли для глаз, детские книжки и пр.

• Известен ряд детских игр-конструкторов начала 1950-х гг. для “собирания” игрушечных атомных электростанций и т.п. Среди них можно назвать “Gilbert U-238 Atomic Energy Lab”, в коробку с которой входили емкости с четырьмя типами урановых руд, равно как с 210Pb, 106Ru, 65Zn и 210Po [29].

• Наглядна также эволюция представлений о наследственных генетических изменениях у людей (т.е. о дефектах, патологиях и отклонениях у необлученных детей облученных родителей). Исходя из данных для дрозофилы и мышей ожидалось появление массы радиационных мутантов у людей, как результата испытания ядерного оружия, радиоактивного загрязнения окружающей среды, использования излучения в медицине и пр. Это отразилось на СМИ, кино и фантастической литературе 1960–1970-х гг., а также на оценках дозы, удваивающей частоту мутаций у человека (первоначально была порядка 30–100 мГр). Оказалось, однако, что реально выявить наследственные генетические эффекты у человека невозможно, настолько мал даже теоретический прирост к естественному мутационному фону при любых сколь-либо правдоподобных дозах, не устраняющих фертильность [3037]. Хотя на уровне микросателлитных полиморфизмов, генных экзонов и гетероплазмии мтДНК такая возможность для больших доз (2–3 Гр) облучения за короткий срок до зачатия, судя по всему, в отечественных исследованиях показана [38, 39]1 (список примечаний идет после основного текста). С другой стороны, в пилотных исследованиях группы А.В. Рубановича (Kuzmina N.S. et al., 2014; 2016 [40, 41]) не было выявлено трансгенерационной передачи даже эпигенетических изменений (гиперметилирования CpG-островков в промоторах ряда генов) потомкам ликвидаторов аварии на Чернобыльской АЭС и работников ядерной индустрии, что укладывается в общую картину. При этом для самого родительского контингента, включая еще и работников ПО “Маяк”, зависимые от радиационного воздействия и от возраста названные эпигенетические изменения выявлялись отчетливо [4042]2.

Таким образом, влияние временной конъюнктуры на биологическое правдоподобие налицо для многих дисциплин.

Неабсолютность критерия: реальные, но неправдоподобные ассоциации; правдоподобные, но не реальные ассоциации [7]

Ранее нами приводились примеры эффектов конфаундеров [2, 4], случайностей и обратной причинности [6] в формировании ложных ассоциаций. Это – примеры первой части заголовка: ассоциации как бы есть, но их биологическое (а иной раз и логическое) правдоподобие отсутствует, вплоть до абсурда.

В [7] были добавлены еще факты по теме, которые ниже несколько расширены:

• Талидомид не являлся тератогеном для большинства экспериментальных животных, но в 40% случаев был тератогеном при приеме его беременными, обусловливая тяжелые патологии новорожденных.

• Применявшаяся в 1942–1954 гг. оксигенация недоношенных детей (кислородная терапия) приводила к слепоте из-за ретролентальной фиброплазии (разрастание соединительной ткани под хрусталиком). Было ослеплено порядка 10 000 детей. Эпидемиологические доказательства причинности получили с трудом, причем в опытах на животных эффект выявлен не был.

• Поскольку противоаритмические средства при инфаркте миокарда нормализуют ритм сердечных сокращений, было рекомендовано их профилактическое применение. RCT показали, однако, что смертность у пациентов, получавших антиаритмические средства, весьма повышена по сравнению со смертностью у получавших плацебо [24, 4346]3. Первоначально испытание было разработано как одностороннее, т.е. его идеология предполагала, что препарат может быть только полезным или нейтральным, поскольку кардиологи не могли и представить себе вред [43, 45]. На пике использования в конце 1980-х гг. противоаритмические препараты вызывали, по оценке [46], около 50 000 смертей ежегодно в одних только США, что сравнимо с числом погибших во Вьетнамской войне [24, 43].

• Гормон-замещающая терапия в период постменопаузы в ранних обсервационных исследованиях оказалась связанной со снижением смертности от кардиоваскулярных патологий, что и представлялось правдоподобным. Но первое же RCT от 1998 г. не подтвердило эффекты, равно как и последующие испытания (2002–2012 гг.). Более того, было обнаружено учащение риска коронарных заболеваний, инсультов, тромбозов, легочной эмболии и рака молочной железы, так что одно из RCT пришлось остановить досрочно [7, 24, 4749]. Тем не менее истина лежит между экспериментом и эпидемиологией: было обнаружено, что положительные эффекты превалируют над отрицательными для возраста 50–60 лет, в то время как при более старшем возрасте значимы, в основном, неблагоприятные последствия (подробнее см. в [7]).

• Рекомендация доктора Б.М. Спока (B.M. Spock) класть младенцев спать ничком для снижения риска синдрома внезапной детской смерти основана на правдоподобном объяснении, что это предохранит от удушения рвотой. Оказалось, однако, что смертность в положении на спине была вдвое ниже по сравнению с другими позами.

• Два RCT 1990-х гг. продемонстрировали, что β-каротин увеличивает смертность от рака легкого у курильщиков, хотя это противоречило всей совокупности предыдущих эпидемиологических и биологических данных.

• Странным выглядит отсутствие связи между психоэмоциональным стрессом (в том числе тяжелым – смертью детей и близких), включая депрессии, и увеличением риска рака различных типов. И это притом, что эффект представляется биологически правдоподобным: психоэмоциональный стресс вызывает и депрессию иммунной системы, и гормональные (нейроэндокринные) сдвиги, и окислительный стресс, который приводит к повреждениям ДНК и к цитогенетическим нарушениям.

• Неясен механизм анестезирующего эффекта иглоукалывания, равно как действия гомеопатии. Многие исследователи считают их биологически неправдоподобными.

Критика критерия [7]

Подробно критику критериев причинности намечено рассмотреть в Сообщении 4, здесь же – только пересказ изложенного в предыдущем обзоре [7].

Конкретно “Биологическое правдоподобие” и сам принцип индуктивного подхода к доказательности в эпидемиологии с помощью критериев причинности критиковался рядом авторов. A.R. Feinstein (США) отмечал в 1979 г., что требование “Биологического правдоподобия” (в форме “Coherent plausibility”) предусматривает биологическую логику, основанную на парадигматической приемлемости, но не на строгих доказательствах. Автор приходит к выводу об отсутствии научных соображений и стандартов науки при применении критериев причинности [7].

Одни из наиболее известных современных эпидемиологов, K.J. Rothman и S. Greenland (США), полностью отрицают индуктивный подход и, судя по всем признакам, вероятностную причинность, сводя все к конечному многофакторному анализу (как минимум, с 1986 г.) [2, 3, 7, 8, 50, 51]. Критерий “Биологическое правдоподобие”, по мнению этих авторов, и необъективен, и неабсолютен, поскольку часто основан не на логике или данных, а только на предыдущих убеждениях. Попытки путем байесовского подхода количественно оценить по шкале от 0 до 1 вероятность того, что основано на прежних убеждениях, а что – на новых гипотезах, демонстрируют, согласно K.J. Rothman и S. Greenland, догматизм или следование текущей публичной моде. Это приводит к необъективности при оценке гипотезы [7, 50]. Ни байесовский [7, 50] и никакой иной [51] подходы не могут превратить правдоподобие в объективный причинный критерий. Использование указанного критерия при оценке новой гипотезы может быть только в отрицательном смысле: “для того, чтобы указать на трудность его применения” [7, 50, 51].

В 1996 г. B.G. Charlton (Англия), рассуждая о мультидисциплинарном и междисциплинарном подходах в эпидемиологии, отмечал их мозаичность. Каждый элемент мозаики, состоящий из конкретных данных, может быть оценен на научную валидность, но метод, которым эти элементы связаны-склеены, не является научным, потому что комбинация доказательств от разных дисциплин не может быть самостоятельной научной дисциплиной. Если пробелы в доказательствах для одной дисциплины заменяются или обходятся с помощью данных из другой дисциплины и наоборот, то получается, что совмещается малосовместимое. Действительно, поскольку интегрируются данные, полученные путем ряда “несоизмеримых” (или качественно различных) подходов, методологий и способов доказательности, то эпидемиология должна положиться на суждение (judgment), на “здравый смысл” в большей степени, чем другие науки [7].

Среди известных нам критиков еще следует назвать K.J. Goodman и C.V. Phillips (Канада). В статье от 2005 г. этих исследователей сказано, что не ясно, как количественно оценить степень важности каждого критерия, не говоря уже о том, чтобы обобщить такой подход в суждение о причинности [52]. Критерий “Биологическое правдоподобие” K.J. Goodman (с иным соавтором) рассматривает совместно с “Coherence” и “Analogy” [53].

Важным утверждением K.J. Goodman и C.V. Phillips от 2005 г. (в 2004 г. сходные построения были высказаны G.B. Gori [54]) является некая квинтэссенция всей критики комплекса критериев: декларируется, что успешность их применения никогда не была проверена на практике путем сравнения с другими подходами [52]. Но статьи [52, 54] были опубликованы в первой половине 2000-х гг., а в 2009 г. нидерландские исследователи предложили методологию взвешивания критериев и проверили валидность ее использования для известных канцерогенов, причем успешно [55] (подробнее запланировано рассмотреть в Сообщении 4).

Вывод о значимости и необходимости критерия

Как было видно выше, критерий “Биологическое правдоподобие” не абсолютен. Формально – ни необходим, несмотря на всю его значимость, ни достаточен, несмотря на его роль в комплексе правил причинности для агентств по охране окружающей среды (например, US Environmental Protection Agency, аббревиатуры US EPA или USEPA), токсикологии (например, Международная программа по химической безопасности ВОЗ; IPCS) и МАИР (Международное агентство по изучению рака; IARC) [7].

Особенно этот момент важен для медицины, причем истоки уходят еще в “Предписания” Гиппократа: “В медицинской практике нужно уделять внимание в первую очередь не правдоподобным теориям, но опыту в сочетании с разумом” [56] (цитировано по [57]). И уже в наше время: “Лекарство, про которое известно, что оно работает, хотя никто не знает почему, предпочтительнее, чем лекарство, которое имеет поддержку в теории, но без подтверждения на практике” [58]4. Использование в медицине подходов, основанных только на теоретических основаниях без подтверждения на опыте, является “результатом необоснованной практики”, поскольку “многие подходы, которые в теории должны быть очень эффективными, на практике оказываются совершенно бесполезными” [58]5. В качестве примера еще в 1961 г. приводилась идея о том, что грубая или тяжелая (strong) пища спровоцирует желудок, пораженный язвой [58], но, наверное, каждый может сам вспомнить массу таких “медицинских” предписаний.

В пособии по теории RCT однозначно сказано, что применение таких испытаний, являясь внедрением научного метода в медицину, “не основано на какой-либо теории о том, как могут работать методы лечения” [59]6.

Для доказательной медицины и клинической практики “Вопрос не в том, “должно ли это работать?”, а в том, “работает ли это?” (даже если мы не знаем, почему)” [58]7.

И все же без соблюдения биологического правдоподобия, без биологического механизма, любое доказательство причинности, как в эпидемиологии, так и в доказательной медицине, выглядит и неполным, и ущербным. Это понимали еще в 19 в. (см. в [7]8). Как сказано в Terris M., 1993 [60] (курсив наш. – А.К.): “[Нельзя] пренебрегать тем фактом, что эпидемиология является биологической наукой, связанной с болезнями людей”9.

СОГЛАСОВАННОСТЬ С ТЕКУЩИМИ ФАКТАМИ И ТЕОРЕТИЧЕСКИМИ ЗНАНИЯМИ (“COHERENCE”)

Перекрывание смысла “Coherence” с другими критериями

Впервые термин, как указывалось выше, появился в Сообщении Главного врача США о последствиях курения от 1964 г. [10] (соответствующий раздел в документе – плод творчества R.A. Stallones от 1963 г. (США); см. в [3]). Критерий означал согласованность с известными фактами природной истории и биологии заболевания. Этот пункт почти буквально совпадал с “Biological plausibility”, предложенным ранее Lilienfeld A.M., 1957; 1959 [3].

A.B. Hill в 1965 г. ввел в свой список оба названных пункта [1], что внесло некоторую путаницу. Действительно, для критерия “Coherence” по смыслу находились аналогии с “Consistency” [6163], “Biological gradient” (зависимость “доза–эффект”) [64], “Biological plausibility” (иногда вплоть до замены последним) [11, 12, 14, 1719, 53, 61, 62, 6468], “Experiment” [12, 13] и “Analogy” [53, 64, 66]. Все это, как предполагается в [64], различные типы “согласованности”.

В критериях Хилла для экоэпидемиологии “Biological plausibility” и “Coherence”, как уже говорилось, были заменены на “Biological concordance” (“Биологическая согласованность”) [13].

K.J. Rothman и S. Greenland во втором издании “Modern Epidemiology” (1998) [69], рассматривая критерии “Coherence”, “Plausibility” и “Analogy”, находили, что, в связи с трудностями отличия их смыслов, они используются, по существу, как одна идея: причинная связь не должна нарушать известные научные принципы и должна согласовываться с экспериментально выявленными биологическими механизмами и другими уместными данными, такими, например, как экологические типы патологий. Это положение из [69] не раз разбиралось другими авторами [66, 70, 71]. Хотя в третьем издании названого пособия (Rothman K.J. et al., 2008) [51] подобного объединения критериев мы уже не находим.

В результате перекрывания смыслов в ряде публикаций из списка критериев Хилла “Coherence” был просто выпущен [20, 24, 67, 7275] (и др.). С другой стороны, в работах M.W. Susser “Coherence” в широком смысле заменил “Biological plausibility” [11, 18, 19]. Обо всем этом мы уже говорили ранее.

В не раз рассматривавшемся в части 1 настоящего сообщения [9] исследовании Weed D.L., Gorelic L.S., 1996 [76] (часто цитируется и иными авторами, в том числе в объемных пособиях по эпидемиологии, канцерогенезу и др. [53, 68, 77]) было обнаружено, что среди 14 обзоров по критериям причинности пункт “Coherence” назывался всего в двух. Наш упомянутый выше анализ распространенности “Coherence” среди критериев Хилла в тех исследованиях, где они использовались как метод доказательности (2013–2019 гг.), тоже показал, что встречаемость критерия наименьшая (вместе с “Analogy”).

Однако исходная мысль Хилла [1] вполне разграничивала концептуальные смыслы “Coherence” и иных критериев.

Специфичность понятия “Coherence” сравнительно с “Biological plausibility”

Многие авторы так и не смогли отделить специфический смысл критерия “Coherence”, отличающий его от других сходных положений. Согласно [70], различия в определении Хиллом терминов “plausibility” (правдоподобие) и “coherence” (согласованность) представляются трудноуловимыми (subtle). Но различия все же находятся, причем концептуальные, хотя и похожие, порой, на схоластику [70]:

• “Правдоподобие” есть позитивное понятие – ассоциация должна соответствовать независимому (substantive) знанию, а “согласованность” вербализуется негативно – как ассоциация, не конфликтующая с накопленными знаниями.

• “Правдоподобие” как бы спрашивает: “Можно ли вообразить механизм, который, если бы он работал, то привел бы к результатам, аналогичным полученным?” То есть возможна и противоположная ситуация, когда механизм не подтвердил бы теорию. Напротив, “согласованность” спрашивает: “Если принять за основу, что установленная теория верна (обратная ситуация заведомо не допускается), то вписались бы наблюдаемые результаты в эту теорию?”.

• “Согласованность” отклоняет наблюдаемый результат как непричинный, если он противоречит преобладающей теории, а правдоподобие оставляет исследователя с большим количеством свобод, исходя из которых определенная часть независимого знания может дать возможность оценки и противоположных результатов.

Коротко говоря [71]: согласно критерию “Биологическое правдоподобие” зависимость должна быть биологически вероятна. Согласно критерию “Согласованность” – зависимость не должна входить в противоречие с известными фактами биологии болезни.

В рамках Международной программы по химической безопасности (ВОЗ) [78]10 отмечается, во-первых, что следует рассмотреть, согласуется ли способ действия фактора с тем, что известно о канцерогенезе в целом (“Биологическое правдоподобие”) и, во-вторых, что известно конкретно о факторе (“Согласованность” – “Coherence”). “Coherence” касается связи постулируемого способа действия с наблюдениями по более широкой базе данных (например, связь способа действия агента при индукции опухолей с таковой для других конечных событий – endpoints) [79].

Примеры отличий в смыслах “Biological plausibility” и “Coherence”. Эпидемиология и радиационная эпидемиология

Приведенные выше рассуждения носят теоретический характер и на деле различия между двумя названными критериями используются редко. Тем не менее то, что Хилл в свой список включил оба критерия, представляется оправданным, возможно, свидетельствуя, скажем пафосно, о глубине профессионального мышления этого автора. Последнее начинаешь понимать, только ознакомившись со многими аспектами материала по причинности эффектов и с фактами из разных областей. А ряд авторов, в том числе западных пособий, до этого понимания, вероятно, так и не дошли (“согласованность” = “правдоподобие”)11.

На двух уже приведенных фактах представим соответствующие иллюстрации.

1. Вспомним про отсутствие связи между психоэмоциональным стрессом (в том числе тяжелым – смертью детей и близких), включая депрессии, и увеличением риска рака различных типов (миниобзор см. в нашей работе [7]). Выполняется ли здесь критерий “Биологическое правдоподобие”, есть ли механизм? Если предположить реальность эффекта, то вполне: психоэмоциональный стресс вызывает, как уже говорилось, и депрессию иммунной системы, и гормональные (нейроэндокринные) сдвиги, и окислительный стресс, приводящий к повреждениям ДНК и цитогенетическим нарушениям. Более того, такой стресс способен индуцировать/модулировать раки у экспериментальных животных, правда, вкупе с канцерогеном (стресс + нитрозамин на крыс [80]). Но имеем ли мы здесь выполнение критерия “Согласованность” [с текущими фактами и теоретическими знаниями]? Вряд ли получится для фактов: множество эпидемиологических исследований по всему миру так и не смогли уверенно продемонстрировать эффект. А теории, которая бы объясняла, почему факты получить не удается, и вовсе, по-видимому, нет.

2. Вновь рассмотрим ситуацию с наследственными генетическими эффектами облучения у человека. Вот некто продекларировал, скажем, что выявил “радиационно-обусловленное” учащение нарушений, аномалий и патологий у необлученного потомства пострадавших в результате аварии на Чернобыльской АЭС, АЭС “Фукусима-1” и т.п. (примеры авторов для первой аварии см. в наших обзорах [31, 33]). Выполняется ли здесь критерий “Биологическое правдоподобие”, есть ли биологический механизм? Есть правдоподобие: в опытах на различных видах животных доказано существование эффекта, хотя и при облучении родителей только в дозах свыше малых (более 100 мГр) [30, 34, 35]. Механизм тоже имеется: продемонстрировано увеличение уровня повреждений ДНК, трансгенерационных мутаций и конкретно выхода аномального потомства [3037]. Хотя второе и третье обнаружено только у животных [3437] (за исключением упомянутых выше российских данных по передающимся потомству тонким внутригенным изменениям для контингента ПО “Маяк” [38, 39]; см. прим. 1), критерию “Биологическое правдоподобие”, как его понимал Хилл [1], это все же удовлетворяет. Но есть ли здесь соответствие критерию “Согласованность”? Нет, поскольку ранее на ряде масштабных когорт (потомки пострадавших от атомных бомбардировок, подвергавшихся радиотерапии, работников ядерных производств и пр.) никаких ощутимых эффектов (кроме изменения соотношения полов) обнаружено не было [30, 3437]. Более того, существует и теория, почему у людей, в отличие от животных, выявить трансгенерационные эффекты не удается: генетические аномалии элиминируются на ранних стадиях развития in utero (“недиагностированная беременность”), ускользая от анализа [32, 3437, 81].

Четыре уровня согласованности (=правдоподобия различных типов) по M.W. Susser

Эти положения были кратко перечислены выше. Материал изложен в работах M.W. Susser 1986 г. [18, 19]. Критерий, отражая ранее существовавшие теорию и знания, включает следующие элементы согласованности [18, 19]12:

1) С теорией. Данные должны быть правдоподобными с позиции существующей теории. Если полученный результат неправдоподобен, сначала следует рассмотреть отказ от него. Но если он все же сохраняется и при дальнейших исследованиях, необходимо найти другое объяснение, и тогда уже сама теория должна быть пересмотрена либо заменена. В этом пункте и утверждение, и его фальсификация имеют равный вес [18, 19].

2) С фактами. При переходе к имеющимся фактам совместимость с ними полученного результата должна подтверждаться. При этом отсутствие фактического соответствия имеет больший вес [можно как бы отбросить гипотезу], чем таковое соответствие или же теоретическое неправдоподобие. Но не всегда легко провести четкую грань между тем, что является существующим фактом, и тем, что существует в рамках предыдущей теории, поскольку для проверки согласованности может потребоваться степень дедукции в обоих случаях. Например, в сообщении от 1961 г. указывалось, что при синдроме Дауна воздействие стресса во время беременности наблюдалось с более высокой частотой, чем при других исходах беременностей. Однако предлагаемое причинное объяснение должно быть отвергнуто исходя из существующих знаний о временном порядке. Фактов и теории органогенеза достаточно, чтобы сделать вывод, что синдром должен был возникнуть до всяких стрессов [18, 19]. Аналогичным образом, утверждение, что частота врожденных аномалий была снижена благодаря улучшению перинатального медицинского обслуживания, несовместимо с тем фактом, что почти все такие аномалии возникают до того, как большинство беременных обращаются за медицинской помощью [19].

3) С биологией. Требование биологической согласованности, под которым M.W. Susser имел в виду “здравый смысл (commonsense) Эванса” (A.S. Evans) [82], применяемый к биологическим системам, оставляет много места для суждений о причинности [19]. Притом, что “здравый смысл одного человека часто является глупостью другого” [18, 19] (на наш взгляд, слишком категорично). Помимо биологии и патологии человека, поиск биологической согласованности обычно предусматривает эксперименты на других видах. Подобный подход полезен при построении теории, но может сильно повлиять на причинный вывод. Так, тератогены, обнаруженные у людей, являются также тератогенами по крайней мере для одного вида животных [83]. Тестирование агента на достаточно большом числе видов (например, на семи и более), которое оказалось отрицательным, ставит под сомнение возможность положительного результата у людей (если только последние не будут удовлетворять постоянству репликации; от себя добавим приведенные выше как раз такие примеры с талидомидом и оксигенацией недоношенных новорожденных). И наоборот, положительные эффекты у какого-либо вида животных повышают достоверность положительных результатов у людей [18, 19]. В публикации [19] M.W. Susser подробно разбирает также примеры несопоставимости данных для животных и человека; это рассмотрено далее.

4) Со статистикой. Имеется в виду наличие зависимости “доза–эффект” [18, 19].

В целом наибольший вес в рамках критерия “Coherence” M.W. Susser придавал явной несовместимости между результатами исследования и существующими фактами [18, 19] (то есть – отбрасыванию, а не подтверждению гипотезы, как указывал K.R. Popper [84]). Отметим, что в области радиационно-эпидемиологических эффектов этот момент нередко забывается, когда исследуются последствия разного рода экстремальных и аварийных воздействий (достаточно бросить беглый взгляд на тезисы форумов, посвященных эффектам аварии на Чернобыльской АЭС).

Неабсолютность критерия

На это указывалось еще Хиллом в 1965 г. [1]; воспроизведено во многих последующих источниках [11, 12, 24, 50, 51, 62, 65, 67, 68, 70, 85, 86].

“Согласованность – это окончательный (ultimate), но все же не необходимый критерий для причинной связи” (Susser M., 1977 [11])13.

“Согласованность утешительна (comforting), [но] сама по себе несогласованность не является деструктивной для гипотезы, подчеркивая пробелы в научном понимании” (Fox G.A., 1991 [86]14; основатель внедрения причинных критериев в экоэпидемиологию).

Как отмечается в USEPA-2005, вывод о причинности в экоэпидемиологии может быть усилен данными, полученными на животных, в токсикокинетических и краткосрочных исследованиях. Однако отсутствие таких данных не является основанием для отказа от причинности [85].

ЭКСПЕРИМЕНТ (“EXPERIMENT”)

Эксперимент контрафактический: определение, философская и эпидемиологическая суть [8]

Контрафактический подход (counterfactual approach), который Хилл выделил в критерий “Эксперимент” (т.е. по сути это “эксперимент контрафактический”), подробно рассмотрен в нашем обзоре [8]. Использование нами русскоязычного термина “контрафактический” здесь и ранее [2, 3, 68], вместо имеющегося в орфографическом словаре “контрфактический” (без “а”), обосновано в [8] тем, что в отечественной философской литературе, посвященной указанному подходу, встречается только первое наименование (к примеру, статья “Контрафактические высказывания” в томе 2 (2010) четырехтомника “Новая философская энциклопедия” [87]).

Неудовлетворительность термина для подразумеваемой Хиллом методологии [8]

Просто “Эксперимент” – это неудачное, слишком неспецифичное название для контрафактического подхода, имело истоком, вероятно, работу Lilienfeld A.M., 1959 [3, 8], в которой среди принципов установления причинности эффектов курения, с попутным упоминанием термина “эксперимент”, предлагалась методология, основанная на устранении действия фактора: “Поставьте эксперимент, чтобы определить, приводит ли прекращение этой привычки к снижению смертности от конкретной патологии” (см. в [8]).

В 1965 г. Хилл так и назвал соответствующий критерий: “Эксперимент”, хотя подразумевался не собственно эксперимент в том смысле, как все его понимают, а только контрафактический (без использования этого термина) [1]. Кратко в [1] было сказано об эффекте некоторых “превентивных мер”. Например – уменьшения уровня пыли на рабочем месте, замены смазочных масел, отказа курить сигареты. “Изменится ли частота связанных с этими факторами событий? Таким образом может быть выявлена самая сильная поддержка гипотезы причинности” [1, 8].

“Самая сильная поддержка гипотезы причинности” [1]. Это положение затем повторяли и другие авторы [88].

Подход по наблюдению эффекта после предотвращения воздействия (“prevention”) для медико-биологических дисциплин имелся в свое время у Клода Бернара (C. Bernard; 19 в.), на что указывал A.J. Bollet в 1964 г. [89] (см. в [3, 8]).

О названном подходе в эпидемиологии как правиле впервые упоминалось, по всей видимости, в работе Wynder E.L., 1956 [3, 8]. В 1957 г. подход в форме предотвращения действия агента (“prevention”) был введен R.J. Huebner для инфекционных (вирусных) заболеваний и A.M. Lili-enfeld для хронических патологий [3, 8].

И никто из перечисленных авторов, кроме Хилла, не давал конкретного названия указанному постулату/критерию. Неудачное наименование “Эксперимент”, как и некоторые другие рассмотренные термины из списка Хилла, привело к смещению понятий и критике [50, 64, 70, 90] (подробнее см. в [8, 9]). В результате во многих источниках (пособиях и работах) критерий “Эксперимент” Хилла понимается как эксперимент в обычном, не контрафактическом смысле, на клетках, животных, людях и даже in silico [62, 65, 72, 9197] (и мн. др.; подробно см. в [8]). Что попадает скорее в сферу действия критерия “Биологическое правдоподобие” (“Biological plausibility”) [7, 9]. Иной раз критерий “Эксперимент” вовсе опускался; его заменяли “Биологическое правдоподобие” или “Согласованность” (“Coherence”), без всякого контрафактического подхода [12, 13, 17, 72, 74, 98].

Философский смысл и история понятия “контрафактический” [8]

Судя по всему, для биологии, медицины и эпидемиологии теория контрафактического подхода в отечественных дисциплинах была формально не озвучена до нашего обзора [8].

Согласно западной энциклопедии (2005) (ссылку см. в [8]), термин “counterfactual conditional” (“контрафактическая условность”) “используется в логическом анализе применительно к выражениям типа: “Если бы А произошло, то и B бы произошло”. Чтобы быть контрафактическим, т.е. “против факта”, это А должно быть ложным или несоответствующим нашему миру”.

В оксфордском словаре по эпидемиологии под редакцией M. Porta (2014) [99] термин “counterfactual” обозначает “событие или условие… которое не происходит (т.е. противно факту), но по одному из пунктов логически возможно”.

В другом оксфордском словаре по эпидемиологии, под редакцией Дж. Ласта (2001 г.; перевод 2009 г.) [100], конструкция “counterfactual definition” (“контрафактическое определение”) переведена как “определение от противного”, или “мера эффекта, в определении которой хотя бы одно из двух условий определения переменных должно противоречить факту”.

Согласно пособию по философии науки (Hofmann B. et al., 2007) [97], контрафактический подход состоит в том, что “присутствие или отсутствие причины приводит к различию”.

Впервые контрафактический подход для определения причины был предложен, как считается, Д. Юмом (D. Hume; “Исследование о человеческом познании”; издания 1748 и 1753 г.), причем замечено это было спустя более 200 лет – в статье от 1973 г. философа Дэвида Люиса (D. Lewis; США) [8].

Контрафактический подход развивался в философии, гносеологии и языкознании в течение 20 в., причем знаковыми считаются монография и статья D. Lewis от 1973 г. [8].

Контрафактический подход в эпидемиологии. Терминологические вариации [8]

Такой подход использовался в эпидемиологии задолго до формирования формальных построений и терминологии. John Snow (1813–1858) в 1854 г. рекомендовал вывести из эксплуатации общественную водоразборную колонку (снять рычаг), которая, как ему удалось показать, могла распространять холеру в одном из районов Лондона. После этого локальная эпидемия пошла на убыль. Данная иллюстрация контрафактического подхода входит во многие пособия и словари по эпидемиологии (см. в [8]). Другие примеры из общей эпидемиологии, взятые из [43, 67, 101] и др. источников, были приведены нами в [68]. Вслед за Сообщениями Главного врача США о последствиях курения от 1964 и 2004 г. [10, 66], во многих пособиях и публикациях (см. в [8]) распространенной иллюстрацией стал отказ от курения с последующей фиксацией снижения частоты заболеваний.

В работе [102] приведены источники 1970-х – начала 2000-х гг., в которых наблюдали эффект (атрибутивные фракции для заболеваемости/смертности) после сокращения уровня экспозиции неблагоприятным фактором вплоть до нуля, при ceteris paribus (“прочих равных условиях”; лат).

Заметим, однако, что термин “counterfactual” (“контрафактический”) в раннее время эпидемиологами не использовался. Ряд авторов и организаций не используют его и сейчас, причем многословных замен немало [8]:

Natural experiment”(“полуэксперимент” – “semi-experimental” [1]; “semiexperiment” [103]), “Reversibility” [13, 73, 104, 105], “Stop/recovery studies” [79], “Intervention” [18, 64, 86, 106], “Preventive action” [64], “Preventive intervention” [71], “Prevention” [107], “Manipulation” [20, 63], “Essentiality of Key Events” [108], “Cessation of exposure” [67], “Terminating exposure” [67], “Исчезновение эффекта при прекращении экспозиции” [24], “Доказательство “от противного”” (пособие Покровский В.И. и др., 2007; ссылку см. в [3, 4, 6, 8], “Обратимость” (перевод пособия Fletcher R.H. et al., 1998; 2005; см. в [8]), “Обратимость (эффективность мер вмешательства)” [109].

Представляется целесообразным заменить в эпидемиологии и медицине “кустарные” и многословные определения, которых более десятка, на единое унифицированное название “counterfactual approach” (“контрафактический подход”) [8].

“Контрафактический идеал” и “контрафактический контраст” в эпидемиологии [8]

Теоретически это синонимы, но в реальной практике появляются замены второй категории. Термин “counterfactual ideal”впервые встретился нам, вкупе с “counterfactual contrast”, в “Modern Epidemiology” Rothman K.J. et al., 2008 [51].

Контрафактический идеал – это теоретический сценарий, когда индивидуум или группа людей, подвергавшихся воздействию, сравниваются с тем же самым индивидуумом или с той же самой группой, но без воздействия. Причем в то же самое время [47, 68, 104, 110].

Поскольку подобный сценарий на деле невозможен, то, как указано в [110], используется подход по замене идеального “контрафактического контраста” на реально возможные группы сравнения, т.е. контроли [20]). Валидность подобной замещающей стадии (приближение к идеальному контролю) определяет валидность оценки эффекта [110]. А получение абсолютного знания о причинности для медико-биологических дисциплин невозможно в каком угодно эксперименте, повторим это вслед за Юмом и Хиллом (подробнее см. в [2, 8, 9], а также ниже).

В конце программной статьи от 1965 г. [1] Хилл высказал свое кредо для практики и этики медико-биологических дисциплин, которое стало как бы манифестом для многих западных авторов. В пособиях [20, 67, 68, 111], энциклопедиях [112] и концептуальных работах [86, 93] (и пр. источники; см. в [8]) приводится прямо буквальная цитата из [1]. Уместно и здесь воспроизвести данное кредо Хилла, поскольку до нашего обзора [8] нигде в отечественной литературе оно, по всей видимости, не приводилось. Итак [1]:

“Вся научная работа является неполной, будь то наблюдательные или экспериментальные исследования. Вся научная работа может быть разрушена или изменена путем продвижения знания. [Но] это не дает нам свободы игнорировать уже имеющиеся данные или откладывать действие, которое, по-видимому, требуется в данный момент”15.

“Контрафактический” – на практике означает и синоним контроля или группы сравнения, и методический подход по устранению воздействия [8]

Как следует из предыдущего материала, “контрафактический” имеет два значения:

• Контроль, группа сравнения (попытка приближения к “контрафактическому идеалу”). Описательные и экспериментальные дисциплины;

• Методический подход (дизайн) по устранению воздействия с последующим наблюдением за эффектом. В основном описательные дисциплины.

Этот дуализм, приведенный и в нашей предыдущей публикации на тему [8], не был разъяснен ранее (два таких пункта рядом нам не встретились ни в одном из источников).

Термин “Контрафактический эксперимент” для критерия Хилла и понятия с определением “контрафактический” [8]

Термин “Контрафактический эксперимент” был введен нами независимо, в Сообщении 2 [3]. Позднее во всей массе источников обнаружилось всего четыре прототипа; они не совпадают и, вероятно, случайны (в пособиях встречаются однократно):

• “Counterfactual experience” (контрафактическое испытание; опыт) [68];

• “Counterfactual thought experiments” (контрафактически замысленный эксперимент) [47];

• “Counterfactual study” (контрафактическое исследование) [20];

• “Counterfactual experiments test” (тест на контрафактические эксперименты) [78].

В зарубежной эпидемиологической литературе обнаружены десятки конструкций и сочетаний слов с определением “counterfactual”; получается прямо “альтернативный мир”, как у D. Lewis (см. в [8]). Таким образом, в данной области концепция и подход достаточно распространены уже более 20 лет; детально разработана формализация; но в отечественных источниках по названному направлению, как сказано, нами не был найден даже термин.

Неабсолютность контрафактического эксперимента [8]

Понятно, что если последствия зашли достаточно далеко и уже необратимы, то устранение причины может не дать эффекта [63, 67, 73, 104, 113]. Кроме того, успешность контрафактического подхода зависит еще и от степени компонентности и множественности причины (см. в [2]). Многие патологии являются результатом мультифакториальной причинности, поэтому прекращение какого-то воздействия не всегда способно отменить или замедлить прогрессирование заболевания. Иногда множественные факторы риска, включая диету, физические упражнения, курение, химические агенты и генетическую предрасположенность, способствуют индукции и прогрессу патологии. Комбинация этих факторов может завершаться заболеванием, но экспериментальные манипуляции только с одним из них способны как привести, так и не привести к снижению эффекта [113].

Контрафактический подход и контрафактический эксперимент в радиационных дисциплинах [8]

Для экспериментальных дисциплин радиационного профиля (радиобиология, радиационная генетика и т.д.) контрафактический подход, понятно, неспецифично предусмотрен априори – в виде обязательного формирования контрольной группы. Что же касается контрафактического эксперимента, когда устраняется воздействие радиационного фактора с последующим наблюдением за эффектом, то это, скорее, область радиационной экологии, радиационной гигиены, редко – радиационной эпидемиологии, но не лабораторных исследований (не удалось вспомнить для радиобиологии ни одного такого примера). В нашем обзоре [8] подробно разобран ряд ситуаций, входящих в сферу радиационной эпидемиологии, которые в той или иной степени можно отнести к контрафактическому подходу и, порой, даже к эксперименту в его как бы “природной” форме (полуэксперимент – semi-experiment Хилла [1, 103). Большинство перечисленных ниже примеров связаны с облучением детей (ссылки см. в [8]):

Остановка работы американских АЭС – якобы снижение детской смертности от злокачественных новообразований поблизости [8]

Группа авторов (J.J. Mangano, Gould J.M. и др.) из некоммерческой организации “Radiation and Public Health Project” (Нью-Йорк) опубликовали несколько работ, в которых приводятся данные о снижении уровня детской смертности, в том числе от раков и лейкозов, неподалеку от американских АЭС после остановки их работы (а во время работы АЭС перечисленные показатели якобы были повышены сравнительно с регионами без АЭС). И хотя данные указанных авторов подвергались критике (“мусорные” – “junk” – работы), не подтверждаясь другими исследованиями, и они не цитируются международными или имеющими международный авторитет организациями, тем не менее важен сам факт использования в радиационной эпидемиологии/радиационной гигиене контрафактического подхода/эксперимента.

Уменьшение доз при рентгеноскопии in utero – снижение риска последующих детских раков и лейкозов [8]

Эффектам пренатального медицинского облучения в прошлые десятилетия посвящен ряд масштабных исследований “случай–контроль”, среди которых главным является Оксфордское (The Oxford Survey of Childhood Cancers). Был сделан вывод, что дозы в 6–10–20 мГр при рентгеноскопии беременных (в 1940–1960 гг.) приводят к учащению смертности от детских раков и лейкозов к возрасту в 10–15 лет в 1.4 раза. Имелось множество неопределенностей в этих исследованиях, в результате чего МКРЗ (ICRP-90; 2003 г. [114]) и НКДАР (с 1972 г.; последний документ – НКДАР-2012; издан в 2015 г. [115]) выразили сомнения в радиационной атрибутивности эффектов (несмотря на значительное число воспроизводимых исследований). Тем не менее данные эффекты, скорее всего, реальны, и это канцерогенные последствия наименьших доз из известных ныне [116].

Последнее подтверждает и “контрафактический эксперимент”: параллельно со снижением дозовой нагрузки при рентгеноскопии беременных с 18 мГр в 1940-х гг. до 2 мГр в 1960-х гг. за процедуру (film; дозиметрия по данным НКДАР-1972), отмечено и уменьшение RR для смертности детей от злокачественных новообразований c 1.9 до 1.17.

Последствия терапевтического облучения детей при нераковых патологиях [8]

В 1920-х – 1950-х годах практиковалась радиотерапия детей, причем в значительных дозах, для лечения множества нераковых патологий, большинство которых ныне не представляются серьезными (аденоиды, потеря волос, воспаления, гемангиома, глухота, коклюш, пневмония, синусит, лишай, увеличение тимуса, тонзиллит и миндалины, угри и карбункулы, фарингит и др.). Терапия была успешна, однако из источников тех лет следует, что у детей наблюдался ряд “субъективных” и объективных последствий, среди которых отчетливо выделяются первичные реакции лучевого поражения (тошнота, рвота и др.) и признаки лучевого синдрома (например, лейкопения). Очевидно, что с окончанием этой практики для нераковых заболеваний в 1960-х гг. контрафактически отменились и названные признаки лучевого поражения.

Вторичные раки после радиотерапии – возможность снижения частоты за счет улучшения техники [8]

Среди ряда факторов, которые обусловливают вторичные последствия радиотерапии злокачественных новообразований (наиболее значимые при облучении детей, поскольку те априори имеют больший ожидаемый период жизни), для контрафактического подхода можно выделить улучшение техники и технологии, снижающее поражение здоровых тканей. Но до последнего времени положительный эффект подобного улучшения не был показан (полагают, что прошло слишком мало времени с момента введения новых технологий радиотерапии – пока не выдержан латентный период для индукции раков).

Профессиональные радиационные воздействия: снижению экспозиции может сопутствовать уменьшение смертности от злокачественных новообразований [8]

Работники ядерной индустрии. В наших обзорах [7, 8] приводились данные по эволюции мировых норм радиационной безопасности (НРБ) с 1920-х до 1990 гг. Предельные дозы, что уже приводилось выше, снизились на два порядка – с 1560 мЗв/год в 1925 г. до 10–20 мЗв/год в 1990-х годах. Казалось бы, параллельно должно наблюдаться и контрафактическое снижение смертности от радиационно-обусловленных заболеваний (раков, лейкозов, циркуляторных патологий), но ситуация оказалась не столь простой. Приведенные почти во всех хроно-исследованиях показатели стандартного индекса смертности (SMR) сравнительно с генеральной популяцией не только не улучшаются с 1940-х гг., а скорее, ухудшаются, хотя с 1960-х гг. и наблюдается нечто вроде плато. В 1940-х – начале 1950-х гг. смертность работников сравнительно с соответствующей половозрастной группой населения была ниже, чем ныне (по крайней мере для работников ядерной индустрии Великобритании [117]). Очевидно влияние конфаундеров (например, улучшения здоровья генеральной популяции от десятилетия к десятилетию), равно как и известного снижения SMR у работников вредных производств при увеличении длительности занятости [118]. Но формально факт все же остается: работать в системе ядерной индустрии сравнительно с обычной занятостью становится как бы все менее безопасно, поскольку относительная смертность от всех причин все выше от десятилетия к десятилетию (либо достигается плато). Несмотря на все ужесточения норм безопасности, прогресс в области защиты и здравоохранения16.

Тем не менее формальный пример контрафактического исхода нашелся и для одной из подобных когорт. Для работников ядерного центра в Окридже (США) с 1947 по 1974 г., параллельно с уменьшением допустимой годовой дозы, отмечалось хроно-снижение SMR для рака легкого. Хотя работники ядерного центра в Окридже, помимо радиации, подвергались воздействию еще и бериллия и прочих агентов (бериллий также является причиной рака легкого).

Радиологи. Эти примеры более однозначны в плане лучевой атрибутивности контрафактических зависимостей.

В работе Berrington A. et al., 2001 [119] прослежена структура смертности британских радиологов (в основном мужчины) за период 1897–1997 гг. по показателю SMR сравнительно с тремя группами мужчин: всего населения Англии и Уэллса (“генеральная популяция”), соответствующего социального класса (“social class I males”) и с медиками не радиологами. Наиболее показательно сравнение с последней группой.

В течение почти 100 лет общая смертность радиологов была несколько ниже, чем у других врачей (SMR от 0.68 до 1.0). То же наблюдалось и для смертности от нераковых патологий (SMR от 0.64 до 0.95). Однако для всех раков подобная тенденция имела место только для самого последнего периода (1955–1979), а до того была повышена (SMR от 1.75 до 1.12). В исследовании [119] были приведены оцененные пожизненные дозы, которые могли накопить радиологи в указанные периоды (от 20 Зв в 1897–1920-х гг. до 0.1 Зв в 1955–1979 гг.). Это позволило нам построить контрафактическую зависимость между SMR от раков и накопленными дозами (для логарифма дозы r = = 0.980; p = 0.02; см. в [8]).

Сходная контрафактическая закономерность обнаружена и для RR рака молочной железы у радиологов США (в основном женщины) с 1949 г. до 1960 г. [120]. Дозовые лимиты для радиологов составляли 70 рэм/год до 1934 г., 30 рэм/год в 1934–1958 гг. и, наконец, 5 рэм/год с 1958 г. (см. в [8, 120])17.

Эксперимент в обычном понимании: роль в установлении эпидемиологической причинности

Как уже упоминалось, ряд авторов включают в критерий Хилла “Эксперимент” все эксперименты в обычном понимании: на людях, животных, in vitro и даже in silico (ссылки см. в [8], а также выше и ниже). Это не отвечает исходному замыслу A.B. Hill [1], подразумевавшему только контрафактический, природный эксперимент. Тем не менее целесообразно рассмотреть место “обычных” экспериментов при подтверждении эпидемиологических ассоциаций. Сходный материал был отчасти изложен в рамках критерия “Биологическое правдоподобие” [7, 9], но конкретная роль именно того или иного экспериментального методологического подхода отражена не была.

Эксперимент – это не правило установления причинности, а только проверка причинной гипотезы, причем не абсолютная

Кажется, что данный подраздел было бы уместно поместить в начале главы, посвященной критерию “Эксперимент”, если бы не необходимость изложить сначала понятия о контрафактическом подходе, контрафактических идеале и контрасте (контроле). Без этих понятий затруднительно уяснить неабсолютность эмпирического подхода.

Эксперимент – это не руководящий принцип (guideline) и не критерий установления причинности в строгом смысле, а скорее метод проверки причинной гипотезы [68, 122]. Эмпирический подход является повторением канона “различий” Дж.С. Милля [68], согласно которому A вызывает B, если при прочих равных условиях изменение A приводит к последующему изменению B (оригинал основного перевода канонов Дж.С. Милля см. в [3]).

Правильно выполненные и имеющие хороший дизайн эксперименты могут предоставлять строгое доказательство “за” или “против” причинности [68]: “экспериментальные тесты могут быть намного сильнее, чем другие тесты” [122]. В 1954 г. статистик в области медицины Jero-me Cornfield (1912–1979; США), являющийся “классиком” теории о силе связи [4, 9], сравнивая наблюдательный эпидемиологический подход и прямой эксперимент, указывал: “У всех у нас есть смутное ощущение, что если мы можем заставить событие произойти, то мы понимаем его лучше, чем если мы просто наблюдаем его пассивно” [123] (цитировано по [124]18.

Тем не менее эксперименты не столь решающи в вопросе определения причинности из-за трудностей в интерпретации результатов [50, 122]19. Приведем здесь важные для радиобиологии примеры “экспериментов” (“анекдотов” [125]), о которых исходно рассказано в блоге (2009) популяризатора науки, биолога А.Ю. Панчина; далее эта информация разошлась в Рунете [125].

1. В одном институте исследовали, так сказать, телепатию у крыс. Животных рассаживали в клетки парами для привыкания друг к другу; затем пары разъединяли и помещали в отдельные, полностью изолированные клетки. Первая группа получала неограниченное количество корма, а вторая, напротив, выдерживалась на голодной диете. Параллельно имелась группа контроля (“непарные”), которая тоже получала неограниченное количество корма. Было обнаружено, что, сравнительно с контролем, партнер голодающей крысы статистически значимо потреблял большее количество корма. Так сказать, “доедал за друга”, который передавал какой-то сигнал.

Результаты неуклонно воспроизводились, и был сделан вывод о новом способе передачи информации. Но проводящий экспертизу специалист из другого учреждения заставил распределять крыс между клетками (вначале и после) рандомизированно (по жребию), равно как и животных на контроль и опыт. После этого “телепатия” отменилась и более не воспроизводилась. Предполагают, что исследователи без намеренного умысла помещали более худых и более толстых крыс в клетки из разных групп, причем соответственно намеченным для этих групп задачам.

2. В другом опыте мышей обучали проходить лабиринт, затем скрещивали между собой самых “умных” (наиболее успешно выполнивших задачу) и самых “глупых”. Потомки первых еще лучше проходили лабиринт, что как бы демонстрировало некую эволюцию (от себя скажем – ламаркистского или эпигенетического типа). Но и потомки “глупых” мышей тоже весьма умнели в плане лабиринта (а должны были быть еще более “глупыми”). То есть “эволюция” оказывалась обратной. Поэтому появилась гипотеза о наличии некоего информационного поля, которое передает навыки от одних обученных мышей другим, причем тем, которые, возможно, и лабиринта-то пока не видели.

Но вот кто-то догадался мыть лабиринт после каждого эксперимента – и “информационное поле” сразу исчезло.

Два приведенных “анекдота” из [125] рельефно иллюстрируют, что выводы из эксперимента могут нацело определяться неправильной интерпретацией результатов.

О неабсолютности экспериментального подхода имеются рассуждения также в работах не раз упоминавшихся K. Rothman и S. Greenland [50, 122]. Приводится пример проверки старинной гипотезы, что малярия вызывается болотным газом. Если осушить болота в одних регионах, оставив их в других, то получится, что заболеваемость малярией в первых явно упадет по сравнению со вторыми, и гипотеза по видимости окажется правильной [50, 51, 122]. Но, согласно K.R. Popper, всегда есть много альтернативных объяснений результатов каждого эксперимента20. И здесь альтернатива, которая правильна, это передача малярии москитами [50, 122].

Еще D. Hume (т.е. Дэвид Юм) в 18 в. указывал, что строгое доказательство в эмпирической науке – невозможно [126] (см. также выше про контрафактические идеал и контраст). Как подчеркивается в Rothman K., Greenland S., 2005 [50]:

“Этот простой факт важен для эпидемиологов, которые часто сталкиваются с утверждениями, будто в эпидемиологии доказательство невозможно, причем подразумевается, что оно якобы возможно в других дисциплинах. Подобная критика исходит из положения, что эксперименты являются определяющим источником научного знания. Данное мнение ошибочно по крайней мере в двух пунктах. Во-первых, неэкспериментальный характер науки не исключает впечатляющих открытий [геодезия, астрономия и пр., в том числе эпидемиология]. Во-вторых, даже когда они возможны, эксперименты (включая RCT) не дают ничего приближающегося к доказательству, и фактически могут быть спорными, противоречивыми или невоспроизводимыми” [50]21.

И далее (курсив наш) [50]:

“Некоторые экспериментаторы полагают, что эпидемиологические связи только наводят на размышления, и считают, что детальное лабораторное исследование механизмов [эффекта] у отдельных людей может выявить причинно-следственные связи с определенностью. Эта позиция не учитывает тот факт, что все связи наводят на размышления именно так, как это обсуждалось Д. Юмом: даже самый тщательный и подробный механистический анализ (dissection) отдельных событий не может обеспечить больше, чем ассоциации, хотя и на более тонком уровне. Лабораторные исследования часто включают наблюдаемый контроль, который нельзя выполнить в эпидемиологии, и именно этот контроль, а не уровень наблюдения, может усиливать выводы из лабораторных исследований. Однако и такой контроль не является гарантией от ошибок. Все плоды научной работы, в области эпидемиологии или других дисциплин, в лучшем случае представляют собой лишь ориентировочные формулировки описания природы, даже если сама работа выполняется без ошибок” [50]22.

Эти рассуждения K. Rothman, S. Greenland [50] полезно было бы сгладить приводимой ранее [8] и выше цитатой с “кредо” Хилла23. Сами авторы [50], в отличие от многих других исследователей и аналитиков, этого не сделали, и они, как сказано, важность причинных критериев – отрицают [50, 51, 61, 69, 122].

Включение экспериментов на людях в критерии Хилла, предложенные для обсервационных исследований, нелогично

В нашей публикации [8] и выше указывалось, что целый ряд авторов критерий Хилла “Эксперимент” (по сути контрафактический) распространил не только на опыты с модельными системами и животными, но и на эксперименты с людьми, т.е. на контролируемые испытания (CT) и RCT. То же отмечено в пособии “Modern Epidemiology” от 2008 г. K.J. Rothman с соавт. [51]24, причем ранее, в энциклопедии от 2005 г., два первых автора выражали недоумение, что же такое A.B. Hill имел в виду под “экспериментом” [122]25. Хотя в его публикации 1965 г. [1], как сказано, все изложено однозначно.

В результате во многих весомых источниках клинические испытания рассматриваются именно в рамках критерия Хилла “Эксперимент”: это МАИР (правда, давно – IARC-1987) [127], British Medical Association (2004) [96], объемные западные пособия по эпидемиологии (2004–2019) [54, 62, 65, 72, 88, 97, 128], лекции по этому предмету (1997–2015) [129, 130] и иные, весьма значимые публикации (1987–2015) [14, 91, 93, 94, 131, 132]. В других источниках CT и RCT, хотя и не относятся авторами к пункту “Эксперимент”, тем не менее называются в контексте критериев Хилла [20, 133].

Это неправомерно с концептуальной позиции: ведь клинические испытания, точнее RCT, расценивают еще с 1979 г. [134] как вершину в иерархии доказательности медико-биологических эффектов у людей [20, 47, 65, 67, 73, 75, 135139], причем их называют “золотым стандартом” подобной доказательности [21, 22, 47, 55, 65, 67, 75, 138, 140] (термин “золотой стандарт” для RCT, согласно [141], введен в 1982 г. A.R. Feinstein и R.I. Horwitz [142]; судя по тексту последней, это так).

Получается алогичность: чтобы оценить путем индукции через совокупность косвенных “пунктов” (“viewpoints” [1]), называемых “критерии”, вероятность причинности ассоциации в обсервационных исследованиях, используют среди прочих подходов самое сильное, основанное на гипотетико-дедуктивном методе, экспериментальное доказательство причинности этой самой ассоциации. Зачем нужны иные критерии, подходы, если RCT (и даже CT) все доказывает априори, причем строже, чем какие-либо дизайны обсервационного характера?

Допустим, мы примем во внимание основной, неустранимый порок RCT – недостаточную “внешнюю валидность” (external validity), т.е. возможную нерепрезентативность данных, полученных на ограниченной группе пациентов или добровольцев (нередко здоровых, с особенностями менталитета, часто только мужчин), для всей популяции [26, 43, 47, 53, 59, 131, 135137, 142145] (известны случаи, когда это приводило к многочисленным жертвам [135, 145, 146]26). Ведь сравнительно с RCT, обсервационные, эпидемиологические исследования, по определению этой дисциплины [99, 100, 147, 148], затрагивают широкие группы населения, т.е. их выводы как бы более репрезентативны. Однако придумать какой-то агент или воздействие, эффекты которых были бы доказаны в клинике путем CT или RCT, а потом, вдруг, стали актуальными для значительной части населения (вероятно, в результате аварии или несчастного случая), не слишком удается. Ведь RCT проводятся в рамках клиники и, из этических соображений, ограничены исследованиями только препаратов (либо вакцин в полевых испытаниях), а также средств терапии [149151], хотя хирургия тоже встречается [152]. Можно выдумать историю про выброс с фармакологического предприятия, что подвергло население неконтролируемой экспозиции некоего фармпрепарата, и, потому, обсервационный вывод об эффекте здесь был сделан в том числе на основе более раннего RCT в клинике. Но подобные изощрения вряд ли практически значимы.

Таким образом, обнаруженное для множества западных пособий и иных источников самобытное введение “до кучи” CT и RCT в комплекс критериев причинности Хилла нелогично и некорректно с позиции научной философии эпидемиологических подходов. Как и при элиминации рядом авторов критерия “Специфичность” [9], A.B. Hill явно никого не уполномочивал на принципиальные изменения, включая расширение контрафактического критерия “Эксперимент” до обычного. И сам A.B. Hill, судя по всему, четко видел границы между эпидемиологией и экспериментальной медициной [153]. Отметим, что официально A.B. Hill считается одним из пионеров внедрения RCT (1948) [23, 104, 149, 154], что не совсем правомерно. Первое известное RCT было проведено в 1925 г. Dora Colebrook (Великобритания) [155], а первое RCT современного дизайна (с распределением на группы по таблице случайных чисел) – в 1938–1941 гг. Joseph Asbury Bell (США) [156]27.

Классическая эпидемиология – это не экспериментальная, а обсервационная дисциплина, основанная преимущественно на индуктивном подходе

Данный материал представляется лежащим вне основной темы настоящего сообщения, но, исходя из сказанного в предыдущем подразделе, это не так. Ибо можно встретить терминологическое смещение “классическая эпидемиология” – “экспериментальная эпидемиология”. Понятно, что во втором случае предусматриваются контролируемый эксперимент и гипотетико-дедуктивный метод. Как это совмещается с тем положением, что эпидемиология – преимущественно обсервационная дисциплина, в которой доказательность поверяется комплексом критериев?

Термин “классическая эпидемиология” встретился в ряде западных источников [47, 74, 138, 157, 158], включая словарь по эпидемиологии под редакцией J.M. Last [100]. Термин был введен, по всей видимости, A.R. Feinstein не позднее 1968 г. [140, 159].

Начиная с этиологической теории факторов окружающей среды и образа жизни, предложенной Гиппократом [56], которая упоминается во множестве источников по эпидемиологии [47, 73, 74, 104, 138, 139, 157, 160, 161], данная дисциплина долгое время оставалась чисто наблюдательной, хотя и использующей вспомогательные лабораторные эксперименты (особенно на раннем, инфекционном этапе [47]). Это следует из многих, вновь, западных пособий, обзоров, лекций [20, 65, 88, 139, 160, 162165] и документов НКДАР ООН [95]. Такого рода дисциплины используют преимущественно индуктивный подход:

“В эпидемиологии научные исследования часто проходят индуктивно” (2010 г.; монография по каузальности из The Johns Hopkins University, США) [166]28.

“Индуктивные методы составляют сущность стандарта эпидемиологических текстов…” (1995 г.; обзор L.R. Karhausen (Франция) по критике подходов K.R. Popper в эпидемиологии) [167]29.

“Конечно, эпидемиологи генерируют гипотезы путем индукции из массивов описательных данных и существующих знаний, с которых их исследования обязательно должны начинаться” [19, 168]30.

“…эпидемиологические выводы являются лишь частью более широкого (индуктивного) эпидемиологического процесса” [169]31.

“…эпидемиология, по сути, является индуктивной дисциплиной” (1936 г.; монография Wade Hampton Frost (США), первого американского профессора по эпидемиологии [47]; разработал дизайн когортных исследований [47, 170] и ввел сам термин “когорта” [171]) [172] (цитировано по [173])32.

В обзоре 1978 г. по дефинициям предмета эпидемиологии [148] неоднократно повторяется слово “observation”, но совсем нет слова “experiment”.

Таким образом, эпидемиологию многие авторы (и мы тоже) причисляют преимущественно к наблюдательным, обсервационным дисциплинам, использующим для формирования выводов, как сказано, в первую очередь индукцию [19, 166169, 172]. (Разумеется, без дедуктивного подхода тоже не обходится – даже выбор дизайна исследования и моделирование [174], стратификация по группам [165, 174], а также формальный статистический вывод (доверительный интервал) [174], – это уже дедукция [165, 174].)

Однако занятие “преимущественно индуктивной дисциплиной”, по всем признакам, может вызывать комплекс неполноценности. “Нет истинной доказательности” по D. Hume [126]. “Ненастоящая наука” по K.R. Popper [84]. “Второсортная наука эпидемиология” (“second-rate science”) [175]. И это притом, что мы все живем и действуем в нашем мире в основном по вероятностному, индуктивному принципу (подробнее об этом см. в части 1 настоящего сообщения [9]). В пособии 2016 г. [20] указывается, что эпидемиология, мол, подвергается критике за то, что она “наблюдательная”. Автор [20] тут же отвергает эту критику, указывая, что в современной эпидемиологии обязательно используется и экспериментальный подход, хотя и редко. Сходные осторожные утверждения (“редко”) можно найти и в некоторых других пособиях [72, 161]. Но в большинстве подобного рода изданий (кроме названных и цитированных здесь выше) осторожность опускается, и говорится однозначно, что данный предмет использует и наблюдения, и истинный эксперимент [47, 62, 73, 99, 104, 157, 176179] (и др.).

Что же рассматривается в качестве эксперимента? Понятно, что CT и RCT, и, как отмечается в [47], обычно ничего более (“Часто экспериментальная эпидемиология просто приравнивается к RCT”33).

В пособиях [73, 179] в качестве экспериментов в эпидемиологии, помимо CT и RCT, приводятся также “field trials” (“полевые испытания” [178]) и “community trials”. Как пример для первой области называется иммунизация/не иммунизация миллионных групп населения при испытаниях вакцин [73, 178]. Это узкая сфера полевой эпидемиологии, которая, согласно профильному изданию по данному предмету, является почти целиком обсервационной дисциплиной [179]34. Что же касается “community trials”, то это практически то же самое, что в первом случае, и пример в [73] приводится также с иммунизацией/не иммунизацией по округам целой страны. Отмечается множество ограничений данного дизайна, поскольку трудно создать равноценные группы-округа [73], и эксперимент во многом превращается в экологический (корреляционный) наблюдательный опыт, не имеющий доказательной силы в эпидемиологии и служащий только для формирования гипотез [24, 67, 73].

В результате попытки привязать к собственно эпидемиологии (“классической эпидемиологии”) экспериментальную составляющую можно назвать формальными. Какие доли от эпидемиологических исследований составляют названные “field trials” и “community trials”? В пособии 2010 г. указывается, что испытания вакцин насчитывают не более 10–20% от всех эпидемиологических исследований на здоровых популяциях [160].

Однако мы, даже с приведенной выше подборкой ссылок и цитат из множества весомых пособий и иных источников, не можем оспаривать утверждения из десятков других, названных и не названных здесь западных и российских пособий по эпидемиологии, согласно которым все эксперименты в клинике и вообще вся экспериментальная медицина – это как бы и почему-то эпидемиология. Нам остается только констатация данного, явно неправомерного, утверждения.

В 1998 г. известный историк эпидемиологии и становления критериев причинности, Mark Parascandola (США), также отмечал: “Хотя некоторые исследователи рассматривают клинические испытания с использованием экспериментальных вмешательств как часть эпидемиологии, это не общее мнение” [175]35.

Тем не менее термин “экспериментальная эпидемиология” присутствует во многих современных источниках, порой единично и без объяснений [47, 65, 73, 99, 100, 139, 161, 176, 179, 180] (есть и другие примеры).

Известна еще дисциплина “клиническая эпидемиология” [47, 138, 140, 149, 158, 159], предтеча EBM [47], представляющая собой использование в рамках клиники для групп пациентов подходов (в основном статистических), первично разработанных в обсервационных исследованиях населения эпидемиологией. В отличие от клинической медицины, имеющей дело с индивидуальным пациентом, клиническая эпидемиология оперирует статистическими закономерностями, выявленными на группах пациентов (но не населения, как классическая эпидемиология) [159]. То есть – некая суженная “эпидемиология в рамках клиники”. Основными методами клинической эпидемиологии являются эксперименты – CT и RCT. В 1990-х гг. данная дисциплина трансформировалась в EBM (историю этого см., например, в [47]), что более логично в плане терминологии и устраняет странный оксюморон “экспериментальная эпидемиология”.

Эпидемиология Поппера (Popperian Epidemiology) – виртуальная дисциплина философов и теоретиков

Этот подраздел является, вновь, логичным продолжением предыдущего.

Как уже говорилось, даже классическая эпидемиология использует комбинацию из индукции и дедукции, но о том, что должно превалировать, индуктивизм (позитивизм), или гипотетико-дедуктивный метод фальсификации гипотез K.R. Popper [84], ранее велись долгие и многословные дискуссии, начиная с пионерской работы Buck C., 1975 [165] по внедрению взглядов K.R. Popper в эпидемиологию. Суть подобного подхода, активно и безальтернативно предлагавшегося позднее и другими авторами (см. в [181] и ниже), состоит в том, что эпидемиолог обязан начинать свое исследование-наблюдение не просто собирая материал, а имея предварительную гипотезу, что же он должен в результате получить. Чтобы ее, эту свою гипотезу, опровергнуть-сфальсифицировать, или же нет [165, 173, 181, 182].

Корректный методологический и статистический подходы в эксперименте, действительно, требуют формулирования гипотезы перед началом исследования (а не изобретения или коррекции ее на основе полученных результатов) [169, 183185]. Это отмечал еще в 1966 г. A.B. Hill [183]. Тем не менее для обсервационных исследований, в частности эпидемиологии, ситуация может быть иной. Например, трудно себе представить, какие априорные гипотезы могли иметь исследователи канцерогенных эффектов, скажем, в японской когорте LSS пострадавших от атомных бомбардировок. Вкупе с изучением больных после радиотерапии было обнаружено, что ряд раков очень явно связан с радиационным воздействием (щитовидной и молочной железы), ряд – связан как правило (легкого, желудка, толстой кишки, пищевода), ряд – связан редко (почки, кожи, прямой кишки, матки, кости и др.), а ряд – вообще никогда не связан (не выявлено для поджелудочной, простаты, семенников, шейного отдела и некоторых других сайтов) [95, 186]. Почему раки поджелудочной, простаты и семенников независимы от облучения, в то время как, скажем, почки, желудка и пищевода – зависимы? Не прослеживаются никакие механизмы и закономерности, и потому – откуда здесь могут быть априорные гипотезы?

Конечно, поставив себя на позицию школьника, можно придумать что угодно (например, что исходная гипотеза была как раз о разной лучевой атрибутивности различных раков), но подобный подход и неконструктивен, и не имеет практической значимости. На игры с попытками притянуть во всех случаях гипотетико-дедуктивные методы к практической эпидемиологии указывал еще M.W. Susser (1988): “Превратите “смутно сформулированные ожидания” в теорию, переименуйте процесс индуктивного мышления в “воспроизведение”, и трансформация завершена” [187]36.

Однако дискуссии относительно “Popperian Epidemiology” все же начались, как сказано, с подачи философов в 1975–1976 гг., со множества откликов на статью Buck C. (1975) [165], и активно продолжались в 1980-х гг., как с поддержкой [173, 182], так и с указаниями на практическую неконструктивность подобного подхода, особенно в области мероприятий для здравоохранения [19, 168, 169, 187], нередко основанных на “предупредительном принципе” (см. в [2]). В 1985 г. в США на базе Society for Epidemiologic Research был созван соответствующий симпозиум (так сказать, “Popper – non Popper Epidemiology”), который вызвал тогда чрезвычайный интерес [182]. Материалы 13 ведущих авторов были опубликованы в ныне доступном сборнике 1988 г. [181]. Эти материалы являются основными на тему до сих пор. В 1990-х гг. работ по подходу K.R. Popper в эпидемиологии стало много меньше, а в 2000-х гг. и позже – еще меньше.

К нынешнему времени, судя по десяткам западных пособий, вопрос почти потерял актуальность, и даже в объемных изданиях по эпидемиологии (например, 2014 г. – 2498 страниц [47], 2016 г. – 442 страницы [20] и 2020 г. – 596 страниц [68]) еще более кратко приведено то, что мы только что кратко и рассмотрели, преимущественно со все теми же дискуссионными ссылками 1970-х – 1980-х гг. [19, 165, 169, 173, 181, 182, 187] (и др.). Основной консенсус, на котором, вероятно, все и сошлись, это использование в эпидемиологии и индуктивных, и дедуктивных подходов [24, 68, 99]. Конечно, все так, но очевидно, что основным, концептуальным подходом здесь служит индукция, и, потому, достаточно виртуальная “Popperian Epidemiology” является уделом философов и теоретиков. Мы разделяем мнение M.W. Susser [19, 168, 187], M. Jacobsen [169, 188], M. Parascandola [175], L.R. Karhausen [167] и некоторых других, не названных здесь авторов [189, 190], об особой важности для практических решений в эпидемиологии именно индуктивного подхода. Называют ли ту эпидемиологию “классической” или, неправомерно, “экспериментальной”.

Эксперименты по испытанию препаратов, воздействий и средств терапии для людей наиболее адекватно проводить на людях

Рассмотренный материал свидетельствует, что для задач классической эпидемиологии (а радиационная эпидемиология по своим особенностям является именно такой [95]) клинические эксперименты, CT и RCT, малоактуальны. Поэтому здесь нецелесообразно слишком подробно раскрывать постулат, что испытания препаратов, воздействий и средств терапии для людей наиболее адекватно проводить именно на людях. Это известно еще со времен Авиценны (980–1037), который с явным юмором отмечал, что тестирование лекарств следует проводить на людях, “поскольку проверка на львах и конях ничего не скажет о действии вещества на организм человека” [191] (ясно, что медицинские опыты на львах проблематичны для любых эпох). В российском пособии от 2013 г. [192] также сказано, что “достоверно предсказать действие новой субстанции на человеческий организм на основании экспериментов на животных невозможно. Фармакокинетика у человека отличается от фармакокинетики даже у приматов”.

Утверждения, что именно данные для людей наиболее адекватно отражают влияние на человека факторов окружающей среды (химических и пр.) и наиболее важны при оценке соответствующих рисков, можно найти в документах USEPA [193]37 (хотя и не во всех [63, 85]), ECETOC (European Centre for Ecotoxicology and Toxicology of Chemicals) [194]38, Teratology Society [133]39, МАИР (отражено в градациях канцерогенности факторов) [127], в работах на тему включения эпидемиологии в государственную и правовую политику [54]40, в юридическую практику [195]41 и пр. [196]42. (Следует отметить, что найти ссылки и цитаты для подобных, как бы априори ясных утверждений, оказалось не так просто. Их нет даже во множестве пособий по эпидемиологии и EBM.)

Игнорирование этого правила тысячелетней давности и использование в медицине основанных только на лабораторных опытах или на биологических теориях подходов приводили, порой, к плачевным последствиям, сопровождавшимся тысячами и десятками тысяч жертв (см. выше и в [7] примеры про талидомид и оксигенацию новорожденных). Однако основатель экспериментальной медицины C. Bernard (т.е. Клод Бернар) в 19 в. придерживался идеи, что только строго контролируемые эксперименты на животных могут обеспечить надежные данные о физиологии и патологии, имеющие медицинское значение. Этот исследователь находил истоки экспериментальной медицины в экспериментальной физиологии [197, 198]43. В конце 1920-х – в 1930 гг. Совет по медицинским исследованиям Великобритании (Medical Research Council; MRC), как указано в историческом обзоре [180], выполнял программы в области экспериментальной эпидемиологии – на животных. В 1930-х гг. M. Greenwood и A.B. Hill (оба – Великобритания), считающиеся именно в такой последовательности основателями эпидемиологии “ранней генерации” (всего для 20 в. насчитывают три генерации) [199], продвигали экспериментальную эпидемиологию [200]. Эта “экспериментальная эпидемиология” 1930-х гг. не совпадает по смыслу с рассмотренной выше одноименной надуманной дисциплиной нашего времени, включающей в эпидемиологию CT и RCT (т.е. эксперименты на людях). Согласно [201], MRC и его представители M. Greenwood и A.B. Hill понимали под “экспериментальной эпидемиологией” тестирование эпидемиологических гипотез в опытах на животных.

В 1940-х гг. опыты на животных все еще включали в “терапевтические (therapeutic) эксперименты” [202] (цитировано по [203]).

Время показало, что прав был скорее Авиценна44. В частности, доклинические исследования новых препаратов на животных не всегда дают адекватные предпосылки для фазы I клинического испытания, приводя, порой, к трагедиям на этой фазе45. Хотя в среднем процент экстраполяции медицинских эффектов с животных на человека удивительно высок (см. далее прим. 65).

Чем эксперименты на людях уступают экспериментам на животных

1) эксперименты на людях часто трудно и дорого организовать [20];

2) по этическим соображениям не все испытания на людях можно повторить и воспроизвести [183]. Это нередко касается и обсервационных, эпидемиологических исследований. Как сказал A.B. Hill в 1965 г.: “Еще раз взглянем [правде в глаза]: будут случаи, когда повторение отсутствует или невозможно, и все же мы не должны стесняться делать выводы” [1]46;

3) для многих факторов или воздействий исследования на людях вообще невозможно проводить по этическим соображениям [12, 20, 22, 47, 65, 66, 68, 96, 142, 149, 159, 164], поскольку “единственные этичные эксперименты относительно причинной связи на людях – это эксперименты по предотвращению” (R. Doll) [107]47. “С этической позиции, участник должен иметь потенциал для получения выгоды, но при этом должна быть неопределенность по поставленному вопросу. Для факторов риска, в отличие от факторов защиты, такой пользы быть не может” [20]48. То же – для RCT при облучении: “Должно иметься ожидание, что в популяции радиационное воздействие приведет к улучшению в состоянии здоровья относительно любой альтернативной терапии” (BEIR-VII) [30]49. Поэтому для лучевого фактора единственные области, где возможны RCT, это аспекты радиотерапии (много работ) [208], сравнение скриннинговых эффектов различных типов диагностического облучения [209], бальнеология (мало публикаций) [210] и иммуностимуляция малыми дозами облучения у больных раком (единичные источники) [211]50;

4) в некоторых случаях по этическим и методологическим соображениям рандомизация при CT невозможна [184, 213], в то время как дизайн экспериментов на животных таковую предусматривает априори, что специально отмечается в документах МАИР [214], USEPA [85], FDA (U.S. Food and Drug Administration) [215], в российском обзоре [216] и в иных источниках [217]. В исследовании Hirst J.A. et al., 2014 [217] было показано, что в опытах на животных отсутствие рандомизации завышает эффект исследуемого воздействия, в то время как рандомизация, сокрытие распределения по группам и “ослепление” (маскировка) исследователей размер эффекта уменьшают. Точно такие же результаты получены для CT и на людях: нерандомизированные исследования демонстрируют, как правило, более высокие эффекты, чем RCT [21, 218] (хотя иногда возможна и обратная зависимость [219]), равно как недостаточные “ослепление” и сокрытие распределения [218, 220, 221]. Более того, имеющие меньший размер выборки и низкокачественные RCT также завышают эффекты сравнительно с масштабными высококачественными RCT [220];

5) лабораторные эксперименты имеют намного больше, так сказать, “степеней свободы”, чем CT в клинике. Это еще в 1912 г. отмечал в своей концептуальной статье T.H. Sollmann (США): “Клинические наблюдения должны выполняться столь же точно, как и лабораторные наблюдения, но для людей опыты не могут быть так же легко контролируемы, условия не могут быть так же легко поддерживаемы одинаковыми или разными, – одним словом, проблемы не могут быть проанализированы так, как они могут быть проанализированы на животном” [222]51.

Действительно, исследователь может использовать многие способы введения (или воздействия), широкий диапазон доз, сочетания с иными агентами; изучать объекты различных видов, животных с любыми гендерными и возрастными характеристиками, моделировать один и тот же объект in vitro, in vivo и in situ, и пр., включая использование контрафактических подходов (элиминирование, ингибирование, блокирование, нокаутирование [8]), а также возможность выявления зависимостей “доза–эффект”. На последнем, как на одной из важных характеристик, оцениваемых в опытах на животных в токсикологическом и канцерогенном аспектах, сделан акцент авторами USEPA [85, 223], FDA [215] и др. [224]. Все сказанное, понятно, актуально и для исследования радиационного фактора;

6) в отличие от RCT, не способных выявить редкие побочные эффекты (их приходится собирать в течение многих лет на обсервационной фазе IV) [149, 192], эксперименты на животных можно проводить именно с этой целью. Согласно [225], токсикологические исследования на животных предназначены не для того, чтобы установить, является ли соединение безопасным для человека (поправим: не только для того), а чтобы изучить типы эффектов, которые это соединение может вызывать при определенных условиях. Исследования на животных часто проводятся с целью вызвать наибольшее количество побочных эффектов, что достигается использованием очень высоких доз и воздействиями по специальным путям доставки соединения прямо в конкретный орган, без учета нормального поглощения и метаболизма [225].

Когда оценка рисков и разработка стандартов безопасности осуществляется только на основе опытов на животных

Как было сказано выше, наиболее точные стандарты для человека можно разработать только на основе опытов на людях. Но это далеко не всегда возможно, в особенности для воздействий повреждающих факторов52. Согласно FDA (“Animal Rule”, 2015), “…было бы неэтично намеренно подвергать здоровых добровольцев воздействию летального или перманентно выводящего из строя токсичного биологического, химического, радиологического или ядерного соединения…” [215]53.

Причем речь идет не только о медицине, но и об эпидемиологии – как оценить потенциальную опасность соединения, если никакие группы людей с ним не контактировали; во всяком случае в масштабах, обеспечивающих обсервационное исследование? Как отмечается, вновь, FDA и ведущими авторами в области радиозащиты США, проводящими поиск в рамках этой организации, когда “полевые испытания для изучения эффективности препарата после случайного или преднамеренного воздействия невозможны” [215, 232]54.

В подобных случаях основной экспериментальной базой для определения самого факта опасности, затем – для количественной оценки рисков с последующей разработкой стандартов безопасности, служат эксперименты на животных. Этого положения в целом придерживаются соответствующие международные и имеющие международный авторитет организации, как нерадиационного, так и радиационного профиля.

1) МАИР (IARC-1987 [127]):

“При отсутствии адекватных данных для людей, биологически правдоподобно и разумно рассматривать агенты, в отношении которых имеется существенное доказательство канцерогенности у экспериментальных животных, как если бы они представляли канцерогенный риск для человека” (курсив – оригинала)55. Существенными доказательствами канцерогенности по МАИР является ее обнаружение на двух и более видах животных и в двух или более независимых исследованиях на одном виде, проводимых в разное время или в разных лабораториях или по разным протоколам. В исключительных случаях одно исследование на одном виде может рассматриваться как существенное доказательство канцерогенности, когда злокачественные новообразования возникают в необычной степени с точки зрения заболеваемости, локализации, типа опухоли или возраста начала заболевания [127].

Сходные положения повторены в IARC-2007 и в IARC-2012 [214]:

“Хотя из этой ассоциации [для животных] нельзя установить, что все агенты, вызывающие рак у экспериментальных животных, также вызывают рак у людей, биологически вероятно, что агенты, канцерогенность которых у экспериментальных животных достаточно очевидна, также представляют канцерогенную опасность для людей. Соответственно, в отсутствие дополнительной научной информации считается, что эти агенты представляют канцерогенную опасность для человека”56.

2) FDA (США). Руководство “Product Development Under the Animal Rule” [215] “предоставляет информацию и рекомендации по разработке препаратов и биологических продуктов, когда исследования эффективности для человека неэтичны или неосуществимы”57.

“Правило “Animal Rule” гласит, что на препараты, разработанные для улучшения или предотвращения серьезных либо опасных для жизни состояний, вызванных воздействием летальных или навсегда выводящих из строя токсичных соединений, когда исследования эффективности на людях неэтичны, а полевые испытания невозможны, FDA может предоставить разрешение на маркетинг на основании адекватных и хорошо контролируемых исследований эффективности на животных, если результаты этих исследований покажут, что препарат с достаточной вероятностью обеспечит клиническую пользу и для людей” (курсив наш. – А.К.) [215]58.

Четыре критерия (criteria), позволяющие, согласно FDA, делать выводы для человека на основе экспериментов на животных, следующие [215, 233235]:

• Существует достаточно изученный патофизиологический механизм токсичности соединения и ее предотвращения или ощутимого снижения препаратом;

• Эффект продемонстрирован для более чем одного вида животных, которые, как ожидается, будут реагировать предсказуемо для человека, а если эффект показан только на одном виде животных, то таковой должен представлять собой достаточно хорошо охарактеризованную животную модель для предсказания реакции у людей;

• Конечный показатель (endpoint) исследования на животных должен быть четко связан с желаемой пользой для людей, которая заключается, как правило, в повышении выживаемости или предотвращении серьезных заболеваний;

• Данные или информация о кинетике и фармакодинамике препарата или другие соответствующие данные либо информация для животных и для людей позволяют выбрать эффективную дозу для человека.

FDA регулирует также разработку и внедрение радиопротекторов/радимитигаторов [232]:

“Маркетинговое утверждение (approval) новых противолучевых средств, для которых определение эффективности на людях неосуществимо или неэтично, будет основываться на исследованиях эффективности на животных и данных по безопасности для фазы I на здоровых добровольцах. Согласно “Animal Rule”, испытания противолучевых средств на людях можно обойти с помощью сокращенного, но строгого пути утверждения [препарата] FDA, который предусматривает выявление его эффективности на двух видах животных, предсказуемый ответ у человека, четкое понимание механизмов действия и безопасность для людей59.

FDA подчеркивает [232], что для доклинических исследований безопасности и эффективности противолучевых средств следует больше полагаться на модель крупных животных, но национальные ресурсы в этом плане ограничены. (Хотя показателем сходства с людьми является генетика и таксономия, а не размер видов. Наиболее весомо эффекты могут быть продемонстрированы на животных, таксономически связанных с людьми, и в дозах, аналогичных тем, которые ожидаются для людей [236].) Исследования на приматах считаются “золотой стандартной моделью” для опытов на животных при разработке и утверждении препаратов FDA [235]. В результате, как указано в Singh V.K., Olabisi A.O., 2017 [235], несмотря на значительные достижения за последние 60 лет в области разработки противолучевых средств на основе опытов на животных, только два фармпрепарата были одобрены FDA для терапии острого лучевого синдрома.

3) USEPA (США), European Food Safety Authority (EFSA), the Joint Food and Agriculture Organization (FAO), the European Chemicals Agency (ECHA) [78], International Life Sciences Institute (ILSI) и International Programme for Chemical Safety (IPCS) [237] и т.п. Для данных организаций и названной международной программы концептуальный подход к определению степени опасности экологических факторов (преимущественно химических токсикантов) основывается на упомянутом выше понятии WoE (еще раз расшифруем: Weight of Evidence – “Вес свидетельств”; перевод наш; понятие введено в 1960 г. [238]), которое означает выводы на основе интеграции и синтеза разнородной информации, полученной в опытах и наблюдениях на разных уровнях биологической организации (в том числе in vitro и in silico [224]) [13, 55, 63, 224]. Подход требует суждения [224] и экспертной оценки [63]. Методологическим основанием служит исследование так называемого “MOA” (“Mode of Action” – способ действия; перевод наш) в опытах на животных [13, 78, 85, 193, 224, 237]. Согласно пособию по причинности в экологии (2015), MOA означает “способ (way), с помощью которого механизм действия агента в конечном итоге влияет на объект” [239]60. Механизм действия и MOA (“mode”) – это, таким образом, разные категории [239]. Применительно к канцерогенезу MOA предусматривает цепочку ключевых событий на разных уровнях организации, к нему и ведущих. Каждое звено исследуется и взвешивается отдельно [78].

Следует отметить, что оценки для WoE, и, главное, для значимости этапов MOA на животных, проводятся с помощью критериев Хилла, хотя и модифицированных [13, 78, 224, 239]. То есть – разработанные для эпидемиологии “пункты” Хилла применяются здесь для исследований на животных (!)61.

USEPA и другие перечисленные выше организации экологического и токсикологического профиля разработали рекомендации по установлению MOA соединений в опытах на животных для использования при оценке рисков для человека [13, 85, 224, 237]. Утверждается, что в большинстве случаев различия в MOA для человека и животных будут носить количественный характер; примеры же качественных отличий редки [224]. Для экстраполяции выявленных эффектов по связке “животные → человек” верно и обратное: отсутствие опухолей в хорошо проведенных долгосрочных исследованиях по крайней мере на двух видах животных дает, согласно USEPA, разумную уверенность, что агент не вызывает канцерогенных последствий у человека [85].

Допущение по умолчанию, согласно которому данные на животных переносятся на людей, включено в руководящие принципы USEPA по крайней мере с 1991 г. (библиографию см. в [63, 193]).

4) NCRP (США). В NCRP-2005 отмечается, что эксперименты на животных, особенно на собаках, долгое время были одним из главных источников для оценки риска воздействия инкорпорированных радионуклидов [240].

5) UNSCEAR [36], МКРЗ (ICRP) [241], BEIR (США) [30], NCRP (США) [240], COMARE (Великобритания) [37]: оценки радиационного генетического риска для человека. Выше и в предыдущей публикации [7] указывалось, что в реальных эпидемиологических исследованиях для людей не удается выявить трансгенерационные (наследственные генетические) изменения (см. также в [3135]). В связи с этим для вычисления “удваивающей дозы” у человека (дозы облучения, которая увеличивала бы частоту спонтанного мутагенеза для одного поколения вдвое) первоначально была использована частота мутирования по семи реперным генным локусам у облученных мышей. Удваивающая доза, рассматриваемая с 1972–1977 гг. как 1 Гр на поколение, явилась, таким образом, простой экстраполяцией эффектов у мышей на эффекты у человека. В 2001 г. этот подход был модифицирован путем использования мутационной модели “человек – мышь”. В последней за исходный фон берется частота наследственных заболеваний у человека, а индуцированный радиацией показатель учащения рассчитывается на основе увеличения частоты мутаций в локусах облученных мышей [32, 33, 36]. Можно видеть, что модель 2001 г. (в настоящее время не изменилась) не основана на получении каких-либо эпидемиологических данных [36].

На наш взгляд, использование количественных данных о трансгенерационных рисках облучения у мышей непосредственно для оценок таковых у человека является наиболее ярким примером настоящего подраздела.

Ограничения экспериментов на животных

Хотя опыты на животных ныне предшествуют любому новому клиническому испытанию, и без доклинической фазы не мыслится никакое RCT62, тем не менее выявленные в подобных опытах закономерности следует интерпретировать с осторожностью.

1. Банально: животные – не люди. Экстраполяция выявленных на животных закономерностей не всегда адекватна как из-за межвидовых различий [18, 51, 63, 71, 88, 93, 193, 195, 196, 225, 245247], так и из-за того, что различия в механизме эффектов часто неизвестны [245]. Метаболические пути соединения могут отличаться у человека и животных [14, 63, 225], поэтому экстраполяция между видами требует знания физиологии видов [86]. Это касается и экстраполяции “животные → → человек” в радиобиологии [248]. Конечно, сравнительно с индуктивными обсервационными исследованиями только прямой эксперимент, основанный на гипотетико-дедуктивном методе, может дать строгие доказательства (см. выше), позволяя контролировать все условия. Но, как указано в [249], “попытка нивелировать названные проблемы экспериментами на животных вводит новые проблемы, поскольку перенос выявленных на животных эффектов на человека далеко не тривиален”63. В работе Cole P., 1991 (США) [195] о роли эпидемиологии в юриспруденции отмечается: “Суды признают, что попытка применить данные для лабораторных животных к человеку не является экстраполяцией, даже если ее обычно и называют так. Скорее это обобщение, в первую очередь субъективный процесс, в котором неявно применяется ряд незащищенных допущений”64.

Разработка фармпрепаратов в настоящее время (2019) характеризуется высоким уровнем отсева; многие предлагаемые методы терапии не выдерживают клинических испытаний. Частично это может быть связано с показателями успешности трансляции результатов от животных к человеку; так называемым “трансляционным сбоем” (“translational failure”) [250]65.

2. Исследования в лаборатории часто проводят при высоких уровнях воздействия, редко имеющих место в ситуации с человеком [51, 75, 164, 245247]. В связи с этим тестирование канцерогенов на грызунах в значительном числе случаев было ложноположительным. Действительно, дозы соединений, близкие к максимально переносимым, могут вызывать митогенез, который способствует мутагенезу и, таким образом, приводит к канцерогенезу, хотя те же соединения в дозах, близких к тем, которые обычно встречаются в повседневной жизни, могут быть безвредными [164]. Таким образом, экстраполяция эффектов от животного к человеку усложняется по крайней мере дуализмом: к качественному межвидовому переходу добавляется количественный дозовый переход [247].

3. “Искусственность лабораторных воздействий” [196]66. Путь, по которому вещество попадает в организм, может оказать влияние на его эффективность. В лаборатории животным часто вводят соединения специальными путями: внутрибрюшинно, подкожно, внутримышечно и внутривенное. Эти способы могут обходить нормальные механизмы, посредством которых потенциальные токсины удаляются до достижения общего кровообращения [225]. Так, длительные попытки доказать связь между курением и повышением частоты рака легкого на животных не приводили к успеху. Обкуривание мышей не вызывало у них учащения указанной опухоли помимо прочего по той причине, что мыши не желали по-настоящему вдыхать табачный дым [251].

4. Животные содержатся в контролируемой и стабильной среде, минимизирующей факторы образа жизни (питания, физической нагрузки, стресса и пр.); прием препаратов также контролируется и стабилен, в отличие от пациентов вне клиники [75].

5. Линии лабораторных животных, как правило, инбредны, что обусловливает намного более четкие, “искусственные” зависимости, чем для генетически разнообразных популяций человека [75, 193, 246].

6. Исследования на животных не воспроизводят длительность, степень, продолжительность, пути воздействия (length, magnitude, duration, routes) и вариабельность воздействия для людей [246].

7. Редукционизм: воздействие на человека нередко происходит через мультимедийные пути, включая пищу, воду, воздух, а также внутреннюю и внешнюю среду. Но в лабораторных исследованиях обычно используется единственный путь воздействия. Кроме того, люди могут одновременно подвергаться эффекту нескольких химических и/или иных факторов, тогда как в большинстве опытов на животных исследуется только единственный фактор [246]. Полная оценка риска, а не идентификация и не описание отдельных опасностей, требует анализа воздействия на человека в “реальном мире” повседневной деятельности и деятельности на протяжении всей жизни [237].

8. Продолжительность жизни человека больше, чем у лабораторных животных, что может не дать развиться у последних изучаемым эффектам (например, канцерогенным) [63].

9. Эффект соединения может зависеть не только от вида (известно множество различий в канцерогенности соединений даже среди грызунов [247]), но и от линии лабораторных животных [247, 252]. Например, пестицид атразин вызывал опухоли молочных желез у самок крыс Sprague-Dawley, но не у крыс F344, Long-Evans, не у мышей CD или самцов крыс Sprague-Dawley [252]. Чувствительность к диоксиноподобным соединениям различается между разными линиями грызунов [253].

10. Имеются другие, хотя и нечастые примеры, когда доказанные для животных канцерогенные [224, 225] и терапевтические [254] эффекты отсутствовали у человека (о более трагичном обратном феномене неоднократно говорилось выше – талидомид, оксигенация новорожденных, антитело CD28TGN1412; см. прим. 44). Иногда люди менее чувствительны к неблагоприятным эффектам, чем животные, что показано, например, для диоксиноподобных соединений на грызунах [253].

Перспективы использования экспериментов in vitro и in silico при оценке рисков и разработке стандартов безопасности

В целом подобные эксперименты служат подкреплением причинности в рамках критерия “Биологическое правдоподобие” (см. выше и в [7]). Хотя “замена теста in vivo клеточным, химико-аналитическим или же вычислительным подходом явно редукционистская” [255]67, иной раз отсутствует возможность провести исследования эффекта токсиканта не только на людях, но и на животных. Тогда, по рассуждениям в ряде источников, возможны попытки оценить риск в том числе в опытах in vitro [113, 256259] и in silico [63, 113, 192, 246, 249, 256] (мнения цитированных авторов, насколько это вероятно и практически значимо, разные). Например, согласно [113], для факторов токсикологии “исследования in vitro, которые тестируют пути в рамках механизма [действия], и демонстрируют биологическую роль агента в прогрессировании патологии, могут дать информацию для прогнозирования потенциальных результатов для здоровья человека гораздо более эффективным способом, чем исследования на людях, особенно для неблагоприятных результатов с длительным латентным периодом” (курсив наш. – А.К.)68.

Вряд ли эта категоричность оправданна, особенно в рамках всего, представленного в наших публикациях на тему [29] (а также здесь выше), но сам факт столь высокой оценки практической значимости опытов in vitro может быть полезен.

В публикации 2010 г. [258] Committee on Toxicity Testing and Assessment of Environmental Agents, сформированного в рамках National Research Council (NRC) США, рассматривается перспектива использования только экспериментов in vitro в испытаниях соединений на токсичность. Методика заключается в идентификации сигнальных путей, нарушение которых может привести к побочным эффектам. Указывается, что “в конечном итоге оценки риска будут проводиться с использованием математического моделирования путей токсичности для определения воздействия, которое не вызовет биологически значимых нарушений в этих путях”69.

Отмечается высокая степень неопределенности подобного подхода в связи с очень большим количеством сигнальных путей. И самое, похоже, главное (курсив наш – А.К.): “Маловероятно, что модели путей токсичности будут вносить количественный вклад в оценку риска по нескольким причинам, в том числе из-за того, что статистическая изменчивость, присущая столь сложным моделям, серьезно ограничивает их полезность при оценке небольших изменений в ответной реакции, и что подобные модели, вероятно, по-прежнему будут включать эмпирическое моделирование дозовых реакций” [258]70. То есть для оценки эффектов малых доз такие модели не подходят.

Далее в работе [258] рассматриваются моменты, демонстрирующие сложность и неоднозначность подхода, но выводом является предсказание (predict) названного комитета, что при таком подходе “химические вещества будут проверяться быстрее и дешевле, а испытания на животных будут сокращены или отменены”. Замена опытов на животных моделями обусловлена, насколько можно понять, сомнительными этическими соображениями, вряд ли правомерными при определении серьезных опасностей для человека.

Исследования по оценкам риска для человека через опыты in vitro проводятся также в рамках нанотоксикологии, где для этого, в частности, анализируется степень корреляции эффектов наночастиц в опытах in vivo и in vitro [259].

Рассмотренные надежды несколько проблематичны при имеющихся ныне методах. Например, тестирование in vitro генотоксических агентов на карцерогенность сравнительно с детекцией на грызунах оказалось не слишком успешным. Хотя для канцерогенов по ряду основных молекулярно-клеточных тестов выявлялась хорошая чувствительность (74% [260]), для неканцерогенов имелась низкая специфичность (75–95% ложноположительных результатов [260]) [260262]71.

Перспективы оценки моделей in silico с соответствующими заключениями и цитатами рассмотрены нами ранее [8].

АНАЛОГИЯ (“ANALOGY”)

История и суть критерия

Как отмечалось нами ранее, это единственный “пункт” из девяти, введенный собственно A.B. Hill [2, 3]. В его публикации 1965 г. [1] данному критерию посвящено пять строчек в журнальном столбце, и суть разъяснена только на двух примерах, причем из области медицины, хотя, как будет видно далее, “Аналогия” актуальна скорее для токсикологических и канцерогенных эффектов соединений.

Суть по Хиллу следующая [1]: “В некоторых случаях было бы справедливо судить [о возможности ассоциации] по аналогии. На основе эффектов талидомида и краснухи [при беременности], мы, несомненно, будем готовы принимать менее значительные (slighter), но похожие свидетельства для другого препарата или для другого вирусного заболевания во время беременности”72.

То есть идея заключалась в том, чтобы не дать беременным принимать препараты, которые аналогичны (“похожи”) на талидомид, а также устранять контакты их с вирусами, похожими на вирус краснухи (профилактика). Согласно [263], при подобном, по сути недоказанном подходе, в первом случае можно было получить и негативные последствия от запрета полезных и безвредных препаратов. Приводился и пример, прямо “по Хиллу”. Доктор W.G. McBride (Австралия), первым поднявший тревогу в 1961 г. относительно талидомида, позже предостерегал и от иного препарата (от утренней тошноты) на предмет его аналогичной тератогенности. Исследования показали, однако, что препарат был безопасен, но фирма уже прекратила его маркетинг [263]73.

После A.B. Hill суть критерия “Аналогия” развивалась рядом авторов, вплоть до последнего времени (2018) [264]. В пособии по экоэпидемиологии [239] рассматриваются философские основы. Сказано, что идея формального вывода из сходства восходит к древним грекам как “аналогия”: связь между любыми двумя вещами или понятиями. Аналогия является выводом из того неспецифического принципа, что вещи, которые имеют похожую структуру, имеют и сходную функцию. Подход используется для определения атрибутов или способов действия вероятной причины, связывая ее по аналогии с более доказанной причиной [239].

Важная смысловая интерпретация M.W. Susser критерия “Аналогия” следующая: “Когда известно, что один класс причинных агентов произвел эффект, то стандарты доказательства того, что другой агент этого класса произведет подобный же эффект, могут быть снижены” [64]74.

Отмечалось, что ныне ценность подхода по аналогии заключается не в подтверждении причинно-следственной связи, а в предложении и проверке гипотез [50, 64, 113, 181, 239]. Проверке – для нового фактора или соединения по аналогии с механизмом для уже исследованного.

Частота упоминаний и использования критерия

Критерий “Аналогия” рассматривается в приведенных выше смыслах во многих источниках по причинности в эпидемиологии [55, 64, 70, 71, 91, 93, 132, 225, 264266], включая пособия [62, 68, 72, 88, 90, 97, 138, 161], а также документы международных и имеющий международный авторитет организаций [13, 85, 95, 214, 239], но далеко не во всех. “Аналогия” среди критериев Хилла отсутствует в обоих цитированных выше оксфордских словарях по эпидемиологии [99, 100], в документах МАИР (1987 и 2006 г.) [127, 267], British Medical Association (2004) [96], в важных обзорах по причинности в эпидемиологии [11, 19, 105], в пособиях [12, 20, 53, 65, 67, 7274, 98, 128], в университетских лекциях [268] и др. [269].

В 2018 г. неоднократно упоминавшийся нами лично [3, 6, 7, 9] американский авторитет на стыке медико-биологических дисциплин, права, коммерции и политики, Douglas L. Weed, в своем обзоре именно по критерию Хилла “Аналогия” (единственный такой обзор за все времена) [264], также приводил около десятка пособий и иных источников (в том числе документ МАИР) с 1970 г., в которых указанный критерий или отсутствовал, или заменялся на иные критерии. В нашем приводившемся выше анализе публикаций за 2013–2019 гг. (35 работ) критерий “Analogy”, как и “Coherence”, находилcя на последнем месте из девяти (по 26 использований). В более раннем, также не раз упоминавшемся нами исследовании Weed D.L., Gorelic L.S., 1996 [76], среди 14 обзоров по критериям причинности пункт “Analogy” по упоминанию тоже находился на последнем месте.

В целом ряде случаев, как сказано в [264] и одновременно выявлено нами (см. выше и в [7, 9]), “Аналогия” заменялась другими критериями или объединялась с таковыми: с “Biological plausibility” [53, 66, 71, 93, 270], с “Coherence” [13, 53, 66, 71, 266] и даже с “Consistency” (“Постоянство ассоциации”) [78].

Таким образом, единственный предложенный лично A.B. Hill критерий причинности по значимости, как кажется, находится практически на последнем месте. Некоторые авторы рассматривают три критерия “Специфичность”, “Согласованность” и “Аналогию” как вовсе “бесполезные” [50, 65, 67]. “Возможно, это один из наиболее слабых критериев” [129], “потенциально вводящий в заблуждение” (из-за умозрительности аналогий) [271], “слабая поддержка причинности” [132], “абсолютно недействительный критерий в суждении о причинной обусловленности” [54], “даже более сомнителен, чем “правдоподобие” и “согласованность”” [69] (цитировано по [70]).

Мы в Сообщении 2 [3] также отметились в плане “незначимости” критерия “Аналогия”, цитируя соответствующие источники.

На чем же базируются такие утверждения, и обоснованы ли они?

Единственная критика критерия: “Аналогии обильны”

Хотя в Weed D.L., 2018 [264] указывается, что критерий “Аналогия” часто элиминируется из списка начиная с 1970 г., обоснования этого были найдены нами только в более поздних работах. Самый ранний источник – ныне некая лекция on-line по каузальности из университета в Атланте: Frumkin H. (Instructor), 1997 [130]. Сказано так: “Аналогия может быть полезна, хотя ее помощь представляется ограниченной, поскольку любой, кто обладает малым творчеством, может, вероятно, грезить об аналогии!” (курсив наш. – А.К.)75. Мол, дело только в фантазии.

Кто же первым высказал эту мысль, хотя и кажущуюся тривиальной?

В списке литературы к названной лекции 1997 г. [130] есть ссылка на упоминавшийся выше сборник симпозиума “Popper – Non Popper Epidemiology” под редакцией K.J. Rothman [181]. В вводной статье этого автора к сборнику [182] ничего про “воображение” и “творчество” нет. Но в другой публикации этого же издания, в Weed D.L., 1988 [272], сказано так:

“…“Аналогия” становится одним из способов придумать гипотезу, хотя [этот подход] немного лишен воображения. Альтернативой “Аналогии” по K.R. Popper была бы творческая изобретательность”76.

То есть идея обратна: кто использует аналогию, тот не имеет воображения сам придумать гипотетический механизм. А было: аналогию находит тот, у кого воображение. Так сказать, диалектика.

Более в сборнике [181] ничего про “Аналогию” и воображение нет. Таким образом выходит, что первоисточник построения об аналогии и воображении в лекции 1997 г. [130] непонятен. И нам придется считать автором этой часто цитируемой мысли по нивелированию критерия инструктора Howard Frumkin, составившего университетскую лекцию [130] (на деле – профессор, директор и руководитель ряда американских центров77). В то время как большинство исследователей считают ее автором K.J. Rothman. Возможно, подобные рассуждения были в первом издании его “Modern Epidemiology” от 1986 г. [273], которое нам недоступно, в отличие от третьего [51], но соответствующей ссылки в Frumkin H., 1997 [130] нет. Судя по пособию [54], мысли о “воображении” и “аналогии” есть во втором издании “Modern Epidemiology” от 1998 г. [69]. Но по факту это позже лекции 1997 г. [130].

В работе Rothman K.J., Greenland S., 2005 [50] имеется однозначное заключение:

“Независимо от того, что понимается под “Аналогией”, оно связано с изобретательским воображением исследователей, которые могут найти аналогии повсюду. В лучшем случае аналогия дает источник более сложных гипотез об исследуемых ассоциациях; отсутствие аналогов отражает только отсутствие воображения или опыта, а не ложность гипотезы”78.

В других монографиях K.J. Rothman про то же сказано или более кратко (2012): “Аналогии обильны” [61], или более развернуто: помимо прочего, начетнически (на наш взгляд) обсуждается формальное противоречие критерия “Аналогия” критерию “Специфичность” (2008) [51].

Остальные известные нам авторы как основу для вывода о ненужности критерия повторяют названные построения J. Rothman (например [54, 62, 113, 129, 239, 268]).

Примеры использования критерия

Умозрительные: обзоры и пособия

Примеры представлены по хронологии источников.

• Первыми являлись упомянутые A.B. Hill талидомид и краснуха у беременных [1]. Пример воспроизведен позднее в [68, 70, 88, 111, 130].

• После обнаружения ассоциаций между, например, HPV и раком шейки матки, можно ожидать, что вирус способен вызывать и другой тип рака [274].

• Аналогия: влияние сходных факторов в других продуктах питания и диете может рассматриваться как часть общего сценария исследования [131].

• Поскольку молекулярная конформация эстрогенов обеспечивает феминизирующую способность, молекулы одинаковой формы должны обладать феминизирующим эффектом. Поэтому можно сделать вывод, что конкретная молекула, имеющая аналогичную форму, вызовет феминизацию… Аналогии, основанные на способах действия молекулярной структуры или последовательностей ДНК [239].

• Для углеродных нанотрубок с использованием литературы по механизму токсичности асбестовых волокон и моделей, основанных на молекулярной структуре и физико-химических характеристиках, сделано предсказание о механизме действия нанотрубок, аналогичном механизму влияния асбеста. Морфология углеродных нанотрубок аналогична асбестовым волокнам; таким образом, ожидается, что волокна вдыхаемого размера будут вести себя одинаково при профессиональных загрязнениях и будут приводить к аналогичной транслокации, отложению в легких и т.д. [113].

• По аналогии с риском рака легких у активных курильщиков возможно судить о таком же риске при пассивным курении, хотя из-за множества вмешивающихся факторов и уклонов точная оценка воздействия может быть затруднена [275].

• Зная о причинном влиянии курения беременной матерью на массу тела новорожденных, можно ожидать, что более низкие уровни воздействия из-за пассивного курения или загрязнения атмосферы будут иметь аналогичные (хотя и меньшие) последствия [88].

Это все, что нашлось в десятках пособий по эпидемиологии и в иных подобных источниках. Кажется, что с “воображением исследователей”, по H. Frumkin и по K. Rothman, не слишком хорошо, но все не так, о чем свидетельствует следующий подраздел.

Реальные: в работах, в которых критерии Хилла используются как методология

Таких работ за 2013–2019 гг. нами, как сказано, проанализировано 35. В 26 из них критерий “Аналогия” назван и используется. Авторами представлены самые разные примеры для исследуемых ими эффектов, когда имеется аналогия с другими, уместными фактами и зависимостями. Недостатка в воображении при этом, действительно, не наблюдается.

Наша выборка, конечно, не отличается полнотой (можно добавить исследования до 2013 г. и за 2020 г.). В большинстве случаев авторы придерживаются основного перечня, предложенного Хиллом [1], так что даже наименее популярные критерии “Coherence” и “Analogy” используются в 74% приведенной ниже выборки. Имеется широкий спектр тем, направлений и дисциплин, в которых для доказательности эффектов применяются критерии Хилла (полные ссылки не приводятся):

• Aghajafari F. et al., 2013 – витамин D и беременность;

• Ahmad M.M. et al., 2017 – аневризма аорты и наследственность;

• Altieri B. et al., 2017 – витамин D и поджелудочная железа;

• Amoroso T., 2019 – экстази и когнитивные функции;

• Bazerbachi F. et al., 2017 – глобулинемия и гепатит;

• Beaule PE et al., 2018 – остеоартрит;

• Biddle S.J. et al., 2016 – сидячая жизнь и смертность;

• Buse D.C. et al., 2019 – причины мигрени;

• Cairney J. et al., 2013 – факторы нарушения координации;

• Chen W., Plewig G., 2015 – розацеа и клещи;

• Degelman M.L., Herman K.M., 2017 – курение и склероз;

• Frank C. et al., 2016 – вирус Зика и микроцефалия;

• Garg K et al., 2018 – полимикробный иммунный ответ;

• Grant W.B., 2018 – витамин D и предотвращение рака;

• Ha M. et al., 2016 – дезинфектанты и повреждение легких;

• Hu F.B., 2013 – сахар и ожирение;

• Hussain S.M. et al., 2018 – причины остеоартрита;

• Jenkins W.D. et al., 2013 – уголь в шахтах и рак;

• Kolkhir P. et al., 2017 – причины крапивницы;

• Large M.M. et al., 2017 – риск суицидов;

• Le Houezec D., 2014 – рассеянный склероз и вакцинация – гепатит B;

• Loeb S. et al., 2017 – риск меланомы;

• Manu P. et al., 2014 – воспаления при шизофрении;

• McCaddon A., Miller J.W., 2015 – гомоцистеин и когнитивные функции;

• McDonald R., Strang J., 2016 – эффективность налоксона;

• Miklossy J., 2011 – болезнь Альцгеймера и спирохетоз;

• Muganurmath C.S. et al., 2018 – обонятельные и вкусовая дисфункции от флутиказона;

• Nakanishi K. et al., 2018 – эффект препаратов от блох на популяции стрекоз;

• Olsen A. et al., 2016 – эффекты налоксона;

• Ravnskov U. et al., 2018 – врожденные факторы при гиперхолистеринемии;

• Ronald L.A. et al., 2016 – коммерция и уход в домах престарелых;

• Roy C. et al., 2017 – ртуть и развитие диабета;

• Urquhart D.M. et al., 2015 – бактерии и боль в пояснице;

• Walton J.R., 2014 – соединения алюминия и болезнь Альцгеймера;

• Weyland P.C. et al., 2014 – витамин D и риск сердечно-сосудистых патологий.

Не совсем в тему настоящего подраздела, но следует отметить, что в списке не видно использования критериев Хилла для оценки эффектов лучевых факторов, хотя данные критерии упоминаются в документах международных и имеющих международный авторитет организаций: НКДАР [95, 115], МАИР (радиационный канцерогенез) [214], BEIR [30] и NCRP [276]. Наша выборка, как уже говорилось, охватывает только 2013–2019 гг., однако есть публикации за иные годы (или в виде иных документов, не статей) по применению критериев Хилла для оценки причинности радиационных эффектов:

• Раки в популяциях вблизи АЭС (Shleien B. et al., 1991) [277];

• Эффекты у работников ядерной индустрии США. Упоминание критериев Хилла (Wakeford R. et al., 1998) [278]. Richard Wakeford (Великобритания) – один из ведущих радиационных эпидемиологов мира, член НКДАР, МКРЗ и других организаций лучевого профиля, главный редактор “Journal of Radiological Protection”. В 2015 г., к 50-летию публикации с критериями Хилла [1], вышла посвященная этой дате статья R. Wakeford [279];

• Детские раки на территориях вблизи АЭС (Fairlie I., 2009) [280];

• Радиация и лейкозы (Martinez-Betancur O., 2010) [281];

• Эффекты малых доз радиации (Ulsh B.A., 2012) [282];

• Возможность канцерогенных эффектов от мобильных телефонов. В монографии (Jorgensen T.J., 2016) [283];

• Эффекты малых доз. В учебной программе для специальности “Химия высоких энергий”, БГУ (Иванов Е.П., 2016) [284].

Актуальность критерия “Аналогия” при оценке токсических, канцерогенных и фармакологических эффектов соединений

Пренебрежительное отношение к “фантазийному” критерию “Аналогия”, которое коснулось и нас ранее [3], оказывается неоправданным для целых направлений медико-биологических дисциплин, имеющих высокую практическую значимость. D.L. Weed недаром обратил на это внимание в обзоре 2018 г., посвященном именно этому критерию [264], поскольку, в рамках “предупредительного принципа” [1], аналогию для суждения о рисках для человека использует и МАИР [127, 214, 267, 285], и FDA [215], и агентства по охране окружающей среды [13, 85, 239], и организации, исследующие химические токсиканты [78, 237, 286] и фарминдустрия [94, 271].

Во-первых, что было рассмотрено выше, названные организации могут делать выводы о рисках и опасностях для человека по аналогии с данными, полученными на животных. Во-вторых, используется априорное суждение о токсичности, канцерогенности и фармакологических свойствах соединений, аналогичных по химической структуре уже изученным [13, 14, 85, 94, 113, 127, 225, 239, 264, 271, 285, 286].

В данном плане представляется странной позиция МАИР. Используя в доказательности комплекс критериев Хилла [127, 267] и, широко, аналогию двух названных типов [127, 214, 267, 285], МАИР среди перечня критериев “Analogy” не упоминает [127, 267]. Получается, так сказать, известное: “предмет есть, а слова такого нет”.

A.B. Hill, когда вводил “Аналогию” в состав девяти причинных критериев [1], не имел, по-видимому, осознанной мысли об особой роли этого пункта для токсикологии и канцерогенеза. Иначе его примеры, наверное, были бы расширены с только талидомида и краснухи. Но интуиция этого исследователя, судя по всему, вновь была на высоте, и то, что после него казалось другим эпидемиологам никчемным применением “фантазии и воображения” (даже авторам двух оксфордских словарей по эпидемиологии [99, 100]), на деле имеет высокую практическую значимость и используется в важных направлениях по охране здоровья и безопасности населения.

ЗАКЛЮЧЕНИЕ

“Я останавливаюсь на этом с такой подробностью потому, что, может статься, те, кто будет жить после меня, столкнутся с подобной бедой и им тоже придется делать выбор; вот я и хотел бы, чтоб мой рассказ был для них указанием, как надо действовать; а сама по себе история моя гроша ломаного не стоит, и незачем было бы привлекать к ней внимание”.

Д. Дефо. “Дневник чумного года”.

В состоящем из двух частей Сообщении 3 были рассмотрены, по нашему мнению, почти все возможные аспекты для девяти критериев Хилла, начиная от истории появления и дефиниций до философской и эпидемиологической сути, использования, ограничений и актуальности для различных медико-биологических дисциплин. Мы можем утверждать, что в столь объемной полноте критерии Хилла вряд ли были изложены ранее, включая десятки западных пособий и монографий по эпидемиологии и по доказательствам каузальности в различных дисциплинах. Полнота объясняется как раз тем, что нами и были использованы практически все основные источники самого разного уровня, от пособий и монографий до малодоступных работ, университетских лекций и иных материалов on-line. Таким образом, вкупе со статьями-преамбулами по критериям “Сила связи” [4, 5], “Временная зависимость” [6], “Биологическое правдоподобие” [7] и “Эксперимент контрафактический” [8], три сообщения [2, 3] (включая настоящее), как мы надеемся, охватывают вопросы наиболее исчерпывающе на настоящий момент.

Актуальность материала, как не раз говорилось, объясняется вездесущностью критериев Хилла для любых дисциплин, основанных на обсервационных подходах, не только естественнонаучных, но и социальных, экономических, юридических и пр. Более того, как было видно выше, критерии Хилла используют даже в опытах на животных [13, 78, 224, 239]. Логика определения причинности едина для человеческого разума, какие бы направления деятельности ни брать, поэтому ориентация в методологических подходах при доказательности ассоциаций между причиной и следствием необходима и в обыденной жизни.

Несмотря на то что A.B. Hill в своей статье 1965 г. [1] только собрал разработанные иными авторами восемь критериев воедино (не сославшись ни на кого) [3], и добавил всего один свой, заслуга этого автора состоит именно в обобщении и формировании единого, в то время наиболее полного, комплекса подходов к оценке вероятности эпидемиологических и других ассоциаций. Британец A.B. Hill официально считается одним из основателей эпидемиологии и эпидемиологических методов 20 в. [199], основателем медицинской статистики [3, 199], а также пионером внедрения RCT [23, 104, 149, 154] (т.е. основателем и главного современного подхода EBM). Во всех случаях имелись иные, менее известные (в данном плане, конечно) предшественники, почти все из США (см. выше и в [3]); тем не менее, названные дисциплины и подходы связываются почти всегда с именем Хилла. Это делает его, вновь скажем пафосно, похожим на Р. Амундсена, открывшего, по сути, и Южный, и Северный полюсы.

В рамках темы цикла сообщений осталось рассмотреть несколько моментов.

1. Некоторые авторы модифицировали критерии причинности для эпидемиологии и социологии. Например, M.W. Susser попытался выработать из них действительно строгие правила доказательности (1973–1991) [11, 18, 19, 64, 168, 187]. Другие, как P. Cole, расширили для юриспруденции эти эпидемиологические, вероятностные и частотные подходы с уровня популяции до отдельного индивидуума (1997) [287]. Третьи авторы, как A.S. Evans, предложили единый комплекс причинных “постулатов” для хронических и инфекционных патологий (1976–1993) [2, 82] (на наш взгляд, наиболее исчерпывающий, но почти нигде не используемый).

2. Имеются попытки выработать градации значимости тех или иных критериев, равно как и их рубрификацию, с позиции научной философии (концептуально) или в плане более конкретных отражений доказательности. Этот аспект критериев нами пока не излагался.

3. Впечатляет широта использования причинных критериев (“критерии Хилла”) официальными организациями, программами ВОЗ, различными видами эпидемиологий, экспериментальными и учебными процессами и пр. Данный момент был рассмотрен нами пока только вкратце. При этом, как было видно выше и в [7], ряд ведущих эпидемиологов отрицают целесообразность использования в доказательности каких-то критериев или подходов, равно как индуктивного принципа вообще. Теоретическое отрицание с попытками нахождения на каждый пункт умозрительных и, действительно, порой фантастических контрпримеров [68, 50, 51, 61, 69, 122], никак не способно устранить тот факт, что и индукция, и соответствующие подходы, безальтернативно используются в нашей жизни, в здравоохранении и в дисциплинах, связанных с безопасностью населения. Хотя, конечно, причинные критерии или пункты, строго говоря, служат только для оценки вероятности ассоциаций, а не как конечное доказательство.

4. Помимо критериев (“Хилла”) в медико-биологических дисциплинах применяются иные подходы к доказательности причинности и к оценке “Веса свидетельств” (WoE), чему, в частности, посвящен недавний обзор Martin P. et al., 2018 [288]. Наш анализ показывает, однако, что более половины из таких подходов, перечисленных в [288], сводятся ко все тем же критериям Хилла, а среди оставшихся значительная часть – просто обзорные и экспертные заключения (т.е. выводы делаются непосредственно из обзоров или из мнений экспертов). Получается, в самом деле, что критерии Хилла – это действительно какие-то “общечеловеческие ценности”.

Есть еще некоторые моменты по теме, но названные – основные, которые мы надеемся рассмотреть в заключительном Сообщении 4.

ПРИМЕЧАНИЯ

1. Пока нет данных, что эти тонкие изменения могут реализоваться в ощутимые нарушения, аномалии и патологии, которые зарегистрировать так и не удалось, как сказано, на десятках тысяч потомков в различных когортах в течение более чем 60 лет [3037].

2. Авторы [40, 41] указывают, что, поскольку возраст потомков не превышал 40 лет, а эпигенетические изменения зависели от возраста, существует возможность, что частота передавшихся трансгенерационно изменений могла бы повыситься (accelerated) в будущем.

3. Например, по данным [44], для препаратов энкаинид и флекаинид, после среднего периода наблюдения, равного 10 мес, умерло 89 пациентов: 59 – от аритмии (43 с препаратом против 16 с плацебо; p = = 4 × 10–4), 22 – от неаритмических сердечных причин (17 против 5; p = 0.01) и 8 – от некардиальных причин (3 против 5).

4. “A remedy which is known to work, though nobody knows why, is preferable to a remedy which has the support of theory without the confirmation of practice” [58].

5. “Many things which in theory ought to be highly effective turn out in practice to be completely useless” [58].

6. “It is not based on any theory of how the treatments might work” [59].

7. “The question to which we must always find an answer is not “should it work?” but “does it work?” (even if we do not know why)” [58].

8. Термин “biologically implausible” (биологическое неправдоподобие) можно найти в постановлении органа английского здравоохранения от 1854 г., согласно которому доказательства заражения холерой через лондонскую воду (исследователь John Snow) не поддержаны лабораторными свидетельствами [7].

9. “Another factor is the widespread overemphasis on statistical approaches, with the concomitant tendency to neglect the fact that epidemiology is a biologic science concerned with disease in human beings” [60].

10. World Health Organization/International Programme on Chemical Safety. Обеспечивает официальную структуру для оценки данных о направлениях (pathways) причинно-следственных ключевых событий, ведущих к неблагоприятным последствиям для здоровья [78].

11. Например, в пособии Szklo M., Nieto F.J., 2019 (четвертое издание [65]) из списка критериев причинности удалены “Согласованность” (Coherence), “Специфичность” и “Аналогия”. Сказано так: “Мы, как и другие авторы (Gordis L., 2014 [67]; Rothman K.J., Greenland S., 2005 [50]) считаем, что эти три руководящих принципа бесполезны по следующим причинам: “Согласованность” трудно отличить от “Биологического правдоподобия…”.

12. Представлена суммирующая компиляция (смысловой перевод) работ [18, 19], материал в которых несколько отличается друг от друга по полноте.

13. “Coherence is an ultimate and yet not a necessary criterion for causality” [67].

14. “Coherence is comforting; incoherence by itself is often not destructive of a hypothesis but emphasizes gaps in scientific understanding” [86].

15. “All scientific work is incomplete – whether it be observational or experimental. All scientific work is liable to be upset or modified by advancing knowledge. That does not confer upon us a freedom to ignore the knowledge we already have, or to postpone the action that it appears to demand at a given time” [1].

16. Этот вывод не следует рассматривать слишком серьезно, он типа софизма. Во-первых, мы не располагаем данными по динамике хроно-изменений для всех мировых когорт работников ядерной индустрии (приведен пример для работников Англии, правда, для всех [117]), а во-вторых – более важны абсолютные (не относительные) риски, которые по сравнению с прежними десятилетиями, очевидно, снизились вместе с фоновыми значениями для генеральной популяции. В третьих, по мере удлинения стажа занятости “эффект здорового работника” становится меньше [117]. Но для СМИ и даже обыденно-научного сознания названный парадокс может представляться социально значимым.

17. Rem – roentgen equivalent man; 1 рэм = 0.01 Зв [121].

18. “We all have a vague feeling that if we can make an event occur, we understand it better than if we simply observe it passively” [123] (цитировано по [124].

19. “Although experimental tests can be much stronger than other tests, they are not as decisive as often thought, because of difficulties in interpretation” [122]. С этим согласится каждый, кому поступали на рецензирование экспериментальные работы. Иной раз именно интерпретация авторов является основой (порой некорректной и субъективной) выводов, а в суть методологии (по смыслу объективной) не всегда и углубляются.

20. “As Popper emphasized, however, there are always many alternative explanations for the outcome of every experiment” [50, 122].

21. “This simple fact is especially important to epidemiologists, who often face the criticism that proof is impossible in epidemiology, with the implication that it is possible in other scientific disciplines. Such criticism may stem from a view that experiments are the definitive source of scientific knowledge. Such a view is mistaken on at least two counts. First, the nonexperimental nature of a science does not preclude impressive scientific discoveries; the myriad examples include plate tectonics, the evolution of species, planets orbiting other stars, and the effects of cigarette smoking on human health. Even when they are possible, experiments (including randomized trials) do not provide anything approaching proof, and in fact may be controversial, contradictory, or irreproducible” [50].

22. “Some experimental scientists hold that epidemiologic relations are only suggestive, and believe that detailed laboratory study of mechanisms within single individuals can reveal cause–effect relations with certainty. This view overlooks the fact that all relations are suggestive in exactly the manner discussed by Hume: even the most careful and detailed mechanistic dissection of individual events cannot provide more than associations, albeit at a finer level. Laboratory studies often involve a degree of observer control that cannot be approached in epidemiology; it is only this control, not the level of observation, that can strengthen the inferences from laboratory studies. Furthermore, such control is no guarantee against error. All of the fruits of scientific work, in epidemiology or other disciplines, are at best only tentative formulations of a description of nature, even when the work itself is carried out without mistakes” [50].

23. Выше указывалось на широкое, буквальное цитирование этого “кредо” Хилла в зарубежных публикациях. Поиск Google на точное сочетание для цитаты выдает порядка 1.65 млн источников; высказывание рассматривается в том числе в рамках “предупредительного принципа”.

24. Применительно к критерию Хилла “Эксперимент” в [51] указано: “Для разных авторов экспериментальные данные могут относиться к клиническим испытаниям, к лабораторным опытам на грызунах или на других отличных от человека организмах, или же к тем и другим” (“To different observers, experimental evidence can refer to clinical trials, to laboratory experiments with rodents or other nonhuman organisms, or to both”.)

25. “Неясно, что Хилл имел в виду под экспериментальными данными. Он мог бы сослаться на свидетельства лабораторных опытов на животных или на доказательства, полученные в экспериментах на людях” (“It is not clear what Hill meant by experimental evidence. It might have referred to evidence from laboratory experiments on animals, or to evidence from human experiments”.) [122].

26. Например, в начале 1980-х гг. был разработан нестероидный противовоспалительный препарат benoxaprofen для терапии артрита/мышечно-скелетной боли [135, 145] (под коммерческими названиями “Opren” в Европе и “Oraflex” в США [135]). Проведенное масштабное RCT на контингенте возрастом 18–65 лет продемонстрировало эффективность, и препарат путем агрессивного маркетинга стал продвигаться в Великобритании и США. Однако у тысяч престарелых пациентов наблюдались тяжелые побочные эффекты, и отмечалось множество смертей от гепаторенальной недостаточности [135, 145] (согласно парламентскому отчету, только в Великобритании – 77 смертей [146]).

27. С историей развития RCT можно ознакомиться на сайте тематической библиотеки “James Lind Library” (Эдинбург).

28. “In epidemiology, scientific investigations often proceed inductively” [166].

29. “Inductive methods constitute the substance of standard epidemiological texts such as Rothman’s, Kahn’s, Miettinen’s etc” [167].

30. “Certainly epidemiologists are in the habit of generating hypotheses by induction from the arrays of descriptive data and existing knowledge with which their studies are bound to begin” [168].

31. “My reply is that epidemiologic inferences are but a part of a wider (inductive) epidemiologic process” [169].

32. “…epidemiology is essentially an inductive science, concerned not merely with describing the distribution of disease, but equally or more with fitting it into a consistent philosophy” [172] (цитировано по [173]).

33. “Often experimental epidemiology is simply equated with randomized controlled trials” [47].

34. “…the book will be addressing issues relating to observational epidemiology – not experimental epidemiology”. “almost all studies conducted by field epidemiologists are observational studies, in which the epidemiologists document rather than determine exposures” [179]. То есть – “природные”, полуэксперименты.

35. “Although some researchers consider clinical trials that employ experimental interventions part of epidemiology, this is not the common view” [175].

36. “Elevate “vaguely formulated expectations” into theory, rename the inductive reasoning process “reproduction”, and the transformation is accomplished” [187].

37. “Adequate human data are the most relevant for assessing risks to humans. When sufficient human data are available to describe the exposure-response relationship for an adverse outcome(s) that is judged to be the most sensitive effect(s), reference values should be based on human data” [193].

38. “Human data form the most direct evidence for an association between health effects and exposure to chemicals” [194].

39. “Human data are required for conclusions that there is a causal relationship between an exposure and an outcome in humans. Experimental animal data are commonly and appropriately used in establishing regulatory exposure limits and are useful in addressing biologic plausibility and mechanism questions, but are not by themselves sufficient to establish causation in a lawsuit. In vitro data may be helpful in exploring mechanisms of toxicity but are not by themselves evidence of causation” [133].

40. “Experimental evidence in humans would indeed constitute proof of causation…” [54].

41. “A number of learned and progressive jurists have recognized that, in the presence of meaningful epidemiologic studies, the contrived exposure situations of animals in laboratories produce information of relatively little value” [195].

42. “…human data are the most valid metric to determine human causality” [196].

43. Еще ранее, в начале 19 в., F. Magendie (1783–1855 гг.; Франция), разработал подход в области фармакологии и терапии, основанный на тестах на животных [57].

44. В 1938 г. венеролог из Бирмингема опубликовал в провинциальном журнале данные сравнительного исследования трех препаратов для лечения сифилиса: английского “Novostab”, американского “Mapharside” и немецкого “Neosalvarsan”. Немецкий препарат оказался наиболее эффективным по способности очищать сифилитические язвы от спирохет у пациентов. Подход MRC Великобритании, однако, заключался в сравнении новых соединений мышьяка со стандартными препаратами сальварсана и неосальварсана с использованием трипаносомового теста на мышах (названная “экспериментальная эпидемиология”). Возможность противоречия стандартного подхода MRC прямым данным на людях, полученным E.W. Assinder (вкупе с “непатриотичностью” его вывода), насторожила тогда не только указанную организацию, но и Министерство здравоохранения Великобритании [180].

45. Например, в 2006 г. в Великобритании проводили в рамках фазы I исследование разработанного германской фирмой TeGenero моноклонального антитела CD28TGN1412 к рецептору CD28 T-лимфоцитов [204207] на 8 добровольцах [206]. Препарат предполагалось использовать при аутоиммунных заболеваниях и лейкозах [204, 206, 207]. Доклинические испытания на приматах и кроликах не выявили побочных эффектов [207]. Двум добровольцам вводили плацебо [206], а шести – всего 1/500 часть от дозы, оцененной на приматах [204]. У всех шести добровольцев препарат вызвал резкую реакцию по типу “цитокинового шторма” [204206], приводящую к полиорганной недостаточности и другим тяжелым эффектам [205207]. Отеки были столь велики, что испытание получило наименование “The Elephant Man Clinical Trial” [206]. У одного участника развилась сухая гангрена с последующей ампутацией части стопы и кончиков пальцев (феномен Рейно). Когнитивные и многие другие серьезные нарушения наблюдались спустя годы после эксперимента, хотя все испытуемые выжили [205].

46. “Once again looking at the obverse of the coin, there will be occasions when repetition is absent or impossible and yet we should not hesitate to draw conclusions” [1].

47. “Because the only ethical experiments concerning causality in humans are experiments in prevention” (Doll R., 1978) [107].

48. “Ethically, the individual involved must have the potential to benefit and yet there must be uncertainty on the question posed. For risk factors, as opposed to protective factors, there may be no such benefit” [20].

49. “There must be the expectation that in the population under study the radiation will lead to an improvement in health status relative to any alternative treatment” [30].

50. В японской статье 2018 г. [212] приведены следующие неопубликованные данные по RCT для “исследования гормезиса”. N. Shimizu из университета в Осаке анализировал показатели у добровольцев, которые ежедневно спали на специальных радиоактивных ковриках (mat), содержащих 228Ac и 77Br с фоновым излучением 5 мкГр/ч. Контролем служили такие же коврики, но без радиоактивности. Здоровые добровольцы (30 мужчин и 30 женщин) со средним возрастом 32 года (22–48 лет) были рандомизированно разделены пополам на группу “гормезиса” и группу плацебо. Через 3 мес. [накопленная доза получается более 3 мГр] уровень активных форм кислорода был в среднем на 3.1 и 9.4% ниже, чем исходные показатели для групп плацебо и гормезиса, соответственно, у мужчин, и на 3.1 и 8.5% у женщин (в обеих группах p < 0.05). “Задержка сна, а также физический, психологический и нейросенсорный статус улучшились в группе гормезиса по сравнению с группой плацебо” [212]. Данные были представлены на симпозиуме “Japanese Society for Radiation Oncology” (Symposium for Cancer Control) в Нагое в 2017 г. В еще одном таком же RCT, выполненном N. Shimizu на 40 мужчинах, в опытной группе наблюдались повышение уровня IgА в слюне и удлинение периода медленного сна [212]. Вряд ли можно сделать серьезные выводы из этого исследования, но сам факт настоящего RCT с облучением здоровых людей все же уникален.

51. “Clinical observations can be made (and to be of any use. they must be made) just as accurate as laboratory observations; but in the human subject, observations cannot be as readily controlled, the conditions cannot be so easily kept uniform or varied – in one word, the problems cannot be analyzed, as they can be in the animal” [222].

52. Порог для известного всем радиобиологам наиболее радиочувствительного детерминированного эффекта – временного подавления сперматогенеза – в большинстве источников, включая российские пособия, соответствует 0.15 Гр (ссылки не приводятся). В других, также весомых публикациях, называется 0.1 Гр (например, [226, 227]). Мало где упоминаются две исходные работы [228, 229] (и суммирующий обзор [230]), причем практически нигде не указывается, что эти данные, доныне являющиеся эталонными, получены в двух клинических исследованиях (1963–1973) на “добровольцах” (22–52 года) в тюрьмах США (Вашингтон и Орегон). Участникам на специальном лежаке локально облучали семенники рентгеновскими лучами, причем неоднократно, до накопленных доз в 75 мГр – 6 Гр. В конце всем проводилась вазэктомия. Тогда и был выявлен порог временного подавления сперматогенеза у человека (периодически брались пункции для биопсии), порядка 0.08–0.1 Гр [228230]. Предпосылками эксперимента была необходимость защитить “семейные драгоценности” (как выразился американский полковник ВВС) у пилотов строящихся в 1950-х гг. самолетов с атомным двигателем и, в 1960-х гг., у космонавтов. В 1963 г. на конференции в Колорадо ведущий эндокринолог США C.G. Heller сказал: “Если всем интересно, что же происходит [при облучении семенников] с человеком, то зачем нам суетиться с мышами, собаками-биглами, канарейками (canaries) и т.д.? Если надо знать о ситуации с человеком, то почему бы не провести эксперименты на людях?” [231]. В начале 1970 гг. эти эксперименты были остановлены по этическим соображениям, а в 1994 г. созданная Б. Клинтоном комиссия расследовала все обстоятельства, включая издержки для здоровья и последующей жизни у многих “добровольцев” [231]. Данные опыты не могут быть названы RCT с облучением, но просто CT на здоровых добровольцах – являются.

53. “…it would be unethical to deliberately expose healthy human volunteers to a lethal or permanently disabling toxic biological, chemical, radiological, or nuclear substance…” [215].

54. “Approval under the Animal Rule can be pursued only if human efficacy studies cannot be conducted because the conduct of such trials is unethical and field trials after an accidental or deliberate exposure are not feasible” [215]. “Furthermore, field trials to study a product”s effectiveness after an accidental or intentional exposure are not feasible” [232].

55. “In the absence of adequate data on humans, it is biologically plausible and prudent to regard agents for which there is sufficient evidence of carcinogenicity in experimental animals as if they presented a carcinogenic risk to humans” [127].

56. “Although this association cannot establish that all agents that cause cancer in experimental animals also cause cancer in humans, it is biologically plausible that agents for which there is sufficient evidence of carcinogenicity in experimental animals also present a carcinogenic hazard to humans” [214].

57. “This guidance provides information and recommendations on drug and biological product development when human efficacy studies are not ethical or feasible” [215].

58. “The Animal Rule states that for drugs developed to ameliorate or prevent serious or life-threatening conditions caused by exposure to lethal or permanently disabling toxic substances, when human efficacy studies are not ethical and field trials are not feasible, FDA may grant marketing approval based on adequate and well-controlled animal efficacy studies when the results of those studies establish that the drug is reasonably likely to produce clinical benefit in humans” [215].

59. “Marketing approval for new radiation countermeasures for which human efficacy studies are not feasible or ethical would be based on animal efficacy studies and phase I safety data in healthy volunteers. Under this animal rule, human efficacy trials of radiation countermeasures could be bypassed through a shortened but stringent FDA approval pathway that demonstrates drug efficacy in two animal species predictive of human responsiveness, a sound understanding of the mechanisms of action, and safety in humans” [232].

60. “The mode of action is the way that the mechanism ultimately affects the entity”. Приведен пример из водной экологии: связывание ионов меди в жабрах нарушает ионную регуляцию, приводя к снижению концентрации натрия и хлорида в крови, что влияет на ее вязкость (механизм), а это, в свою очередь, вызывает остановку (arrest) сердца рыбы (mode of action) [239].

61. Вездесущность критериев причинности Хилла для доказательности как в медико-биологических дисциплинах, так и в самых разных эпидемиологиях (классической, полевой, молекулярной, судебной, поведения, психиатрической, социальной, и пр.; все такие дисциплины имеются), в тератологии, нейропсихиатрии, юриспруденции, экономике и др., запланировано рассмотреть в сообщении 4. Здесь же мы видим, что критерии Хилла дотянулись в областях экологии и токсикологии даже до исследований на животных. Так сказать, “общечеловеческие ценности”. Это, как уже указывалось в части 1 настоящего сообщения [9], связано с тем, что индуктивно-дедуктивные правила установления причинных зависимостей едины для человеческого разума и являются следствием законов логики, уходя корнями в построения философов прошлых столетий, преимущественно Д. Юма и Дж. Милля [2, 3].

62. Самым, по-видимому, ярким примером, чем заканчивается отсутствие испытания на животных при внедрении препарата в практику, стало массовое отравление диэтиленгликолем в 1937 г. в США [192, 242244]. Это был первый описанный случай токсичности указанного соединения для человека [242]. Дети и взрослые отравились не потому, что “пили антифриз” (куда входит похожее соединение), а потому, что принимали сульфаниламидный препарат-сироп “с малиновым вкусом” [243], под названием “Elixir Sulfanilamide”, растворителем в котором был 72%-ный диэтиленгликоль (в воде сульфаниламиды нерастворимы, а фирме хотелось сделать сироп) [192, 242244]. В то время в США не было закона, запрещающего маркетинг непроверенных препаратов [244], поэтому “эликсир” прошел только органолептическую проверку [192], без испытаний на животных, и был запущен в продажу [192, 242244]. Препарат получили 353 пациента, из которых умерло от почечной недостаточности 105 (34 ребенка и 71 взрослый) [242]. Химик фирмы, додумавшийся взять растворителем 72%-ный (!) диэтиленгликоль, покончил с собой [244]. В результате FDA приняла в 1938 г. закон об обязательном тестировании препаратов на животных [242, 243]. Заметим, что, в отличие от рассмотренного выше талидомида 1950-х гг., для которого опыты на животных не показали тератогенности, для “Elixir Sulfanilamide” подобных опытов вовсе не было. И это притом, что, как сказано, еще в начале 19 в. F. Magendie начал использовать тестирование препаратов на животных [57].

63. “Resorting to animal experimentation can reduce some of these problems but introduces new ones, because inference from results in animals to effects in humans is far from trivial” [249].

64. “Courts are recognizing that the effort to apply laboratory animal findings to man is not an extrapolation-even though it is commonly referred to as such. Rather it is a generalization, primarily a subjective process, in which a number of undefended assumptions are implicitly invoked” [195].

65. Однако этот аналитический обзор [250] по 121 исследованию экстраполяции эффектов медицинских препаратов, вмешательств и просто “событий” (event) с животных на человека, несмотря на неопределенные выводы, реально дает иную картину. Наша оцифровка (GetData Graph Digitizer, ver. 2.26.0.20) и расчеты данных с диаграммы и box-plots работы [250] (figures 2, 4, 7) показывают следующее. Успешная экстраполяция (на 50–100%) соответствует 67% выборки (75–100% – 27%); по медианным величинам исследования в области вмешательств и просто исследования оказались экстраполяционно адекватными в 64 и 79% случаев соответственно. Наконец, для конкретных видов медианы успешности экстраполяции были равны: 82% – мышь, 73% – кролик, 67% – крыса, 64% – приматы, 54% – собака и 33% – морская свинка. Для свиньи в [250] имелось только одно исследование, потому успешность экстраполяции составила 100%.

66. M.W. Susser в работе 1986 г. [18] приводит пример искусственности дизайна экспериментов на животных, который может не воспроизводиться в обсервационных исследованиях на людях. В 1966 г. было обнаружено, что у крыс острая недостаточность белка на ранних стадиях развития приводит к истощению клеток головного мозга. Данный факт привел ко многим эпидемиологическим исследованиям детей по проверке влияние раннего недоедания на умственное развитие. Но такие работы не могли и не проверяли последствия острой пищевой недостаточности; вместо этого они оценивали эффекты постоянного и хронического недоедания. Таким образом, пока не были изучены эффекты на развитие детей острого пренатального голодания во время голода, адекватных подтверждений опытам на крысах получить было нельзя.

67. “Replacing a test on a living organism with a cellular, chemicoanalytical, or computational approach obviously is reductionistic” [255].

68. “In vitro studies that test mechanistic pathways and demonstrate the biological role of an agent in disease progression may result in knowledge that can be used to predict potential human health outcomes in a much more time-efficient manner than human studies, particularly for adverse outcomes with a long latency period” [113].

69. “Risk assessments would eventually be conducted using mathematical models of toxicity pathways (TP models) to estimate exposures that will not cause biologically significant perturbations in these pathways” [258].

70. “Toxicity pathways models are unlikely to contribute quantitatively to risk assessments for several reasons, including that the statistical variability inherent in such complex models severely limits their usefulness in estimating small changes in response, and that such models will likely continue to involve empirical modeling of dose responses” [258].

71. Тесты: на наличие вируса Эймса, мышиной лимфомы, на микроядра или аберрации хромосом [260, 262], на образование аддуктов ДНК [261].

72. “Analogy: in some circumstances, it would be fair to judge by analogy. With the effects of thalidomide and rubella before us, we would surely be ready to accept slighter but similar evidence with another drug or another viral disease in pregnancy” [1].

73. Позже оказалось, что W.G. McBride сфальсифицировал опыты на животных с новым препаратом от тошноты [263]. На наш взгляд, он мог руководствоваться здесь и добрыми побуждениями, будучи напуганным талидомидом, хотя, конечно, подобные методы непростительны даже в рамках “предупредительного принципа”.

74. “…when one of a class of causal agents is known to have produced an effect, the standards for evidence that another agent of that class produces a similar effect can be reduced” [64].

75. “Analogy can be helpful, although the help seems limited since anybody with a little creativity can probably dream up an analogy!” [130].

76. “Analogy, then, becomes one way to invent a hypothesis, although it is a bit unimaginative. A Popperian alternative to analogy would be: creative inventiveness” [272].

77. Howard Frumkin is Professor Emeritus of Environmental and Occupational Health Sciences at the University of Washington School of Public Health; Professor and Chair of Environmental and Occupational Health at Emory University’s Rollins School of Public Health and Professor of Medicine at Emory Medical School from 1990–2005. см. на https://deohs.washington.edu/faculty/howard-frumkin (address data 28.11.2020).

78. “Whatever insight might be derived from analogy is handicapped by the inventive imagination of scientists who can find analogies everywhere. At best, analogy provides a source of more elaborate hypotheses about the associations under study; absence of such analogies only reflects lack of imagination or experience, not falsity of the hypothesis” [50].

Список литературы

  1. Hill B.A. The environment and disease: association or causation? // Proc. R. Soc. Med. 1965. V. 58. № 5. P. 295–300. https://doi.org/10.1177/0141076814562718

  2. Котеров А.Н. Критерии причинности в медико-биологических дисциплинах: история, сущность и радиационный аспект. Сообщение 1. Постановка проблемы, понятие о причинах и причинности, ложные ассоциации // Радиац. биология. Радиоэкология. 2019. Т. 59. № 1. С. 1–32. [Koterov A.N. Causal criteria in medical and biological disciplines: history, essence and radiation aspect. Report 1. Problem statement, conception of causes and causation, false associations // Radiats. Biol. Radioecol. (‘Radiat ion biology. Radioecology’, Moscow). 2019. V. 59. № 1. P. 1–32. (In Russian. Engl. abstr.)] Koterov A.N. Causal criteria in medical and biological disciplines: history, essence and radiation aspect. Report 1. Problem statement, conception of causes and causation, false associations // Biol. Bull. (Moscow). 2019. V. 46. № 11. P. 1458–1488. https://doi.org/10.1134/S106235901911016510.1134/S1062359019110165https://doi.org/10.1134/S0869803119010065

  3. Котеров А.Н. Критерии причинности в медико-биологических дисциплинах: история, сущность и радиационный аспект. Сообщение 2. Постулаты Генле–Коха и критерии причинности неинфекционных патологий до Хилла // Радиац. биология. Радиоэкология. 2019. Т. 59. № 4. С. 341–375. [Koterov A.N. Causal criteria in medical and biological disciplines: history, essence and radiation aspect. Rep. 2. Henle–Koch postulates and criteria for causality of non-communicable pathologies before Hill // Radiats. Biol. Radioecol. (‘Radiation biology. Radioecology’, Moscow). 2019. V. 59. № 4. P. 341–375. (In Russian. Engl. abstr.)] https://doi.org/10.1134/S0869803119040052

  4. Котеров А.Н., Ушенкова Л.Н., Зубенкова Э.С. и др. Сила связи. Сообщение 1. Градации относительного риска // Мед. радиология и радиац. безопасность. 2019. Т. 64. № 4. С. 5–17. [Koterov A.N., Ushen-kova L.N., Zubenkova E.S. et al. Strength of association. Report 1. Graduation of relative risk // Med. Radiol. Radiat. Bezopasnost (‘Medical Radiology and Radiation Safety’; Moscow). 2019. V. 64. № 4. P. 5–17. (In Russian. Engl. abst.)] https://doi.org/10.12737/article_5d1adb25725023.14868717

  5. Котеров А.Н., Ушенкова Л.Н., Молодцова и др. Сила связи. Сообщение 2. Градации величины корреляции // Мед. радиология и радиац. безопасность. 2019. Т. 64. № 6. С. 12–24. [Koterov A.N., Ushenkova L.N., Molodtsova D.V. et al. Strength of association. Report 2. Graduation of correlation size // Med. Radiol. Radiat. Bezopasnost (‘Medical Radiology and Radiation Safety’; Moscow). 2019. V. 64. № 6. P. 12–24. (In Russian. Engl. abst.)] https://doi.org/10.12737/1024-6177-2019-64-6-12-24

  6. Котеров А.Н., Ушенкова Л.Н., Бирюков А.П. Критерий Хилла “Временная зависимость”. Обратная причинность и ее радиационный аспект // Радиац. биология. Радиоэкология. 2020. Т. 60. № 2. С. 115–152. [Koterov A.N., Ushenkova L.N., Biryukov A.P. Hill’s criteria ‘Temporality’. Reverse causation and its radiation aspect // Radiats. Biol. Radioecol. (‘Radiation biology. Radioecology’, Moscow). 2020. V. 60. № 2. P. 115–152. (In Russian. Engl. abstr.)] Koterov A.N., Ushenkova L.N., Biryukov A.P. Hill”s Temporality criterion: reverse causation and its radiation aspect // Biol. Bull. (Moscow). 2020. Т. 47. № 12. С. 1–33. https://doi.org/10.1134/S106235902012003110.1134/S1062359020120031.https://doi.org/10.31857/S086980312002006X

  7. Котеров А.Н., Ушенкова Л.Н., Бирюков А.П. Критерий Хилла “Биологическое правдоподобие”. Интеграция данных из различных дисциплин в эпидемиологии и радиационной эпидемиологии // Радиац. биология. Радиоэкология. 2020. Т. 60. № 5. С. 453–480. [Koterov A.N., Ushenkova L.N., Biryukov A.P. Hill’s criteria ‘Biological plausibility’. The data integration from different disciplines in Epidemiology and Radiation Epidemiology // Radiats. Biol. Radioecol. (‘Radiation biology. Radioecology’, Moscow). 2020. V. 60. № 5. P. 453–480. (In Russian. Engl. abstr.)]https://doi.org/10.31857/S0869803120050069

  8. Котеров А.Н., Ушенкова Л.Н., Бирюков А.П. Критерий Хилла “Эксперимент”. Контрафактический подход в дисциплинах нерадиационного и радиационного профиля // / Радиац. биология. Радиоэкология. 2020. Т. 60. № 6. С. 565–594. [Koterov A.N., Ushenkova L.N., Biryukov A.P. Hill’s criteria ‘Experiment’. The counterfactual approach in non-radiation and radiation sciences // ‘Radiats. Biol. Radioecol. (‘Radiation biology. Radioecology’, Moscow). 2020. V. 60. № 6. P. 565–594. (In Russian. Engl. abstr.)] https://doi.org/10.31857/S0869803120060193

  9. Котеров А.Н. Критерии причинности в медико-биологических дисциплинах: история, сущность и радиационный аспект. Сообщение 3. Ч. 1: первые пять критериев Хилла: использование и ограничения // Радиац. биология. Радиоэкология. 2021. Т. 61. № 3. С. 301–332. [Koterov A.N. Causal criteria in medical and biological disciplines: history, essence and radiation aspect. Report 3, Part 1: first five Hill’s criteria: use and limitations // Radiats. Biol. Radioecol. (‘Radiation biology. Radioecology’, Moscow). 2021. V. 61. № 3. Р. 301–332. (In Russian. Engl. abstr.)] https://doi.org/10.31857/S0869803121030085.

  10. United States Department of Health, Education and Welfare (USDHEW). Smoking and Health: Report of the Advisory Committee to the Surgeon General of the Public Health Service Publication No. 1103. Washington DC: U.S. Department of Health, Education and Welfare, 1964. 387 p. https://biotech.law.lsu.edu/cases/tobacco/nnbbmq.pdf (Address data 11.10.2020).

  11. Susser M. Judgement and causal inference: criteria in epidemiologic studies // Am. J. Epidemiol. 1977. V. 105. № 1. P. 1–15. Reprint: Am. J. Epidemiol. 1995. V. 141. № 8. P. 701–715.

  12. Strom B.L. Study designs available for pharmacoepidemiology studies // Pharmacoepidemiology / Ed. by B.L. Strom. 3rd Ed. Baffins Lane, Chichester, West Sussex: John Wiley & Sons Ltd, 2000. P. 17–30.

  13. Meek M.E., Palermo C.M., Bachman A.N. et al. Mode of action human relevance (species concordance) framework: Evolution of the Bradford Hill considera-tions and comparative analysis of Weight of Evidence // J. Appl. Toxicol. 2014. V. 34. № 6. P. 595–606. https://doi.org/10.1002/jat.2984

  14. Carbone M., Klein G., Gruber J., Wong M. Modern criteria to establish human cancer etiology // Cancer Res. 2004. V. 64. № 15. P. 5518–5524. https://doi.org/10.1158/0008-5472.CAN-04-0255

  15. Weed D.L., Hursting S.D. Biologic plausibility in causal inference: current method and practice // Am. J. Epidemiol. 1998. V. 147. № 5. P. 415–425. https://doi.org/10.1093/oxfordjournals.aje.a009466

  16. Weed D.L. Precaution, prevention, and public health ethics // J. Med. Philosophy. 2004. V. 29. № 3. P. 313–332. https://doi.org/10.1080/03605310490500527

  17. Weed D.L. Epidemiologic evidence and causal infe-rence // Hematol. Oncol. Clin. North Am. 2000. V. 14. № 4. P. 797–807. https://doi.org/10.1016/S0889-8588(05)70312-9

  18. Susser M. Rules of inference in epidemiology // Regul. Toxicol. Pharmacol. 1986. V. 6. № 2. P. 116–128. https://doi.org/10.1016/0273-2300(86)90029-2

  19. Susser M. The logic of Sir Karl Popper and the practice of epidemiology // Am. J. Epidemiol. 1986. V. 124. № 5. P. 711–718. https://doi.org/10.1093/oxfordjournals.aje.a114446

  20. Bhopal R.S. Concepts of Epidemiology: Integrated the ideas, theories, principles and methods of epidemiology. 3rd Ed. Oxford: University Press, 2016. 442 p.

  21. Worrall J. What evidence in Evidence-Based Medicine? // Philosophy of Science. 2002. V. 69. № S3. P. S316–S330. https://doi.org/10.1086/341855

  22. Worrall J. Why randomize? Evidence and ethics in cli-nical trials // Contemporary Perspectives in Philo-sophy and Methodology of Science / Eds W.J. Gonzalez, J. Alcolea. A Coruna: Netbiblo, 2006. P. 65–82.

  23. Worrall J. Causality in medicine: getting back to the Hill top // Prev. Med. 2011. V. 53. № 4–5. P. 235–238. https://doi.org/10.1016/j.ypmed.2011.08.009

  24. Власов В.В. Эпидемиология: Учебное пособие. 2-е изд., испр. М.: ГЭОТАР-Медиа, 2006. 464 с. [Vlasov V.V. Epidemiology. 2nd ed., rev. M.: GEOTAR-Media, 2006. 464 p. (In Russian)]

  25. Hrobjartsson B., Gotzsche P.C., Gluud C. The controlled clinical trial turns 100 years: Fibiger”s trial of serum treatment of diphtheria // Beit. Med. J. 1998. V. 317. № 7167. P. 1243–1245. https://doi.org/10.1136/bmj.317.7167.1243

  26. Meldrum M.L. A brief history of the randomized controlled trial. From oranges and lemons to the gold standard // Hematol. Oncol. Clin. North. Am. 2000. V. 14. № 4. P. 745–760, vii. https://doi.org/10.1016/s0889-8588(05)70309-9

  27. Phillips A.N., Davey Smith G. Confounding in epidemiological studies // Br. Med. J. 1993. V. 306. № 870. P. 142. https://doi.org/10.1136/bmj.306.6870.142-b

  28. DOE 1995. U.S. Department of Energy. Closing the Circle on the Splitting of the Atom // The Environmental Legacy of Nuclear Weapons Production in the United States and What the Department of Energy is Doing About It. U.S. Department of Energy, Office of Environmental Management, January 1995. DOE/EM-0266. 106 p. https://www.energy.gov/sites/prod/files/2014/03/f8/Closing_the_Circle_Report.pdf (address data 11.10.2020).

  29. Frame P., Kolb W. Living with Radiation: the First Hundred Years. 2nd Ed. Maryland: Syntec, Inc. 2000; and // Gilbert U-238 Atomic Energy Lab (1950–1951). Oak Ridge Associated Universities, 1999. https://www.orau.org/ptp/collection/atomictoys/atomictoys.htm (address data 11.10.2020).

  30. BEIR VII Report 2006. Phase 2. Health Risks from Exposure to Low Levels of Ionizing Radiation. Committee to Assess Health Risks from Exposure to Low Levels of Ionizing Radiation, – National Research Council. http://www.nap.edu/catalog/11340.html (address data 11.10.2020).

  31. Koterov A.N., Biryukov A.P. The possibility of determining of anomalies and pathologies in the offspring of liquidators of Chernobyl accident by the non-radiation factors // Int. J. Low Radiat. (Paris). 2011. V. 8. № 4. P. 256–312. https://doi.org/10.1504/IJLR.2011.046529

  32. Котеров А.Н., Бирюков А.П. Дети ликвидаторов аварии на Чернобыльской атомной электростанции. 1. Оценка принципиальной возможности зарегистрировать радиационные эффекты // Мед. радиология и радиац. безопасность. 2012. Т. 57. № 1. С. 58–79. [Koterov A.N., Biryukov A.P. The offspring of liquidators of Chernobyl Atomic Power Station accident. 1. The estimation of the basic opportunity to register of radiation effect // Med. Radiol. Radiat. Bezopasnost (‘Medical Radiology and Radiation Safety’; Moscow). 2012. V. 57. № 1. P. 58–79. (In Russian. Engl. abstr.)]

  33. Котеров А.Н., Бирюков А.П. Дети участников ликвидации последствий аварии на Чернобыльской атомной электростанции. 2. Частота отклонений и патологий и их связь с нерадиационными факторами // Мед. радиология и радиац. безопасность. 2012. Т. 57. № 2. С. 51–77. [Koterov A.N., Biryukov A.P. The offspring of liquidators of Chernobyl Atomic Po-wer Station accident. 2. The frequency of anomalies and pathologies and its connection to non-radiation factors // Med. Radiol. Radiat. Bezopasnost (‘Medical Radiology and Radiation Safety’; Moscow). 2012. V. 57. № 2. P. 51–77. (In Russian. Engl. abstr.)]

  34. Котеров А.Н. Малые дозы радиации: факты и мифы. Основные понятия и нестабильность генома. М.: Изд-во “ФМБЦ им. А.И. Бурназяна ФМБА России”, 2010. 283 с. [Koterov A.N. Low Dose of Radiation: the Facts and Myths. The Basic Concepts and Genomic Instability. Мoscow: Publ. by “FMBC by A.I. Burnazjan FMBA of Russia”, 2010. 283 p. (In Russian. Eng. abstr.)]

  35. Koterov A.N. Genomic instability at exposure of low dose radiation with low LET. Mythical mechanism of unproved carcinogenic effects // Int. J. Low Radiat. 2005. V. 1. № 4. P. 376–451. https://doi.org/10.1504/IJLR.2005.007913

  36. UNSCEAR 2001. Report to the General Assembly, with Scientific Annexes. Annex Hereditary effects of radiation. New York: United Nations, 2001, P. 5–160.

  37. COMARE 2002. 7th Report. Parents occupationally exposed to radiation prior to the conception of their children. A review of the evidence concerning the incidence of cancer in their children / Ed. Crown. Produced by the National Radiological Protection Board, 2002. 86 p.

  38. Захарова М.Л., Безлепкин В.Г., Кириллова Е.Н. и др. Генетический материал радиобиологического репозитория тканей человека и некоторые результаты его исследования // Мед. радиол. и радиац. безопасность. 2010. Т. 55. № 5. С. 5–13. [Zakharova M.L., Bezlepkin V.G., Kirillova E.N. et al. Radiobiology human tissue repository genetic material and the certain results of its study // Med. Radiol. Radiat. Bezopasnost (‘Medical Radiology and Radiation Safety’; Moscow). 2010 V. 55. № 3. P. 27–45. (In Russian. Engl. abstr.)]

  39. Безлепкин В.Г., Кириллова Е.Н., Захарова М.Л. и др. Отдаленные и трансгенерационные молекулярно-генетические эффекты пролонгированного воздействия ионизирующей радиации у работников предприятия ядерной промышленности // Радиац. биология. Радиоэкология. 2011. Т. 51. № 1. С. 20–32. [Bezlepkin V.G., Kirillova E.N., Zakharova M.L. et al. Delayed and transgenerational molecular and genetic effects of prolonged influence of ionizing radiation in nuclear plant workers // Radiats. Biol. Radioecol. (“Radiation biology. Radioecology”, Moscow). 2011. V. 51. № 1. P. 20–32. (In Russian. Engl. abstr. PubMed)]

  40. Kuzmina N.S., Myazin A.E., Lapteva N.Sh., Rubanovich A.V. The study of hypermethylation in irradiated parents and their children blood leukocytes // Cent. Eur. J. Biol. 2014. V. 9. № 10. P. 941–950.

  41. Kuzmina N.S., Lapteva N.Sh., Rubanovich A.V. Hypermethylation of gene promoters in peripheral blood leukocytes in humans long term after radiation exposure // Environ. Res. 2016. V. 146. P. 10–17. https://doi.org/10.1016/j.envres.2015.12.008

  42. Kuzmina N.S., Lapteva N.Sh., Rusinova G.G. et al. Gene hypermethylation in blood leukocytes in humans long term after radiation exposure. Validation set // Environ. Pollut. 2018. V. 234. P. 935–942. https://doi.org/10.1016/j.envpol.2017.12.039

  43. Gotzsche P.C. Deadly Medicines and Organised Crime. How Big Pharma has Corrupted Healthcare. London: Radcliffe Publishing, 2013. 310 p.

  44. Echt D.S., Liebson P.R., Mitchell L.B. et al. Mortality and morbidity in patients receiving encainide, flecaini-de, or placebo. The Cardiac Arrhythmia Suppression Trial // N. Engl. J. Med. 1991. V. 324. № 12. P. 781–788. https://doi.org/10.1056/NEJM199103213241201

  45. Pocock S.J. When to stop a clinical trial // Br. Med. J. 1992. V. 305. № 6847. P. 235–240. https://doi.org/10.1136/bmj.305.6847.235

  46. Moore T. Deadly medicine: Why tens of thousands of heart patients died in America’s worst drug disaster. New York: Simon & Schuster, 1995. 352 p.

  47. Handbook of Epidemiology / Eds W. Ahrens, I. Pigeot. 2nd ed. New York, Heidelberg, Dordrecht, London: Springer, 2014. 2498 p.

  48. Davey Smith G. Data dredging, bias, or confounding. They can all get you into the BMJ and the Friday papers // Br. Med. J. 2002. V. 325. № 7378. P. 1437–1438. https://doi.org/10.1136/bmj.325.7378.1437

  49. Gage S.H., Munafo M.R., Davey Smith G. Causal inference in developmental origins of health and disease (DOHaD) research // Annu. Rev. Psychol. 2016. V. 67. P. 567–585. https://doi.org/10.1146/annurev-psych-122414-033352

  50. Rothman K.J., Greenland S. Causation and causal infe-rence in epidemiology // Am. J. Public Health. 2005. V. 95. Suppl 1. P. S144–S150. https://doi.org/10.2105/AJPH.2004.059204

  51. Rothman K.J., Greenland S., Poole C., Lash T.L. Causation and causal inferene // Modern Epidemiology / Eds K.J. Rothman, S. Greenland, T.L. Lash. 3rd ed. Philadelphia (PA): Wolters Kluwer, 2008. P. 5–31.

  52. Goodman K.J., Phillips C.V. Hill”s criteria of causation // Encyclopedia of Statistics in Behavioral Science. V. 2 / Eds B.S. Everitt, D.C. Howell. Chichester: John Wiley & Sons, Ltd, 2005. P. 818–820.

  53. Goodman S.N., Samet J.M. Cause and Cancer Epidemiology // Schottenfeld and Fraumeni Cancer Epidemiology and Prevention / Eds M. J. Thun et al. 4th ed. New York: Oxford University Press. Printed by Sheridan Books, Inc., USA, 2018. P. 97–104.

  54. Gori G.B. Epidemiologic evidence in public and legal policy: reality or metaphor? Critical Legal Issues. Washington: Washington Legal Foundation. Working Paper Series No. 124, 2004. 33 p.

  55. Swaen G., van Amelsvoort L. A weight of evidence approach to causal inference // J. Clin. Epidemiol. 2009. V. 62. № 3. P. 270–277. https://doi.org/10.1016/j.jclinepi.2008.06.013

  56. Hippocrates. Precepts // Works: Translated by W.H.S. Jones. London: Wm. Heinemann, 1923, V. I. P. 313.

  57. Bull J.P. The historical development of clinical therapeutic trials // J. Chronic Dis. 1959. V. 10. № 3. P. 218–248. https://doi.org/10.1016/0021-9681(59)90004-9

  58. Asher R. Apriority: thoughts on treatment // Lancet. 1961. V. 2. № 7217. P. 1403–1404. https://doi.org/10.1016/s0140-6736(61)91217-x

  59. Mathews J.N.S. Introduction to Randomized Controlled Clinical Trials. Texts in Statistical Science. 2nd ed. Charman & Hall/CRC, 2006. 272 p.

  60. Terris M. The Society for Epidemiologic Research and the future of epidemiology // J. Publ. Health Policy. 1993. V. 14. № 2. P. 137–148. https://doi.org/10.2307/3342960

  61. Rothman K.J. Epidemiology. An Introduction. 2nd ed. Oxford etc.: Oxford University Press Inc., 2012. 268 p.

  62. Merrill R.M. Introduction to Epidemiology. 7th ed. Burlington: Jones & Bartlett Learning, 2017. 339 p.

  63. USEPA 2006. A Framework for Assessing Health Risks of Environmental Exposures to Children. EPA/600/R-05/093F. Washington, DC: National Center for Environmental Assessment Office of Research and Development U.S. Environmental Protection Agency, 2006. 145 p.

  64. Susser M. What is a cause and how do we know one? A grammar for pragmatic epidemiology // Am. J. Epidemiol. 1991. V. 133. № 7. P. 635–648. https://doi.org/10.1093/oxfordjournals.aje.a115939

  65. Szklo M., Nieto F.J. Epidemiology. Beyond the Basics. 4th ed. Burlington: Jones & Bartlett Learning, 2019. 577 p.

  66. The Health Consequences of Smoking: A Report of the Surgeon General Rockville, MD: Office of the Surgeon General, US Public Health Service, 2004. 910 p.

  67. Gordis L. Epidemiology. 5th Ed. Philadelphia: Saunders, Elsevier Inc., 2014. 392 p.

  68. Aschengrau A., Seage G.R., III. Epidemiology in Public Health. 3rd ed. Burlington: Jones & Bartlett Learning, LLC, 2014. 596 p.

  69. Rothman K.J., Greenland S. Causation and causal inference Modern Epidemiology / Ed. K.J. Rothman. 2nd ed. Philadelphia: Lippincott Williams & Wilkins, 1998. P. 7–28.

  70. Hofler M. The Bradford Hill considerations on causality: a counterfactual perspective // Emerg. Them. Epidemiol. 2005. V. 2. №. 11. 9 p. https://doi.org/10.1186/1742-7622-2-11

  71. Thygesen L.C., Andersen G.S., Andersen H. A philosophical analysis of the Hill criteria // J. Epidemiol. Commun. Health. 2005. V. 59. № 6. P. 512–516. https://doi.org/10.1136/jech.2004.027524

  72. Webb P., Bain C. Essential Epidemiology. An Introduction for Students and Health Professionals. 2nd ed. Cambridge etc.: Cambridge University Press, 2011. 445 p.

  73. Bonita R., Beaglehole R., Kjellstrom T. Basic epidemiology. 2nd ed. World Health Organization, 2006. 212 p.

  74. Katz D.L., Elmore J.G., Wild D.M.G., Lucan S.C. Jekel”s Epidemiology, Biostatistics, Preventive Medicine, and Public Health. 4th ed. Philadelphia: Elsevier Inc., 2014. 453 p.

  75. Greenhalgh T. The Basics of Evidence Based Medicine. 2nd ed. London, UK: BMJ Books, 2001. 222 p.

  76. Weed D.L., Gorelic L.S. The practice of causal inference in cancer epidemiology // Cancer Epidemiol. Biomark. Prev. 1996. V. 5. № 4. P. 303–311.

  77. Encyclopedia of Statistics in Behavioral Science. V. 1 / Eds B.S. Everit, D.C. Howell. Chichester: John Wiley & Sons, Ltd, 2005. 2990 p.

  78. Becker R.A., Dellarco V., Seed J. et al. Quantitative weight of evidence to assess confidence in potential modes of action // Regul. Toxicol. Pharmacol. 2017. V. 86. P. 205–220. https://doi.org/10.1016/j.yrtph.2017.02.017

  79. Sonich-Mullin C., Fielder R., Wiltse J. et al. Internatio-nal Programme on Chemical Safety. IPCS conceptual framework for evaluating a mode of action for chemical carcinogenesis // Regul. Toxicol. Pharmacol. 2001. V. 34. № 2. P. 146–152. https://doi.org/10.1006/rtph.2001.1493

  80. Ulanova M., Gekalyuk A., Agranovich I. et al. Stress-induced stroke and stomach cancer: sex differences in oxygen saturation // Adv. Exp. Med. Biol. 2016. V. 923. P. 135–140. https://doi.org/10.1007/978-3-319-38810-6_18

  81. Воробцова И.Е. Генетические и соматические эффекты ионизирующей радиации у людей и животных (сравнительный аспект) // Радиац. биология. Радиоэкология. 2002. Т. 42. № 6. С. 639–643. [Vorobtsova I.E. Genetic and somatic effects of ionizing radiation in humans and animals (comparative aspect) // Radiats. Biol. Radioecol. (‘Radiation biology. Radioecology’, Moscow). 2002. V. 42. № 6. P. 639–643. (In Russian. Engl. abstr. PubMed)]

  82. Evans A.S. Causation and disease: The Henle-Koch postulates revisited // Yale J. Biol. Med. 1976. V. 49. № 2. P. 175–195.

  83. Brown N.A., Fabro S. The value of animal teratogenicity testing for predicting human risk // Clin. Obstet. Gynecol. 1983. V. 26. № 2. P. 467–477. https://doi.org/10.1016/0890-6238(93)90025-3

  84. Popper K.R. The Logic of Scientific Discovery. London and New York: Routledge Classics, 2002. 513 p.

  85. USEPA 2005. Guidelines for Carcinogen Risk Assessment. EPA/630/P-03/001B. Washington, DC: Risk Assessment Forum. National Center for Environmental Assessment Office of Research and Development U.S. Environmental Protection Agency, 2005. 166 p.

  86. Fox G.A. Practical causal inference for ecoepidemiologists // J. Toxicol. Environ. Health. 1991. V. 33. № 4. P. 359–273. https://doi.org/10.1080/15287399109531535

  87. Сидоренко Е.А. Контрафактические высказывания // Новая философская энциклопедия. В 4 т. Т. 2. М.: Мысль, 2010. С. 297–298. [Sidorenko E.A. Counterfactual statements // New Philosophical Encyclopedia. In 4 v. V. 2. Moscow, Mysl, 2010. P. 297–298. (In Russian)]

  88. Bruce N., Pope D., Stanistreet D. Quantitative Methods for Health Research. A Practical Interactive Guide to Epidemiology and Statistics. 2nd Ed. Oxford: John Wiley & Sons, 2019. 545 p.

  89. Bollet A.J. On seeking the cause of disease // Clin. Res. 1964. V. 12. P. 305–310.

  90. Merrill R.M., Frankenfeld C.L., Freeborne N., Mink M. Behavioral Epidemiology. Principles and Applications. Burlington: Jones & Bartlett Learning, LLC, 2016. 298 p.

  91. Egilman D., Kim J., Biklen M. Proving causation: the use and abuse of medical and scientific evidence inside the courtroom – an epidemiologist’s critique of the judicial interpretation of the Daubert ruling // Food Drug. Law J. 2003. V. 58. № 2. P. 223–250.

  92. Котеров А.Н., Жаркова Г.П., Бирюков А.П. Тандем радиационной эпидемиологии и радиобиологии для практики радиационной защиты // Мед. радиол. и радиац. безопасность. 2010. Т. 55. № 4. С. 55–84. [Koterov A.N., Zharkova G.P., Biryukov A.P. Tandem of radiation epidemiology and radiobiology for practice and radiation protection // Med. Radiol. Radiat. Bezopasnost (‘Medical Radiology and Radiation Safety’; Moscow). 2010. V. 55. № 5. P. 48–73. (In English.) (In Russian. Eng. abstr.)]

  93. Schlesselman J.J. “Proof” of cause and effect in epidemiologic studies: criteria for judgment // Prev. Med. 1987. V. 16. № 2. P. 195–210. https://doi.org/10.1016/0091-7435(87)90083-1

  94. Shakir S.A., Layton D. Causal association in pharmacovigilance and pharmacoepidemiology: thoughts on the application of the Austin Bradford-Hill criteria // Drug Saf. 2002. V. 25. № 6. P. 467–471. https://doi.org/10.2165/00002018-200225060-00012

  95. UNSCEAR 2006. Report to the General Assembly, with Scientific Annexes. Annex A. Epidemiological studies of radiation and cancer. New York: United Nations, 2008. P. 17–322.

  96. Smoking and reproductive life. The impact of smoking on sexual, reproductive and child health / Eds D. Carter D., N. Nathanson, C. Seddon et al. British Medical Association. Board of Science and Education & Tobacco Control Resource Centre, 2004. https://www.rauchfrei-info.de/fileadmin/main/data/Dokumente/Smoking_ReproductiveLife.pdf (address data 11.10.2020).

  97. Hofmann B., Holm S., Iversen J.-G. Philosophy of science // Research methodology in the medical and biological sciences / Eds P. Laake, H.B. Benestad, B.R. Olsen. London etc.: Academic Press, Elsevier, 2007. P. 1–32.

  98. Gay J. Clinical Epidemiology & Evidence-Based Me-dicine Glossary: Terminology Specific to Epidemiology. 2005. http://people.vetmed.wsu.edu/jmgay/courses/GlossEpiTerminology.htm (address data 11.10.2020).

  99. A Dictionary of Epidemiology / Ed. M. Porta. 6th ed. New York: Oxford University Press, 2014. 344 p.

  100. A Dictionary of Epidemiology / Ed. J.M. Last. Oxford: Oxford University Press, 2001.

  101. Doll R. Weak associations in epidemiology: importance, detection, and interpretation // J. Epidemiol. 1996. V. 6. № 4. Suppl. P. S11–S20. https://doi.org/10.2188/jea.6.4sup_11

  102. Murray C.J.L., Ezzati M., Lopez A.D. et al. Comparative quantification of health risks: conceptual framework and methodological issues // Health Metrics. 2003. V. 1. Art. 1. 38 p. https://doi.org/10.1186/1478-7954-1-1

  103. Guzelian P.S., Victoroff M.S., Halmes N.C. et al. Evidence-based toxicology: a comprehensive framework for causation // Hum. Exp. Toxicol. 2005. V. 24. № 4. P. 161–201. https://doi.org/10.1191/0960327105ht517oa

  104. Epidemiology: Principles and Practical Guidelines / Eds J. Van den Broeck, J.R. Brestoff. Dordrecht: Springer, 2013. 621 p.

  105. Glynn J.R. A question of attribution // Lancet. 1993. V. 342. № 8870. P. 530–532. https://doi.org/10.1016/0140-6736(93)91651-2

  106. Bae S., Kim H.C., Ye B. et al. Causal inference in environmental epidemiology // Environ. Health Toxicol. 2017. V. 32. Art. e2017015. https://doi.org/10.5620/eht.e2017015

  107. Lower G.M., Kanarek M.S. Conceptual/operational criteria of causality: relevance to systematic epidemiologic theory // Med. Hypotheses. 1983. V. 11. P. 217–244. https://doi.org/10.1016/0306-9877(83)90064-6

  108. Collier Z.A., Gust K.A., Gonzalez-Morales B. et al. A weight of evidence assessment approach for adverse outcome pathways // Regul. Toxicol. Pharmacol. 2016. V. 75. P. 46–57. https://doi.org/10.1016/j.yrtph.2015.12.014

  109. Семеновых Г.К., Новиков С.М., Семеновых Л.Н. Анализ случаев заболеваний, обусловленных действием факторов среды обитания. Характеристика опасности для здоровья: Учеб. пособие. Вып. 4. М.: Изд-во Первого МГМУ им. И.М. Сеченова, 2011. 88 с. [Semenovykh G.K., Novikov S.M., Semenovykh L.N. Analysis of cases caused by the action of environmental factors. Characteristics of health hazards: Textbook. allowance. Issue 4. M.: Publishing House Sechenov First Moscow State Medical University, 2011. 88 p. (In Russian)]

  110. Maldonado G., Greenland S. Estimating causal effects // Int. J. Epidemiol. 2002. V. 31. № 2. P. 422–429.

  111. Friis R.H., Sellers T.A. Epidemiology for Public Health Practice. 5th Ed. Burlington: Jones & Bartlett Lear-ning. 2014. 804 p.

  112. Phillips C.V., Goodman K.J. Hill’s considerations for causal inference // Encyclopedia of Epidemiology. Two Volume Set. / Ed. S. Boslaugh. Saint Louis University, SAGE Publications, Inc, 2008. P. 494–495.

  113. Fedak K.M., Bernal A., Capshaw Z.A., Gross S. Applying the Bradford Hill criteria in the 21st century: how data integration has changed causal inference in molecular epidemiology // Emerg. Themes Epidemiol. 2015. V. 12. Article 14. https://doi.org/10.1186/s12982-015-0037-4

  114. ICRP Publication 90. Biological effects after prenatal irradiation (embryo and fetus) // Ann. ICRP. 2003. V. 33. № 1–2. P. 5–206. https://doi.org/10.1016/S0146-6453(03)00021-6-ICRP_90.pdf

  115. UNSCEAR 2012. Report to the General Assembly, with Scientific Annexes. Annex A. Attributing health effects to ionizing radiation exposure and inferring risks. New York: United Nations, 2015. 86 p.

  116. Котеров А.Н., Вайнсон А.А. Биологические и медицинские эффекты излучения с низкой ЛПЭ для различных диапазонов доз // Мед. радиология и радиац. безопасность. 2015. Т. 60. №. 3. С. 5–31. [Koterov A.N., Wainson A.A. Health effects of low Let radiation for various dose ranges // Med. Radiol. Radiat. Bezopasnost (‘Medical Radiology and Radiation Safety’; Moscow). 2015. V. 60. № 3. P. 5–31. (In Russian. Engl. abstr.)]

  117. Atkinson W.D., Law D.V., Bromley K.J., Inskip H.M. Mortality of employees of the United Kingdom Atomic Energy Authority, 1946–97 // Occup. Environ. Med. 2004. V. 61. № 7. P. 577–585.

  118. Bell C.M., Coleman D.A. Models of the healthy worker effect in industrial cohorts // Stat. Med. 1987. V. 6. № 8. P. 901–909. https://doi.org/10.1002/sim.4780060805

  119. Berrington A., Darby S.C., Weiss S.A., Doll R. 100 years of observation on British radiologists: mortality from cancer and other causes 1897–1997 // Br. J. Radiol. 2001. V. 74. № 882. P. 507–519. https://doi.org/10.1259/bjr.74.882.740507

  120. Mohan A.K., Hauptmann M., Linet M.S. et al. Breast cancer mortality among female radiologic technologists in the United States // J. Natl. Cancer Inst. 2002. V. 94. № 12. P. 943–948. https://doi.org/10.1093/jnci/94.12.943

  121. ICRP Publication 118. ICRP Statement on tissue reactions and early and late effects of radiation in normal tissues and organs – threshold doses for tissue reactions in a radiation protection context. Annals of the ICRP / Ed. C.H. Clement. Amsterdam–New York: Elsevier, 2012. 325 p.

  122. Rothman K., Greenland S. Hill”s Criteria for Causality // Encyclopedia of Biostatistics, Online. John Wiley & Sons, Ltd., 2005. 4 p. https://www.rtihs.org/sites/default/files/26902%20Rothman%201998%20The%20encyclopedia%20of%20biostatistics.pdf (дата обращения 11.10.2020).

  123. Cornfield J. Statistical relationships and proof in medicine // Am. Stat. 1954. V. 8. № 5. P. 19–23.

  124. Greenhouse J.B. Commentary: Cornfield, epidemiology and causality // Int. J. Epidemiol. 2009. V. 38. № 5. P. 1199–1201. https://doi.org/10.1093/ije/dyp299

  125. Panchin A.Yu. The Science. Small nonsense with big consequences // Blog. 2009-08-01. https://scinquisitor.livejournal.com/9724.html; “Epigenetics” website. Laboratory of Epigenetics of the Institute of Gerontology, NAMSU. Posted on 16.09.2011. https://www.epigenetics.com.ua/?p=153; “Biomolecule” website. Special project “Clinical Research”. 2018/06.29. https://biomolecula.ru/articles/put-k-tysiacham-aptek-nachinaetsia-s-odnoi-molekuly and many others. https://biomolecula.ru/articles/put-k-tysiacham-aptek-nachinaetsia-s-odnoi-molekuly и мн. дp. (addresses data 20.10.2020).

  126. Hume D. A Treatise of Human Nature. 2nd ed. Oxford: Oxford University Press, 1978.

  127. IARC 1987. International Agency for Research on Cancer. IARC Monographs on the Evaluation of Carcinogenic Risks to Humans, Supplement 7, Overall Evaluations of Carcinogenicity: An Updating of IARC Monographs, Volumes 1 to 42, Lyon, 1987. 449 p.

  128. Stewart A. Basic Statistics and Epidemiology A Practical Guide. 4th ed. CRC Press, 2016. 212 p.

  129. Alexander L.K., Lopes B., Ricchetti-Masterson K., Yeatts K.B. Causality // Epidemiologic Research and Information Center (ERIC) Notebook. 2nd Ed. UNC Gillings School of Global Public Health, 2015. 5 p. https://sph.unc.edu/files/2015/07/nciph_ERIC15.pdf (address data 17.10.2020).

  130. Frumkin H. (Instructor). Causation in Medicine // Emory University – Rollins School of Public Health. Atlanta, Georgia, 1997. http://www.aoec.org/ceem/methods/emory2.html (address data 17.10.2020).

  131. Biesalski H.K., Aggett P.J., Anton R. et al. 26th Hohenheim Consensus Conference, September 11, 2010 Scientific substantiation of health claims: evidence-based nutrition // Nutrition. 2011. V. 27. № 10. Suppl. S1–S20. https://doi.org/10.1016/j.nut.2011.04.002.

  132. King J. Bradford Hill Criteria for causal inference. Presentation at the 2015 ANZEA Conference // Auckland: Julian King & Associates. https://www.julianking.co.nz/wp-content/uploads/2018/01/150602-BHC-jk5-web.pdf (address data 17.10.2020).

  133. Public Affairs Committee of the Teratology Society. Causation in teratology-related litigation // Birth Defects Res. A Clin. Mol. Teratol. 2005. V. 73. № 6. P. 421–423. https://doi.org/10.1002/bdra.20139

  134. Canadian Task Force on the Periodic Health Exami-nation. The periodic health examination // Can. Med. Assoc. J. 1979. V. 121. № 9. P. 1193–1254.

  135. Howick J. The Philosophy of Evidence-Based Medicine. Chichester: Wiley-Blackwell, 2011. 248 p.

  136. Howick J., Chalmers I., Glasziou P. et al. The 2011 Oxford CEBM Evidence Levels of Evidence (Introductory Document) // Oxford Centre for Evidence-Based Medicine. 2011. 3 p. https://www.cebm.ox.ac.uk/resources/levels-of-evidence/ocebm-levels-of-evidence (address data 18.11.2020).

  137. Андреева Н.С., Реброва О.Ю., Зорин Н.А. и др. Системы оценки достоверности научных доказательств и убедительности рекомендаций: сравнительная характеристика и перспективы унификации // Мед. технологии. Оценка и выбор. 2012. № 4. С. 10–24. [Andreeva N.S., Rebrova O.Y., Zorin N.A. et al. Systems for assessing the reliability of scientific evidence and the soundness of guidelines: comparison and prospects for unification // Medical Technologies. Assessment and Choice (Moscow). 2012. № 4. P. 10–24. (In Russian. Engl. abstr.)]

  138. Fletcher R.H., Fletcher S.W., Wagner E.H. Clinical Epidemiology: The Essentials. 3rd ed. Philadelphia: Lippincott Williams & Wilkins, 1996. 276 p.

  139. Lilienfeld”s Foundations of Epidemiology. 4th ed. Original Ed. A.M. Lilienfeld / Eds D. Schneider, D.E. Lilienfeld. New York: Oxford University Press, 2015. 333 p.

  140. Feinstein A.R. Clinical epidemiology. I. The populational experiments of nature and of man in human illness // Ann. Int. Med. 1968. V. 69. № 4. P. 807–820. https://doi.org/10.7326/0003-4819-69-4-807

  141. Jones D.S., Podolsky S.H. The art of medicine. The history and fate of the gold standard // Lancet. 2015. V. 385. № 9977. P. 1502–1503. https://doi.org/10.1016/S0140-6736(15)60742-5

  142. Feinstein A.R., Horwitz R.I. Double standards, scienti-fic methods, and epidemiologic research // N. Engl. J. Med. 1982. V. 307. № 26. P. 1611–1617. https://doi.org/10.1056/NEJM198212233072604

  143. Mant D. Can randomised trials inform clinical decisions about individual patients? // Lancet. 1999. V. 353. № 9154. P. 743–746. https://doi.org/10.1016/S0140-6736(98)09102-8

  144. Mayer D. Essential Evidence-based Medicine. 2nd ed. Cambridge University Press, 2010. 442 p. https://www.yumpu.com/en/document/read/56834431/ dan-mayer-essential-evidence-based-medicine (address data 18.11.2020).

  145. Worrall J. Evidence: philosophy of science meets me-dicine // J. Eval. Clin. Pract. 2010. V. 16. № 2. P. 356–362. https://doi.org/10.1111/j.1365-2753.2010.01400.x

  146. Opren. Parliament.uk. Hansard 1803–2005. HC. Deb 20 July 1987. Volume 120. cc. 183–188. https://api.parliament.uk/historic-hansard/commons/1987/jul/20/opren (address data 2020/06/21).

  147. MacMahon B., Pugh T.F., Ipsen J. Epidemiologic Methods. Boston: Little, Brown, 1960. 302 p.

  148. Lilienfeld D.E. Definitions of epidemiology // Am. J. Epidemiol. 1978. V. 107. № 2. P. 87–90. https://doi.org/10.1093/oxfordjournals.aje.a112521

  149. Jadad A.R., Enkin M.W. Randomized Controlled Trials. Questions, Answers, and Musings. 2nd ed. Malden, Oxford, Carlton: BMJ Books, 2007. 136 p.

  150. Worrall J. Evidence in medicine // Compass. 2007. V. 2. № 6. P. 981–1022. https://doi.org/10.1111/j.1747-9991.2007.00106.x

  151. Krauss A. Why all randomised controlled trials produce biased results // Ann. Med. 2018. V. 50. № 4. P. 312–322. https://doi.org/10.1080/07853890.2018.1453233

  152. Wartolowska K., Beard D.J., Carr A.J. The use of placebos in controlled trials of surgical interventions: a brief history // J. R. Soc. Med. 2018. V. 111. № 5. P. 177–182. https://doi.org/10.1177/0141076818769833

  153. Hill A.B. Observation and experiment // N. Engl. J. Med. 1953. V. 248. № 24. P. 995–1001. https://doi.org/10.1056/NEJM195306112482401

  154. Doll R. Clinical trials: retrospect and prospect // Stat. Med. 1982. V. 1. № 4. P. 337–344. https://doi.org/10.1002/sim.4780010411

  155. Colebrook D. Report of the work at the North Islington Infant Welfare Centre Light Department. 3 March, FD1/5052. National Archive in Kew, London, 1925.

  156. Bell J.A. Pertussis prophylaxis with two doses of alum-precipitated vaccine // Public Health Rep. 1941. V. 56. № 31. P. 1535–1546. https://doi.org/10.2307/4583816

  157. Teaching Epidemiology. A Guide for Teachers in Epidemiology, Public Health, and Clinical Medicine. 4th ed. / Eds J. Olsen, N. Greene, R. Saracci, D. Tricho-poulos. New York: Oxford University Press, 2015. 555 p.

  158. Sackett D.L. Clinical epidemiology. what, who, and whither // J. Clin. Epidemiol. 2002. V. 55. № 12. P. 1161–1166. https://doi.org/10.1016/s0895-4356(02)00521-8

  159. Feinstein A.R. Clinical epidemiology: The architecture of clinical research. Philadelphia etc.: W. B. Saunders Company, 1985. 812 p.

  160. Saracci R. Epidemiology. A Very Short Introduction. New York: Oxford University Press. Inc., 2010. 171 p.

  161. Holmes L.J. Applied Epidemiologic Principles and Concepts. Clinicians” Guide to Study Design and Conduct. New York: Taylor & Francis, 2018. 316 p.

  162. Taylor I. Epidemiology 1866–1966 // Public Health. 1967. V. 82. № 1. P. 31–37. https://doi.org/10.1016/s0033-3506(67)80063-5

  163. Kincaid H. Causal modelling, mechanism, and probability in epidemiology // Causality in the Sciences / Eds P.M. Illari, F. Russo, J. Williamson New York: Oxford University Press, 2011. 20 p. https://doi.org/10.1093/acprof:oso/9780199574131.003.0004

  164. Lagiou P., Adami H.O., Trichopoulos D. Causality in cancer epidemiology // Eur. J. Epidemiol. 2005. V. 20. № 7. P. 565–574. https://doi.org/10.1007/sl0654-005-7968-y

  165. Buck C. Popper’s philosophy for epidemiologists // Int. J. Epidemiol. 1975. V. 4. № 3. P. 159–168. https://doi.org/10.1093/ije/4.3.159

  166. Coughlin S.S. Causal Inference and Scientific Paradigms in Epidemiology. Bentham E-book. 2010. 70 p. https://doi.org/10.2174/97816080518161100101. https://ebooks.benthamscience.com/book/9781608051816/ (address data 19.11.2020).

  167. Karhausen L.R. The poverty of Popperian epidemiology // Int. J. Epidemiol. 1995. V. 24. № 5. P. 869–874. https://doi.org/10.1093/ije/24.5.869

  168. Susser M. Falsification, verification and causal infe-rence in epidemiology: reconsiderations in the light of sir Karl Popper’s philosophy // Causal Inference / Ed. K.J. Rothman. Chestnut Hill, MS: Epidemiologic Resources, 1988. P. 33–57.

  169. Jacobsen M. Inference in Epidemiology // Causal Inference / Ed. K.J. Rothman. Chestnut Hill, MS: Epidemiologic Resources, 1988. P. 105–117.

  170. Frost W.H. Risk of persons in familial contact with pulmonary tuberculosis // Am. J. Public Health Nations Health. 1933. V. 23. № 5. P. 426–432. https://doi.org/10.2105/ajph.23.5.426

  171. Doll R. Cohort studies: history of the method. I. Prospective cohort studies // Soz. Praventivmed. 2001. V. 46. № 2. P. 75–86. https://doi.org/10.1007/bf01299724

  172. Frost W.H. Snow on Cholera: being a reprint of two papers by John Snow, M.D. together with a biographical memoir by B.W. Richardson and an introduction by Wade Hampton Frost, M.D. The Commonwealth Fund. New York, 1936. P. 15.

  173. Labarthe D.M., Stallones R.A. Epidemiologic inference // Causal Inference / Ed. K.J. Rothman. Chestnut Hill, MS: Epidemiologic Resources, 1988. P. 119–129.

  174. Maclure M. Popperian refutation in epidemiology // Am. J. Epidemiol. 1985. V. 121. № 3. P. 343–350. https://doi.org/10.1093/oxfordjournals.aje.a114005

  175. Parascandola M. Epidemiology: second-rate science? // Public Health Rep. 1998. V. 113. № 4. P. 312–320.

  176. Ahlbom A., Norell S. Introduction to Modern Epidemiology. 2nd Ed. Epidemiology Resources Inc., 1990.

  177. Susser M., Stein Z. Eras in Epidemiology: The Evolution of Ideas. New York: Oxford University Press, 2009. 368 p.

  178. Общая эпидемиология с основами доказательной медицины: руководство к практическим занятиям: Учеб. Пособие / Под. ред. В. И. Покровского, Н.И. Брико. 2-е изд. М.: ГЭОТАР-Медиа, 2012. 496 с. [Base Epidemiology with the Basics of Evidence-Based Medicine: a Guide to Practical Exercises: textbook / Eds V.I. Pokrovsky, N.I. Brico. 2nd ed. Moscow: GEOTAR-Media. 2012. 496 p. (In Russian)]

  179. Field Epidemiology / Ed. M.B. Gregg. 3rd Ed. Oxford University Press, 2008. 572 p.

  180. Toth B. Why the MRC therapeutic trials committee did not introduce controlled clinical trials // J.R. Soc. Med. 2015. V. 108. № 12. P. 499–511. https://doi.org/10.1177/0141076815618891

  181. Causal Inference / Ed. K.J. Rothman. Epidemiology Resources Inc. Mass., USA, 1988. 207 p.

  182. Rothman K.J. Inferring causal connection – habit, faith or logic? // Causal inference / Ed. K.J. Rothman. Epidemiology Resources Inc., Mass., USA, 1988. P. 3–12.

  183. Hill A.B. Reflections on the controlled trial // Ann. Rheum. Dis. 1966. V. 25. № 2. P. 107–113. https://doi.org/10.1136/ard.25.2.107

  184. Vandenbroucke J.P. Observational research, randomised trials, and two views of medical science // PLoS Med. 2008. V. 5. № 3. P. Art. e67. 5 p. https://doi.org/10.1371/journal.pmed.0050067

  185. Collier R. Legumes, lemons and streptomycin: a short history of the clinical trial // CMAJ. 2009. V. 180. № 1. P. 23–24. https://doi.org/10.1503/cmaj.081879

  186. Boice J.D., Jr. Ionizing Radiation // Schottenfeld and Fraumeni Cancer Epidemiology and Prevention / Eds D. Schottenfeld and J. F. Fraumeni. 3rd ed. New York: Oxford University Press, 2006. P. 259–293.

  187. Susser M. Rational science versus a system of logic // Causal Inference / Ed. K.J. Rothman. Chestnut Hill, MS: Epidemiologic Resources, 1988. P. 189–199.

  188. Jacobsen M. Against Popperized Epidemiology // Int. J. Epidemiol. 1976. V. 5. № 1. P. 9–11. https://doi.org/10.1093/ije/5.1.9

  189. Schlesinger G.N. There”s a fascination frantic in philosophical fancies / Causal Inference / Ed. K.J. Rothman. Chestnut Hill, MS: Epidemiologic Resources, 1988. P. 165–172.

  190. Greenland S. Induction versus Popper: substance versus semantics // Int. J. Epidemiol. 1998. V. 27. № 4. P. 543–548. https://doi.org/10.1093/ije/27.4.543

  191. Ibn Sina (c. 1012 CE; c. 402 AH). Kitab al-Qanun fi al-tibb: Translation by A. Tibi, E. Savage-Smith. The James Lind Library. https://www.jameslindlibrary.org/ibn-sina-c-1012-ce-c-402-ah/ (address data 20.11.2020).

  192. Мелихов О.Г. Клинические исследования. 3-е изд. М.: Изд-во Атмосфера, 2013. 200 с. [Melikhov O.G. Clinical Researches. 3rd Ed. Moscow: Atmosphere Publishing House, 2013. 200 p. (In Russian)]

  193. USEPA 2002. A Review of the Reference Dose and Reference Concentration Processes. EPA/630/P-02/002F. Final Report. Washington, DC: Risk Assessment Forum. National Center for Environmental Assessment Office of Research and Development U.S. Environmental Protection Agency, 2002. 192 p.

  194. Framework for the Integration of Human and Animal Data in Chemical Risk Assessment. Technical Report No. 104. European Centre for Ecotoxicology and To-xicology of Chemicals (ECETOC AISBL). Brussels, 2009. 124 p.

  195. Cole P. The epidemiologist as an expert witness // J. Clin. Epidemiol. 1991. V. 44. Suppl. 1. P. 35S–39S. https://doi.org/10.1016/0895-4356(91)90173-7

  196. James R.C., Britt J.K., Halmes N.C., Guzelian P.S. Evidence-based causation in toxicology: a 10-year retrospective // Hum. Exp. Toxicol. 2015. V. 34. № 12. P. 1245–1252. https://doi.org/10.1177/0960327115601767

  197. Franco N.H. Animal experiments in biomedical research: a historical perspective // Animals (Basel). 2013. V. 3. № 1. P. 238–273. https://doi.org/10.3390/ani3010238

  198. Bernard C. An Introduction to the Study of Experimental Medicine: Translated by H.C. Greene. Henry Schuman inc., 1949. 226 p.

  199. Zhang F.F., Michaels D.C., Mathema B. et al. Evolution of epidemiologic methods and concepts in selected textbooks of the 20th century // Soz. Praventivmed. 2004. V. 49. № 2. P. 97–104. https://doi.org/10.1007/s00038-004-3117-8

  200. Greenwood M., Hill A.B., Topley W.W.C., Wilson J. Experimental Epidemiology. Medical Research Council Special Report Series No 209, London: His Majesty’s Stationery Office, 1936. 221 p. https://www.gwern.net/docs/genetics/selection/1936-greenwood-experimentalepidemiology.pdf (address data 23.11.2020).

  201. Parascandola M. Two approaches to etiology: the debate over smoking and lung cancer in the 1950s // Endeavour. 2004. V. 28. № 2. P. 81–86. https://doi.org/10.1016/j.endeavour.2004.02.003

  202. Hinshaw H.C., Feldman W.H. Evaluation of chemotherapeutic agents in clinical trials: a suggested procedure // Am. Rev. Tubercul. 1944. V. 50. P. 202–213.

  203. Vandenbroucke J.P. A short note on the history of the randomized controlled trial // J. Chronic Dis. 1987. V. 40. № 10. P. 985–987. https://doi.org/10.1016/0021-9681(87)90149-4

  204. Attarwala H. TGN1412: from discovery to disaster // J. Young Pharm. 2010. V. 2. № 3. P. 332–336. https://doi.org/10.4103/0975-1483.66810

  205. Panoskaltsis N., McCarthy N.E., Stagg A.J. et al. Immune reconstitution and clinical recovery following anti-CD28 antibody (TGN1412)-induced cytokine storm // Cancer Immunol. Immunother. 2020. V. 8. P. 1–16. https://doi.org/10.1007/s00262-020-02725-2

  206. Sandilands G.P., Wilson M., Huser C. et al. Were monocytes responsible for initiating the cytokine storm in the TGN1412 clinical trial tragedy? // Clin. Exp. Immunol. 2010. V. 162. № 3. P. 516–527. https://doi.org/10.1111/j.1365-2249.2010.04264.x

  207. Wadman M. London’s disastrous drug trial has serious side effects for research // Nature. 2006. V. 40. № 7083. P. 388–389. https://doi.org/10.1038/440388a

  208. Nguyen T.K., Nguyen E.K., Warner A. et al. Failed randomized clinical trials in Radiation Oncology: what can we learn? // Int. J. Radiat. Oncol. Biol. Phys. 2018. V. 101. № 5. P. 1018–1024. https://doi.org/10.1016/j.ijrobp.2018.04.030

  209. National Lung Screening Trial Research Team, Aberle D.R., Adams A.M., Berg C.D. et al. Reduced lung-cancer mortality with low-dose computed tomographic screening // N. Engl. J. Med. 2011. V. 365. № 5. P. 395–409. https://doi.org/10.1056/NEJMoa1102873

  210. Santos I., Cantista P., Vasconcelos C. Balneotherapy in rheumatoid arthritis – a systematic review // Int. J. Biometeorol. 2016. V. 60. № 8. P. 1287–12301. https://doi.org/10.1007/s00484-015-1108-5

  211. Reissfelder C., Timke C., Schmitz-Winnenthal H. et al. A randomized controlled trial to investigate the influence of low dose radiotherapy on immune stimulatory effects in liver metastases of colorectal cancer // BMC Cancer. 2011. V. 11: Art. 419. https://doi.org/10.1186/1471-2407-11-419

  212. Shibamoto Y., Nakamura H. Overview of biological, epidemiological, and clinical evidence of radiation hormesis // Int. J. Mol. Sci. 2018. V. 19. № 8. Art. 2387. 16 p. https://doi.org/10.3390/ijms19082387

  213. Altman D.G. Randomisation. Essential for reducing bias // Brit. Med. J. 1991. V. 302. № 6791. P. 1481–1482. https://doi.org/10.1136/bmj.302.6791.1481

  214. IARC 2012. Radiation. A review of human carcinogens. V. 100 D. IARC monographs on the evaluation of carcinogenic risks to humans. Lyon, France, 2012. 341 p.

  215. FDA 2015. Product Development Under the Animal Rule. Guidance for Industry. U.S. Department of Health and Human Services. Food and Drug Administration. Center for Drug Evaluation and Research (CDER). Center for Biologics Evaluation and Research (CBER). Animal Rule, 2015. 54 p.

  216. Селезнева А.И., Макарова М.Н., Рыбакова А.В. Методы рандомизации животных в эксперименте // Междунар. вестн. ветеринарии. 2014. № 2. С. 84–89. [Selezneva A.I., Makarova M.N., Rybakova A.V. Randomization of experimental animals // Int. Veterinar. Gazette. 2014. № 2. P. 84–89. (In Russian. Engl. abstr.)]

  217. Hirst J.A., Howick J., Aronson J.K. et al. The need for randomization in animal trials: an overview of syste-matic reviews // PLoS One. 2014. V. 9. № 6. Article e98856. https://doi.org/10.1371/journal.pone.0098856

  218. Ioannidis J.P., Haidich A.B., Pappa M. et al. Comparison of evidence of treatment effects in randomized and nonrandomized studies // J. Am. Med. Assoc. 2001. V. 286. № 7. P. 821–30. https://doi.org/10.1001/jama.286.7.821

  219. Odgaard-Jensen J., Vist G.E., Timmer A. et al. Randomisation to protect against selection bias in healthcare trials // Cochrane Database Syst. Rev. 2011. № 4. Article № MR000012. 58 p. https://doi.org/10.1002/14651858.MR000012.pub3

  220. Kunz R., Oxman A.D. The upredictability paradox: review of empirical comparisons of randomised and non-randomised clinical trials // Br. Med. J. 1998. V. 317. № 7167. P. 1185–1190. https://doi.org/10.1136/bmj.317.7167.1185

  221. Schulz K.F., Chalmers I., Altman D.G. et al. “Allocation concealment”: the evolution and adoption of a methodological term // J. R. Soc. Med. 2018. V. 111. № 6. P. 216–224. https://doi.org/10.1177/0141076818776604

  222. Sollmann T. Experimental therapeutics // J. Am. Med. Assoc. 1912. V. 58. № 4. P. 242–244. https://doi.org/10.1001/jama.1912.04260010244004

  223. USEPA 1995. U.S. Environmental Protection Agency. Final Water Quality Guidance for the Great Lakes System Rules and Regulations // Authenticated US Go-vernment Information. Federal Register. 1995. V. 60. №. 56. P. 15366–15425. Supply: https://www.epa.gov/sites/production/files/2015-12/documents/1995_water_quality_guidance_for_great_lakes_sid.pdf (adress data 21.11.2020).

  224. Meek M.E., Boobis A., Cote I. et al. New developments in the evolution and application of the WHO/IPCS framework on mode of action/species concordance analysis // J. Appl. Toxicol. 2014. V. 34. № 1. P. 1–18. https://doi.org/10.1002/jat.2949

  225. Hollingsworth J.G., Lasker E.G. The Case against differential diagnosis: Daubert, medical causation. Testimony, and the scientific method // J. Health Law. 2004. V. 37. № 1. P. 85–111.

  226. Evans J.S., Abrahamson S., Bender M.A. et al. Health effects – models for nuclear power-plant accident consequence analysis. Part I: Introduction, integration, and summary // U.S. Nuclear Regulatory Commission (NRC). NUREG/CR-4214. Rev. 2, TRI-141. 1993. 156 p. https://www.nrc.gov/docs/ML0500/ML050030192.pdf (address data 22.11.2020).

  227. Statkiewicz Sherer M.A., Visconti P.J., Ritenour E.R. Radiation Protection in Medical Radiography. 6th ed. St. Louis, MO: Mosby Elsevier, 2011. 383 p.

  228. Heller C.G. Effects on the germinal epithelium // Radiobiological Factors in Manned Space Flight / Ed. W.H. Langham. NRC Publication 1487. Washington, DC, National Academy of Sciences, National Research Council, 1967. P. 124–133.

  229. Rowley M.J., Leach D.R., Warner G.A., Heller C.G. Effect of graded doses of ionizing radiation on the human testis // Radiat. Res. 1974. V. 59. № 3. P. 665–678. https://doi.org/10.2307/3574084

  230. Clifton D.K., Bremner W.J. The effect of testicular X-irradiation on spermatogenesis in man. A comparison with the mouse // J. Androl. 1983. V. 4. № 6. P. 387–392. https://doi.org/10.1002/j.1939-4640.1983.tb00765.x

  231. Advisory Committee on Human Radiation Experiments (ACHRE) USA. Final Report. Washington: U.S. Government Printing Office, 1995. 929 p. https://bioethicsarchive.georgetown.edu/achre/final/report.html (address data 22.11.2020).

  232. Singh V.K., Ducey E.J, Brown D.S., Whitnall M.H. A review of radiation countermeasure work ongoing at the Armed Forces Radiobiology Research Institute // Int. J. Radiat. Biol. 2012. V. 88. № 4. P. 296–310. https://doi.org/10.3109/09553002.2012.652726

  233. Singh V.K., Newman V.L., Berg A.N., MacVittie T.J. Animal models for acute radiation syndrome drug disco-very // Exp. Opin. Drug Discov. 2015. V. 10. № 5. P. 497–517. https://doi.org/10.1517/17460441.2015.1023290

  234. Singh V.K., Seed T.M. A review of radiation countermeasures focusing on injury-specific medicinals and regulatory approval status: part I. Radiation sub-syndromes, animal models and FDA-approved countermeasures // Int. J. Radiat. Biol. 2017. V. 93. № 9. P. 851–869. https://doi.org/10.1080/09553002.2017.1332438

  235. Singh V.K., Olabisi A.O. Nonhuman primates as mo-dels for the discovery and development of radiation countermeasures // Exp. Opin. Drug Discov. 2017. V. 12. № 7. P. 695–709. https://doi.org/10.1080/17460441.2017.1323863

  236. Gray G.M., Steven B., Gail C. et al. The Annapolis accords on the use of toxicology in risk assessment and decision-making: an Annapolis center workshop report // Toxicol. Meth. 2001. V. 11. № 3. P. 225–231. https://doi.org/10.1080/105172301316871626

  237. Seed J., Carney E.W., Corley R.A. et al. Overview: using mode of action and life stage information to evaluate the human relevance of animal toxicity data // Crit. Rev. Toxicol. 2005. V. 35. № 8–9. P. 663–672. https://doi.org/10.1080/10408440591007133

  238. Good I.J. Weight of evidence, corroboration, explanatory power,information, and the utility of experiments // J. Royal Stat. Soc. Series B: Methodological. 1960. V. 22. № 2. P. 319–331. https://doi.org/10.1111/j.2517-6161.1960.tb00378.x

  239. Ecological Causal Assessment / Eds S.B. Norton, S.M. Cormier, Glenn W. Suter II. U.S. Environmental Protection Agency. Cincinnati, OH, USA: CRC Press, 2015. 497 p.

  240. NCRP. Report No 150. Extrapolation of radiation-induced cancer risks from nonhuman experimental systems to humans. National Council on Radiation Protection and Measurements, 2005. 280 p.

  241. ICRP Publication 103. The 2007 Recommendations of the International Commission on Radiological Protection. Annals of the ICRP / Ed. J. Valentin. Amsterdam–New York: Elsevier, 2007. 329 p.

  242. Schep L.J., Slaughter R.J., Temple W.A. et al. Diethylene glycol poisoning // Clin. Toxicol. (Phila). 2009. V. 47. № 6. P. 525–535. https://doi.org/10.1080/15563650903086444

  243. Hajar R. Animal testing and medicine // Heart Views. 2011. V. 12. № 1. P. 42. https://doi.org/10.4103/1995-705X.81548

  244. Ballentine C. Sulfanilamide disaster. Taste of raspberries, taste of death: the 1937 elixir sulfanilamide incident // FDA Consumer magazine. June 1981 Issue. 5 p. https://www.fda.gov/files/about%20fda/published/The-Sulfanilamide-Disaster.pdf (address data 25.11.2020).

  245. Animal and human studies addressing health effects // National Research Council. 2005. An Assessment of Potential Health Effects from Exposure to PAVE PAWS Low-Level Phased-Array Radiofrequency Ener-gy. Washington, DC: The National Academies Press, 2005. 214 p. https://doi.org/10.17226/11205. https://www.nap.edu/catalog/11205/an-assessment-of-potential-health-effects-from-exposure-to-pave-paws-low-level-phased-array-radiofrequency-energy

  246. USEPA 2016. Framework for Incorporating Human Epidemiologic & Incident Data in Risk Assessments for Pesticides – Office of Pesticide Programs” U.S. Environmental Protection Agency, 2016. 51 p.

  247. Freedman D.A., Zeisel H. From mouse-to-man the quantitative assessment of cancer risks // Stat. Sci. 1988. V. 3. № 1. P. 3–28.

  248. Иванов И.В., Ушаков И.Б. Основные подходы к экстраполяции данных с животных на человека в радиобиологическом эксперименте // Мед. радиология и радиац. безопасность. 2020. Т. 65. № 3. С. 5–12. [Ivanov I.V., Ushakov I.B. Basic approaches to the extrapolation of data of animals to human in radiobiological experiment // Med. Radiol. Radiat. Bezopasnost (‘Medical Radiology and Radiation Safety’; Moscow). 2020. V. 65. № 3. P. 5–12. (In Russian. Engl. abstr.)] https://doi.org/10.12737/1024-6177-2020-65-3-5-12

  249. Kundi M. Causality and the interpretation of epidemiologic evidence // Environ. Health Perspect. 2006. V. 114. № 7. P. 969–974. https://doi.org/10.1289/ehp.8297

  250. Leenaars C.H.C., Kouwenaar C., Stafleu F.R. et al. Ani-mal to human translation: a systematic scoping review of reported concordance rates // J. Transl. Med. 2019. V. 17. Article 223. 22 p. https://doi.org/10.1186/s12967-019-1976-2

  251. Suter G.W. II, Norton S., Cormier S. The science and philosophy of a method for assessing environmental causes // Hum. Ecol. Risk Assess. 2010. V. 16. №1. P. 19–34. https://doi.org/10.1080/10807030903459254

  252. Schoeny R., Haber L., Dourson M. Data considerations for regulation of water contaminants // Toxicology. 2006. V. 221. № 2–3. P. 217–224. https://doi.org/10.1016/j.tox.2006.01.019

  253. Becker R.A., Patlewicz G., Simon T.W. et al. The adverse outcome pathway for rodent liver tumor promotion by sustained activation of the aryl hydrocarbon receptor // Regul. Toxicol. Pharmacol. 2015. V. 73. № 1. P. 172–190. https://doi.org/10.1016/j.yrtph.2015.06.015

  254. Lacchetti C., Ioannidis J., Guyatt G. Surprising results of randomized trials // User”s Guides to the Medical Literature. A Manual for Evidence-Based Clinical Practice / Eds G. Guyatt, D. Rennie, M.O. Meade, D.J. Cook. 2nd Ed. JAMA Evidence. The Evidence-Based Medicine Working Group. New York etc.: McGraw Hill Medical, 2008. P. 113–151.

  255. Hartung T., Luechtefeld T., Maertens A., Kleensang A. Integrated testing strategies for safety assessments // ALTEX. 2013. V. 30. № 1. P. 3–18. https://doi.org/10.14573/altex.2013.1.003

  256. Non-clinical development: Basic principles. Medicines R&D. Toolbox (online library). The European Patients’ Academy on Therapeutic Innovation (EUPATI): Patient Engagement Through Education. National Platforms. https://toolbox.eupati.eu/resources/non-clinical-development-basic-principles/ (address data 27.11.2020).

  257. Environmental Health Risk Assessment. Guidelines for assessing human health risks from environmental hazards // Department of Health and Ageing and enHealth Council. Population Health Division. Publication Distribution Officer, 2002. 258 p.

  258. Crump K.S., Chen C., Louis T.A. The future use of in vitro data in risk assessment to set human exposure standards: challenging problems and familiar solutions // Environ. Health Perspect. 2010. V. 118. № 10. P. 1350–1354. https://doi.org/10.1289/ehp.1001931

  259. Romeo D., Salieri B., Hischier R. et al. An integrated pathway based on in vitro data for the human hazard assessment of nanomaterials // Environ. Int. 2020. V. 137. Article 105505. 12 p. https://doi.org/10.1016/j.envint.2020.105505

  260. Kirkland D., Aardema M., Henderson L., Müller L. Evaluation of the ability of a battery of three in vitro genotoxicity tests to discriminate rodent carcinogens and non-carcinogens I. Sensitivity, specificity and re-lative predictivity // Mutat. Res. 2005. V. 584. № 1–2. P. 1–256. https://doi.org/10.1016/j.mrgentox.2005.02.004

  261. Kirkland D., Aardema M., Muler L., Makoto H. Evaluation of the ability of a battery of three in vitro genoto-xicity tests to discriminate rodent carcinogens and non-carcinogens II. Further analysis of mammalian cell results, relative predictivity and tumour profiles // Mutat. Res. 2006. V. 608. № 1. P. 29–42. https://doi.org/10.1016/j.mrgentox.2006.04.017

  262. Kirkland D., Speit G. Evaluation of the ability of a battery of three in vitro genotoxicity tests to discriminate rodent carcinogens and non-carcinogens III. Appropriate follow-up testing in vivo // Mutat. Res. 2008. V. 654. № 2. P. 114–132. https://doi.org/10.1016/j.mrgentox.2008.05.002

  263. Andersen H. History and philosophy of modern epidemiology. Based on a talk delivered at the &HPS Conference, Pittsburgh, October 2007. http://philsci-archive.pitt.edu/4159/ (дата обращения 28.11.2020).

  264. Weed D.L. Analogy in causal inference: rethinking Austin Bradford Hill”s neglected consideration // Ann. Epidemiol. 2018. V. 8. № 5. P. 343–346. https://doi.org/10.1016/j.annepidem.2018.03.004

  265. Russo F., Williamson J. Interpreting causality in the health sciences // Int. Stud. Philos. Sci. 2007. V. 21. № 2. P. 157–170. https://doi.org/10.1080/02698590701498084

  266. Lowell R.B., Culp J.M., Dube M.G. A weight-of-evidence approach for Northern river risk assessment: integrating the effects of multiple stressors // Environ. Toxicol. Chem. 2000. V. 19. № 4. P. 1182–1190. https://doi.org/10.1002/etc.5620190452

  267. IARC 2006. International Agency for Research on Cancer. IARC monographs on the evaluation of carcinogenic risks to humans. Preamble. Lyon, France, 2006. 27 p.

  268. Pai M. Fundamentals of Epidemiology. Lections. Montreal, Canada: McGill University, 2014. https://www.teachepi.org/courses/fundamentals-of-epidemiology/ (address data 28.11.2020).

  269. Boobis A.R., Doe J.E., Heinrich-Hirsch B. et al. IPCS framework for analyzing the relevance of a noncancer mode of action for humans // Crit. Rev. Toxicol. 2008. V. 38. № 2. P. 87–96. https://doi.org/10.1080/10408440701749421

  270. Becker R.A., Ankley G.T., Edwards S.W. et al. Increa-sing scientific confidence in adverse outcome pathways: application of tailored Bradford-Hill considera-tions for evaluating Weight of Evidence // Regul. Toxi-col. Pharmacol. 2015. V. 72. № 3. P. 514–537. https://doi.org/10.1016/j.yrtph.2015.04.004

  271. Guess H.A. Premarketing applications of pharmacoepidemiology // Pharmacoepidemiology / Ed. B.L. Strom. 3rd ed. Baffins Lane, Chichester, West Sussex: John Wiley & Sons Ltd, 2000. P. 449–462.

  272. Weed D.L. Causal criteria and Popperian refutation // Causal Inference / Ed. K.J. Rothman. Chestnut Hill, MS: Epidemiologic Resources, 1988. P. 15–32.

  273. Rothman K. Modern Epidemiology. 1st ed. Boston: Little Brown MA., 1986. 358 p.

  274. Kleinberg S., Hripcsak G. A review of causal inference for biomedical informatics // J. Biomed. Inform. 2011. V. 44. P. 1102–1112. https://doi.org/10.1016/j.jbi.2011.07.001

  275. Lucas R.M., McMichael A.J. Association or causation: evaluating links between “environment and disease” // Bull. World Health Organ. 2005. V. 83. № 10. P. 792–795. https://doi.org/10.1590/s0042-96862005001000017

  276. NCRP 1994. Science and judgment in risk assessment // National Research Council. Washington, DC: National Academy Press, 1994. 672 p. https://doi.org/10.17226/2125

  277. Shleien B., Ruttenber A.J., Sage M. Epidemiologic studies of cancer in populations near nuclear facilities // Health Phys., 1991. V. 61. № 6. P. 699–713. https://doi.org/10.1097/00004032-199112000-00001

  278. Wakeford R., Antell B.A., Leigh W.J. A review of probability of causation and its use in a compensation scheme for nuclear industry workers in the United Kingdom // Health Phys. 1998, V. 74. № 1. P. 1–9. https://doi.org/10.1097/00004032-199801000-00001

  279. Wakeford R. Association and causation in epidemiology – half a century since the publication of Bradford Hill’s interpretational guidance // J. R. Soc. Med. 2015.V. 108. № 1. P. 4–6. https://doi.org/10.1177/0141076814562713

  280. Fairlie I. Commentary: childhood cancer near nuclear power stations // Environ. Health. 2009. V. 8. Art. 43. 12 p. https://doi.org/10.1186/1476-069X-8-43

  281. Martinez-Betancur O. Causal judgment by Sir Austin Bradford Hill criteria: leukemias and radiation // Revista de la Facultad de Medicina, Universidad Nacional de Colombia. 2010. V. 58. № 3. P. 236–249.

  282. Ulsh B.A. The new radiobiology: returning to our roots // Dose Response. 2012. V. 10. № 4. P. 593–609. https://doi.org/10.2203/dose-response.12-021

  283. Jorgensen T.J. Strange Glow. The Story of Radiation. Princeton and Oxford: Princeton University Press, 2016. 490 p.

  284. Иванов Е.П. Эффекты малых доз. Учебная программа для специальности 1-31 05 03 “Химия высоких энергий”. Белорусский государственный университет, 2016. 23 с. [Ivanov E.P. Low dose effects. Curriculum for specialty 1-31 05 03 “Chemistry of high energies”. Belarusian State University, 2016. 23 p. (In Russian)]

  285. IARC 2010. International Agency for Research on Cancer. IARC Monographs on the Evaluation of Carcinogenic Risks to Humans, V. 93. Carbon Black, Titanium Dioxide, and Talc. Lyon, France, 2010. 466 p.

  286. Faustman E.M., Gohlke J.M., Ponce R.A. et al. Experimental approaches to evaluate mechanisms of deve-lopmental toxicity // Handbook of Developmental Toxicology / Ed. R.D. Hood. New York: CRC Press, 1997. P. 13–41.

  287. Cole P. Causality in epidemiology, health policy and law // Environ. Law Rep. 1997. V. 27. № 6. P. 10279–10285.

  288. Martin P., Bladier C., Meek B. et al. Weight of evidence for hazard identification: a critical review of the literature // Environ. Health Perspect. 2018. V. 126. № 7. Art. 076001. 15 p. https://doi.org/10.1289/EHP3067

Дополнительные материалы отсутствуют.