Вестник Военного инновационного технополиса «ЭРА», 2023, T. 4, № 3, стр. 304-308

Функциональная связность областей слуховой коры в процессах обработки речи и языка

И. Г. Маланчук 1*, В. А. Орлов 1, С. И. Карташов 1, Д. Г. Малахов 1

1 Национальный исследовательский центр “Курчатовский институт”
Москва, Россия

* E-mail: cora1@inbox.ru

Поступила в редакцию 18.10.2023
После доработки 25.10.2023
Принята к публикации 25.10.2023

Полный текст (PDF)

Аннотация

Представлены результаты фМРТ-исследования, направленного на установление функциональной связности областей головного мозга человека, вовлеченных в обработку чистой речевой информации и устных вербальных высказываний. Описаны данные в отношении особенностей связности первичной слуховой коры.

ВВЕДЕНИЕ

В современной нейрокогнитивистике языка и речи продолжаются исследования различных областей мозга, обеспечивающих восприятие речевой информации. На модели приматов была предложена иерархическая структура слуховых зон [1]; в исследованиях головного мозга человека (ГМЧ) устанавливаются соотношения слуховых зон человека и приматов [27]; уточнена анатомическая структура извилины Хешля (HG) [8, 9] и т.д. В последние 20 лет усилия нейрофизиологов направлены на установление распределенной функциональной организации слуховой коры, иерархий в ее подсистемах [1017], при том что сегодня выделяется около 30 анатомических субобластей слуховой коры [9, 18].

В одном из последних обширных исследований [11] показана значительная и, как утверждается, независимая от HG роль верхней височной извилины (STG) в обработке вербальных высказываний, в связи с чем заявлен принцип параллельной обработки речеязыкового материала в HG и STG, вплоть до того, что авторы на основе применения метода прямой фокальной электрокортикальной стимуляции и исследования абляции HG делают вывод о том, что “HG, по-видимому, не требуется для восприятия речи (согласно цитируемому тексту, для обработки языка. Пер. с англ. яз. – И.М., В.О. и др.), в то время как STG требуется” [11, с. 4634]. Такая гипотеза, без сомнения, интересна в аспекте представлений о распределенных параллельно функционирующих нейросетях, обеспечивающих ту или иную базовую или “частную” функцию, однако важными остаются вопросы нейронального обеспечения речеязыковой интеграции, равно как и теоретическое осмысление феноменов языка и речи и, соответственно, отбора речевых стимулов для проведения нейрофизиологических исследований, а также вопрос применяемых инструментальных методов и заданий [11, 13, 1921].

Более полувека продолжаются попытки дифференцировать процессы речи и языка, однако и самая последняя зарубежная работа по этой проблеме [22], выполненная, как и [11], на материале атонального языка, в силу используемой методологии и методики не решила эту задачу. Между тем до- и внеязыковые формы речи представляют собой естественные коммуникативные знаки не только в период раннего постнатального онтогенеза, но и в коммуникативной культуре взрослых, и специфическое нейрональное обеспечение чистых речевых форм, показанное в [23] и подтверждающее существование распределенных и различных нейросетей ГМЧ при обработке речевых и речеязыковых стимулов, требует еще множества исследований и подробного анализа.

Разработанная ранее концепция “Речь vs. Язык” развивает представления о существовании двух типов знаковых систем, специализированных по речи и языку [24, 25]. Это означает необходимость активизации нейрофизиологических исследований функциональных структур ГМЧ, в том числе структур слуховой коры, с учетом различий в типах естественных стимулов: собственно речевых, соотнесенных с социально-когнитивными задачами и системой социальных отношений/смыслов; a priori интегративного характера устных речеязыковых высказываний, репрезентирующих и социальный аспект речи, и концептуальную картину мира человека.

В данной работе, в том числе в связи с гипотезой о независимости STG от HG при обработке языковых высказываний [11], представим прежде всего данные фМРТ-исследования в отношении этих двух областей интереса.

ЭКСПЕРИМЕНТАЛЬНАЯ ЧАСТЬ

В проведенном фМРТ-эксперименте испытуемым предъявляли четыре типа стимулов, в том числе значимые для обсуждения данной темы стимулы S1 – вопросительная вокализация с типичным повышением тона в границах единственного гласноподобного звука, который условно обозначили как редуцированный [ъ]: Ъ?; S2 – вопросительное вербальное высказывание-холофраза Да? с идентичным прагмасемантическим вокально-речевым оформлением. В соответствии с числом стимулов в фМРТ-эксперименте использовали рандомизированный блочный план (латинский квадрат 4 × 4). Стимулы предъявляли в рандомизированном порядке, по восемь предъявлений каждого стимула в каждом блоке с интервалом 1 с между одинаковыми стимулами в блоке и интервалом в 15 с между сериями стимулов одного типа в блоке, а также между блоками. Поскольку стимулы являются естественными речекоммуникативными единицами, используемыми во взрослой обыденной коммуникативной культуре, для распознавания их значений и смыслов не требовалось предварительного обучения испытуемых. Стимулы записаны в шумоизолированной студии профессиональным педагогом по речи, женским голосом, в высоком регистре. Проведена нормализация стимулов по громкости. Эмоциональная составляющая минимизирована, и, согласно экспертным оценкам и оценкам испытуемых в постэкспериментальном опросе, стимулы не содержат выраженного позитивного либо негативного эмоционального компонента, распознаются как “нейтральные”. В эксперименте блокировано естественное речевое поведение отклика.

Выборку исследования составили 15 испытуемых – восемь женщин, семь мужчин с нормальным слухом и зрением, с их слов, без неврологических нарушений (без обращения к неврологу в течение последних двух лет), правши. Все испытуемые – студенты вузов (уровень бакалавриата либо магистратуры), носители русской речевой городской культуры и русского языка как родного. Средний возраст – 22.4 года. Каждый испытуемый подписал добровольное согласие на участие в исследовании. Исследование одобрено локальным этическим комитетом НИЦ “Курчатовский институт”.

Стимулы предъявляли через амагнитные головные телефоны с функцией шумоподавления на звуковом уровне 80 дБ, бинаурально. Во время записи испытуемые должны были сохранять спокойное расслабленное состояние и смотреть на экран монитора, где с целью организации визуального внимания испытуемого предъявлялся фиксировочный крест.

Сканирование проводили на магнитно-резонансном томографе Siemens Magnetom Verio 3T (Германия) с 32-канальной головной МР-катушкой. Испытуемый располагался в МРТ-камере в положении лежа, голова закреплялась с помощью уплотняющих модулей. Для каждого испытуемого были записаны анатомические данные с высоким разрешением на основе Т1-взвешенной 3D‑последовательности (TR = 2530 мс, TE = = 3.31 мс, 176 срезов, размер воксела – 1 × 1 × × 1 мм3). Запись функциональных данных осуществлялась на основе мультисрезовой эхо-планарной последовательности EPI: TR = 1110 мс, TE = 24 мс, 51 срез, размер воксела – 2 × 2 × 2 мм3, угол отклонения вектора намагниченности (flip angle) 90°. От каждого испытуемого в эксперименте получено по 32 записи активации мозга на каждый стимул.

Предобработку данных МРТ проводили на основе свободно распространяемого программного пакета SPM12 и разработанных одним из авторов статьи (В.А. Орлов) терминальных скриптов системы MacOS. Структурные и функциональные данные были приведены к центру в передней комиссуре вручную. Проводили расчет и коррекцию артефактов движения. С целью удаления артефактов магнитной восприимчивости на основе записанных во время исследования карт неоднородности магнитного поля выполняли коррекцию функциональных данных. Структурные и функциональные МРТ-объемы были нормализованы на шаблонные изображения в MNI (Montreal Neurological Institute) пространстве. Использование мультисрезовых последовательностей для регистрации фМРТ-данных приводит к появлению физиологических и аппаратных вкладов в шум. Такие вклады приводят к некорректной статистической оценке активации нейронных сетей. Для их детекции и подавления использовали метод независимых компонент (МНК). На последнем этапе предобработки данных с целью удаления случайных выбросов к функциональным данным был применен гауссовский фильтр с ядром 6 × 6 × 6 мм3. Для получения результирующих статистических карт использовали классическую обобщенную линейную модель.

РЕЗУЛЬТАТЫ

Получены данные о связности зон ГМЧ при пассивном восприятии чистого речевого (вокально-речевого) стимула и устного вербального высказывания минимальной структуры. Покажем прямые связи билатеральных областей HG, значимо отличающиеся (p ≤ 0.001) в задачах восприятия этих двух стимулов.

В экспериментальных условиях восприятия естественной чистой вокально-речевой формы установлены следующая структура и уровни связности (в диапазоне от 14.0373 до –14.0373) областей интереса в слуховой коре взрослых.

Правосторонняя Heschl’s gyrus (HG r) выявляет наибольшую тесноту связей со следующими областями (наименования согласно CONN):

Heschl’s gyrus, слева (HG l),

superior temporal gyrus, anterior div., справа (aSTG r),

planum polare, справа (PP r),

superior temporal gyrus, posterior div., билатерально (pSTG l и pSTG r);

– c несколько меньшей теснотой связи – с такими областями, как

central opercular cortex, слева (CO l),

parietal operculum cortex, слева (PO l),

temporal pole, билатерально (TP l, TP r),

parietal operculum cortex, справа (PO r),

superior temporal gyrus, anterior div., слева (aSTG l),

central opercular cortex, справа (CO r);

– с наименьшим коэффициентом связности по сравнению с указанными с insular cortex, справа (IC r).

Левостронняя HG l обнаруживает наибольшую тесноту связей с областями:

planum polare, билатерально (PP l, PP r),

planum temporale, билатерально (PT l, PT r);

– с понижением коэффициента связности – с областями:

central opercular cortex, слева (CO l),

parietal operculum cortex, слева (PO l),

superior temporal gyrus, posterior div., билатерально (pSTG l, pSTG r),

superior temporal gyrus, anterior div., билатерально (aSTG r, aSTG l),

temporal pole, слева (TP l),

insular cortex, слева (IC l),

temporal pole, справа (TP r).

Кроме того, HG (право- и левосторонняя) обнаруживает прямые связи с pMTG – задним отделом средней височной извилины (билатерально), с ее более высоким уровнем связности с правосторонней HG. STG также имеет более обширную сеть связей в аудиторной подсистеме ГМЧ, что будет описано в другой публикации.

В задаче восприятия естественного речеязыкового высказывания минимальной структуры установлена связность (диапазон – от 20.1742 до ‒20.1742) выделенных областей интереса в слуховой коре взрослых:

– правосторонняя Heschl’s gyrus (HG r) выявляет набольшую тесноту связи с областями:

Heschl’s gyrus, слева (HG l),

superior temporal gyrus, posterior div., слева (pSTG l);

– с понижением коэффициента связности:

central opercular cortex, слева (CO l),

superior temporal gyrus, anterior div., справа (aSTG r),

superior temporal gyrus, posterior div., справа (pSTG r),

parietal operculum cortex, билатерально (PO r, PO l),

superior temporal gyrus, anterior div., слева (aSTG l),

central opercular cortex, справа (CO r),

temporal pole, справа (TP r),

juxtapositional lobule cortex – supplementary motor cortex, слева (SMA l);

– левостронняя HG l обнаруживает наибольшую тесноту связей (однако в целом более низкую, чем у HG r в данной задаче) с областями:

central opercular cortex, слева (CO l),

superior temporal gyrus, anterior div., справа (aSTG r),

superior temporal gyrus, posterior div., справа (pSTG r),

planum temporale, билатерально (PT r, PT l),

planum polare, билатерально (PP l, PP r), с более низким уровнем связности у праволатеральной PP,

superior temporal gyrus, anterior div., слева (aSTG l),

parietal operculum cortex, билатерально (PO l, PO r), с более низким уровнем связности у праволатеральной PO,

insular cortex, слева (IC l),

temporal pole, справа (TP r),

central opercular cortex, справа (CO r).

ОБСУЖДЕНИЕ И ВЫВОДЫ

Результаты, полученные в [11], имеют существенное ограничение, связанное с односторонней стимуляцией HG и STG и односторонней абляцией HG в клиническом случае. Остается проблемным и вопрос о сгенерированных тональных стимулах, хотя и отвечающих спектрограммам предложений, но модифицированных по уровням интенсивности (громкости) и унифицированных по длительности [11], что принципиально меняет условия эксперимента по сравнению с восприятием естественных вербальных конструкций, а активации ГМЧ при восприятии синтезированных интонационных стимулов, как можно полагать в силу ряда причин, могут не соответствовать ответам мозга на естественные вокально-интонационные стимулы [25].

Представленные данные отражают активации в областях интереса обоих полушарий ГМЧ. Важными для результата работы являются последовательное минимальное приращение сигнала – от “простой” вокализации до минимальной прагмалингвистической единицы, имеющей односложную структуру и при этом естественное увеличенное время сигнала (со 150 до 250 мс), а временной диапазон прагматически значимой повышательной интонации составил для обоих стимулов 100 мс [23]; а также максимальная нейтрализация эмоциональной составляющей.

Полученные результаты показывают обширные системы высокозначимых связей извилины Хешля, имеющей, как известно, тонотопическую организацию. Высокозначимая связность извилины Хешля представлена в обеих задачах – восприятия чистого речевого стимула и речеязыкового высказывания минимальной языковой структуры.

При восприятии чистого речевого сигнала в данных экспериментальных условиях правосторонняя HG обнаруживает наибольшую связность как с левосторонней HG, так и с aSTG справа, pSTG справа и слева, PP справа (контрлатеральный PP не представлен в данной задаче), с меньшей теснотой связи – с aSTG слева, TP, PO и CO – билатерально, правая IC имеет минимальную связность с правой HG. Левосторонняя HG обнаруживает наибольшую тесноту связей с PP и PT билатерально, с понижением коэффициента связности с CO и PO слева, билатерально с pSTG и aSTG, а также с TP (c меньшим коэффициентом справа, чем слева), наконец, с левосторонней IC. HG (право- и левосторонняя) обнаруживает прямые связи с pMTG (билатерально), с ее более высоким уровнем связности с правосторонней HG. STG кроме связности с HG имеет обширную сеть связей в слуховой коре, что будет представлено в следующей публикации.

При восприятии естественного речеязыкового высказывания минимальной структуры установлен – с повышением тесноты связности по сравнению с первой задачей – наибольший уровень связности правосторонней HG с HG слева и pSTG слева, и далее с понижением коэффициента связности с CO слева, aSTG справа, pSTG справа, PO билатерально, aSTG слева, CO справа, TP справа (левое TP не представлено), а также SMA слева. Левосторонняя HG обнаруживает наибольшую тесноту связей, однако в целом более низкую, чем правой HG в этой задаче, с CO слева, aSTG справа, pSTG справа (левая pSTG не представлена), PT билатерально, PP билатерально (с более низким уровнем связности у праволатеральной PP), aSTG слева, PO билатерально (с более низким уровнем связности у правой PO), IC слева, TP справа (левое не представлено), CO справа.

И правая, и левая HG имеют широкую сеть как ипси-, так и конрлатеральных связей в обеих задачах, что важно прежде всего с точки зрения вопроса о латерализации/межполушарном представительстве функции “чистой” речи, обработке различными областями слуховой коры различных ее признаков – от голосовых до динамических интонационных, значимых для контроля речевой формы и распознавания ее социальной семантики, а также вопросов о специализации нейросетей в отношении анализа языковых средств и о нейросетевых субсистемах при восприятии интегративного характера устных вербальных высказываний разной сложности.

В данном исследовании не обнаружена ипсилатеральная связь левой HG c левой pSTG, что значимо для соотнесения с данными о ранних латентных реакциях в STG [11], однако будет дополнительно проверено на большей выборке испытуемых.

Работы выполнена в рамках выполнения государственного задания НИЦ “Курчатовский институт” с использованием вычислительных ресурсов федерального центра коллективного пользования “Комплекс моделирования и обработки данных исследовательских установок мега-класса” НИЦ “Курчатовский институт”.

Список литературы

  1. Kaas J.H., Hackett T.A. // PNAS. 2000. V. 97. P. 11793.

  2. Bendor D., Wang X. // J. Neurophysiol. 2008. V. 100. P. 888.

  3. Petkov C.I., Kayser C., Augath M. // PLoS Biol. 2006. V. 4. P. 215.

  4. Petkov C.I., Jarvis E.D. // Front. Evol. Neurosci. 2012. V. 4. P. 12.

  5. Scharff C., Friederici A.D., Petrides M. // Front. Evol. Neurosci. 2013. V. 5. P. 1.

  6. Rauschecker J.P., Scott S.K. // Nat. Neurosci. 2009. V. 12. № 6. P. 718.

  7. Sweet R.A., Dorph-Petersen K.-A., Lewis D.A. // J. Comp. Neurol. 2005. V. 491. № 3. P. 270.

  8. Da Costa S., van der Zwaag W., Marques J.P. et al. // J. Neurosci. 2011. V. 31. № 40. P. 14067.

  9. Wallace M.N., Johnston P.W., Palmer A.R. // Exp. Brain Res. 2002. V. 143. P. 499.

  10. Boemio A., Fromm S., Braun A., Poeppel D. // Nat. Neurosci. 2005. V. 8. P. 389.

  11. Hamilton L.S., Oganian Yu., Hall J., Chang E.F. // Cell. 2021. V. 184. № 8. P. 4626.

  12. Heuvel M.P., Sporns O. // J. Neurosci. 2011. V. 31. P. 15775.

  13. Poli D., Pastore V.P., Martinoia S., Massobrio P. // J. Neural Eng. 2016. V. 13. № 2. P. 026023.

  14. Poliva O., Bestelmeyer P.E., Hall M. et al. // Cogn. Behav. Neurol. 2015. V. 28. № 3. P. 160.

  15. Steinschneider M., Nourski K.V., Rhone A.E. et al. // Front. Neurosci. 2014. V. 8. P. 240.

  16. Tremblay P., Dick A.S. // Brain Lang. 2016. V. 162. P. 60.

  17. Щемелева О.В., Жукова О.В., Шелепин Ю.Е. и др. // Физиология человека. 2019. Т. 45. № 6. С. 16.

  18. Hackett T.A. // Handbook of clinical neurology. 2015. V. 129. Amsterdam: Elsevier, P. 27.

  19. Жирнова В.А., Зырянов А.С., Гордеева Е.А. и др. // Когнитивная наука в Москве: новые исследования. Материалы конференции. 2019. С. 609.

  20. Trébuchon A., Alario F.-X., Liégeois-Chauvel C. // Front. Hum. Neurosci. 2021. V. 15. P. 702773.

  21. Меметова К.С., Князева В.М., Станкевич Л.Н. и др. // Сб. тезисов XXIV съезда физиол. о-ва им. И.П. Павлова. СПб., 2023. С. 379.

  22. Tomasello R., Grisoni L., Boux I. et al. // Cereb. Cortex. 2022. V. 32. № 21. P. 4885.

  23. Маланчук И.Г., Орлов В.А., Карташов С.И., Малахов Д.Г. // Физиология человека. 2023. Т. 49. № 3. С. 106.

  24. Маланчук И.Г. Речь как психический процесс: монография. Красноярск, 2009. 285 с.

  25. Дементьев В.В. Теория речевых жанров: монография. М.: Знак, 2010. 594 с.

  26. Hamilton L.S., Huth A.G. // Lang. Cogn. Neurosci. 2020. V. 35. № 5. P. 573.

Дополнительные материалы отсутствуют.