Журнал высшей нервной деятельности им. И.П. Павлова, 2022, T. 72, № 2, стр. 159-186

Роль стриатума в двигательном научении

Н. Ю. Ивлиева 1*

1 Федеральное государственное бюджетное учреждение науки Институт высшей нервной деятельности и нейрофизиологии РАН
Москва, Россия

* E-mail: nivlieva@mail.ru

Поступила в редакцию 01.06.2021
После доработки 14.07.2021
Принята к публикации 05.10.2021

Полный текст (PDF)

Аннотация

Рассмотрена роль стриатума в двигательном научении. Современные молекулярно-генетические подходы позволили ближе взглянуть на участие нейронов прямого и непрямого пути в различных аспектах двигательного научения. Исследования на животных свидетельствуют о том, что при критическом участии дофаминергической системы нейроны прямого пути играют ключевую роль в формировании и поддержании часто выполняемых в данном контексте движений вплоть до участия в механизмах обеспечения процесса их автоматизации, а нейроны непрямого пути – в сообразующемся с конкретной ситуацией гибком вовлечении определенных движений. Эти эффекты активности двух путей, вероятно, достигаются за счет их комплементарного влияния на механизмы обеспечения поведенческой вариабельности.

Ключевые слова: стриатум, научение, инструментальный условный рефлекс, привычка, навык, базальные ганглии, проекционные нейроны стриатума, дофамин, черное вещество, вентральная область покрышки

В предыдущей работе (Ивлиева, 2021) был приведен краткий обзор данных о связях стриатума и рассмотрены исследования, в которых в центре внимания находилась роль стриатума в организации двигательной функции. В той статье мы ограничились рассмотрением работ, в которых в экспериментальной поведенческой модели в явном виде не присутствовало научение. В этом тексте мы перейдем к рассмотрению данных об участии стриатума в двигательном научении, полученных в исследованиях на животных.

Участие стриатума в процессах двигательного научения на основе вознаграждения в настоящее время является стержнем, на котором держатся ключевые представления о функциях базальных ганглиев (БГ). Так, на протяжении длительного времени стриатум тесно связывали с определенными аспектами движения; на входе стриатум получает информацию от всех отделов неокортекса, а также из гиппокампа и миндалины, а на выходе связан главным образом с двигательными структурами; стриатум является главной мишенью для дофаминергических (ДЕ) нейронов среднего мозга и по уровню дофамина (ДА) превосходит все мозговые структуры; ДА же, в свою очередь, при всей неопределенности механизмов участия в процессах научения (Майоров, 2018; Ивлиева, 2021) связан с процессами подкрепления и движения.

ПРОЕКЦИОННЫЕ НЕЙРОНЫ: D1- И D2-ЭКСПРЕССИРУЮЩИЕ КЛЕТКИ

В первую очередь мы рассмотрим работы, направленные на установление особой роли в двигательном научении проекционных нейронов, экспрессирующих D1- или D2-рецепторы, часто для краткости называемых нейронами прямого (ПП) и непрямого пути (НП) соответственно. В экспериментальных условиях, не предусматривающих целенаправленного обучения животных, результатами различных воздействий на нейроны прямого и непрямого пути являются, как правило, противоположные двигательные эффекты, что в целом свидетельствует в пользу классических представлений о содействии движению со стороны прямого пути БГ и о подавлении тенденции к выполнению движения – со стороны НП; с другой стороны, регистрация клеточной активности или ее коррелятов почти без исключений демонстрирует очень сходные паттерны активности двух путей в связи с движением (Bariselli et al., 2019, Ивлиева, 2021). Одно из самых первых исследований роли двух путей стриатума в научении было осуществлено Кравицем и соавт. (Kravitz et al., 2012), они оптогенетически билатерально стимулировали (1-секундным пульсом постоянного света) нейроны прямого или непрямого пути дорзомедиального стриатума в момент приближения животного к емкостному датчику и показали повышение числа контактов с датчиком в случае активации ПП и, наоборот, снижение – при активации НП, и сделали вывод о том, что стимуляция ПП подкрепляет, а непрямого – служит наказанием. Позже Виченте и соавт. в сходной поведенческой ситуации в ответ на нажатие животным педали стимулировали (уже световыми импульсами) нейроны дорзолатерального стриатума и сделали другие выводы на основании своих данных: они предположили, что стимуляция обоих путей является вознаграждающей, но подкрепляющий эффект проявляется по-разному, что интерпретируется авторами как подкрепление различных стратегий действия, в частности, более генерализованной стратегии при стимуляции нейронов НП (Vicente et al., 2016).

Тему ключевой роли активности обоих путей в процессах подкрепления/наказания интересно развивают Йттри и Дадман (Yttri, Dudman, 2016). В их исследовании мышь с фиксированной головой самостоятельно инициировала перемещение джойстика для получения капли вознаграждения; короткая (сопоставимая по времени с движением) стимуляция нейронов дорзомедиального стриатума осуществлялась приблизительно в одной трети самых быстрых движений в момент превышения порога скорости движения, установленного экспериментаторами; они показали, что подобная стимуляция ПП повышает скорость движений, а НП – снижает, и, что важно, авторы убедительно аргументируют, что это влияние осуществляется посредством механизмов научения, а не через прямое влияние на исполняемое движение. В работе Бахурина и соавт. (Bachurin et al., 2020) исследовались лизательные движения в условиях рефлекса на время и также показаны разнонаправленные эффекты стимуляции нейронов обоих путей вентролатерального стриатума на инициацию движения, но речь здесь идет уже о непосредственном влиянии на движение. Таким образом, в этих исследованиях с применением избирательной стимуляции ПП и НП в явном виде прослеживаются разнонаправленные эффекты активации D1- и D2-экпрессирующих нейронов в разных отделах стриатума, но также выявляется неоднозначность механизмов таких эффектов.

Пионерское исследование активности нейронов прямого и непрямого пути дорзального стриатума при инструментальном научении было проведено Куи и соавт. (Cui et al., 2013) на мышах, научившихся получать вознаграждение после 10 нажатий произвольно на правую или левую педаль, осуществляемых спонтанно. Это позволило авторам оценить активность нейронов прямого и непрямого пути при сходных по физическим параметрам движениях, совершаемых в различающихся мотивационных состояниях (например, правый поворот за едой к кормушке и правый же поворот от кормушки к педали). Они обнаружили, что нейроны обоих путей демонстрируют сходную картину кратковременной активации в период инициации инструментального движения. Подобная активация нейронов обоих путей предшествовала инициации поворота тела животного (рис. 1(а)). Вскоре было опубликовано исследование Исомуры и соавт. (Isomura et al., 2013), которые различали нейроны прямого и непрямого пути дорзолатерального стриатума крыс с помощью другого метода (применялись юкстаклеточное мечение и визуализация специфической м-РНК); они показали, что при самостоятельной инициации животным инструментального движения (притягивание рычага) активность нейронов обоих путей приурочена к моменту инициации и модулируется вознаграждением сходным образом, что противоречило их первоначальной гипотезе. Также они обращают внимание на небольшую тенденцию для нейронов двигательного типа предположительно НП к большей продолжительности по времени нарастания от начала изменения до пика активности по сравнению с D1-экспрессирующими нейронами. Таким образом, в условиях выученных движений наблюдается все тот же парадокс, когда стимуляция нейронов прямого и непрямого пути оказывает, как правило (но см. Vicente et al., 2016), разнонаправленное действие, а результаты регистрации активности свидетельствуют об очень сходной динамике активности этих двух групп нейронов.

Рис. 1.

Схематическое представление или реконструкция данных о спайковой активности нейронов прямого (справа) и непрямого (слева) пути стриатума в разных экспериментальных ситуациях. Вертикальная пунктирная линия – время действия условного стимула. Отметки на оси абсцисс – инструментальные движения. (а) – Однообразная активация нейронов ПП и НП при пищевом инструментальном УР по данным Cui et al., 2013. (б) – Реконструкция данных Jin et al., 2014, когда животное совершает быструю серию из четырех нажатий на педаль. (в) – Активность нейронов ПП и НП в ответ на условный стимул при наличии двигательной реакции (сплошная линия) и при ошибочном пропуске (пунктирная линия) (по данным Sippy et al., 2015). (г) – Почти исключительная активация только нейронов НП в ответ на условный стимул (по данным Owesson-White et al., 2016). На этом фрагменте (в отличие от всех других) – справа представлена активность нейронов НП. (д) – Активность нейронов ПП больше приурочена к моменту движения, а нейронв НП – к межстимульнуму интервалу (реконструкция данных Sheng et al., 2019). (е) – При наличии и в отсутствие вознаграждения нейроны прямого и непрямого пути ведут себя по-разному (по данным Nonomura et al., 2018). Пунктиром обозначена активность при неподкрепленных движениях. (ж) – Только нейроны НП активируются преимущественно при требуемой смене педали внутри серии нажатий (реконструкция по данным Geddes et al., 2018). (з) – Активность нейронов ПП приобретает тенденцию к опережению активности нейронов НП при формировании привычки (по данным O’Hare et al., 2016).

Fig. 1. Schematic representation or reconstruction of data on the spike activity of neurons in the direct (right) and indirect (left) striatum pathways in different experimental situations. The vertical dashed line is the initiation of the conditioned stimulus. The marks on the abscissa are instrumental movements. (a) – Uniform activation of neurons of direct and indirect pathways in food instrumental UR according to Cui et al., 2013. (б) – Reconstruction of the data of Jin et al., 2014, when the animal makes a quick series of four pedal presses. (в) Activity of neurons of direct and indirect pathways in response to a conditioned stimulus in the presence of a motor response (solid line) and in the presence of an erroneous omission (dashed line) (according to Sippy et al., 2015). (г) – Almost exclusive activation of only neurons of indirect pathway in response to a conditioned stimulus (according to Owesson-White et al., 2016). In this fragment (unlike all others), the activity of NP neurons is shown on the right. (д) – The activity of the neurons of direct pathways is more confined to the movement, and the activity of the neuron of indirect pathways – to the interstimulus interval (data reconstruction by Sheng et al., 2019). (е) – In the presence and in the absence of reward, neurons in the direct and indirect pathways demostrate different activity (according to Nonomura et al., 2018). The dotted line indicates the activity with unrewarded movements. (ж) – Only neurons of indirect pathways are activated predominantly with the required change of the lever within a series of presses (reconstruction according to the data of Geddes et al., 2018). (з) – The activity of neurons of direct pathways tends to outstrip the activity of indirect pathway neurons during habit formation (according to O’Hare et al., 2016).

Освоение новых простых действий, приводящих к вознаграждению, индуцировало у мышей, по наблюдению Шэн и соавт., пластичность как в D1-, так и в D2-экспрессирующих нейронах (главным образом в ДМС), но они показали, что эти изменения были разнонаправленными: после обучения отношение AMPA/NMDA повысилось у D1- и снизилось у D2-экспрессирующих проекционных нейронов (Shan et al., 2014).

А при выработке реакции избавления на начальной стадии потенциировались входы к D2-экспрессирующим нейронам дорзального стриатума, на стадии же сформированной реакции эта потенциация нивелировалась, но усиливались входы к D1-эспрессирующим нейронам (Diao et al., 2021).

В поисках специфической роли нейронов прямого и непрямого пути стриатума в организации движения Джин и соавт. в продолжение начатой ранее работы (Jin, Costa, 2010) регистрировали активность клеток дорзального стриатума, теперь идентифицируя их посредством оптогенетической стимуляции, при требовании к животным как можно более быстро выполнить последовательность из четырех нажатий на педаль (Jin et al., 2014); они обнаружили некоторые различия активности в связи с инициацией и завершением последовательности: в то время как нейроны ПП приблизительно поровну реагировали и в начале и в конце последовательности нажатий, активность нейронов НП была больше приурочена к началу последовательности, также исследователи показали преобладание торможения разряда на протяжении выполнения мышью всей двигательной последовательности в активности нейронов НП и, напротив, устойчивую активацию нейронов ПП (рис. 1(б)).

Текуапетла и соавт. (Tecuapetla et al., 2016) исследовали, как относительно кратковременные строго приуроченные к определенной фазе поведения оптогенетические влияния на активность нейронов прямого и непрямого пути дорзального стриатума скажутся на осуществлении спонтанного инструментального условнорефлекторного поведения (в режиме подкрепления последовательности из восьми нажатий (fixed ratio 8)). Они показали, что пятисекундная активация кратковременными световыми импульсами нейронов ПП при переходе мыши от кормушки к педали увеличивает время подхода к рычагу за счет остановки животного в момент стимуляции, а активация нейронов НП приводит к прекращению следования к рычагу и часто – к отходу от месторасположения педали и кормушки. Примечательно, что и совместное, и осуществленное по отдельности торможение обоих путей постоянно действующим светом также приводило к увеличению времени инициации последовательности нажатий. Аналогичная по параметрам активация в момент первого из серии нажатия на педаль приводит в случае нейронов ПП к увеличению числа нажатий, а нейронов НП – к отказу от нажатий, и также нередко – к выходу из зоны расположения педали и кормушки (интересно, что торможение нейронов НП оказывает тот же эффект). Авторы делают вывод о необходимости совместной комплементарной активности обоих путей для нормального осуществления движения и не считают избыточное число нажатий на рычаг при активации нейронов ПП следствием процессов самостимуляции.

Более сложная последовательность спонтанно инициируемых нажатий на педали была выбрана для обучения животных в работе Геддес и соавт. (Geddes et al., 2018): от мышей требовалось выполнить последовательно сначала два нажатия на левую педаль, а затем – два нажатия на правую, после чего они получали вознаграждение у противоположной стенки камеры; при обучении животных такой гетерогенной двигательной последовательности авторы надеялись подступиться к изучению роли прямого и непрямого в пути в организации двигательной иерархии. Им удалось показать, что в инициации всей последовательности в целом большую роль играют нейроны ПП стриатума, а при переключении с одной подпоследовательности (два нажатия на левую педаль) на другую (два – на правую) существенно большую активность проявляют нейроны НП. После разрушения D1- или D2-экпрессирующих нейронов выполнение хорошо предварительно выученной последовательности сильно ухудшалось, причем двустороннее разрушение нейронов ПП приводило к неспособности правильно начать последовательность: животные преимущественно нажимали на педаль, предшествующую получению вознаграждения, а двустороннее разрушение нейронов НП нарушало своевременное переключение с левой педали на правую. Подобно ранее упомянутому исследованию Текуапетлы, в этой работе также исследовалось влияние короткой (значительно более короткой у Геддес и соавт. (Geddes et al., 2018)) оптогенетической стимуляции проекционных нейронов стриатума, строго приуроченной к определенному моменту поведения, в данном случае исследователи выясняли последствия активации после каждого по отдельности нажатия на педаль в разных попытках. Обнаружено, что стимуляция нейронов ПП приводит к вставкам дополнительных нажатий в подпоследовательности, а стимуляция нейронов НП прекращает одну подпоследовательность, не изменяя другой (рис. 1 (ж)).

Более естественна для животного ситуация, когда вместо набора дискретных коротких движений выполняется непрерывная последовательность плавно сменяющих друг друга движений. Лопец-Хуэрта и соавт. (Lopez-Huerta et al., 2021) исследовали влияния оптогенетических воздействий на нейроны прямого и непрямого пути в ипси- и контралатеральном дорзальном стриатуме при выполнении мышью требующего существенной ловкости движения доставания приманки через щель. Они показали, что стимуляция и торможение активности D1- и D2- экспрессирующих нейронов в разных полушариях по-разному влияют на выполнение движения, однако интерпретация данных в отношении специфики этого влияния представляет определенную сложность из-за того, что использованная ими продолжительная (и постоянным светом) стимуляция одного большого пула нейронов не вполне адекватна поведенческой ситуации быстро меняющейся последовательности движений, которую животное совершает для доставания пищевого комка.

Определенные различия в активности D1- и D2-экпрессирующих нейронов удалось выявить и Сиппи и соавт. (Sippy et al., 2015) в довольно простой поведенческой ситуации. Ими был использован условный стимул – кратковременное (1 мс) отклонение вибриссы, если мышь в ответ на него в течение одной секунды начинала лизательные движения, она получала каплю воды. Исследователи измеряли мембранный потенциал клеток дорзолатерального стриатума и обнаружили, что нейроны ПП реагируют на стимуляцию вибриссы более крутым нарастанием мембранного потенциала по сравнению с нейронами НП. Также они показали, что короткая оптогенетическая стимуляция нейронов ПП может наравне со стимуляцией вибрисс у обученных животных вызывать лизательные движения. Интересно, что в случае невыполнения животным движения на стимул реакция нейронов ПП сохранялась, в отличие от реакции нейронов НП (рис. 1 (в)).

Овессон-Уайт и соавт. прибегли к поиску специфики участия D1- и D2-экспрессирующих нейронов вентрального стриатума в инструментальном поведении с помощью мультимодального сенсора, позволившего им быстро в одной и той же точке отслеживать динамику концентрации ДА, регистрировать спайковую активность клеток, а также определять экспрессируемые этими клетками рецепторы ДА (Owesson-White et al., 2016). Они обнаружили, что в ответ на звуковой условный стимул, который предвещает появление через две секунды педали для самостимуляции, активируются преимущественно D2-экспрессирующие нейроны; также они показали, что среди клеток, активность которых приурочена к моменту нажатия на педаль, присутствуют оба типа нейронов (рис. 1 (г)).

Другой подход к решению этой же проблемы применяют Ольденбург и Сабатини (Oldenburg, Sabatini, 2015). Их интересовала активность нейронов первичной моторной коры в ответ на активацию нейронов прямого и непрямого пути в дорзальном стриатуме, и они применяли длительную оптогенетическую стимуляцию (постоянным светом в стриатуме); у бодрствующих животных с закрепленной головой регистрировали активность нейронов коры в фоне и при выполнении животным инструментального движения в ответ на короткий звуковой стимул. Они делают вывод о том, что классическая модель подтверждается их данными, однако, они также показали, что стимуляция нейронов НП опосредует кратковременное повышение активности некоторой совокупности клеток коры в самом начале стимуляции. Особое же внимание они обращают на результаты исследования активности нейронов моторной коры в связи с инструментальным движением: а именно на то, что модуляция корковой активности со стороны БГ минимальна в период совершения движения, что выраженность активации в связи с инструментальным движением на фоне стимуляции непрямого пути возрастает, а прямого – снижается, и что при этом стимуляция ПП преимущественно модулирует разряд нейронов, которые активны в связи с движением, чего нельзя сказать о стимуляции НП, скорее можно отметить, что на фоне стимуляции НП изменяется подмножество клеток, реагирующих на тон в ситуации успеха: стирается реакция у одних, появляется у других (Oldenburg, Sabatini, 2015).

Шенг и соавт. (Sheng et al., 2019) на протяжении нескольких дней регистрировали активность одного и того же ансамбля нейронов дорзолатерального стриатума по ходу формирования инструментального рефлекса, когда мыши в ответ на звуковой стимул должны были передней лапой толкнуть рычаг для получения капли воды; от животных требовалось воздерживаться от движения в межстимульный интервал, т.к. спонтанное движение в этот интервал приводило к пролонгированию времени до следующего стимула. Они обнаружили, что по ходу стабилизации инструментального поведения параллельно формируется и более стабильный ансамбль клеток, сохраняющих общую картину паттерна активности на протяжении дней, при этом нейроны непрямого пути (выявляемые у D2-Cre-мышей, а не у A2a-Cre, что в последние годы делается редко, т.к. при этом оказываются задействованными и холинергические интернейроны) преимущественно активны в межстимульный период, когда нужно воздерживаться от движения, а нейроны прямого пути преимущественно активируются в период инструментального движения; когда же двигательная задача изменяется, например, когда меняется направление отклонения рычага, резко преобразуется и картина активности всего ансамбля нейронов (рис. 1 (д)). Данные по хемогенетическому подавлению активности исследуемых типов нейронов подтвердили данные регистрации о причастности нейронов прямого пути к инициации инструментального движения, а непрямого – к подавлению межстимульных реакций. К сожалению, стройность построения несколько расстраивает то обстоятельство, что в аналогичных условиях в варианте эксперимента с другими последующими изменениями двигательной задачи, картины активации ансамблей D1- и D2-экспрессирующих нейронов перед сменой задачи практически неразличимы. Аналогичная стабилизация нейронных ансамблей по мере научения была продемонстрирована и в условиях классического обусловливания (Shin et al., 2020).

Некоторая надежда на разрешение парадокса одновременной активации двух противоположно себя проявляющих при стимуляции путей возникает в связи с исследованием Нономуры и соавт. Они также показали одновременную активацию D1- и D2-экспрессирующих нейронов дорзомедиального стриатума в ответ на запускающий движение стимул, но в отношении реакции на вознаграждение показали отчетливые различия в их активности (Nonomura et al., 2018). В этом исследовании животное (мышь) должно было тянуть либо толкать передней лапой рычаг в условиях четко структурированной посредством условных стимулов (пускового стимула и сигнала обратной связи) задачи с вероятностным вознаграждением и периодическим переключением без предупреждающего сигнала режимов вознаграждения для инструментальных движений. Они показали, что нейроны ПП преимущественно активируются в ответ на вознаграждение и проявляют тенденцию к снижению активности в отсутствие вознаграждения, а нейроны НП, напротив, активируются, когда звучит сигнал, означающий отмену вознаграждения (рис. 1 (е)), также активность последних коррелирует не только с текущим, но и с предыдущим отрицательным результатом инструментальной реакции, и более того – с последующим поведенческим выбором. Также они показали, что оптогенетическая активация стриатных проекций прямого и непрямого пути, начинающаяся вскоре после начала звучания сигнала о наличии или отсутствии вознаграждения (время стимуляции подбиралось по принципу соответствия естественной активности, установленной в уже упомянутых экспериментах с регистрацией), повышает вероятность переключения на другое движение в случае активации НП, и несколько снижает при стимуляции ПП. Наблюдения о разнонаправленной активности нейронов прямого и непрямого пути в ответ на сигнал о наличии или об отмене награды в некоторой степени согласуются с наблюдениями Шина и соавт. (Shin et al., 2018) о противоположной динамике активности этих типов нейронов ДМС в связи с ценностью вознаграждения при классическом обусловливании, однако они не согласуется с выводами Исомуры и соавт. (см. выше), сделанными на основе данных более близкого по дизайну исследования инструментального УР с регистрацией активности нейронов более латеральной области дорзального стриатума, что может быть причиной расхождений. Важно не рассматривать эти наблюдения в отрыве от условий поведенческой задачи, в которой они были получены, и, в частности, особое значение для выявления таких закономерностей может иметь присутствие переключения без предупреждения в экспериментальной процедуре у Нономуры (Nonomura et al., 2018). Согласно Шин и соавт. нейроны НП вносят более весомый вклад в поведенческую адаптацию в зависимости от текущего результата (Shin et al., 2018), и, возможно, этот вклад становится более значимым, если в поведенческой задаче присутствует переключение. Близкие заключения были сделаны в исследовании на приматах на основании фармакологических воздействий на D1- и D2-рецепторы (Ueda et al., 2017).

Еще больше усложняют ситуацию результаты работы Ксяо и соавт. (Xiao et al., 2020): в то время как данные большинства исследований, допуская разные интерпретации активности нейронов НП, вполне определенно подтверждают участие нейронов прямого пути в содействии движению, этот коллектив авторов делает вывод о том, что активация генетически предопределенной популяции D1-экспрессирующих нейронов стриосом дорзального стриатума подавляет движение и действует как “негативное подкрепление” в ситуациях предпочтения места и выбора поилки.

Четкое разделение на ПП и НП в мозге приматов – гораздо более сложная и этически сомнительная задача, однако, особенности связей определенных регионов стриатума позволяют сделать некоторые выводы о специфике функционирования двух путей. Так, в отношении задней части хвостатого ядра анатомические исследования показали, что ее нейроны очень локально и плотно проецируется на каудодорзолатеральную область ретикулярной части SN и каудальновентральный бледный шар, который также локально проецируется на каудолатеральную часть ретикулярной части черного вещества (Kim et al., 2017). Электрофизиологические исследования подтвердили, что эти связи являются тормозными и представляют собой прямой путь (Yasuda, Hikosaka, 2015) и непрямой путь (Kim et al., 2017). Исследования этих регионов показали, что “плохие” (не вознаграждаемые) объекты кодируются нейронами непрямого пути, тогда как реакции на “хорошие” объекты регистрируются преимущественно в активности нейронов прямого пути (Kim et al., 2017), и в соответствии с классическими представлениями о функциях двух путей, активность нейронов стриатума в ответ на “плохие” объекты приводит к торможению саккад к ним, а активация в ответ на “хорошие” объекты, наоборот, запускает саккады.

В целом исследования активности двух популяций проекционных нейронов стриатума при вновь выученных движениях выявляют те же проблемы, которые были сформулированы по итогам обзора исследований движений общего поведенческого репертуара (Ивлиева, 2021): более или менее одновременную активацию нейронов обоих путей во время движения при том, что эффекты однообразных влияний (стимуляции или торможения) оказываются разнонаправленными для двух путей. Однако данные по научению несколько более разнообразны, и за некоторой их пестротой угадывается нечто общее. В частности, возникает впечатление воспроизводимости темы участия нейронов непрямого пути в поведенческом переключении: Виченте и соавт. отмечают более генерализованную двигательную стратегию при вознаграждающей стимуляции нейронов НП (Vicente et al., 2016), в исследовании Текуапетлы и соавт. активация нейронов непрямого пути приводила к прекращению текущих действий и к отказу от выполнения последующих двигательных элементов серии, а также нередко – к выходу из зоны расположения педали и кормушки (Tecuapetla et al., 2016); Геддес и соавт. отмечают выраженную активность нейронов именно непрямого пути при требуемом в процедуре переходе от одной педали к другой (Geddes et al., 2018); продемонстрированная активация непрямого пути в исследовании Овессон-Уайт (Owesson-White et al., 2016) согласуется с переходом животного в ответ на УС к педали для самостимуляции. Наконец, участие нейронов НП в поведенческом переключении находится в фокусе работы Нономуры и соавт. (Nonomura et al., 2018) и Уеды и соавт. (Ueda et al., 2017). Не противоречат этому особенности вовлечения нейронов моторной коры в двигательный ответ при стимуляции нейронов прямого и непрямого пути в работе Ольденбург и Сабатини (Oldenburg, Sabatini, 2015).

В заключение этого подраздела упомянем работу, в которой предметом исследования было инструментальное научение, а основные результаты получены ex vivo (O’Hare et al., 2016): сначала у животных вырабатывали привычку нажимать на педаль, потом их умерщвляли, срезы мозга обрабатывали, чтобы заполнить клетки индикатором кальция, после этого на них изучали ответы нейронов стриатума на электрическую стимуляцию коры. Результаты оказались довольно интересными: авторы утверждают, что определили особенности, которые значимо коррелируют с поведением по привычке в каждом индивидуальном случае. Так, привычное поведение коррелирует с усилением корковых связей обоих путей дорзолатерального стриатума, а также с тенденцией к более ранней активации нейронов ПП по сравнению с нейронами НП (рис. 1 (з)). Авторы считают, что “стриатум оказывает широкие, специфичные для каждого пути модулирующие воздействия на входящую активность, преобразуя сформированное двигательное поведение в привычку”. Представляется почти невероятным, что такие выводы можно сделать на основе изучения срезов. Но в отношении данной работы сложности с интерпретацией данных могут возникнуть у читателя еще до анализа манипуляций исследователей со срезами, а именно на стадии оценки методов научения. Мы выделили курсивом слово “привычка”, которое основательно закрепилось в исследованиях роли стриатума в научении, и на нем надо остановиться отдельно. Это понятие активно используется в рамках широко распространенной концепции о дихотомии процессов научения с подкреплением: речь идет о разделении инструментального поведения на так называемые целенаправленное поведение и поведение по привычке. Предполагается, что в первом случае поведение направляется целью – последующим получением награды или другим благоприятным изменением среды, второе – предшествующими движению стимулами.

СТРИАТУМ И ПРИВЫЧКА

1. Проблемы с “поведением по привычке”

О понятии привычки нужно поговорить подробнее в связи с тем, что стриатум считают ключевым участником процесса формирования и, возможно, реализации привычки. Основу проблемы составляет глобальное деление поведения на две большие категории: целенаправленное поведение и поведение, осуществляющееся по принципу “стимул-реакция” (по привычке) (Graybiel, 2008; Daw, 2018; Balleine, 2019). Эти типы поведения часто не различаются по внешним проявлениям и для их разделения используются специально разработанные подходы: например, обучение и тестирование в крестообразном лабиринте, тестирование обученных животных в ситуации угашения после обесценивания вознаграждения, тестирование после ослабления условной связи (contingency degradation) (Dickinson, 1985; Knowlton, Patterson, 2018). И ввиду косвенного характера таких оценок исследователи, стоявшие у истоков развития экспериментального подхода, настаивают на том, что важно применять не один тест (Yin, Knowlton, 2006). Однако на практике нередко применяется единственный тест, и его результаты допускают существенное многообразие интерпретаций (Goodman, Packard, 2019; Vandaele et al., 2019; Schreiner et al., 2020).

И возвращаясь к работе О’Харе и соавт. (O’Hare et al., 2016), отметим, что ими также был использован только один тест, и продемонстрированные в нем различия неоднозначны. Тенденцию к формированию целенаправленного поведения или поведения по привычке они формировали у двух групп животных посредством двух режимов подачи вознаграждения: одну группу они подкрепляли в режиме случайного соотношения (движений и вознаграждения), а другую – случайного интервала (Dickinson et al., 1985). По этой схеме обе группы животных получают приблизительно равное количество вознаграждения за опыт и обе группы получают его нерегулярно; отличие состоит в том, что при подкреплении в режиме случайного соотношения животное получает еду за определенное число нажатий на педаль при том, что это число каждый раз выбирается случайно, а при подкреплении в режиме случайного интервала, животное получает награду сразу после первого нажатия по истечении определенного интервала, длительность интервала также задается случайно. К поведенческим данным, которые приводят авторы, возникают вопросы: в обеих группах их животные в условиях обесценивания награды нажимают на педаль чаще, чем в условиях без процедуры обесценивания, и в группе, в которой формировалась привычка, таких животных большинство, именно это и приводит к значимым различиям между группами; однако не такая поведенческая закономерность лежит в основе метода разделения целенаправленных действий и действий по привычке: логика метода никак не объясняет более частых нажатий в условиях обесценивания награды (Dickinson, 1985), она предполагает, что животные, действующие по привычке, будут в приблизительно равном темпе нажимать на педаль в накормленном и ненакормленном состоянии, а животные, действующие целенаправленно, в условиях обесценивания награды будут нажимать на педаль реже. Такая резкая неоднозначность данных, безусловно, требует отдельного внимания и не может служить основой для проверки последующих предположений. И подобные ситуации в работах по проблеме механизмов поведения по привычке встречаются нередко.

2. Исследования механизмов участия стриатума в поведении по привычке

Одно из первых экспериментальных подтверждений участия дорзального стриатума в контроле автоматизированного поведения было приведено в исследовании Паккарда и МакГауфа (Packard, McGaugh, 1996). Они показали, что в крестообразном лабиринте крысы в начале обучения ориентируются главным образом на окружающие стимулы (place strategy), а при длительном обучении используют стратегию поворота в заученном направлении (response strategy), но после инактивации дорзального стриатума они снова начинают ориентироваться на внешние стимулы. Позже было обнаружено, что дорзальный стриатум в этом отношении неоднороден и в организацию автоматизированных ответов в большей степени вовлечен дорзолатеральный стриатум (ДЛС) (Yin, Knowlton, 2006; Graybiel, Grafnon, 2015; Knowlton, Patterson, 2018; Balleine, 2019; Crego et al., 2020), в то время как дорзомедиальный стриатум (ДМС) играет важную роль в организации целенаправленного поведения; это подтверждали и исследования с помощью подходов по разобщению действия и его результата (обесценивание вознаграждения, деградация условнорефлекторной связи, Hammond, 1980; Dickinson, 1985); и на основании большого экспериментального материала был сделан вывод о том, что стратегия поворота в заученную сторону и немотивированные нажатия на педаль разделяют общий нейрофизиологический субстрат, а именно ДЛС (см. обзор Yin, Knowlton, 2006). ДЛС грызунов в общих чертах соотносится со скорлупой (putamen) у приматов и значительный пласт работ группы Хикосаки позволяет заключить, что скорлупа опосредует формирование привычки у обезьян и, вероятно, человека, а хвостатое ядро (соотносящееся с ДМС грызунов) вовлечено в организацию целенаправленного поведения (см. обзоры Kim, Hikosaka, 2015; Hikosaka et al., 2019).

Эти представления в общих чертах подтверждаются новыми данными (Smith, Graybiel, 2013; Hawes et al., 2015; Rueda-Orozco, Robbe, 2015; Martiros et al., 2018; Vandaele et al., 2019; Crego et al., 2020; Garr, Delamater, 2020), хотя значительная неопределенность в распределении ролей между структурами и подструктурами кортикостриатопаллидарной системы на разных стадиях формирования и поддержания привычки сохраняется (Ashby et al., 2007; Atallah et al., 2006; Vandaele et al., 2019; Crego et al., 2020; Garr, Delamater, 2020; Yu et al., 2021).

Синаптические преобразования по ходу автоматизации действия происходят и в ДМС (Diao et al., 2021; Yu et al., 2021). Предпринимаются попытки изучения специфического участия нейронов стриосом в организации поведения по принципу “стимул-реакция” (Jenrette et al., 2019; Nadel et al., 2020). Предполагаемые клеточно-молекулярные механизмы привычки приведены в обзоре Malvaez (2020), однако, связь рассмотренных сигнальных каскадов с привычкой остается под большим вопросом, учитывая упомянутые ранее методологические проблемы. Необходимость преодоления этих проблем выходит сейчас на первое место, тем более что идеи о значимости механизмов привычки в развитии разнообразных патологических состояний человека получают все большую популярность в клинических исследованиях (Knowlton, Patterson, 2018; Burnette et al., 2021; Klugah-Brown et al., 2020; Sigurdsson et al., 2020; Wang et al., 2020; Lipton et al., 2019; Ceceli et al., 2020).

НАВЫК И СТРИАТУМ

Деление инструментальной условнорефлекторной деятельности на произвольную и автоматизированную является лейтмотивом исследований Хикосаки с коллегами, проведенных главным образом на обезьянах (Kim, Hikosaka, 2015). Такое деление во многом совпадает с обсуждавшейся выше дихотомией “целенаправленное поведение – поведение по привычке”, вплоть до разделяемых областей стриатума, но и имеет существенные отличия (Garr, Delamater, 2019), а также сопряжено со своими сложностями. Так, например, в своем обзоре Ким и Хикосака (Kim, Hikosaka, 2015) приводят список свойств, которые в совокупности отличают произвольные действия от автоматизированных: обучение им происходит быстро, осуществляются они значительно медленнее, часто с ошибками в неизменных условиях, направляются преимущественно под контролем зрения на основании пространственного взаимного расположения тела, его частей и целевых объектов, в меньшей степени зависят от исполнительного органа (например, могут почти одинаково выполняться правой и левой рукой/лапой), они не запоминаются надолго, произвольные действия осуществляются осознанно.

Рассмотрим исследование, авторы которого называют формируемое поведение двигательной привычкой и подтверждают это результатами тестирования в условиях угашения после обесценивания вознаграждения (Rueda-Orozco, Robbe, 2015). Они обучали крыс входить в зону получения вознаграждения на тредбане не раньше заранее предопределенного времени после начала его движения, обучение занимало много времени (порядка ста сессий с не менее чем 40 попытками), в результате животное освоило стереотипный двигательный паттерн, который удовлетворяет проверке на привычку. Было показано, что только после длительного обучения активность нейронов ДЛС тесно коррелирует как со скоростью, так и с положением животного. Также авторы приводят следующее наблюдение: “Ожидаемый коррелят выполнения по привычке состоит в том, что после случайной ошибки опытные животные немедленно корректируют свои показатели при следующем испытании… Эта немедленная адаптация поведения нарушалась после инъекций мусцимола. В целом после нарушения активности нейронов ДЛС мусцимолом, способность животных выполнять последовательность была сохранена, но исполнение стало очень вариабельным. Эта повышенная изменчивость была связана с трудностью животных в том, чтобы бежать с правильной скоростью в нужное время и с нарушением корректировки после неправильных попыток”. Это замечание предполагает отсутствие ригидности изучаемой “двигательной привычки”, как минимум, в определенных аспектах. И вероятно, в данном случае более уместно говорить о навыке.

Обучая крыс на ускоряющемся ротороде, Йин и соавт. показали, что в результате упрочения навыка потенциируются преимущественно возбудительные входы к нейронам непрямого пути ДЛС, в то время как выработанное поведение начинает меньше зависеть от активности D1-экспрессирующих нейронов ПП (Yin et al., 2009). Зоммер и соавт. выявили изменения в уровне связывания D1-рецепторов в дорзомедиальном стриатуме в самом начале формирования навыка, а D2-рецепторов – в дорзолатеральном стриатуме после завершения выработки (Sommer et al., 2014); а Дюрие и соавт., разрушая D1- или D2-экспрессирующие нейроны дорзального стриатума до обучения или после, показали значительно более тяжелые последствия разрушения первых: животные с устранением D1-экспрессирующих нейронов не обучались и не проявляли тенденции к восстановлению навыка, если были научены до воздействия, животные с поражением D2-экспрессирующих нейронов обучались значительно медленнее, но к концу периода обучения приближались к уровню выполнения задачи контрольными животными, а при разрушении после обучения их показатели довольно быстро восстанавливались (Durieux et al., 2012). Более локальные разрушения выявили следующую специфику: выработка навыка существенно замедляется при разрушении D1-экспрессируюх нейронов ДЛС, а разрушение D2-экспрессирующих нейронов ДМС существенно сказывается на результатах выполнения задачи только в первый день обучения. Изучение с помощью волоконной фотометрии динамики входов из ассоциативных и моторных областей коры соответственно в ДМС и ДЛС показало, что эти две кортикостриатные подсистемы по-разному вовлечены в формирование навыка: Купфершмидт и соавт. показали (Kupferschmidt et al., 2017), что в первый день обучения на ротороде моторные области вовлекаются сразу, а включенность ассоциативных областей достигает пика к концу тренировки, вскоре участие ассоциативных областей снова уменьшается, при этом была продемонстрирована отчетливая связь между скоростью научения и темпом демобилизации ассоциативных входов в ДМС. Эти данные в целом свидетельствуют в пользу включения обоих регионов дорзального стриатума на начальном этапе освоения навыка и последующего постепенного развития автономии сенсомоторного звена по мере консолидации навыка, возможно, вплоть до автономии сенсомоторной коры (Ashby et al., 2007), что могло бы согласовать некоторые противоречия в результатах. Такой вывод подтверждается и последними данными на человеке (Pinsard et al., 2019; Choi et al., 2020).

Нестандартный подход применяют Накамура и соавт. (Nakamura et al., 2017): они использовали моторизованный вращающийся барабан, двигаясь вперед внутри которого животное могло достичь места получения питьевого вознаграждения, шагать оно должно было по ступенькам, расстояние между которыми и паттерн их чередования изменялись экспериментаторами. Было показано, что такое изменение порядка ступеней после успешного освоения животным предыдущего паттерна в первом же опыте приводит к значительному увеличению c-Fos-положительных нейронов как в ДЛС, так и в ДМС; при этом нейроны обоих путей ДЛС были затронуты примерно одинаково. Интересно, что на 7-й день освоения новой последовательности число активированных нейронов существенно снизилось в ДЛС, но не в ДМС. Возможно, здесь имеют значение совсем другая структура и динамика мотивации, по сравнению с той, что присутствует при научении на ротороде.

Хотя существует справедливое мнение о том, что задачи на обучение дискретной последовательности скорее выявляют, как прогнозируются временные закономерности в окружающей среде, но вряд ли являются хорошими моделями ловких непрерывных последовательных действий, какими обычно бывают навыки (Krakauer et al., 2019), экспериментально навык часто изучается как фиксированная последовательность определенных движений. Именно на роли стриатума в выстраивании двигательной последовательности сфокусировано внимание в исследовании Ротвэлл и соавт. (Rothwell et al., 2015); они выявили специфическую роль нейронов прямого пути ДЛС в выполнении выученной последовательности движений и показали участие проекций из вторичной моторной коры в инициации исполнения последовательности, а также усиление синаптических связей между корой и ДЛС в процессе формирования очередности действий. Мартирос и соавт. обучали разных животных разным вариантам фиксированных последовательностей из трех нажатий на две педали; не разделяя нейроны прямого и непрямого пути, они показали, что вне зависимости от конкретной выполняемой крысой последовательности на стадии прочно сформированного двигательного паттерна нейроны ДЛС активируются преимущественно в начале и в конце правильно выполняемой последовательности (Martiros et al., 2018). В ранее упомянутых нами исследованиях (Jin et al., 2014; Rueda-Orozco, Robbe, 2015; Geddes et al., 2018; Vandaele et al., 2019) выполнение последовательности движений животных также доводилось до автоматизма, в некоторых из них проводилось тестирование на чувствительность к обесцениванию награды. Основным результатом, объединяющим эти и более ранние работы (например, Jin, Costa, 2010), является активность, приуроченная к началу и/или окончанию двигательной последовательности. Эти исследования укрепляют позиции представлений о том, что в организации действия стриатум может играть роль “светофора”, санкционирующего запуск и прекращение последовательности действий (Calabresi, Di Filippo, 2010). Однако обстоятельное исследование Салес-Карбонелл и соавт., специально предпринятое для прояснения этого вопроса, ставит под сомнение правильность такого представления (Sales-Carbonell et al., 2018).

В большой серии работ Хикосака и соавт. изучали закономерности формирования двигательных последовательностей и участие БГ в формировании навыка (см. обзоры Kim, Hikosaka, 2015; Hikosaka et al., 2019). Они показали, что на начальной стадии научения в большей степени задействованы передние отделы хвостатого ядра, а на стадии сформированного навыка – его задняя часть (“хвост”). В обзорной работе 2015-го года Ким и Хикосака обращают внимание на то, что закономерности, описанные для двигательных навыков, во многом сходны с закономерностями формирования навыка различения/выделения объектов (Kim, Hikosaka, 2015). Относительно этой категории навыков особого упоминания заслуживает совсем недавнее исследование Куниматсу и соавт., показавшими при обучении обезьян усложненной версии задачи различения “хороших” и “плохих” объектов (об исследованиях роли прямого и непрямого пути в этом поведении говорилось выше), что информация о зрительном окружении передается на проекционные нейроны стриатума посредством быстроразряжающихся интернейронов и при экспериментальном прерывании их связи с проекционными нейронами животное теряет способность к освоению навыка (Kunimatsu et al., 2021).

Для навыка характерно еще одно не упомянутое нами ранее свойство: координация многочисленных, часто одновременных, движений при действии. Этому вопросу посвящено исследование Лемке и соавт. (Lemke et al., 2019). Они регистрировали активность нейронов первичной моторной коры (M1) и дорзолатерального стриатума на протяжении всего периода научения навыку доставания через щель приманки у крыс, и наблюдали появление скоординированной низкочастотной активности в M1 и ДЛС, которая была связана с появлением быстрых и последовательных крупных движений, при этом развитие ловких тонких движений не зависело от этой активности. Авторы другого исследования участия стриатума в формировании навыка доставания приманки определяли динамику субъединичного состава NMDA-рецепторов ДЛС в обоих полушариях в привязке к латерализации тренируемой конечности (Kent et al., 2013). Было показано, в частности, что в контра- и ипсилатеральных отделах стриатума происходят противоположно направленные изменения субъединичного состава, которые наблюдаются уже и на ранней стадии научения, что авторы смело связывают с облегчением или, наоборот, воспрепятствованием для индуцирования сопровождающих научение пластических изменений. Фактор латерализации также оценивался в работе Хейв и соавт. (Hawe et al., 2015), обучавших крыс повороту в определенную сторону в т-образном лабиринте и оценивавших синаптическую пластичность в зависимости от полушария, региона дорзального стриатума и от стадии научения; они подтвердили более раннюю задействованность ДМС и выявили различия в пластических изменениях в разных полушариях и в разных регионах стриатума.

На основании рассмотренных работ можно заключить, что в формировании навыка ведущую роль играет ДЛС; является ли его участие критичным уже в начале научения и сохраняет ли активность структуры свою значимость для выполнения действия по прошествии длительного времени после достижения стадии автоматизации, остается пока предметом обсуждения; ДМС, однако, также чрезвычайно важен, особенно на ранней стадии научения и при специализации навыка. Приобретение навыка, как правило, связано с формированием определенной двигательной последовательности, и в большом числе исследований упоминается характерный паттерн активности нейронов стриатума, приуроченный к началу и завершению соответствующей очередности движений (Jin, Costa, 2010; Martiros et al., 2018; Vandaele et al., 2019), одни авторы рассматривают его по аналогии с сигналами светофора (Calabresi, Di Filippo, 2010), предписывающего изменения движения, другие справедливо утверждают, что тогда такая активность должна быть отчетливо дискретной и явно отличимой от других видов активности, и убедительно показывают, что это условие не соблюдается в популяционной картине разряда нейронов стриатума (Sales-Carbonell et al., 2018). Другими вескими доводами против такой аналогии являются свидетельства полной сохранности последовательного поведенческого паттерна после инактивации ДЛС (Rueda-Orozco, Robbe, 2015), после блокады выходного звена БГ (Desmurget, Turner, 2010), а также совпадение по времени (а не опережение со стороны БГ, как должно было бы быть в случае верной аналогии с сигналом светофора) начала двигательной активности и активности на выходе БГ, продемонстрированное в некоторых работах (например, Anderson, Horak, 1985). Дискуссии такого рода возвращают нас к теме участия стриатума в поведенческой гибкости.

ПЛАСТИЧНОСТЬ ПОВЕДЕНИЯ

В явном виде вопросы о гибкости поведения ставятся, когда на поведенческом уровне исследуют различного рода переделки, переключения, чередования, условное торможение, угашение и др.

Интересно, что работы с такого рода методическими подходами преобладают в исследованиях роли таламических входов в стриатум (Kato et al., 2018; Saund et al., 2017). Возможно, это связано с тем, что двусторонние воздействия на интраламинарные ядра существенно изменяют поведение, а односторонние, как правило, не позволяют выявить определенных эффектов на научение (Edlow et al., 2013; Schiff et al., 2007; Шаповалова и др., 1996). По результатам этих методически очень искусных работ авторы делают выводы о важной роли входов в стриатум из таламуса в регуляции поведенческой гибкости. На участие таламических ядер в модуляции пластичности поведения наряду с медиальной префронтальной корой и стриатумом указывается и в работе Накайамы и соавт. (Nakayama et al., 2018).

Лорен с сотрудниками сопоставляли результаты оптогенетической активации проекционных нейронов ДЛС при переделке порядка выполнения последовательности нажатия на две педали и показали разнонаправленные эффекты стимуляции прямого и непрямого пути: активация нейронов ПП облегчала переделку чередования нажатий на педали, а активация нейронов НП существенно замедляла, однако, нужно отметить, что интерпретация данных этого исследования затрудняется несколько небрежно описанной методикой, выбранным режимом стимуляции, а также на удивление несущественной динамикой поведенческих показателей переделки во всех группах (Laurent et al., 2017), и это препятствует сопоставлению результатов с данными других исследований.

Матамалес и соавт. изучали специфику участия D1- и D2-экспрессирующих нейронов в угашении инструментального рефлекса, определяя уровень задействованности обеих популяции нейронов дорзального стриатума по показателям транскрипционной активности в тот или иной период обучения. Они приходят к выводу, что D2-экспрессирующие нейроны оказывают влияние на нейроны прямого пути, способствуя подавлению нежелательной в новой ситуации пластичности и “задают новое направление произвольному действию”, тем самым способствуя гибкости поведения (Matamales et al., 2020). Похожий вывод делают Пик и соавт. в отношении нейронов прямого и непрямого пути задней части ДМС (Peak et al., 2020): они показали, что уровень маркера пластических изменений Zif268 в результате инструментального научения повышается только в нейронах ПП, а также предположили, что нейроны НП участвуют в поддержании поведенческой пластичности. И, наконец, авторы исследований на поведенческих моделях с явной ситуацией выбора также приходят к близким заключениям (Nonomura et al., 2018; Kwak, Jung, 2019).

ОЦЕНКА КАЧЕСТВА И РЕЗУЛЬТАТА ДЕЙСТВИЯ (И НЕ ТОЛЬКО ОЦЕНКА)

Как уже упоминалось, стриатум является ключевой мишенью для ДЕ-нейронов среднего мозга. Разными методами продемонстрировано, что популяция ДЕ-нейронов среднего мозга является разнородной по многим признакам (например, Poulin et al., 2018; Menegas et al., 2018).

Научение и движение – основные функции, с которыми тесно связана активность ДЕ-нейронов среднего мозга, главной мишенью которых является стриатум. Согласно наиболее цитируемой сегодня концепции ДА служит универсальным обучающим сигналом, кодирующим ошибку предсказания вознаграждения (ОПВ) (Schultz, 2013). В последнее время особенно широко обсуждаются природа, формы и сама возможность сосуществования сигнала об ОПВ и других видов активности ДЕ-системы, в первую очередь связанных с запуском движения (Flagel et al., 2011; Syed et al., 2016; Dodson et al., 2016; Coddington, Dudman, 2018; da Silva et al., 2018; Lee et al., 2019; Mohebi et al., 2019; Lee et al., 2020; Kutlu et al., 2021). С одной стороны, теория об ОПВ (Schultz, 2013) находит все новые подтверждения (Watabe-Uchida et al., 2017; Steinberg et al., 2013; Chang et al., 2016; Eshel et al., 2016), с другой стороны, быстро накапливаются данные, противоречащие этой теории или требующие ее уточнения. Важно то, что данные в пользу участия ДА в инициации/организации движения получены, как правило, на свободноподвижных животных и в них систематически демонстрируется, что выброс ДА/активация ДЕ-системы предшествует/сопутствует движению (Cacciapaglia et al., 2011; Flagel et al., 2011; Ivlieva et al., 2014; Oleson et al., 2012; Pasquereau, Turner, 2014; Schultz et al., 1983; Howe, Dombeck, 2016; da Silva et al., 2018; Tye et al., 2013; Diao et al., 2021; Майоров, Серков, 2016; Майоров, 2021) и даже контролирует ключевые параметры движения (Hughes et al., 2020), в то время как активность, ассоциирующаяся с ОПВ, была выявлена и активно исследована, главным образом, в условиях классического УР, где движение гораздо менее значимо. Мы рассмотрим новые данные, принимая во внимание, что, во-первых, ДА контролирует подвижность практически у всех многоклеточных животных (Caveney et al., 2006), во-вторых, ДЕ-система среднего мозга млекопитающих получает прямые входы ото всех двигательных систем мозга (Watabe-Uchida et al., 2012; Coddington, Dudman, 2019), и, в-третьих, при паркинсонизме основной удар принимает на себя нигростриатная ДЕ-система (Hernandez et al., 2019).

Ранее (Ивлиева, 2021) мы уже упоминали исследования, в которых продемонстрирована активация ДЕ-системы перед инициацией спонтанных движений в разных условиях (Howe и Dombek, 2016; da Silva et al., 2018), однако также показано фазное снижение активности ДЕ-нейронов непосредственно перед движением (Dodson et al., 2016). Коддингтон и Дадман регистрировали активности ДЕ-нейронов у животных с фиксированной головой (Coddington, Dudman, 2018), находящихся в закрепленной на пружине корзинке. Они тоже показали снижение активности большинства исследованных нейронов SNpc в самом начале движения, в активности части нейронов VTA наблюдалось аналогичное торможение; важно, что такая картина наблюдалась только до введения в эксперимент вознаграждающих стимулов. После они вырабатывали следовой классический УР и показали, что у части клеток к связанному с движением (лизательные движения и сопровождающие их движения тела) торможению добавляется предваряющая его короткая активация. В целом по результатам работы они делают вывод об отдельных источниках для активности, связанной с движением, и активности в ответ на стимуляцию (звук, воду), предполагают интегрирование ДЕ-нейронами соответствующих входов и указывают на расхождение своих данных с предсказаниями теории об ОПВ (даже в условиях классического УР). Следовой классический УР также был использован в качестве поведенческой модели в исследовании Ли и соавт. (Lee et al., 2020), они оптогенетически вызывали кратковременное торможение активности нейронов VTA и латеральной части SNpc как перед подачей пищевого стимула, так и сразу после, и показали, что торможение активности непосредственно после подачи вознаграждения оказывает более выраженное влияние на последующее поведение (аналогичное эффекту уменьшения порции молока), это относилось к обоим ядрам, но для SNpc было также продемонстрировано заметное влияние торможения на текущие движения в период перед вознаграждением, на основании этого сделан вывод о более выраженном вкладе ДА в процессы научения. Также отметим, что и эти авторы заявляют об определенных расхождениях своих результатов с закономерностями, предсказанными теорией об ОПВ.

Саундерс и соавт. показали, что в отсутствие каких бы то ни было внешних вознаграждающих стимулов серии сочетаний короткой оптогенетической активации дофаминовых нейронов с предъявлением дискретного сенсорного стимула (свет+звук) было достаточно для того, чтобы в последующем этот стимул вызывал активацию ДЕ-нейронов. Интересно, что обусловленная реакция приближения к источнику света (“Павловское приближение”) возникала вследствие сочетаний УС со стимуляцией ДЕ-нейронов VTA, но не компактной части SN (Saunders et al., 2018). Предполагается, что ДЕ-нейроны VTA получают как сильные входные сигналы о безусловных вознаграждающих стимулах, способных безоговорочно активировать ДЕ-клетки, так и слабые входы от нейтральных стимулов (Майоров, 2018; Galaj, Ranaldi, 2021). Посредством сочетанной стимуляции слабый сигнал усиливается и преобретает способность активировать ДЕ-нейроны VTA, вызывая условный ответ. Обучение происходит, когда такая совместная стимуляция инициирует активацию внутриклеточных каскадов вторичных посредников, что приводит к усилению глутаматных синапсов на ДЕ-нейронах (Nisanov et al., 2020; Galaj, Ranaldi, 2021).

Теперь перейдем к рассмотрению работ, в которых исследовался инструментальный УР и основным был вопрос о природе приуроченной к движению активности ДЕ-нейронов. Коста и соавт. в большой серии экспериментов в качестве поведенческой модели использовали спонтанно инициируемую последовательность из восьми нажатий на педаль. Они показали, что ДА нейроны SNpc демонстрируют преимущественно кратковременные активационные реакции перед началом выполнения последовательности (Jin, Costa, 2010, da Silva et al., 2018), оптогенетическое торможение ДЕ-нейронов (5 с) исследованной структуры препятствовало инициации последовательности, но не влияло на выполнение уже запущенной до начала стимуляции последовательности (da Silva et al., 2018). (Эти данные укрепили представления об аналогии с сигналом светофора, о которой говорилось выше: Calabresi, Di Filippo, 2010). Примечательный подход к решению проблемы связи активности ДЕ-нейронов с движением или с предсказанием награды предложили Зайд и соавт. (Syed et al., 2016): они обучали животных просовывать нос в отверстие и слушать условный сигнал, который инструктировал их либо немедленно выполнять нажатия на одну из педалей, либо оставаться неподвижными на протяжении короткого времени, сопоставимого со временем нажатия на педали. Было показано, что мезолимбическая ДЕ-система начинает активироваться во всех случаях в связи с инициацией движения, т.е. в ситуации, когда животное в ответ на сигнал должно ждать, начало роста концентрации ДА откладывалось на время ожидания; также они обнаружили различия в динамике изменения концентрации ДА в правильных и ошибочных попытках еще до появления сигналов, подтверждающих ошибочность действий. Той же проблеме посвящена серия работ, в которых исследователям удалось выделить в активности ДЕ-нейронов, проецирующихся в ДЛС, компонент, очевидно связанный с движением (с контралатеральным поворотом, Parker et al., 2016), они также провели дополнительное исследование, чтобы доказать, что эта активность не определяется ОПВ (Lee et al., 2019).

О роли ДЕ-нейронов в избегании говорит название статьи Менегас и соавт. (Menegas et al., 2018), которые на мышах в ситуации выбора исследовали активность нигростриатной подсистемы, ранее выделенной ими по морфологическим основаниям (в ней тела ДЕ-нейронов расположены в латеральной части SNpc, а их аксоны направляются в хвостовую часть каудо-путамена); однако, с их утверждением о том, что дофаминовые нейроны подкрепляют реакцию избегания, не легко согласиться: показали они, по сути, обратное тому, что показано на птицах, а именно то, что действие, за которым следует стимуляция ДЕ-аксонов в изученной области, с меньшей вероятностью будет повторено. Такие воздействия операционально определяют как наказание. Трактуя наказание как подкрепление избегания “посредством механизма Павловского предсказания”, авторы не приводят эмпирических или теоретических доводов.

Об особенностях разных популяций ДЕ-нейронов говорит и серия работ Хикосаки и соавт. (Matsumoto, Hikosaka, 2009, Kim et al., 2014, 2015). Они показали, что на “головку” и “хвост” хвостатого ядра обезьян проецируются отдельные группы ДЕ-нейронов (Kim et al., 2014), и эти группы посылают в стриатум функционально различные сигналы (обновляемый в противовес устойчивому (update vs sustain)), которые по-разному участвуют в формировании краткосрочной и долгосрочной памяти (Kim et al., 2015). Нейроны, кодирующие “обновляемый” ДЕ-сигнал, избирательно чувствительны к прогнозируемому вознаграждению (кодируют ОПВ), в то время как нейроны с “устойчивым” ДЕ-сигналом имеют тенденцию сохранять “исторически сложившиеся” (сформированным в результате длительного обучения много дней назад) реакции на вознаграждение (Kim et al., 2015). Интересно сопоставить это наблюдение с физиологическими свойствами проекций к ДЕ-нейронам черного вещества от нейронов стриосом: Эванс и соавт. показали, что вслед за тормозной паузой, вызванной стимуляцией нейронов стриосом, в ДЕ-нейронах присутствует сильный эффект отдачи (Evans et al., 2020), и можно предположить, что “устойчивый” ДА-сигнал, отмеченный у обезьян, может опосредоваться подобным механизмом. Интересно, что здесь могут быть вовлечены клетки стриосом, которые все чаще обсуждаются в связи с их участием в механизмах привычки. Отмечено и еще одно различие этих, описанных у обезьян, групп нейронов черного вещества: стимулы, предвещающие угрозу, подавляют активность ДЕ-нейронов в передней вентромедиальной части, но возбуждают ДЕ-нейроны в задней дорзолатеральной части компактной части SN. (Matsumoto, Hikosaka, 2009).

Однако, как и с проекционными нейронами стриатума, вопрос о степени функциональной гетерогенности и кластеризации нейронов ДЕ-ядер среднего мозга остается открытым. Энгелхард и соавт. считают, что на этот вопрос можно получить ответ, изучая реакции нейронов в условиях более сложных среды и задачи, например, в виртуальном лабиринте; они показали, что подавляющий процент клеток от числа зарегистрированных реагирует на вознаграждение в соответствии с закономерностями ОПВ, а в отношении других компонентов реакций им удалось выделить несколько кластеров, например, клеток с реакцией в соответствии с параметрами движения, на условный стимул и др. (Engelhard et al., 2019). Среди них нужно отметить кластер нейронов, активность которых авторы связывают с точностью выполнения задачи (аккуратностью): интересно, что повышение частоты разряда этих клеток коррелирует с увеличением числа ошибок. В этой связи приведем также наши результаты.

Мы изучали активность нейронов VTA крысы, обучая ее доставанию пищевого шарика (пелеты) из узкой горизонтальной трубки. Детальный анализ активности нейронов во время последовательной смены движений при доставании пищи из трубки показал, что активность большинства нейронов начинает снижаться в разные моменты выполнения этой непрерывной последовательности движений; суммарная активность клеток с таким паттерном формирует плавное, практически линейное снижение активности к моменту выема пищи. Когда животное выполняло более сложную задачу – в конце двигательной последовательности должно было пронести пищу через щель, не уронив ее, – активность на старте была несколько выше, но снижалась более резко к моменту критической фазы движения (Ивлиев, Ивлиева, 2018). И в подтверждение наблюдения Энгелхард и соавт. (Engelhard et al., 2019) ошибки животные совершали на фоне значительно более высокой активности нейронов вентральной тегментальной области (рис. 2). Когда Бова и соавт. применяли оптогенетическую стимуляцию ДЕ-нейронов компактной части SN во время доставания пищи в сходных усложненных условиях (пища помещалась на тонком столбике), они обнаружили заметное снижение результативности пищедобывательных движений и сделали очень интересный вывод: среди прочего они утверждают, что стимуляция ДЕ-нейронов ускоряет переход от одного промежуточного движения к другому в двигательной последовательности (Bova et al., 2020).

Рис. 2.

Импульсная активность большинства нейронов VTA, демонстрирующих торможение в период нахождения лапы в трубке. Популяционная активность нейронов VTA в начале движения, зарегистрированных при модификации навыка. Перистимульные гистограммы выровненные (вертикальные линии) относительно начала просовывания лапы в трубку и сглаженные методом скользящей средней по трем точкам. Снизу: усредненные значения бина, полученные на интервале до пересечения лапой датчика для перистимульной гистограммы сверху перед процедурой сглаживания. Сравнение группы “успех” с контролем и группой “неудача” проводили с помощью ANOVA и Dunnett теста. Разбросы даны в виде 95% доверительного интервала. ** – p ≤ 0.01, *** – p ≤ 0.001. Ширина бина на всех гистограммах рисунка 20 мс.

Fig. 2. PETHs of population activity (three points moving average window) of neurons reducing firing rate when the forepaw is in the tube recorded with the skill modification in early movement; PETHs and corresponding average discharge rates (under them) for control runs (no gap) are shown in white, for successful and unsuccessful (with gap) runs – in gray and black, respectively. Averaging for bottom row is carried out at intervals before the vertical lines on the corresponding PETHs for unsmoothed data (comparison of control, successful and unsuccessful runs before inserting the forepaw into the tube). Spreads are 95% confidence interval. ** – p ≤ 0.01, *** – p ≤ 0.001 (ANOVA and Dunnett test).

Проблема разнородности дофаминовых эффектов в разных регионах стриатума находится и в центре внимания Хамида и соавт. (Hamid et al., 2021): в поле зрения исследователей находилась большая площадь стриатума (включающая ДМС и ДЛС) помещенной на вращающийся барабан мыши; они обнаружили, что дофаминовый сигнал (регистрируемый с помощью кальциевого индикатора в аксонах ДЕ-нейронов, а также с помощью световой дофаминовой метки) распространяется волнообразно, начинаясь в одном регионе стриатума и плавно смещаясь в другой. Когда у животных вырабатывали пищевые классический и инструментальный рефлексы, в ответ на вознаграждающий стимул фиксировались разнонаправленные волны: при инструментальном обусловливании волна инициировалась в ДМС и распространялась латерально, и, наоборот, при классическом латерально возникшая волна распространялась медиально; при этом в начале научения траектория волн сильно варьировала, а в конце – была стабильно однообразной. Авторы (Hamid et al., 2021) рассматривают эти различия в связи с понятиями контролируемости событий и агентности.

Таким образом, ДЕ-нейроны изменяют частоту разряда и в связи с движением, и в связи с результатами действия. Выраженность тех или других реакций в активности отдельных клеток в большой степени зависит от критичности действия в данной поведенческой модели и от принадлежности ДЕ-нейронов к той или иной клеточной популяции; эти различающиеся между собой группы нейронов, вероятно, могут быть отличны друг от друга и по другим признакам; с какой степенью определенности эти популяции ДЕ-нейронов могут быть разделены между собой, остается предметом дискуссий и дальнейших исследований.

ОБСУЖДЕНИЕ

Нейроны стриатума принимают важное участие в процессе двигательного научения. Активность нейронов прямого и непрямого пути часто демонстрирует сходный паттерн, в то время как результаты избирательного воздействия на эти нейроны часто имеют разнонаправленную динамику, таким образом, основные выводы предыдущей работы о парадоксальной одновременной активации нейронов обоих путей во время движения могут быть распространены на существенную часть исследований выработанных движений. Однако в активности нейронов прямого и непрямого пути при вновь выученных движениях присутствуют и различия: так, при выполнении животным простых задач уровень разряда нейронов прямого пути несколько превалирует при инициации движения или имеет тенденцию опережать активацию нейронов непрямого пути (Sippy et al., 2015; Isomura et al., 2013; O’Hare et al., 2016; Sheng et al., 2019); также можно говорить об участии нейронов НП в поведенческой гибкости (Vicente et al., 2016; Tecuapetla et al., 2016; Geddes et al., 2018; Owesson-White et al., 2016; Nonomura et al., 2018; Matamales et al., 2020; Peak et al., 2020).

Стриатум играет роль в выборе поведенческого мотива, но его участие в текущем выборе носит скорее облегчающий, чем санкционирующий характер (Anderson, Horak, 1985; Thura, Cisek, 2017; Hormigo et al., 2021); и, скорее всего, особая роль стриатума состоит в направленном изменении вероятности последующего выбора этого же поведенческого паттерна в зависимости от его результата (Kim et al., 2017; Nonomura et al., 2018). То есть, вероятно, что участие стриатума в составе БГ в выборе во многом является косвенным, но очень значимым (Anderson, Horak, 1985; Dudman, Krakauer, 2016; Thura, Cisek, 2017; Kwak, Jung, 2019; Hormigo et al., 2021). Возможно, такой механизм может играть особую роль в выборе “по умолчанию”, когда на “произвольный” выбор нет времени и/или выбор осуществляется по привычке (Hardwik et al., 2019; Crego et al., 2020).

Вероятно, преобладание активации нейронов ПП в большей степени поддерживает реализуемые в данный момент двигательные программы, а усиление активности НП смещает тенденцию к возбуждению нейронов, в меньшей степени связанных с доминирующим двигательным паттерном, вплоть до переключения на другое движение (Vicente et al., 2016; Ueda et al., 2017; Nonomura et al., 2018) или другое поведение (Tekuapetla et al., 2016). Не исключено, что при угашении и переделках УР отчасти вовлекаются те же механизмы (Matamales et al., 2020; Peak et al., 2020). В нашей предыдущей обзорной работе (Ивлиева, 2021) мы обратили внимание на то, что манипуляции именно с нейронами НП часто приводили к изменениям исследовательского поведения (Alcacer et al., 2017; Durieux et al., 2012; Lemos et al., 2016), эти же нейроны проявляли изменения активности в связи с ориентировочным поведением (Parker et al., 2018).

Попытаемся изложить предполагаемую последовательность событий при выполнении инструментального движения:

1) Инициация инструментального движения происходит при критическом участии нейронов прямого пути БГ на фоне высокой концентрации ДА в стриатуме, достаточной для активации низкоаффинных D1-рецепторов (Майоров, 2021); влияя на эти рецепторы, дофамин препятствует переходу клетки в возбужденное состояние, однако при достижении клеткой порогового уровня генерации спайков, дофамин существенно повышает ее возбудимость (см. обзор Gerfen, Surmeier, 2010) и, вероятно, таким образом влияет на параметры движения (Hughes et al., 2020). Параллельно это может повышать вероятность повторения однажды исполненного движения по принципу: раз движение было произведено, оно не бесполезно. И чем чаще движение выполняется на фоне высокого уровня ДА, тем выше эффективность возбуждающих входов к соответствующим D1-эспрессирующим нейронам (Shen et al., 2007; Mawase et al., 2017) и, следовательно, выше вероятность повторного выполнения движения. Есть основания считать, что “закрепление” движения через прямой путь может и не зависеть непосредственно от последующего вознаграждения (Ueda et al., 2017; Kim et al., 2015; Evans et al., 2020). В то же время в исследовании Ягишиты с коллегами показано, что пластические изменения в проеционных нейронах стриатума происходят, когда дофаминовый сигнал поступает во временном окне, открывающемся сразу после сочетанной стимуляции возбуждающих входов (Yagishita et al., 2014). Однако этот результат и построенные на его основании компьютерные модели (Urakubo et al., 2020) не исключают возможности изменений и на фоне уже повышенной концентрации ДА, так как в условиях проведения сочетаний стимуляции в присутствии апплицированного ДА исследователи получили сходные по амплитуде пластические перестройки; присутствие ДА в синаптической щели к моменту стимуляции теоретически может и облегчить проблему совпадения активности. Возможно, такая проблема может решаться и за счет выделения ДА под влиянием синхронной активности холинергических интернейронов стриатума (Threlfell et al., 2012). Возвращаясь к инициируемому движению: его управляемость может обеспечиваться параллельной активацией нейронов непрямого пути, при этом первоначальный возбуждающий эффект такой активации на популяцию нейронов моторной коры (Oldenburg, Sabatini, 2015) может служить “толчком”, выводящим тело из состояния покоя.

2) Уже в начале выполнения движения активация ДЕ-нейронов начинает снижаться, что ведет к подавлению активности нейронов ПП и способствует большему вовлечению клеток НП. Это в свою очередь может препятствовать выполнению конкурентных движений и способствовать большей точности выбранного движения (Hikosaka et al., 2000; Dodson et al., 2016; Ивлиева, Ивлиев, 2018, Engelhard et al., 2019). Также это может содействовать повышению чувствительности нейронов непрямого пути к сигналам о результате выполненного действия и таким образом обеспечивать зависимость знака пластических изменений от событий, следующих за движением (по причине, во-первых, высокого сродства D2-рецепторов к ДА (Richfield et al., 1989), во-вторых, их “настроенности” на выявление отрицательной динамики активности ДЕ-системы (Lee et al., 2021; Yapo et al., 2017), а также из-за того, что в зависимости от уровня дофамина в D2-экспрессирующих нейронах стриатума может развиваться либо длительная потенциация, либо длительная депрессия в условиях STDP (Shen et al., 2008). Помимо этого, активация нейронов НП может несколько изменить паттерн активации нейронов первичной моторной коры (Oldenburg, Sabatini, 2015), что в условиях неопределенности (приведет ли движение к ожидаемому результату) может способствовать переходу к выполнению другого движения (Hartmann et al., 2015).

3) Результат действия в виде полученного или не полученного пищевого вознаграждения может, в первую очередь, быть опосредован быстрыми входами из интраламинарных ядер таламуса и медиодорзального таламического ядра, и уже позже – ДЕ-нейронами или механизмами освобождения ДА в терминалях через посредство таламических проекций и холинергических интернейронов стриатума (Threlfell et al., 2012; Cover et al., 2019).

Таким образом, предполагается, что клетки ПП играют ключевую роль в инициации движения и “сохранении” всего приобретенного двигательного репертуара особи, что может, например, объяснить быстрое восстановление старых навыков, а клетки непрямого пути вовлечены в процесс гибкого управления движениями.

Несколько меняя ракурс, попытаемся рассмотреть процесс формирования навыка как процесс динамичной оптимизации баланса двух путей: можно предположить, что прямой путь играет ключевую роль в поддержании часто выполняемых (благодаря своей эффективности) в данном контексте движений вплоть до участия (вероятно, на равных с корой) в механизмах обеспечения процесса их автоматизации (Smith, Graybiel, 2013; Charlesworth et al., 2012; Ashby et al., 2007; Jenrette et al., 2019; Nadel et al., 2020), а непрямой путь, в том числе и через влияние на нейроны коры (Oldenburg, Sabatini, 2016), способствует генерации вариабельности, или двигательной генерализации (Vicente et al., 2016); осуществление же действия в условиях определенного варьирования его параметров, позволяющего “нервной системе интенсивно набирать потоки рецепции”, способствует отработке стабильной реализации действия вплоть до решения задачи стандартного выполнения в нестандартных условиях, о которой говорит Бернштейн (1947), и в определении постулируемых им “локусов коррекционной взыскательности” критичной может оказаться активность именно нейронов непрямого пути. Возможно, что непрямой и прямой пути БГ критически вовлечены в оба процесса регуляции двигательной изменчивости, о которых говорят Давале и соавт. (Dhawale et al., 2019): “Быстрый процесс модулирует изменчивость в зависимости от результатов последних попыток, увеличивая ее, когда результативность низкая, и наоборот. Более медленный процесс регулирует динамику быстрого процесса на основе неопределенности ландшафта вознаграждения в данной задаче”. И, возможно, в быстром процессе ведущая роль у нейронов НП, а в медленном – у нейронов ПП (благодаря, в первую очередь, пластическим изменениям в них).

Еще одна важная проблема, которую затрагивает Бернштейн, обсуждая формирование навыка, это перешифровка образа движения и “выявление потребных сенсорных коррекций”. Он пишет: “…сколь угодно ясный образ двигательного состава движения не дает еще никакого понятия о коррекциях и перешифровках, необходимых для его осуществления”. Можно предположить, что на уровне стриатума эта проблема решается при постепенной передаче функций от ДМС к ДЛС или у приматов от хвостатого ядра к скорлупе (putamen) (или от головы хвостатого ядра к его задней части (“хвосту”)). Существуют свидетельства того, что научение кинематическим и динамическим составляющим движения происходит относительно независимо (Krakauer et al., 1999), и весьма умозрительно, но можно предположить, что ДМС в большей степени отвечает за первые, а ДЛС – за вторые. С этим согласуется значительная роль зрительного контроля (как отслеживание траектории) для корректного выполнения неавтоматизированных действий, на которую обращают внимание Ким и Хикосака (2015), и уменьшение роли такого контроля по мере автоматизации движений. (На уровне человека при этом можно говорить о постепенном выходе определенных аспектов движения из-под сознательного контроля (Kim, Hikosaka, 2015).

Отсутствие возможности говорить о сознании животных не исключает существования у них родственных механизмов переключения автоматизированных и произвольных процессов. Некоторые связи стриатума, выявленные в исследованиях на животных, и их особенности могут быть кандидатами на роль участников в механизмах переключения между произвольным и автоматизированным контролем. Например, Хинтирян и соавт. показали, что входы из отделов коры, которые могут быть вовлечены в обеспечение взаимодействия между различными корковыми сетями, проецируются в центральные, очень ограниченные регионы дорзального стриатума – по контрасту с входами из отделов коры, более тесно связанных с сенсорными проекциями, широко распространяющимися по периферии стриатума (Hintiryan et al., 2016). А по данным Райга и Силберберга нейроны ДМС получают мультимодальные входы, у нейронов же ДЛС они зарегистрировали только реакции на тактильные стимулы (Reig, Silberberg et al., 2014). По данным Куниматсу и соавт., нейроны прямого пути стриатума в большой степени контролируются быстроразряжающимися ГАМК-ергическими интернейронами (FSI) и роль последних критична в модуляции ответов на стимулы со стороны контекста (Kunimatsu et al., 2021). При этом у крыс блокада проекций от FSI к проекционным нейронам приводит к усилению активности нейронов НП, и вероятно, эти интернейроны обеспечивают довольно тонкую и специфичную регуляцию баланса активности двух путей (Damodaran et al., 2014) и могут принимать участие во взаимодействии механизмов, обеспечивающих автоматизм и произвольность поведения. Большой интерес в этом контексте представляют особенности синапсов от нейронов прямого и непрямого пути на клетки ретикулярной части черного вещества, позволяющие входам от ПП в большей степени контролировать частоту разряда (амплитуду), а от НП – временную приуроченность активности (Simmons et al., 2020); более предсказуемы (по сравнению с нейронами ПП) и временные аспекты влияния со стороны нейронов НП на ДЕ-нейроны (Evans et al., 2020), что косвенно подкрепляет предположение об участии нейронов НП в предопределении момента выполнения запланированного движения (Bakhurin et al., 2020) за счет, например, предотвращения его автоматического запуска.

Активность ДЕ-нейронов в свою очередь очень многогранна: они изменяют частоту разряда в ответ на широкий спектр внешних стимулов, имеющих разную значимость, среди которых особенно выделяются стимулы, связанные с вознаграждением; также они преобразуют активность и в связи с движением; знак этих изменений сильно зависит от тончайших нюансов на разных изучаемых уровнях: например, от особенностей (не всегда явных) поведенческой ситуации, от индивидуальных особенностей животного, от принадлежности изучаемой клетки к определенной нейронной популяции, от влияний на уровне пресинапса и т.д. (например, Flagel et al., 2011; Howe, Dombek, 2016; Dodson et al., 2016; Kim et al., 2015; Mohebi et al., 2019); многочисленные модусы активности ДЕ-нейронов не связаны с кодированием ОПВ даже в условиях классического УР (Coddington, Dudman, 2018, 2019; Lee et al., 2020). Фазные ответы на сенсорную стимуляцию и изменения импульсации в связи с движением могут быть экспериментально разделены во времени, вероятно, они определяются различными входами; степень сегрегации этих механизмов является предметом дискуссий (см. обзор Coddington, Dudman, 2019).

Выраженность изменений, приуроченных к движению в активности отдельных ДЕ-клеток в большой степени зависит от критичности действия в данной поведенческой модели и соответственно такие изменения более явны при инструментальном УР. Более дискретные действия сопровождаются короткими фазными изменениями дофаминового сигнала; последовательности плавно сменяющих друг друга движений сопровождаются плавными изменениями уровня ДА в проекционных структурах (Howe et al., 2013), обеспеченными, вероятно, последовательным вовлечением отдельных клеток (Ивлиев, Ивлиева, 2018). Предполагается, что активация ДЕ-системы способствует быстрому запуску наиболее вероятного в данном контексте движения (Tye et al., 2013; Hamid et al., 2016; Howard et al., 2017), а фазное снижение частоты разряда дофаминовых нейронов относительно фонового уровня или после предварительной активации способствует большей точности действия (Ивлиева, Ивлиев, 2018; Engehardt et al., 2019; Dodson et al., 2016); соответственно в инициации движения, происходящего на фоне высокой концентрации ДА, ключевую роль играют эффекты медиатора на D1-экспрессирующие нейроны стриатума, а в его корректировке – на нейроны непрямого пути. Искусственная активация ДЕ-нейронов, существенно выходящая за пределы физиологического диапазона по времени, интенсивности и паттерну, “торопит” переходы от одной двигательной стадии к другой (Bova et al., 2020).

Не менее важен вклад ДА в регуляцию движений через влияние на механизмы пластичности (Coddington, Dudman, 2018, 2019; Chang et al., 2016; Hamid et al., 2016, 2021; Saunders et al., 2018; Xiao et al., 2018; Mohebi et al., 2019). Исследования пластичности нейронов стриатума и входов к ним в последние годы вступили в новую эпоху, когда стало возможно подступиться к изучению синаптической и структурной пластичности на бодрствующих животных в процессе научения. Многообразие пластических преобразований, разнородность регионов и клеточного состава стриатума, а также многоликость и сложная динамика процессов научения будут в совокупности приводить к большим проблемам с интерпретацией новых данных, однако совладание с этими трудностями станет большим шагом на пути к пониманию механизмов участия стриатума в научении.

ЗАКЛЮЧЕНИЕ

При движениях в ситуации научения в активности нейронов стриатума проявляются закономерности, во многом близкие тем, что наблюдаются при движениях повседневного поведенческого репертуара. Однако при научении более выпукло проявляется участие нейронов непрямого пути в обеспечении гибкости поведения: их активность в большей степени связана с ситуациями угашения, переключения, переделки, генерализации и т.п. Мы предполагаем, что нейроны ПП играют ключевую роль в формировании и поддержании часто выполняемых в данном контексте движений вплоть до участия в механизмах обеспечения процесса их автоматизации, а нейроны НП – в сообразующемся с конкретной ситуацией гибком вовлечении или временном исключении определенных движений. Эти эффекты активности двух путей, вероятно, достигаются за счет их комплементарного влияния на механизмы обеспечения поведенческой вариабельности или двигательной генерализации; осуществление же действия в условиях определенного варьирования его параметров, позволяющего “нервной системе интенсивно набирать потоки рецепции” (Бернштейн, 1947), способствует отработке стабильной реализации действия вплоть до решения задачи стандартного выполнения в нестандартных условиях.

С некоторой степенью определенности можно говорить о том, что высокие концентрации ДА в стриатуме через влияние на нейроны ПП облегчают инициацию действия и пластические перестройки, способствующие более вероятному выполнению данного действия в будущем; а для регуляции активности нейронов непрямого пути большее значение имеют динамические изменения уровня ДА, а не концентрация медиатора как таковая.

На настоящий момент очевидно, что механизмы участия стриатума в произвольном движении не могут быть удовлетворительно прояснены, с одной стороны, без определения роли различных видов интернейронов стриатума, без определения принципов “разделения труда” между стриосомами и матриксом, между ДЛС и ДМС, а также выявления закономерностей модуляторных влияний со стороны дофамина и ацетилхолина; с другой стороны, необходимо как можно скорее определиться с тем, какой круг явлений стоит за понятием привычки. “Здесь только нужно постоянно помнить: надо прийти в движение, что лишь в движении сцепляются какие-то вещи так, что нам может открыться идея”, – говорит Мамардашвили (2002, стр. 252).

Список литературы

  1. Бернштейн Н.А. О построении движений. М.: Наука, 1947.

  2. Ивлиев Д.А., Ивлиева Н.Ю. Плавное снижение активности нейронов вентральной области покрышки среднего мозга в процессе выполнения пищедобывательного движения. Журн. высш. нервн. деятельности им. И.П. Павлова.2018. 68 (3): 265–272. https://doi.org/10.7868/S0044467718030012

  3. Ивлиева Н.Ю. Роль стриатума в организации произвольного движения. Журн. высш. нерв. деят. 2021. 71 (2): 164–183. https://doi.org/10.31857/S00444677210200522021

  4. Майоров В.И. Функции дофамина в инструментальном условном рефлексе. Журн. высш. нервн. деятельности им. И.П. Павлова. 2018. 68 (4): 404–414. https://doi.org/10.1134/S0044467718040093

  5. Майоров В.И. Модель нейронного механизма инструментализации движений, вызванных стимуляцией двигательной коры. Журн. высш. нервн. деятельности им. И.П. Павлова. 2021. 71 (2): 202–212. https://doi.org/10.31857/S0044467721020064

  6. Майоров В.И., Серков А.Н. Активность нейронов вентральной тегментальной области среднего мозга при первом выполнении условного рефлекса активного избегания. Журн. высш. нервн. деятельности им. И.П. Павлова. 2016. 66 (6): 725–729. https://doi.org/7868/S004446771606006X

  7. Мамардашвили М. Эстетика мышления. Философские чтения. СПб.: Азбука-классика, 2002. 832 с.

  8. Шаповалова К.Б., Поминова Е.В., Дюбкачева Т.А. Особенности влияния холинергической системы неостриатума крыс на обучение активному избеганию в норме и при разрушении интраламинарных ядер таламуса. Рос. физиол. журн. им. И.М. Сеченова. 1996. 82 (1): 1–12.

  9. Alcacer C., Andreoli L., Sebastianutto I., Jakobsson J., Fieblinger T., Cenci M.A. Chemogenetic stimulation of striatal projection neurons modulates responses to Parkinson’s disease therapy. J Clin Invest. 2017. 127 (2): 720–734. https://doi.org/10.1172/JCI90132

  10. Anderson M.E., Horak F.B. Influence of the globus pallidus on arm movements in monkeys. III. Timing of movement-related information. J Neurophysiol. 1985. 54 (2): 433–48. https://doi.org/10.1152/jn.1985.54.2.433

  11. Ashby F.G., Ennis J.M., Spiering B.J. A neurobiological theory of automaticity in perceptual categorization. Psychol Rev. 2007. 114 (3): 632–56. https://doi.org/10.1037/0033-295X.114.3.632

  12. Atallah H.E., Lopez-Paniagua D., Rudy J.W., O’Reilly R.C. Separate neural substrates for skill learning and performance in the ventral and dorsal striatum. Nat Neurosci. 2007. 10 (1): 126–31. https://doi.org/10.1038/nn1817

  13. Bakhurin K.I., Li X., Friedman A.D., Lusk N.A., Watson G.D., Kim N., Yin H.H. Opponent regulation of action performance and timing by striatonigral and striatopallidal pathways. Elife. 2020. 9:e54831. https://doi.org/10.7554/eLife.54831

  14. Balleine B.W. The Meaning of Behavior: Discriminating Reflex and Volition in the Brain. Neuron. 2019. 104(1): 47–62. https://doi.org/10.1016/j.neuron.2019.09.024

  15. Bariselli S., Fobbs W.C., Creed M.C., Kravitz A.V. A competitive model for striatal action selection. Brain Res. 2019. 1713: 70–79. https://doi.org/10.1016/j.brainres.2018.10.009

  16. Bova A., Gaidica M., Hurst A., Iwai Y., Hunter J., Leventhal D.K. Precisely timed dopamine signals establish distinct kinematic representations of skilled movements. Elife. 2020. 9:e61591. https://doi.org/10.7554/eLife.61591

  17. Burnette E.M., Grodin E.N., Schacht J.P., Ray L.A. Clinical and Neural Correlates of Reward and Relief Drinking. Alcohol Clin Exp Res. 2021. 45(1): 194–203. https://doi.org/10.1111/acer.14495

  18. Cacciapaglia F., Wightman R.M., Carelli R.M. Rapid dopamine signaling differentially modulates distinct microcircuits within the nucleus accumbens during sucrose-directed behavior. J Neurosci. 2011. 31(39): 13860–13869. https://doi.org/10.1523/JNEUROSCI.1340-11.2011

  19. Calabresi P., Di Filippo M. Neuroscience: Brain’s traffic lights. Nature. 2010. 466(7305): 449. https://doi.org/10.1038/466449a

  20. Caveney S., Cladman W., Verellen L., Donly C. Ancestry of neuronal monoamine transporters in the Metazoa. Journal of Experimental Biology. 2006. 209: 4858–4868. https://doi.org/10.1242/jeb.02607

  21. Ceceli A.O., Natsheh J.Y., Cruz D., Tricomi E. The neurobehavioral mechanisms of motivational control in attention-deficit/hyperactivity disorder. Cortex. 2020. 127: 191–207. https://doi.org/10.1016/j.cortex.2020.02.009

  22. Chang C.Y., Esber G.R., Marrero-Garcia Y., Yau H.J., Bonci A., Schoenbaum G. Brief optogenetic inhibition of dopamine neurons mimics endogenous negative reward prediction errors. Nature neuroscience. 2016. 19 (1): 111. https://doi.org/10.1038/nn.4191

  23. Choi Y., Shin E.Y., Kim S. Spatiotemporal dissociation of fMRI activity in the caudate nucleus underlies human de novo motor skill learning. Proc Natl Acad Sci U S A. 2020. 117 (38): 23886–23897. https://doi.org/10.1073/pnas.2003963117

  24. Coddington L.T., Dudman J.T. The timing of action determines reward prediction signals in identified midbrain dopamine neurons. Nat Neurosci. 2018. 21(11): 1563–1573. https://doi.org/10.1038/s41593-018-0245-7

  25. Coddington L.T., Dudman J.T. Learning from Action: Reconsidering Movement Signaling in Midbrain Dopamine Neuron Activity. Neuron. 2019. 104 (1): 63–77. https://doi.org/10.1016/j.neuron.2019.08.036

  26. Cover K.K., Gyawali U., Kerkhoff W.G., Patton M.H., Mu C., White M.G., Marquardt A.E., Roberts B.M., Cheer J.F., Mathur B.N. Activation of the Rostral Intralaminar Thalamus Drives Reinforcement through Striatal Dopamine Release. Cell Rep. 2019. 26 (6): 1389–1398.e3. https://doi.org/10.1016/j.celrep.2019.01.044

  27. Crego A.C.G., Štoček F., Marchuk A.G., Carmichael J.E., van der Meer M.A.A., Smith K.S. Complementary Control over Habits and Behavioral Vigor by Phasic Activity in the Dorsolateral Striatum. J Neurosci. 2020. 40 (10): 2139–2153. https://doi.org/10.1523/JNEUROSCI.1313-19.2019

  28. Cui G., Jun S.B., Jin X., Pham M.D., Vogel S.S., Lovinger D.M., Costa R.M. Concurrent activation of striatal direct and indirect pathways during action initiation. Nature. 2013. 494 (7436): 238–242. https://doi.org/10.1038/nature11846

  29. Damodaran S., Evans R.C., Blackwell K.T. Synchronized firing of fast-spiking interneurons is critical to maintain balanced firing between direct and indirect pathway neurons of the striatum. J Neurophysiol. 2014. 111 (4): 836–48. https://doi.org/10.1152/jn.00382.2013

  30. Daw N.D. Are we of two minds? Nat Neurosci. 2018. 21 (11): 1497–1499. https://doi.org/10.1038/s41593-018-0258-2

  31. Desmurget M., Turner R.S. Motor sequences and the basal ganglia: kinematics, not habits. J Neurosci. 2010. 30 (22): 7685–90. https://doi.org/10.1523/JNEUROSCI.0163-10.2010

  32. Dhawale A.K., Miyamoto Y.R., Smith M.A., Ölveczky B.P. Adaptive Regulation of Motor Variability. Curr Biol. 2019. 29 (21): 3551–3562.e7. https://doi.org/10.1016/j.cub.2019.08.052

  33. Diao Z., Yao L., Cheng Q., Wu M., Di Y., Qian Z., Wei C., Liu Y., Tian Y., Ren W. Involvement of Midbrain Dopamine Neuron Activity in Negative Reinforcement Learning in Mice. Mol Neurobiol. 2021. 58 (11): 5667–5681. https://doi.org/10.1007/s12035-021-02515-6

  34. Dickinson A. Actions and habits: the development of behavioural autonomy Philosophical Transactions of the Royal Society of London. Series B, BiologicalSciences. 1985. 308 (1135): 67–78.

  35. Dodson P.D., Dreyer J.K., Jennings K.A., Syed E.C., Wade-Martins R., Cragg S.J., Bolam J.P., Magill P.J. Representation of spontaneous movement by dopaminergic neurons is cell-type selective and disrupted in parkinsonism. Proceedings of the National Academy of Sciences. 2016. 113 (15). P. E2180–E2188. https://doi.org/10.1073/pnas.1515941113

  36. Dudman J.T., Krakauer J.W. The basal ganglia: from motor commands to the control of vigor. Curr Opin Neurobiol. 2016. 37: 158–166. https://doi.org/10.1016/j.conb.2016.02.005

  37. Durieux P.F., Schiffmann S.N., de Kerchove d’Exaerde A. Differential regulation of motor control and response to dopaminergic drugs by D1R and D2R neurons in distinct dorsal striatum subregions. EMBO J. 2012. 31 (3): 640–653. https://doi.org/10.1038/emboj.2011.400

  38. Edlow B.L., Haynes R.L., Takahashi E., Klein J.P., Cummings P., Benner T., Greer D.M., Greenberg S.M., Wu O., Kinney H.C., Folkerth R.D. Disconnection of the ascending arousal system in traumatic coma. J Neuropathol Exp Neurol. 2013. 72 (6): 505–23. https://doi.org/10.1097/NEN.0b013e3182945bf6

  39. Engelhard B., Finkelstein J., Cox J., Fleming W., Jang H.J., Ornelas S., Koay S.A., Thiberge S.Y., Daw N.D., Tank D.W., Witten I.B. Specialized coding of sensory, motor and cognitive variables in VTA dopamine neurons. Nature. 2019. 570 (7762): 509–513. https://doi.org/10.1038/s41586-019-1261-9

  40. Eshel N., Tian J., Bukwich M., Uchida N. Dopamine neurons share common response function for reward prediction error. Nat Neurosci. 2016. 19 (3): 479–86. https://doi.org/10.1038/nn.4239

  41. Evans R.C., Twedell E.L., Zhu M., Ascencio J., Zhang R., Khaliq Z.M. Functional Dissection of Basal Ganglia Inhibitory Inputs onto Substantia Nigra Dopaminergic Neurons. Cell Rep. 2020. 32 (11): 108156. https://doi.org/10.1016/j.celrep.2020.108156

  42. Flagel S.B., Clark J.J., Robinson T.E., Mayo L., Czuj A., Willuhn I., Akers C.A., Clinton S.M., Phillips P.E., Akil H. A selective role for dopamine in stimulus-reward learning. Nature. 2011. 469 (7328): 53–7. https://doi.org/10.1038/nature09588

  43. Galaj E., Ranaldi R. Neurobiology of reward-related learning. Neurosci Biobehav Rev. 2021. 124: 224–234. https://doi.org/10.1016/j.neubiorev.2021.02.007

  44. Garr E., Delamater A.R. Exploring the relationship between actions, habits, and automaticity in an action sequence task. Learn Mem. 2019. 26 (4): 128–132. https://doi.org/10.1101/lm.048645.118

  45. Garr E., Delamater A.R. Chemogenetic inhibition in the dorsal striatum reveals regional specificity of direct and indirect pathway control of action sequencing. Neurobiol Learn Mem. 2020. 169: 107169. https://doi.org/10.1016/j.nlm.2020.107169

  46. Geddes C.E., Li H., Jin X. Optogenetic Editing Reveals the Hierarchical Organization of Learned Action Sequences. Cell. 2018. 174 (1): 32–43.e15. https://doi.org/10.1016/j.cell.2018.06.012

  47. Gerfen C.R., Surmeier D.J. Modulation of striatal projection systems by dopamine. Annual review of neuroscience. 2011. 34: 441–466.

  48. Goodman J., Packard M.G. There Is More Than One Kind of Extinction Learning. Front Syst Neurosci. 2019. 13: 16. https://doi.org/10.3389/fnsys.2019.00016

  49. Graybiel A.M. Habits, rituals, and the evaluative brain. Annu Rev Neurosci. 2008. 31: 359–87. https://doi.org/10.1146/annurev.neuro.29.051605.112851

  50. Graybiel A.M., Grafton S.T. The striatum: where skills and habits meet. Cold Spring Harb Perspect Biol. 2015. 7 (8): a021691. https://doi.org/10.1101/cshperspect.a021691

  51. Hamid A.A., Pettibone J.R., Mabrouk O.S., Hetrick V.L., Schmidt R., Vander Weele C.M., Kennedy R.T., Aragona B.J., Berke J.D. Mesolimbic dopamine signals the value of work. Nat Neurosci. 2016. 19 (1): 117–26. https://doi.org/10.1038/nn.4173

  52. Hamid A.A., Frank M.J., Moore C.I. Wave-like dopamine dynamics as a mechanism for spatiotemporal credit assignment. Cell. 2021. 184 (10): 2733–2749.e16. https://doi.org/10.1016/j.cell.2021.03.046

  53. Hammond L.J. The effect of contingency upon the appetitive conditioning of free-operant behavior. J Exp Anal Behav. 1980. 34 (3): 297–304. https://doi.org/10.1901/jeab.1980.34-297

  54. Hardwick R.M., Forrence A.D., Krakauer J.W., Haith A.M. Time-dependent competition between goal-directed and habitual response preparation. Nat Hum Behav. 2019. 3 (12): 1252–1262. https://doi.org/10.1038/s41562-019-0725-0

  55. Hartmann C., Lazar A., Nessler B., Triesch J. Where’s the Noise? Key Features of Spontaneous Activity and Neural Variability Arise through Learning in a Deterministic Network. PLoS Comput Biol. 2015. 11 (12): e1004640. https://doi.org/10.1371/journal.pcbi.1004640

  56. Hawes S.L., Evans R.C., Unruh B.A., Benkert E.E., Gillani F., Dumas T.C., Blackwell K.T. Multimodal Plasticity in Dorsal Striatum While Learning a Lateralized Navigation Task. J Neurosci. 2015. 35 (29): 10535–49. https://doi.org/10.1523/JNEUROSCI.4415-14.2015

  57. Hernandez L.F., Obeso I., Costa R.M., Redgrave P., Obeso J.A. Dopaminergic Vulnerability in Parkinson Disease: The Cost of Humans’ Habitual Performance. Trends Neurosci. 2019. 42 (6): 375–383. https://doi.org/10.1016/j.tins.2019.03.007

  58. Hikosaka O., Takikawa Y., Kawagoe R. Role of the basal ganglia in the control of purposive saccadic eye movements. Physiol Rev. 2000. 80: 953–978.

  59. Hikosaka O., Kim H.F., Amita H., Yasuda M., Isoda M., Tachibana Y., Yoshida A. Direct and indirect pathways for choosing objects and actions. Eur J Neurosci. 2019. 49 (5): 637–645. https://doi.org/10.1111/ejn.13876

  60. Hikosaka O., Yasuda M., Nakamura K., Isoda M., Kim H.F., Terao Y., Amita H., Maeda K. Multiple neuronal circuits for variable object-action choices based on short- and long-term memories. Proc Natl Acad Sci U S A. 2019. 116 (52): 26313–20. https://doi.org/10.1073/pnas.1902283116

  61. Hintiryan H., Foster N.N., Bowman I., Bay M., Song M.Y., Gou L., Yamashita S., Bienkowski M.S., Zingg B., Zhu M., Yang X.W., Shih J.C., Toga A.W., Dong H.W. The mouse cortico-striatal projectome. Nat Neurosci. 2016. 19 (8): 1100–1114. https://doi.org/10.1038/nn.4332

  62. Hormigo S., Zhou J., Chabbert D., Shanmugasundaram B., Castro-Alamancos M.A. Basal Ganglia Output Has a Permissive Non-Driving Role in a Signaled Locomotor Action Mediated by the Midbrain. J Neurosci. 2021. 41 (7): 1529–1552. https://doi.org/10.1523/JNEUROSCI.1067-20.2020

  63. Howard C.D., Li H., Geddes C.E., Jin X. Dynamic Nigrostriatal Dopamine Biases Action Selection. Neuron. 2017. 93 (6): 1436–1450.e8. https://doi.org/10.1016/j.neuron.2017.02.029

  64. Howe M.W., Tierney P.L., Sandberg S.G., Phillips P.E., Graybiel A.M. Prolonged dopamine signalling in striatum signals proximity and value of distant rewards. Nature. 2013. 500 (7464): 575–579. https://doi.org/10.1038/nature12475

  65. Howe M.W., Dombeck D.A. Rapid signalling in distinct dopaminergic axons during locomotion and reward. Nature. 2016. 535 (7613): 505–510. https://doi.org/10.1038/nature18942

  66. Hughes R.N., Bakhurin K.I., Petter E.A., Watson G.D.R., Kim N., Friedman A.D., Yin H.H. Ventral Tegmental Dopamine Neurons Control the Impulse Vector during Motivated Behavior. Curr Biol. 2020. 30 (14): 2681–2694.e5. https://doi.org/10.1016/j.cub.2020.05.003

  67. Isomura Y., Takekawa T., Harukuni R., Handa T., Aizawa H., Takada M., Fukai T. Reward-modulated motor information in identified striatum neurons. J Neurosci. 2013. 33 (25): 10209–20. https://doi.org/10.1523/JNEUROSCI.0381-13.2013

  68. Ivlieva N.Y., Timofeeva N.O., Ivliev D.A. The Dopamine Impels Us to Action as Suggested by the Neuronal Activity in the Ventral Tegmental Area during Avoidance Conditioning. The Russian Journal of Cognitive Science. 2014. 1 (1–2): 54–64.

  69. Jenrette T.A., Logue J.B., Horner K.A. Lesions of the Patch Compartment of Dorsolateral Striatum Disrupt Stimulus-Response Learning. Neuroscience. 2019. 415: 161–172. https://doi.org/10.1016/j.neuroscience.2019.07.033

  70. Jin X., Costa R.M. Start/stop signals emerge in nigrostriatal circuits during sequence learning. Nature. 2010.466: 457–462. https://doi.org/10.1038/nature09263

  71. Jin X., Tecuapetla F., Costa R.M. Basal ganglia subcircuits distinctively encode the parsing and concatenation of action sequences. Nat Neurosci. 2014. 17 (3): 423–30. https://doi.org/10.1038/nn.3632

  72. Kato S., Fukabori R., Nishizawa K., Okada K., Yoshioka N., Sugawara M., Maejima Y., Shimomura K., Okamoto M., Eifuku S., Kobayashi K. Action Selection and Flexible Switching Controlled by the Intralaminar Thalamic Neurons. Cell Rep. 2018. 22 (9): 2370–2382. https://doi.org/10.1016/j.celrep.2018.02.016

  73. Kent K., Deng Q., McNeill T.H. Unilateral skill acquisition induces bilateral NMDA receptor subunit composition shifts in the rat sensorimotor striatum. Brain Res. 2013. 1517: 77–86. https://doi.org/10.1016/j.brainres.2013.04.021

  74. Kim H.F., Ghazizadeh A., Hikosaka O. Separate groups of dopamine neurons innervate caudate head and tail encoding flexible and stable value memories. Front. Neuroanat. 2014. 8. 120. https://doi.org/10.3389/fnana.2014.00120

  75. Kim H.F., Ghazizadeh A., Hikosaka O. Dopamine Neurons Encoding Long-Term Memory of Object Value for Habitual Behavior. Cell. 2015. 163 (5): 1165–1175. https://doi.org/10.1016/j.cell.2015.10.063

  76. Kim H.F., Hikosaka O. Parallel basal ganglia circuits for voluntary and automatic behaviour to reach rewards. Brain. 2015. 138 (Pt 7): 1776–800. https://doi.org/10.1093/brain/awv134

  77. Kim H.F., Amita H., Hikosaka O. Indirect Pathway of Caudal Basal Ganglia for Rejection of Valueless Visual Objects. Neuron. 2017. 94 (4): 920–930.e3. https://doi.org/10.1016/j.neuron.2017.04.033

  78. Klugah-Brown B., Di X., Zweerings J., Mathiak K., Becker B., Biswal B. Common and separable neural alterations in substance use disorders: A coordinate-based meta-analyses of functional neuroimaging studies in humans. Hum Brain Mapp. 2020. 41 (16): 4459–4477. https://doi.org/10.1002/hbm.25085

  79. Knowlton B.J., Patterson T.K. Habit Formation and the Striatum. Curr Top Behav Neurosci. 2018. 37: 275–295. https://doi.org/10.1007/7854_2016_451

  80. Krakauer J.W., Ghilardi M.F., Ghez C. Independent learning of internal models for kinematic and dynamic control of reaching. Nat Neurosci. 1999. 2 (11): 1026–31. https://doi.org/10.1038/14826

  81. Krakauer J.W., Hadjiosif A.M., Xu J., Wong A.L., Haith A.M. Motor Learning. Compr Physiol. 2019. 9 (2): 613–663. https://doi.org/10.1002/cphy.c170043

  82. Kravitz A.V., Tye L.D., Kreitzer A.C. Distinct roles for direct and indirect pathway striatal neurons in reinforcement. Nat Neurosci. 2012. 15(6): 816-8. https://doi.org/10.1038/nn.3100

  83. Kunimatsu J., Yamamoto S., Maeda K., Hikosaka O. Environment-based object values learned by local network in the striatum tail. Proc Natl Acad Sci U S A. 2021. 118 (4): e2013623118. https://doi.org/10.1073/pnas.2013623118

  84. Kupferschmidt D.A., Juczewski K., Cui G., Johnson K.A., Lovinger D.M. Parallel, but Dissociable, Processing in Discrete Corticostriatal Inputs Encodes Skill Learning. Neuron. 2017. 96 (2): 476–489.e5. https://doi.org/10.1016/j.neuron.2017.09.040

  85. Kutlu M.G., Zachry J.E., Melugin P.R., Cajigas S.A., Chevee M.F., Kelly S.J., Kutlu B., Tian L., Siciliano C.A., Calipari E.S. Dopamine release in the nucleus accumbens core signals perceived saliency. Curr Biol. 2021.31 (21): 4748–4761.e8. https://doi.org/10.1016/j.cub.2021.08.052

  86. Kwak S., Jung M.W. Distinct roles of striatal direct and indirect pathways in value-based decision making. Elife. 2019. 8: e46050. https://doi.org/10.7554/eLife.46050

  87. Laurent M., De Backer J.F., Rial D., Schiffmann S.N., de Kerchove d’Exaerde A. Bidirectional Control of Reversal in a Dual Action Task by Direct and Indirect Pathway Activation in the Dorsolateral Striatum in Mice. Front Behav Neurosci. 2017. 11: 256. https://doi.org/10.3389/fnbeh.2017.00256

  88. Lee R.S., Mattar M.G., Parker N.F., Witten I.B., Daw N.D. Reward prediction error does not explain movement selectivity in DMS-projecting dopamine neurons. Elife. 2019. 8: e42992. https://doi.org/10.7554/eLife.42992

  89. Lee K., Claar L.D., Hachisuka A., Bakhurin K.I., Nguyen J., Trott J.M., Gill J.L., Masmanidis S.C. Temporally restricted dopaminergic control of reward-conditioned movements. Nat Neurosci. 2020. 23 (2): 209–216. https://doi.org/10.1038/s41593-019-0567-0

  90. Lee S.J., Lodder B., Chen Y., Patriarchi T., Tian L., Sabatini B.L. Cell-type-specific asynchronous modulation of PKA by dopamine in learning. Nature. 2021. 590 (7846): 451–456. https://doi.org/10.1038/s41586-020-03050-5

  91. Lemke S.M., Ramanathan D.S., Guo L., Won S.J., Ganguly K. Emergent modular neural control drives coordinated motor actions. Nat Neurosci. 2019. 22 (7): 1122–1131. https://doi.org/10.1038/s41593-019-0407-2

  92. Lemos J.C., Friend D.M., Kaplan A.R., Shin J.H., Rubinstein M., Kravitz A.V., Alvarez V.A. Enhanced GABA Transmission Drives Bradykinesia Following Loss of Dopamine D2 Receptor Signaling. Neuron. 2016. 90 (4): 824–838. https://doi.org/10.1016/j.neuron.2016.04.040

  93. Lipton D.M., Gonzales B.J., Citri A. Dorsal Striatal Circuits for Habits, Compulsions and Addictions. Front Syst Neurosci. 2019. 13: 28. https://doi.org/10.3389/fnsys.2019.00028

  94. Lopez-Huerta V.G., Denton J.A., Nakano Y., Jaidar O., Garcia-Munoz M., Arbuthnott G.W. Striatal bilateral control of skilled forelimb movement. Cell Rep. 2021. 34 (3): 108651. https://doi.org/10.1016/j.celrep.2020.108651

  95. Malvaez M. Neural substrates of habit. J Neurosci Res. 2020. 98 (6): 986–997. https://doi.org/10.1002/jnr.24552

  96. Martiros N., Burgess A.A., Graybiel A.M. Inversely Active Striatal Projection Neurons and Interneurons Selectively Delimit Useful Behavioral Sequences. Curr Biol. 2018. 28 (4): 560–573.e5. https://doi.org/10.1016/j.cub.2018.01.031

  97. Matamales M., McGovern A.E., Mi J.D., Mazzone S.B., Balleine B.W., Bertran-Gonzalez J. Local D2- to D1-neuron transmodulation updates goal-directed learning in the striatum. Science. 2020. 367 (6477): 549–555. https://doi.org/10.1126/science.aaz5751

  98. Matsumoto M., Hikosaka O. Two types of dopamine neuron distinctly convey positive and negative motivational signals. Nature. 2009. 459: 837–841. https://doi.org/10.1038/nature08028

  99. Mawase F., Uehara S., Bastian A.J., Celnik P. Motor Learning Enhances Use-Dependent Plasticity. J Neurosci. 2017. 37 (10): 2673–2685. https://doi.org/10.1523/JNEUROSCI.3303-16.2017

  100. Menegas W., Akiti K., Amo R., Uchida N., Watabe-Uchida M. Dopamine neurons projecting to the posterior striatum reinforce avoidance of threatening stimuli. Nat Neurosci. 2018. 21 (10): 1421–1430. https://doi.org/10.1038/s41593-018-0222-1

  101. Mohebi A., Pettibone J.R., Hamid A.A., Wong J.T., Vinson L.T., Patriarchi T., Tian L., Kennedy R.T., Berke J.D. Dissociable dopamine dynamics for learning and motivation. Nature. 2019. 570 (7759): 65–70. https://doi.org/10.1038/s41586-019-1235-y

  102. Nadel J.A., Pawelko S.S., Copes-Finke D., Neidhart M., Howard C.D. Lesion of striatal patches disrupts habitual behaviors and increases behavioral variability. PLoS One. 2020. 15 (1): e0224715. https://doi.org/10.1371/journal.pone.0224715

  103. Nakamura T., Nagata M., Yagi T., Graybiel A.M., Yamamori T., Kitsukawa T. Learning new sequential stepping patterns requires striatal plasticity during the earliest phase of acquisition. Eur J Neurosci. 2017. 45(7): 901–911. https://doi.org/10.1111/ejn.13537

  104. Nakayama H., Ibañez-Tallon I., Heintz N. Cell-Type-Specific Contributions of Medial Prefrontal Neurons to Flexible Behaviors. J Neurosci. 2018. 38 (19): 4490–4504. https://doi.org/10.1523/JNEUROSCI.3537-17.2018

  105. Nisanov R., Schelbaum E., Morris D., Ranaldi R. CaMKII antagonism in the ventral tegmental area impairs acquisition of conditioned approach learning in rats. Neurobiol Learn Mem. 2020. 175: 107299. https://doi.org/10.1016/j.nlm.2020.107299

  106. Nonomura S., Nishizawa K., Sakai Y., Kawaguchi Y., Kato S., Uchigashima M., Watanabe M., Yamanaka K., Enomoto K., Chiken S., Sano H., Soma S., Yoshida J., Samejima K., Ogawa M., Kobayashi K., Nambu A., Isomura Y., Kimura M. Monitoring and Updating of Action Selection for Goal-Directed Behavior through the Striatal Direct and Indirect Pathways. Neuron. 2018. 99 (6): 1302–1314.e5. https://doi.org/10.1016/j.neuron.2018.08.002

  107. Oldenburg I.A., Sabatini B.L. Antagonistic but Not Symmetric Regulation of Primary Motor Cortex by Basal Ganglia Direct and Indirect Pathways. Neuron. 2015. 86 (5): 1174–81. https://doi.org/10.1016/j.neuron.2015.05.008

  108. O’Hare J.K., Ade K.K., Sukharnikova T., Van Hooser S.D., Palmeri M.L., Yin H.H., Calakos N. Pathway-Specific Striatal Substrates for Habitual Behavior. Neuron. 2016. 89 (3): 472–9. https://doi.org/10.1016/j.neuron.2015.12.032

  109. Oleson E.B., Gentry R.N., Chioma V.C., Cheer J.F. Subsecond dopamine release in the nucleus accumbens predicts conditioned punishment and its successful avoidance. J Neurosci. 2012. 32 (42): 14804–8. https://doi.org/10.1523/JNEUROSCI.3087-12.2012

  110. Owesson-White C., Belle A.M., Herr N.R., Peele J.L., Gowrishankar P., Carelli R.M., Wightman R.M. Cue-Evoked Dopamine Release Rapidly Modulates D2 Neurons in the Nucleus Accumbens During Motivated Behavior. J Neurosci. 2016. 36 (22): 6011–21. https://doi.org/10.1523/JNEUROSCI.0393-16.2016

  111. Packard M.G., McGaugh J.L. Inactivation of hippocampus or caudate nucleus with lidocaine differentially affects expression of place and response learning. Neurobiol Learn Mem. 1996. 65: 65–72. https://doi.org/10.1006/nlme.1996.0007

  112. Parker N.F., Cameron C.M., Taliaferro J.P., Lee J., Choi J.Y., Davidson T.J., Daw N.D., Witten I.B. Reward and choice encoding in terminals of midbrain dopamine neurons depends on striatal target. Nat Neurosci. 2016. 19 (6): 845–54. https://doi.org/10.1038/nn.4287

  113. Parker J.G., Marshall J.D., Ahanonu B., Wu Y.W., Kim T.H., Grewe B.F., Zhang Y., Li J.Z., Ding J.B., Ehlers M.D., Schnitzer M.J. Diametric neural ensemble dynamics in parkinsonian and dyskinetic states. Nature. 2018. 557 (7704): 177–182. https://doi.org/10.1038/s41586-018-0090-6

  114. Pasquereau B., Turner R.S. Dopamine neurons encode errors in predicting movement trigger occurrence. Journal of neurophysiology. 2014. 113 (4): 1110–1123.

  115. Peak J., Hart G., Balleine B.W. From learning to action: the integration of dorsal striatal input and output pathways in instrumental conditioning. Eur J Neurosci. 2019. 49 (5): 658–671. https://doi.org/10.1111/ejn.13964

  116. Pinsard B., Boutin A., Gabitov E., Lungu O., Benali H., Doyon J. Consolidation alters motor sequence-specific distributed representations. Elife. 2019. 8: e39324. https://doi.org/10.7554/eLife.39324

  117. Poulin J.F., Caronia G., Hofer C., Cui Q., Helm B., Ramakrishnan C., Chan C.S., Dombeck D.A., Deisseroth K., Awatramani R. Mapping projections of molecularly defined dopamine neuron subtypes using intersectional genetic approaches. Nat Neurosci. 2018. 21 (9): 1260–1271. https://doi.org/10.1038/s41593-018-0203-4

  118. Reig R., Silberberg G. Multisensory integration in the mouse striatum. Neuron. 2014 Sep 3; 83 (5): 1200–12. https://doi.org/10.1016/j.neuron.2014.07.033

  119. Richfield E.K., Penney J.B., Young A. B. Anatomical and affinity state comparisons between dopamine D1 and D2 receptors in the rat central nervous system. Neuroscience. 1989. 30 (3): 767–777.

  120. Rothwell P.E., Hayton S.J., Sun G.L., Fuccillo M.V., Lim B.K., Malenka R.C. Input- and Output-Specific Regulation of Serial Order Performance by Corticostriatal Circuits. Neuron. 2015. 88 (2): 345–56. https://doi.org/10.1016/j.neuron.2015.09.035

  121. Rueda-Orozco P.E., Robbe D. The striatum multiplexes contextual and kinematic information to constrain motor habits execution. Nat Neurosci. 2015. 18 (3): 453–60. https://doi.org/10.1038/nn.3924

  122. Sales-Carbonell C., Taouali W., Khalki L., Pasquet M.O., Petit L.F., Moreau T., Rueda-Orozco P.E., Robbe D. No Discrete Start/Stop Signals in the Dorsal Striatum of Mice Performing a Learned Action. Curr Biol. 2018. 28 (19): 3044–3055.e5. https://doi.org/10.1016/j.cub.2018.07.038

  123. Saund J., Dautan D., Rostron C., Urcelay G.P., Gerdjikov T.V. Thalamic inputs to dorsomedial striatum are involved in inhibitory control: evidence from the five-choice serial reaction time task in rats. Psychopharmacology (Berl). 2017. 234 (16): 2399–2407. https://doi.org/10.1007/s00213-017-4627-4

  124. Saunders B.T., Richard J.M., Margolis E.B., Janak P.H. Dopamine neurons create Pavlovian conditioned stimuli with circuit-defined motivational properties. Nat Neurosci. 2018. 21 (8): 1072–1083. https://doi.org/10.1038/s41593-018-0191-4

  125. Schiff N.D., Giacino J.T., Kalmar K., Victor J.D., Baker K., Gerber M., Fritz B., Eisenberg B., Biondi T., O’Connor J., Kobylarz E.J., Farris S., Machado A., McCagg C., Plum F., Fins J.J., Rezai A.R. Behavioural improvements with thalamic stimulation after severe traumatic brain injury. Nature. 2007. 448 (7153): 600–3. https://doi.org/10.1038/nature06041

  126. Schreiner D.C., Renteria R., Gremel C.M. Fractionating the all-or-nothing definition of goal-directed and habitual decision-making. J Neurosci Res. 2020. 98 (6): 998–1006. https://doi.org/10.1002/jnr.24545

  127. Schultz W., Ruffieux A., Aebischer P. The activity of pars compacta neurons of the monkey substantia nigra in relation to motor activation. Exp Brain Res. 1983. 51: 377–387.

  128. Schultz W. Updating dopamine reward signals. Current opinion in neurobiology. 2013. 23 (2): 229–238.

  129. Shan Q., Ge M., Christie M.J., Balleine B.W. The acquisition of goal-directed actions generates opposing plasticity in direct and indirect pathways in dorsomedial striatum. J Neurosci. 2014. 34: 9196–9201.

  130. Shen W., Flajolet M., Greengard P., Surmeier D. J. Dichotomous dopaminergic control of striatal synaptic plasticity. Science. 2008. 321 (5890): 848–851. https://doi.org/10.1126/science.1160575

  131. Sheng M.J., Lu D., Shen Z.M., Poo M.M. Emergence of stable striatal D1R and D2R neuronal ensembles with distinct firing sequence during motor learning. Proc Natl Acad Sci U S A. 2019. 116 (22): 11038–11047. https://doi.org/10.1073/pnas.1901712116

  132. Shin J.H., Kim D., Jung M.W. Differential coding of reward and movement information in the dorsomedial striatal direct and indirect pathways. Nat Commun. 2018. 9(1):404. https://doi.org/10.1038/s41467-017-02817-1

  133. Shin J.H., Song M., Paik S.B., Jung M.W. Spatial organization of functional clusters representing reward and movement information in the striatal direct and indirect pathways. Proc Natl Acad Sci U S A. 2020. 117 (43): 27004–27015. https://doi.org/10.1073/pnas.2010361117

  134. Sigurdsson H.P., Jackson S.R., Kim S., Dyke K., Jackson G.M. A feasibility study for somatomotor cortical mapping in Tourette syndrome using neuronavigated transcranial magnetic stimulation. Cortex. 2020. 129: 175–187. https://doi.org/10.1016/j.cortex.2020.04.014

  135. da Silva J.A. Tecuapetla F., Paixão V., Costa R.M. Dopamine neuron activity before action initiation gates and invigorates future movements. Nature. 2018. 554 (7691): 244–248. https://doi.org/10.1038/nature25457

  136. Simmons D.V., Higgs M.H., Lebby S., Wilson C.J. Indirect pathway control of firing rate and pattern in the substantia nigra pars reticulata. J Neurophysiol. 2020. 123 (2): 800–814. https://doi.org/10.1152/jn.00678.2019

  137. Sippy T., Lapray D., Crochet S., Petersen C.C. Cell-Type-Specific Sensorimotor Processing in Striatal Projection Neurons during Goal-Directed Behavior. Neuron. 2015. 88 (2): 298–305. https://doi.org/10.1016/j.neuron.2015.08.039

  138. Smith K.S., Graybiel A.M. A dual operator view of habitual behavior reflecting cortical and striatal dynamics. Neuron. 2013. 79 (2): 361–74. https://doi.org/10.1016/j.neuron.2013.05.038

  139. Sommer W.H., Costa R.M., Hansson A.C. Dopamine systems adaptation during acquisition and consolidation of a skill. Front Integr Neurosci. 2014. 8: 87. https://doi.org/10.3389/fnint.2014.00087

  140. Steinberg E.E., Keiflin R., Boivin J.R., Witten I.B., Deisseroth K., Janak P.H. A causal link between prediction errors, dopamine neurons and learning. Nature neuroscience. 2013. 16 (7): 966–973. https://doi.org/10.1038/nn.3413

  141. Syed E.C., Grima L.L., Magill P.J., Bogacz R., Brown P., Walton M.E. Action initiation shapes mesolimbic dopamine encoding of future rewards. Nat Neurosci. 2016. 19 (1): 34–36. https://doi.org/10.1038/nn.4187

  142. Tecuapetla F., Jin X., Lima S.Q., Costa R.M. Complementary Contributions of Striatal Projection Pathways to Action Initiation and Execution. Cell. 2016 Jul 28; 166 (3): 703–715. https://doi.org/10.1016/j.cell.2016.06.032

  143. Threlfell S., Lalic T., Platt N.J., Jennings K.A., Deisseroth K., Cragg S.J. Striatal dopamine release is triggered by synchronized activity in cholinergic interneurons. Neuron. 2012. 75 (1): 58–64. https://doi.org/10.1016/j.neuron.2012.04.038

  144. Thura D., Cisek P. The Basal Ganglia Do Not Select Reach Targets but Control the Urgency of Commitment. Neuron. 2017. 95 (5): 1160–1170.e5. https://doi.org/10.1016/j.neuron.2017.07.039

  145. Tye K.M., Mirzabekov J.J., Warden M.R., Ferenczi E.A., Tsai H.C., Finkelstein J., Kim S.Y., Adhikari A., Thompson K.R., Andalman A.S., Gunaydin L.A., Witten I.B., Deisseroth K. Dopamine neurons modulate neural encoding and expression of depression-related behavior. Nature. 2013. 493 (7433): 537–541. https://doi.org/10.1038/nature11740

  146. Ueda Y., Yamanaka K., Noritake A., Enomoto K., Matsumoto N., Yamada H., Samejima K., Inokawa H., Hori Y., Nakamura K., Kimura M. Distinct Functions of the Primate Putamen Direct and Indirect Pathways in Adaptive Outcome-Based Action Selection. Front Neuroanat. 2017. 11: 66. https://doi.org/10.3389/fnana.2017.00066

  147. Vandaele Y., Mahajan N.R., Ottenheimer D.J., Richard J.M., Mysore S.P., Janak P.H. Distinct recruitment of dorsomedial and dorsolateral striatum erodes with extended training. Elife. 2019. 8: e49536. https://doi.org/10.7554/eLife.49536

  148. Vicente A.M., Galvão-Ferreira P., Tecuapetla F., Costa R.M. Direct and indirect dorsolateral striatum pathways reinforce different action strategies. Curr Biol. 2016. 26 (7): R267–9. https://doi.org/10.1016/j.cub.2016.02.036

  149. Wang Y., Qin Y., Li H., Yao D., Sun B., Li Z., Li X., Dai Y., Wen C., Zhang L., Zhang C., Zhu T., Luo C. The Modulation of Reward and Habit Systems by Acupuncture in Adolescents with Internet Addiction. Neural Plast. 2020 Mar 13; 2020: 7409417. https://doi.org/10.1155/2020/7409417

  150. Watabe-Uchida M., Eshel N., Uchida N. Neural Circuitry of Reward Prediction Error. Annu Rev Neurosci. 2017. 40: 373–394.

  151. Xiao L., Chattree G., Oscos F.G., Cao M., Wanat M.J., Roberts T.F. A Basal Ganglia Circuit Sufficient to Guide Birdsong Learning. Neuron. 2018 Apr 4; 98 (1): 208–221.e5. https://doi.org/10.1016/j.neuron.2018.02.020

  152. Xiao X., Deng H., Furlan A., Yang T., Zhang X., Hwang G.R., Tucciarone J., Wu P., He M., Palaniswamy R., Ramakrishnan C., Ritola K., Hantman A., Deisseroth K., Osten P., Huang Z.J., Li B. A Genetically Defined Compartmentalized Striatal Direct Pathway for Negative Reinforcement. Cell. 2020. 183 (1): 211–227.e20. https://doi.org/10.1016/j.cell.2020.08.032

  153. Yagishita S., Hayashi-Takagi A., Ellis-Davies G.C.R., Urakubo H., Ishii S., Kasai H: A critical time window for dopamine actions on the structural plasticity of dendritic spines. Science 2014. 345: 1616–1620.

  154. Yapo C., Nair A.G., Clement L., Castro L.R., Hellgren Kotaleski J., Vincent P. Detection of phasic dopamine by D1 and D2 striatal medium spiny neurons. J Physiol. 2017. 595 (24): 7451–7475. https://doi.org/10.1113/JP274475

  155. Yasuda M., Hikosaka O. Functional territories in primate substantia nigra pars reticulata separately signaling stable and flexible values. J Neurophysiol. 2015. 113 (6): 1681–96. https://doi.org/10.1152/jn.00674.2014

  156. Yin H.H., Knowlton B.J. The role of the basal ganglia in habit formation. Nat Rev Neurosci. 2006 7 (6): 464–76. https://doi.org/10.1038/nrn1919

  157. Yin H.H., Mulcare S.P., Hilário M.R., Clouse E., Holloway T., Davis M.I., Hansson A.C., Lovinger D.M., Costa R.M. Dynamic reorganization of striatal circuits during the acquisition and consolidation of a skill. Nat Neurosci. 2009. 12 (3): 333–41. https://doi.org/10.1038/nn.2261

  158. Yttri E.A., Dudman J.T. Opponent and bidirectional control of movement velocity in the basal ganglia. Nature. 2016. 533 (7603): 402–6. https://doi.org/10.1038/nature17639

  159. Yu X., Chen S., Shan Q. Depression in the Direct Pathway of the Dorsomedial Striatum Permits the Formation of Habitual Action. Cereb Cortex. 2021. bhab031. https://doi.org/10.1093/cercor/bhab031

Дополнительные материалы отсутствуют.