Акустический журнал, 2021, T. 67, № 5, стр. 561-570

Разрешение гребенчатых спектров в зависимости от центральной частоты и ширины спектральной полосы звуковых стимулов

О. Н. Милехина a, Д. И. Нечаев a, М. С. Томозова a, А. Я. Супин a*

a Институт проблем экологии и эволюции РАН
119071 Москва, Ленинский просп. 33, Россия

* E-mail: alex_supin@mail.ru

Поступила в редакцию 04.03.2020
После доработки 28.04.2021
Принята к публикации 10.06.2021

Полный текст (PDF)

Аннотация

Звуковые стимулы с гребенчатыми спектрами используются для тестирования частотной разрешающей способности слуха. Получаемые оценки частотного разрешения зависят от центральной частоты и ширины спектральной полосы сигнала. Измерялось разрешение гребенчатой структуры спектра при различной центральной частоте и ширине частотной полосы сигнала и в двух схемах эксперимента: с использованием гребенчатого или плоского референтного сигналов. При гребенчатом референтном сигнале не было статистически значимой зависимости разрешения от центральной частоты и ширины спектральной полосы сигнала: во всех случаях разрешение было около 10 цикл/окт. При плоском (не гребенчатом) референтном сигнале разрешение гребенчатой структуры спектра существенно зависело как от центральной частоты тест-сигнала, так и от ширины его спектральной полосы: чем выше центральная частота и чем шире спектральная полоса, тем выше разрешение. Различие оценок разрешения, зависящее от используемого референтного сигнала, может быть объяснено разным участием механизма частотного анализа, основанного на профиле возбуждения, и временного механизма. Механизм, основанный на профиле возбуждения, эффективен для различения гребенчатого тест-сигнала и гребенчатого референтного сигнала. Механизм временного анализа эффективен для различения гребенчатого тест-сигнала и референтного сигнала с плоским спектром.

Ключевые слова: слух, гребенчатые спектры, частотный анализ

ВВЕДЕНИЕ

Звуковые стимулы с гребенчатыми спектрами, т.е. спектрами, содержащими периодически чередующиеся максимумы и минимумы спектральной плотности (спектральные “решетки”), используются как эффективные тест-сигналы для тестирования частотной разрешающей способности (ЧРС) слуха как у нормально слышащих испытуемых, так и у пациентов с ослабленным слухом или носителей кохлеарных имплантов. Однако при использовании таких тест-сигналов необходимо учитывать, что получаемые оценки частотного разрешения зависят от параметров сигнала, в том числе от центральной частоты и ширины спектральной полосы.

Первоначально восприятие сигналов с гребенчатыми спектрами исследовалось для широкополосных сигналов с постоянными частотными интервалами между гребнями [14]. Такой тип стимулов вызывает ощущение тональности, причем высота тональности соответствует частотному интервалу между гребнями (высота повторяемости, repetition pitch). Было показано [3], что высота повторяемости ощущается при частотных интервалах между гребнями спектра не менее 50 Гц, т.е. при плотности гребней не более 20 цикл/кГц. Этот предел может быть принят за оценку разрешения гребенчатой спектральной структуры для данного типа сигналов. Ощущение высоты повторяемости характерно именно для широкополосных сигналов и исчезает при сужении полосы сигнала.

Позже были предложены схемы экспериментов, в которых разрешение гребенчатой структуры спектра измерялось без оценки субъективных ощущений испытуемого (частоты повторяемости). Одна из схем измерения основывалась на различении между тест-сигналом с периодически меняющейся (инвертируемой) фазой гребней спектра и референтным сигналом с постоянной фазой гребней спектра. Такая схема измерения использовалась как при сигналах с постоянными частотными интервалами между гребнями спектра [57], так и при сигналах с частотно-пропорциональным рисунком гребенчатой структуры [8, 9]. В первом случае ширину частотной полосы сигнала меняли в соответствии с плотностью гребней, так чтобы в спектральной полосе всегда содержалось четыре цикла гребенчатого рисунка. Это делали с целью минимизировать неопределенность отнесения полученной оценки разрешения гребенчатой структуры к определенной частоте. В этих экспериментах разрешение гребенчатой структуры спектра оценивали в безразмерных единицах f0f, где f0 – центральная частота сигнала и δf – частотный интервал между соседними гребнями. Выраженное в таких единицах, разрешение гребенчатой структуры спектра было оценено от 12.0 на центральной частоте сигнала 1 кГц до 16.4 на частоте 8 кГц. Другая форма тест-сигналов – гребенчатые спектры с частотно-пропорциональными интервалами между гребнями. Для таких сигналов разрешение гребенчатой структуры спектра мало зависело от частоты сигнала; наблюдали лишь слабую тенденцию к снижению разрешения на частотах 2 и 4 кГц [7]. Однако в более поздней работе той же исследовательской группы было получено небольшое повышение ЧРС с частотой [10]. Общий результат и того, и другого исследования состоит в том, что зависимость от частоты, если имеется, то слабая. Эксперименты, в которых гребенчатые сигналы были использованы в качестве маскеров, также показали слабую зависимость порога маскировки от частотной полосы сигнала в диапазоне 200–800 Гц при центральной частоте 4 кГц [11].

Данные о зависимости ЧРС от ширины спектральной полосы сигнала имеют особое значение при использовании тест-сигналов с гребенчатым спектром для оценки ЧРС у пациентов с ослабленным слухом и у носителей кохлеарных имплантов. При восприятии звуков через кохлеарный имплант, как правило, ЧРС в несколько раз ниже, чем при нормальном слухе: не выше, чем несколько цикл/окт [1217]. При низкой плотности гребней частотная полоса сигнала, содержащая хотя бы несколько гребней спектра, не может быть узкой. Поэтому в большинстве экспериментов с измерением ЧРС у носителей кохлеарных имплантов использованы широкополосные тест-сигналы.

Все приведенные выше данные согласуются с моделью, согласно которой анализ гребенчатых спектров происходит в результате прохождения входного сигнала через гребенку частотно-избирательных фильтров. В результате этого формируется некоторый профиль возбуждения. В большей части частотного диапазона слуха полосы пропускания слуховых фильтров приблизительно пропорциональны характеристической частоте [18]. Если гребни спектра тест-сигнала также частотно-пропорциональны, изменение частотной полосы сигнала мало влияет на оценку ЧРС.

Помимо механизма, основанного на профиле возбуждения, в слуховой системе действует другой механизм, основанный на анализе временной структуры афферентного потока нервных импульсов, посылаемых слуховой улиткой в слуховые нервные центры (механизм временного анализа). Сигналы с гребенчатым спектром имеют скрытую временную организацию, на основе которой может функционировать механизм временного анализа. Возможность такого анализа гребенчатой структуры сигналов предполагалась, в частности, в исследованиях эффекта тональности повторяемости [1, 2, 1921]. Степень вовлеченности одного или другого механизма зависит от схемы эксперимента, в частности, от типа референтного сигнала, используемого в задаче различения. Если задача состоит в различении двух гребенчатых сигналов с разными рисунками фазы гребней, то более эффективен механизм профиля возбуждения. Если задача состоит в различении гребенчатого тест-сигнала и “плоского” (без гребенчатой структуры спектра) референтного сигнала, основную роль играет механизм временного анализа [2224]. Для более полного понимания влияния спектральной полосы на оценку ЧРС, это влияние должно быть исследовано в двух ситуациях: при доминировании механизма, основанного на профиле возбуждения, и механизма временного анализа.

В данной работе измеряли разрешение гребенчатой структуры спектра тест-сигналов при различной центральной частоте и ширине частотной полосы сигнала и в двух схемах эксперимента: с использованием гребенчатого или плоского референтного сигнала. Для схемы с гребенчатым референтным сигналом зависимость разрешения гребенчатой структуры спектра от ширины спектральной полосы была исследована ранее [7, 10]. Однако в данном исследовании эти измерения были повторены, чтобы иметь возможность корректного сравнения с данными, полученными при плоском референтном сигнале на одной и той же группе испытуемых и при идентичных условиях эксперимента.

МЕТОДИКА

Испытуемые и условия эксперимента

В работе участвовали восемь испытуемых (четверо мужчин и четыре женщины) в возрасте от 25 до 45 лет. Все испытуемые имели слуховые пороги не хуже 15 дБ в диапазоне частот от 0.5 до 8 кГц, в котором выполнялись измерения. Никто из испытуемых не имел истории нарушений слуха. Поэтому все они рассматривались как нормально слышащие. Все испытуемые имели опыт участия в психоакустических экспериментах, связанных с различением сложных тест-сигналов.

Во время измерения испытуемый находился в комфортной позе в кабине MINI 350 (IAC, Германия), которая обеспечивала заглушение внешних звуков на 40 дБ. Процедура измерений была одобрена этической комиссией Института проблем экологии и эволюции РАН при условии предъявления звуков интенсивностью до 70 дБ уровня звукового давления (УЗД) и ежедневного уровня экспозиции до 110 дБ относительно 1 мкПа2 с. Эти условия соответствовали Санитарной норме РФ СН2.2.4/2.1.8.562-96.

Сигналы

В экспериментах использованы два типа сигналов: тест и референтный. Тест-сигнал (рис. 1a) имел спектр, ограниченный одним периодом косинусоидальной функции от логарифма частоты. Спектр был центрирован на частоте 1, 2 или 4 кГц. Ширина косинусоидальной функции составляла 0.5, 1 или 2 окт. В пределах этой огибающей спектр содержал периодически чередующиеся максимумы и минимумы – гребни, описываемые также косинусоидальной функцией от логарифма частоты, т.е. гребни были частотно-пропорциональными. Глубина гребней была максимальной (индекс модуляции 1.0), т.е. в минимумах спектральная амплитуда падала до нуля. Каждые 400 мс происходила реверсия фазы гребней: положения спектральных максимумов и минимумов на частотной шкале взаимно сменяли друг друга. Сигнал содержал шесть сегментов с альтернативными фазами гребней, так что общая длительность сигнала составляла 2400 мс. Моменты включения и выключения сигнала имели пологие фронты длительностью 10 мс.

Рис. 1.

Примеры характеристик фильтров, используемых для цифровой генерации сигналов. Представлены фильтры с центральной частотой 2 кГц, шириной полосы пропускания 2 окт и плотностью гребней 5 цикл/окт. (а) – Фильтры для генерации тест-сигнала, 1 и 2 – альтернативные фильтры с противоположным положением максимумов и минимумов на шкале частот. На логарифмической шкале частот частотно-пропорциональные гребни выглядят как равномерные. (б) – Фильтр для генерации гребенчатого референтного сигнала; центральная частота, полоса пропускания и плотность гребней те же, что у тест-сигнала. (в) – Фильтр для генерации плоского референтного сигнала; центральная частота и полоса пропускания те же, что у тест-сигнала.

Референтный сигнал был либо гребенчатым (рис. 1б), либо плоским (без гребенчатой структуры спектра) (рис. 1в). Гребенчатый референтный сигнал имел те же огибающую, плотность и глубину гребней, фронты нарастания-спада и УЗД, что и тест-сигнал, но, в отличие от тест-сигнала, фаза гребней была постоянной в течение всей длительности, которая, как и у тест-сигнала, составляла 2400 мс.

Плоский референтный сигнал имел спектр, ограниченный одним периодом косинусоидальной функции от логарифма частоты, с той же центральной частотой и шириной спектральной полосы, что у тест-сигнала, однако не имел гребенчатой структуры спектра в пределах огибающей. Длительность сигнала, длительность фронтов нарастания-спада и УЗД были теми же, что у тест-сигнала (соответственно, 2400 и 10 мс и 70 дБ).

Все сигналы генерировали цифровым способом при частоте стробирования 32 кГц. Программа генерации состояла в том, что белый шум, представленный гауссовой последовательностью чисел, пропускался через цифровой фильтр, который задавал необходимый спектр сигнала, включая (если предусмотрено) гребенчатую структуру. Для генерации тест-сигнала использовали два фильтра с противоположными фазами гребней. Каждые 400 мс входная последовательность чисел перенаправлялась со входа одного фильтра на вход другого; выходы фильтров суммировались. При такой структуре программы не возникали широкополосные “всплески” (щелчки) в моменты переключений: ширина спектра сигнала не выходила за заданные фильтрами границы. Для генерации референтного сигнала использовали один фильтр – гребенчатый или плоский. После синтеза сигнала формировали его 10 мс фронты нарастания–спада, чем устранялись щелчки в моменты включения–выключения.

Генерацию сигналов выполняли стандартным персональным компьютером, используя программу (“виртуальный прибор”), созданную в программной оболочке LabVIEW (National Instruments, США). Сигналы, синтезированные в цифровом виде, переводили в аналоговую форму, используя 16-битный цифроаналоговый преобразователь карты сбора и обработки данных NI USB-6251 (National Instruments, США). Аналоговые сигналы воспроизводили диотически через головные телефоны HD580 Sennheiser (Германия). Для калибровки сигналов использовали симулятор уха RA0039 (G.R.A.S., Дания).

Процедура измерений

Измерения проводили по трехальтернативной процедуре с принудительным выбором, в сочетании с адаптивным варьированием плотности гребней. Каждое предъявление содержало три сигнала: один тестовый и два референтных. Каждый сигнал длился 2400 мс с 400 мс паузами между ними (рис. 2). Все сигналы генерировали непосредственно в ходе эксперимента (on-line), так что два референтных сигнала имели одинаковые параметры, но не были точной копией друг друга, а различались флуктуациями, свойственными шуму. Задача испытуемого состояла в том, чтобы определить, какой из трех сигналов отличается от двух других, т.е. обнаружить тест-сигнал.

Рис. 2.

Примеры сигналов, предъявляемых в процессе измерений. Центральная частота сигналов 2 кГц, ширина спектральной полосы 2 окт, плотность гребней 5 цикл/окт. (а) – Гребенчатые референтные сигналы, тест-сигнал – второй из трех предъявленных. (б) – Референтные сигналы с плоским спектром, тест-сигнал – первый из трех предъявленных. Т – тест-сигнал, Р – референтный сигнал.

Плотность гребней спектра тест-сигнала меняли от предъявления к предъявлению. Если референтный сигнал имел гребенчатый спектр, его плотность гребней также меняли, так что она была равна плотности гребней спектра тест-сигнала. Плотность гребней меняли ступенчато, используя следующие значения: 2, 3, 5, 7, 10, 15, 20, 30, 50, 70, 100 цикл/окт (квазилогарифмическая шкала, 6 ступеней на логарифмическую единицу). Плотность гребней меняли по адаптивному правилу “два–вверх, один–вниз”. В соответствии с этим правилом, после двух подряд правильных обнаружений тест-сигнала плотность гребней в следующем предъявлении повышали на один шаг; после каждой ошибки плотность гребней в следующем предъявлении понижали на один шаг. Такая процедура приводила варьируемый параметр (плотность гребней) к величине, обеспечивающей 71% вероятность обнаружения тест-сигнала [25]. Эта вероятность близка к среднему значению (67%) между безошибочным обнаружением тест-сигнала (100%) и случайным угадыванием при невозможности обнаружить тест-сигнал (33%), поэтому плотность гребней, обеспечивающая такую вероятность, принимали за порог. Адаптивное варьирование плотности гребней продолжали до получения 10 точек перегиба (переходов от повышения плотности гребней к понижению и обратно). Геометрическое среднее этих 10 точек принимали за оценку разрешения гребенчатой структуры спектра в данном эксперименте.

При каждой комбинации параметров сигнала (центральной частоты и ширины спектральной полосы) измерения повторяли трижды на каждом из 8 испытуемых. Среднее значение этих 24 измерений принимали за окончательную оценку разрешения, которую характеризовали также стандартным отклонением.

РЕЗУЛЬТАТЫ

Разрешение гребенчатой структуры спектра при гребенчатом референтном сигнале

Оценки разрешения, полученные при гребенчатом референтном сигнале, мало зависели как от центральной частоты, так и от ширины спектральной полосы сигнала (рис. 3а). Во всех случаях разрешение было около 10 цикл/окт.

Рис. 3.

ЧРС как функция ширины спектральной полосы при гребенчатых референтных сигналах; параметр – центральная частота сигнала. (а) – Плотность гребней выражена в цикл/окт. (б) – Плотность гребней представлена в количестве циклов в ЭПШ частотно-избирательного фильтра соответствующей частоты. Планки погрешностей – стандартные отклонения

Регрессионный анализ показал, что при всех частотах тест-сигнала (центральная частота 1, 2 или 4 кГц) не было статистически значимой зависимости разрешения от ширины спектральной полосы: для частот 1, 2 и 4 кГц наклон линии регрессии составлял соответственно 0.13, –0.15 и 0.25 (цикл/окт)/окт, и ни один из этих показателей статистически достоверно (по критерию 95% доверительного интервала) не отличался от нуля (табл. 1).

Таблица 1.  

Коэффициенты регрессии для зависимости ЧРС от ширины спектральной полосы сигнала для гребенчатого референтного сигнала. k – коэффициент регрессии, СО – стандартная ошибка для коэффициента регрессии. Нижняя граница 95% и верхняя граница 95% – границы 95% доверительного интервала для коэффициента регрессии. Ни один из коэффициентов регрессии не отличается статистически достоверно от нуля

Центральная частота k СО Нижняя граница 95% Верхняя граница 95%
1 кГц 0.132 0.195 –0.251 0.516
2 кГц –0.149 0.176 –0.500 0.201
4 кГц 0.252 0.273 –0.293 0.797

Наблюдалась незначительная зависимость разрешения от центральной частоты сигнала. На рис. 3а эта зависимость проявляется как сдвиг графиков для 1, 2 и 4 кГц относительно друг друга: чем выше частота, тем выше положение графика. Хотя и незначительная, зависимость была статистически достоверной (табл. 2). Однако эта зависимость исчезала, если плотность гребней спектра была представлена не как количество циклов на октаву, а как количество гребней на полосу пропускания частотно-избирательных слуховых фильтров. По формуле, представленной в работе [17], эквивалентная прямоугольная ширина полосы пропускания (ЭПШ) для частот 1, 2 и 4 кГц равна соответственно 131, 237 и 450 Гц, что составляет 0.18, 0.17 и 0.16 окт. При таком представлении графики, представляющие зависимость разрешения от ширины спектральной полосы для разных частот сигнала, сближаются, и 95% доверительные интервалы наклона линий регрессии для всех частот занимают диапазон от отрицательных до положительных значений, т.е. не отличаются статистически достоверно от нуля (табл. 2).

Таблица 2.  

Коэффициенты регрессии для зависимости ЧРС от центральной частоты сигнала для гребенчатого референтного сигнала. k – коэффициент регрессии, СО – стандартная ошибка для коэффициента регрессии. Нижняя граница 95% и верхняя граница 95% – границы 95% доверительного интервала для коэффициента регрессии. При представлении плотности гребней как цикл/окт 95% доверительные интервалы находятся в области положительных значений, т.е. все коэффициенты регрессии статистически достоверно отличаются от нуля. При представлении плотности гребней как количества гребней на полосу пропускания фильтров, 95% доверительные интервалы находятся в области от негативных до позитивных значений, т.е. не отличаются статистически достоверно от нуля

Ширина полосы k СО Нижняя граница 95% Верхняя граница 95%
Плотность гребней
0.5 окт 0.275 0.118 0.038 0.512
1 окт 0.474 0.105 0.263 0.684
2 окт 0.404 0.101 0.202 0.606
Количество гребней на полосу пропускания фильтров
0.5 окт -0.011 0.020 –0.050 0.029
1 окт 0.033 0.017 –0.002 0.068
2 окт 0.009 0.017 –0.025 0.043

Разрешение гребенчатой структуры спектра при плоском референтном сигнале

Оценки разрешения, полученные при плоском референтном сигнале, существенно зависели как от центральной частоты тест-сигнала, так и от ширины его спектральной полосы: чем выше центральная частота и чем шире спектральная полоса, тем выше разрешение. На рис. 4а зависимость разрешения от центральной частоты сигнала отражена в относительном сдвиге графиков для частот 1, 2 или 4 кГц (чем выше частота, тем выше положение графика), а зависимость от ширины спектральной полосы – в позитивном наклоне графиков. При самой низкой из исследованных частот (1 кГц) и минимальной ширине полосы (0.5 окт) разрешение составило в среднем около 10 цикл/окт, что близко к значению, полученному при гребенчатом референтном сигнале. При самой высокой из исследованных частот (4 кГц) и самой широкой полосе (2 окт), разрешение составило в среднем 35.2 цикл/окт. При всех комбинациях центральной частоты и ширины спектральной полосы сигнала 95% доверительные интервалы для наклона линий регрессии были в области положительных чисел, т.е. все наклоны линий регрессии статистически достоверно отличались от нуля (табл. 3 и 4).

Рис. 4.

То же, что на рис. 3, для плоских референтных сигналов.

Таблица 3.  

Коэффициенты регрессии для зависимости ЧРС от ширины спектральной полосы сигнала для плоского референтного сигнала. Обозначения те же, что для табл. 1. Для всех коэффициентов регрессии 95% доверительные интервалы находятся в области положительных значений, т.е. статистически достоверно отличаются от нуля

Центральная частота k СО Нижняя граница 95% Верхняя граница 95%
1 кГц 2.74 0.65 1.45 4.04
2 кГц 10.55 1.39 7.78 13.32
4 кГц 15.38 2.02 11.35 19.42
Таблица 4.  

Коэффициенты регрессии для зависимости ЧРС от центральной частоты сигнала для плоского референтного сигнала. Обозначения те же, что для табл. 2. Для всех коэффициентов регрессии 95% доверительные интервалы находятся в области положительных значений, т.е. статистически достоверно отличаются от нуля

Ширина полосы k СО Нижняя граница 95% Верхняя граница 95%
Плотность гребней
0.5 окт 0.66 0.25 0.16 1.16
1 окт 3.5 0.61 2.28 4.72
2 окт 6.78 1.10 4.60 8.97
Количество гребней на полосу пропускания фильтров
0.5 окт 0.11 0.04 0.03 0.20
1 окт 0.60 0.10 0.39 0.80
2 окт 1.15 0.19 0.78 1.52

Зависимость разрешения как от центральной частоты, так и от ширины спектральной полосы сигнала существенно не изменилась при представлении плотности гребней в количестве циклов не на октаву, а на ширину полосы пропускания слуховых фильтров (рис. 4б, табл. 4).

ОБСУЖДЕНИЕ

В предыдущих исследованиях [2224] было показано различное разрешение гребенчатой структуры сигналов при различных задачах различения: между двумя гребенчатыми сигналами или между гребенчатым и плоским сигналами. Предполагалось, что различие в оценках ЧРС для этих двух задач обусловлено участием разных механизмов частотного анализа, а именно, механизма профиля возбуждения и механизма временного анализа. Преимущественная роль одного или другого механизма в различении сигналов проявляется в оценках ЧРС в зависимости как от типа референтного сигнала [23], так и от центральной частоты сигнала [24].

Настоящее исследование показало зависимость оценки разрешения гребенчатой структуры спектра от ширины спектральной полосы сигнала, причем ширина спектральной полосы влияет и на то, как разрешение зависит от центральной частоты сигнала. Эффекты центральной частоты и ширины спектральной полосы проявлялись только при одной из двух схем эксперимента, а именно, при различении между гребенчатым тест-сигналом и плоским референтным сигналом. В этом случае эффекты центральной частоты и ширины спектральной полосы дополняли друг друга. Принимая во внимание ранее полученные данные о возможности участия разных механизмов частотного анализа, целесообразно рассмотреть возможную роль этих механизмов в закономерностях, наблюдавшихся в данном исследовании.

Модель профиля возбуждения

Модель профиля возбуждения подразумевает, что входной сигнал создает некоторое распределение уровней возбуждения по гребенке частотно-избирательных слуховых фильтров, т.е. профиль возбуждения или “внутренний спектр”. Если входной сигнал имеет гребенчатый спектр, то и профиль возбуждения (внутренний спектр) также имеет гребенчатую структуру. Однако глубина гребней во внутреннем спектре снижена по сравнению со спектром входного сигнала из-за интегрирования в полосах пропускания фильтров. Степень редукции глубины гребней зависит от соотношения плотности гребней входного сигнала и добротности слуховых фильтров. При увеличении плотности гребней входного сигнала разрешение гребенчатой структуры профиля возбуждения возможно до тех пор, пока глубина гребней в профиле не упадет ниже некоторого порогового уровня.

Ширина полос пропускания слуховых фильтров приблизительно пропорциональна частоте. Если гребни входного сигнала также частотно-пропорциональны, то соотношение между плотностью гребней и добротностью фильтров мало меняется с частотой. Поэтому редукция глубины гребней в профиле возбуждения мало зависит от ширины спектральной полосы сигнала, так что варьирование полосы и(или) центральной частоты сигнала мало влияет на разрешение гребенчатой структуры спектра.

Независимость разрешения гребенчатой структуры от центральной частоты и ширины частотной полосы сигнала иллюстрируется на рис. 5, который представляет результат моделирования профилей возбуждения для двух комбинаций центральной частоты и ширины спектральной полосы: (а) 1 кГц, 0.5 окт и (б) 4 кГц, 2 окт. Плотность гребней в этих двух примерах соответствует экспериментально найденным оценкам разрешения при использовании гребенчатых референтных сигналов: соответственно 8.4 и 9.6 цикл/окт. Промежуточные значения параметров не представлены на рисунке, поскольку предполагалось, что они дают результаты, промежуточные между двумя приведенными примерами. Профили возбуждения рассчитывали сверткой спектров с формой фильтра, описываемого скругленной экспонентой (rounded exponent, roex) с ЭПШ 0.18 окт для частоты 1 кГц и 0.16 окт для частоты 4 кГц (согласно формуле Glasberg and Moore, 1990). Оба моделированных профиля возбуждения имеют практически одинаковую глубину гребней 0.5–0.6 дБ. Таким образом, модель профиля возбуждения предсказывает практически одинаковую ЧРС как для сигналов с более низкой частотой и узкой спектральной полосой, так и для сигналов с более высокой частотой и широкой спектральной полосой. Это предсказание хорошо соответствует экспериментальным данным, полученным с применением гребенчатых референтных сигналов. Однако модель профиля возбуждения не соответствует данным, полученным с применением плоских референтных сигналов.

Рис. 5.

Модель различения сигналов по механизму, основанному на профиле возбуждения. (а) – Спектр входного сигнала с центральной частотой 1 кГц, шириной спектральной полосы 0.5 окт и плотностью гребней 8.4 цикл/окт. 1 и 2 – спектры с противоположными фазами гребней. (б) – Моделированные профили возбуждения для спектров, представленных на (а); профили получены сверткой спектров с характеристикой фильтра с ЭПШ 0.18 окт. (в) и (г) – То же, что на (а) и (б), при центральной частоте сигнала 4 кГц, ширине спектральной полосы 2 окт, плотности гребней 9.6 цикл/окт, ЭПШ фильтра 0.16 окт.

Модель временного анализа

Модель временного анализа подразумевает выявление временной структуры сигнала. Временная организация сигналов проявляется в их автокорреляционной функции (АКФ). В частности, АКФ сигнала с гребенчатым спектром характеризуется наличием двух сегментов: незадержанного и задержанного. Лаг задержанного сегмента количественно равен количеству гребней на линейную единицу частоты; например, лаг, выраженный в мс, равен количеству гребней на кГц (цикл/кГц). При частотно-пропорциональной структуре гребней их плотность, выраженная в цикл/кГц, понижается с повышением частоты. Поэтому различение сигналов с гребенчатыми спектрами, основанное на механизме временного анализа, должно облегчаться с повышением центральной частоты сигнала. Расширение частотной полосы сигнала также должно облегчать различение из-за расширения спектра в сторону высоких частот.

Модель анализа гребенчатых сигналов, основанная на временном механизме, представлена на рис. 6. Представлены АКФ сигнала с центральной частотой 1 кГц и спектральной полосой 0.5 окт (рис. 6а) и сигнала с центральной частотой 4 кГц и спектральной полосой 2 окт (рис. 6б). Плотность гребней в этих двух сигналах составляет соответственно 10 и 35 цикл/окт, что соответствует экспериментально найденным оценкам разрешения при использовании плоских референтных сигналов. Помимо начального сегмента с нулевым лагом, обе АКФ содержат задержанный сегмент, длящийся приблизительно от 7.5 до 20 мс. Модель подразумевает, что различение гребенчатых спектров на основе временного механизма возможно, если лаг задержанных сегментов не превышает некоторого предела, до которого возможно выявление временной организации сигнала. Одинаковый лаг задержанного сегмента для сигналов, иллюстрированных на рис. 6а и 6б, предсказывает разрешение 10 цикл/окт для сигнала с центральной частотой 1 кГц и спектральной полосой 0.5 окт и 35 цикл/окт для сигнала с центральной частотой 4 кГц и спектральной полосой 2 окт.

Рис. 6.

Модель различения сигналов по механизму временного анализа. (а) – АКФ гребенчатого сигнала с центральной частотой 1 кГц, шириной спектральной полосы 0.5 окт, плотностью гребней 10 цикл/окт. (б) – АКФ гребенчатого сигнала с центральной частотой 4 кГц, шириной спектральной полосы 2 окт, плотностью гребней 35 цикл/окт. (в) – АКФ плоского сигнала с центральной частотой 1 кГц, шириной спектральной полосы 0.5 окт. (г) – АКФ плоского сигнала с центральной частотой 4 кГц, шириной спектральной полосы 2 окт.

В отличие от сигналов с гребенчатым спектром, сигналы с плоским спектром имеют АКФ без задержанного сегмента (рис. 6в и 6г). Это различие может служить признаком различия между гребенчатым спектром тест-сигнала и плоским спектром референтного сигнала. Однако такой признак не эффективен для различения двух сигналов с одинаковой плотностью, но разной фазой гребней, поскольку лаг задержанного сегмента АКФ не зависит от фазы гребней.

ЗАКЛЮЧЕНИЕ

Подводя итог данным измерения и моделирования, можно заключить:

1. Механизм частотного анализа, основанный на профиле возбуждения, эффективен для различения гребенчатого тест-сигнала и гребенчатого референтного сигнала. Различение сигналов по этому механизму характеризуется незначительной зависимостью оценки ЧРС от центральной частоты и ширины спектральной полосы сигнала.

2. Механизм временного анализа эффективен для различения гребенчатого тест-сигнала и референтного сигнала с плоским спектром. Различение сигналов по этому механизму характеризуется значительной зависимостью оценки ЧРС от центральной частоты и ширины спектральной полосы сигнала.

Работа поддержана Российским научным фондом, грант 16-15-10046, и Российским фондом фундаментальных исследований, грант 20-15-00054.

Список литературы

  1. Bilsen F.A., Ritsma R.J. Some parameters influencing the perceptibility of pitch // J. Acoust. Soc. Am. 1970. V. 47. P. 469–475.

  2. Yost W.A. Pitch strength of iterated rippled noise // J. Acoust. Soc. Am. 1996. V. 100. P. 3329–3335.

  3. Yost W.A., Hill R. Strength of the pitches associated with ripple noise // J. Acoust. Soc. Am. 1978. V. 64. P. 485–492.

  4. Yost W.A., Hill R., Perez-Falcon T. Pitch and pitch discrimination of broadband signals with rippled power spectra // J. Acoust. Soc. Am. 1978. V. 63. P.1166–1173.

  5. Supin A.Y., Popov V.V., Milekhina O.N., Tarakanov M.B. Frequency resolving power measured by rippled noise // Hearing Res. 1994. V. 78. P. 31–40.

  6. Supin A.Y., Popov V.V., Milekhina O.N., Tarakanov M.B. Frequency-temporal resolution of hearing measured by rippled noise // Hearing Res. 1997. V. 108. P. 17–27.

  7. Supin A.Y., Popov V.V., Milekhina O.N., Tarakanov M.B. Frequency resolving power at various rippled-noise patterns // J. Acoust. Soc. Am. 1998. V. 103. P. 2042–2050.

  8. Supin A.Y., Popov V.V., Milekhina O.N., Tarakanov M.B. Ripple depth and density resolution in rippled noise // J. Acoust. Soc. Am. 1999. V. 106. P. 2800–2804.

  9. Supin A.Y., Popov V.V., Milekhina O.N., Tarakanov M.B. The effect of masking noise on rippled-spectrum resolution // Hearing Res. 2001. V. 151. P. 157–166.

  10. Milekhina O.N., Nechaev D.I., Supin A.Y. Estimates of frequency resolving power of humans by different methods: The role of sensory and cognitive factors // Hum. Physiol. 2018. V. 44. P. 357–363.

  11. Римская-Корсакова Л.К., Лалаянц М.Р., Супин А.Я., Таварткиладзе Г.А. Маскировка коротких стимулов шумами с гребенчатыми спектрами: I. Проявления компрессивной нелинейности улитки и оценка частотной разрешающей способности // Акуст. журн. 2011. Т. 57. № 1. С. 117–126.

  12. Henry B.A., Turner C.W. The resolution of complex spectral patterns by cochlear implant and normal-hearing listeners // J. Acoust. Soc. Am. 2003. V. 113. P. 2861–2873.

  13. Won J.H., Drennan W.R., Rubinstein J.T. Spectral-ripple resolution correlates with speech reception in noise in cochlear implant users // J. Assoc. Res. Otolaryngol. 2007. V. 8. P. 384–392.

  14. Saoji A.A., Litvak L., Spahr A.J., Eddins D.A. Spectral modulation detection and vowel and consonant identification in cochlear implant listeners // J. Acoust. Soc. Am. 2009. V. 126. P. 955–958.

  15. Anderson E.S., Nelson D.A., Kreft H., Nelson P.B., Oxenham A.J. Comparing spatial tuning curves, spectral ripple resolution, and speech perception in cochlear implant users // J. Acoust. Soc. Am. 2011. V. 130. P. 364–375.

  16. Jeon E.K., Turner C.W., Karsten S.A., Henry B.A., Gantz B.J. Cochlear implant users’ spectral ripple resolution // J. Acoust. Soc. Am. 2015. V. 138. P. 2350–2358.

  17. Narne V.K., Van Dun B., Bansal S., Prabhu L., Moore B.C.J. Effects of spectral smearing on performance of the spectral ripple and spectro-temporal ripple tests // J. Acoust. Soc. Am. 2016. V. 140. P. 4298–4306.

  18. Glasberg B.R., Moore B.C.J. Derivation of auditory filter shapes from notched-noise data // Hearing Res. 1990. V. 47. P. 103–138.

  19. Krumbholz K., Patterson R.D., Nobbe A. Asymmetry of masking between noise and iterated rippled noise: Evidence for time interval processing in the auditory system // J. Acoust. Soc. Am. 2001. V. 110. P. 2096–2107.

  20. Patterson R.D., Handel S., Yost W.A., Datta A.J. The relative strength of the tone and noise components in iterated rippled noise // J. Acoust. Soc. Am. 1996. V. 100. P. 3286–3294.

  21. Yost W.A., Patterson R.D., Sheft S. A time domain description for the pitch strength of iterated rippled noise // J. Acoust. Soc. Am. 1996. V. 99. P. 1066–1078.

  22. Anderson E.S., Oxenham A.J., Nelson P.B., Nelson D.A. Assessing the role of spectral and intensity cues in spectral ripple detection and discrimination on cochlear implant users // J. Acoust. Soc. Am. 2012. V. 132. P. 3925–3934.

  23. Nechaev D.I., Milekhina O.N., Supin A.Ya. Estimates of ripple-density resolution based on the discrimination from rippled and nonrippled reference signals // Trends Hear. 2019. V. 23. P. 1–9.

  24. Milekhina O.N., Nechaev D.I., Supin A.Ya. Rippled-spectrum resolution dependence on frequency: Estimates obtained by discrimination from rippled and nonrippled reference signals // J. Acoust. Soc. Am. 2019. V. 146. P. 2231–2239.

  25. Levitt H. Transformed up-down methods in psychoacoustics // J. Acoust. Soc. Am. 1971. V. 49. P. 467–477.

Дополнительные материалы отсутствуют.