В последнее время у меня возник повышенный интерес к вопросу восприятия верхнего диапазона звуковых частот. И причиной этому послужил вот, какой случай. В ходе обсуждения параметров LAME, а точнее ключа --lowpass, отвечающего за выбор верхней граничной частоты, один из участников форума попросил совета: какой музыкальный фрагмент выбрать, чтобы четко уловить наличие/отсутствие частот выше 16 кГц. Сперва вопрос мне показался довольно простым — почему-то я был просто таки уверен, что совершенно четко улавливаю срез на 16 кГц в том же MP3 128 кбит/с.
Для чистоты, так сказать, эксперимента, я взял первую попавшуюся композицию (кажется, что-то из Pink Floyd), декодировал её в 32-битное WAV с применением НЧ фильтра на 16 кГц (SoX lowpass) и запустил слепой ABX тест. И сразу же я был поражен: отсутствие частоты выше 16 кГц (а срез АЧХ я сделал максимально крутым) оказалось далеко не «очевидным». Собственно, в основном ВЧ составляющие содержались в фоновом шуме записи, и я был практически уверен, что запросто уловлю сужение частотного диапазона этого самого шума. Ну а запустив слепое сравнение, я был окончательно разочарован: успешно пройти его мне не удалось.
И это несмотря на кажущуюся звонкость высоких в музыкальной композиции. Вот, взгляните на спектр оригинального аудио и аудио со срезом на 16 кГц («Pink Floyd — Welcome To Machine»):
Выборочно прослушав таким же образом еще несколько композиций Pink Floyd, а также некоторых других рок-групп, мне так и не удалось уловить отсутствие ВЧ составляющих. Даже «Pink Floyd — Time» не дала ожидаемого эффекта — звон часов был таким же отчетливым и без спектра выше 16 кГц.
Тогда я решил переключиться на электронику. В ход пошел трек «David Guetta — Just A Little More Love (elektro edit)». Казалось бы: высокие очень ярко выражены даже в начальной, вокальной партии, о чем говорит и спектрограмма:
Но, к моему великому сожалению, оказалось, что наиболее высокие частоты каким-то образом маскируются и фактически на слух не воспринимаются. Да, именно маскируются: я специально выделили отфильтрованные составляющие путем вычитания сигнала полученного из исходного, и прослушал разностный сигнал. Выделенные таким образом частоты слышны вполне отчетливо.
В итоге найти музыкальный фрагмент, на котором воспринималось бы отсутствие ВЧ, мне всё же удалось. Это было вступление из «Pink Floyd — Wish You Were Here», сам фрагмент и отчет я выложил на форуме. А вот его спектрограмма:
Как видно, резкий звук акустической гитары имеет широчайший частотный диапазон (т.к. это по сути транзиент, т.е. переходной процесс с очень крутым фронтом), и полоса пропускания заметно влияет на его «звонкость».
Так или иначе, весь этот случай — весьма показательный. Впрочем, я знаю, что ввело меня в подобное заблуждение. Тот же LAME при кодировании с низким битрейтом (например, 128 кбит/с) не просто обрезает всё, что выше 16 кГц, а вдобавок еще и режет частотные составляющие с низким уровнем в диапазоне более низких частот. На спектрограмме это выглядит как некоторая разреженность спектра. Например, вот тот же фрагмент, только закодированный с LAME 3.99.5 -q 0 -b 128:
Очевидно, именно разреженность фонового шума, а не сужение его частотного диапазона, чаще всего воспринимается в подобных случаях.
Но это всё была прелюдия. Как я уже сказал, после описанного случая вопрос частотного слуха меня серьезно заинтересовал. Потому я решил произвести на этот счет кое-какие исследования — о них я напишу в своей следующей статье.
Информация от спонсора
Евгений Степанов: компьютерный мастер. ИП Евгений Борисович Степанов поможет в решении любых вопросов, связанных с компьютерной техников. Сайт мастера: http://www.evgeniystepanov.ru. Дополнительная информация: ОГРН 309026125000018, телефоны: +7495 5323613, 89261065432.