Загрузки в формате 24/192 — почему они не имеют смысла. Часть 1/5: физиология слуха

Дата обновления: 28 Ноября 2013
2013-11-28T00:16
Audiophile's Software

Это свободный, любительский перевод статьи, оригинал которой расположен на сайте Xiph.org и датирован 1 марта 2012 г.

1. Физиология слуха
2. Ультразвук вреден
3. Семплирование, разрядность, динамический диапазон
4. Слуховые тесты
5. Как действительно улучшить звучание

Статьи прошлого месяца показали, что музыкант Нил Янг и Стив Джобс из Apple обсуждали распространение музыкального контента в «бескомпромиссном студийном качестве». Большая часть прессы и комментариев выражала особый энтузиазм касательно перспективы загрузок в формате 24 бит 192 кГц. Тема 24/192 была одной из ключевых в моей собственной беседе с группой мистера Янга несколько месяцев назад.

К сожалению, распространение музыки в формате 24 бит/192 кГц не имеет смысла. Точность его воспроизведения несколько уступает 16/44.1 или 16/48, при этом формат расходует практически в 6 раз больше дискового пространства.

Сегодня есть несколько реальных проблем с качеством музыкального материала, распространяемого в цифровом виде. Формат 24/192 не решает ни одной из них. Не смотря на то, что все приписывают 24/192 чуть ли не магические свойства, на деле никаких улучшений мы не увидим.

Прежде всего, плохие новости

В последние две недели я имел удовольствие пообщаться с людьми образованными — учеными умами, которые верили в резонность загрузок формата 24/192 и никак не могли понять: как вообще можно с этим не согласиться? Ими были заданы хорошие вопросы, заслуживающие детального рассмотрения и подробных ответов.

Меня также заинтересовало, чем мотивируется пропаганда аудио с высоким разрешением. Опрос показал, что очень немногие люди понимают Теорему Котельникова хотя бы на базовом уровне, и это не удивительно. Отсутствие понимания математики, технологии и психологии имело место в большинстве дискуссий и часто демонстрировалось даже профессионалами с богатым опытом. Некоторые из них даже возразили, что теорема Найквиста не объясняет, как на самом деле работает цифровой звук.

Дезинформация и суеверия на руку лишь шарлатанам. Так что давайте для начала рассмотрим некоторые теоретические основы, объясняющие, почему распространение в 24/192 не имеет смысла — прежде чем предложим некоторые улучшения, которые бы действительно имели смысл.

Джентльмены, встречайте: ваши уши

Уши слышат за счет волосковых клеток, находящихся на резонансной основной мембране, в улитке. Каждая волосковая клетка тщательно настроена на узкую полосу частот, определяемую её позицией на мембране. На графике чувствительность имеет зависимость от частоты с пиком в середине и спадами в обе стороны в форме конуса, с перекрытием диапазонов соседних волосков. Звук не слышен, если отсутствуют волоски, настроенные на его частотные составляющие.



Слева: изображение анатомического разреза улитки с основной (базилярной) мембраной, окрашенной в бежевый. Мембрана настроена на различную резонансную частоту вдоль всей её длины — от наиболее высоких частот у основания, к наиболее низким у вершины. Отмечены приблизительные точки резонанса некоторых частот.
Справа: схематическая диаграмма, изображающая амплитудно-частотные характеристики волосковых клеток, расположенных вдоль мембраны, в виде банка перекрывающихся фильтров.

Это похоже на аналоговое радио, улавливающее станцию с хорошим уровнем сигнала, имеющую частоту вблизи той, на которую оно настроено. По мере того, как различия между частотой станции и частотой, установленной на приемнике, увеличиваются, уровень сигнала становится ниже, а количество помех увеличивается — и так, пока полезный сигнал не исчезает вовсе (вне зависимости от мощности передатчика). Существует верхний и нижний граничные пределы диапазона слышимых частот, по достижению которого чувствительность последних волосковых клеток достигает нуля, и данная частота уже оказывается не слышна.

Частота дискретизации и слышимый спектр

Я уверен, вы слышали это много-много раз: Человеческий слух покрывает диапазон от 20 Гц до 20 кГц. Важно понимать, каким образом в ходе исследований получились именно эти значения.

Прежде всего мы измеряем порог слышимости во всем звуковом диапазоне для группы слушателей-испытуемых. В результате мы получаем график, демонстрирующий минимальный уровень звука, который может воспринимать здоровое человеческое ухо для каждой из заданных частот в нормальных условиях. Безэховая камера, точно откалиброванное оборудование и жесткий статистический анализ — это еще на самое сложное. Как сами уши, так и общая внимательность человека подвержены скорой усталости, которая может негативно сказаться на результатах тестирования. Потому требуется значительное количество перерывов и пауз в прослушивании. Тестирование может занимать от часов до многих дней, в зависимости от методики.

Затем мы проводим сбор данных для определения противоположного порога — болевого. Это настолько высокое значение амплитуды колебаний, при котором механические и нейронные элементы уха оказываются не только перегружены, но также ощущают физическую боль. Собрать такие данные весьма непросто. Ведь в процессе тестирования вы должны исключить нанесение необратимого ущерба слуху испытуемых.



Усредненные кривые равной громкости, полученные Флетчером и Мансоном (1993 г.), расширенные в диапазон >16 kHz по результатам современных исследований. Порог слышимости и болевой порог изображены красным. Последующие исследователи уточнили эти данные, что позволило создать шкалу Фон и привело к появлению международного стандарта кривых равной громкости (ISO 226). Современные исследования показали, что ухо значительно менее чувствительно к низким частотам, чем показали результаты Флетчера и Мансона.

Верхним пределом воспринимаемого человеком диапазона является частота, на которой кривые порога слышимости и болевого порога пересекаются. Чтобы хоть немного услышать звук, имеющий эту частоту, он должен быть невыносимо громким.

На низких частотах улитка работает подобно фазоинверторной трубке. Геликотрема представляет собой отверстие в вершине основной мембраны и работает в качестве порта, настроенного на частоту а районе 40-65 Гц, в зависимости от конкретного человека. Ниже этой частоты характеристика чувствительности быстро спадает.

Таким образом диапазон 20 Гц — 20 кГц полностью покрывает слышимый спектр частот, это утверждение базируется на чуть ли не вековом опыте.

Генетические подарки и золотые уши

По моим данным многие люди свято верят в свою уникальность и одаренность необычайными слуховыми способностями. Так существуют ли такие «золотые уши» на самом деле?

Это зависит от того, что именно вы называете золотыми ушами.

Здоровые уши молодого человека слышат лучше, чем больные, или чем уши человека в возрасте. Некоторые люди исключительно хорошо натренированы и улавливают в музыке такие нюансы, о существовании которых другие и не догадываются. Одно время, в 90-х, я мог определить любой популярный MP3 кодер по звучанию (хотя тогда все они были не лучшего качества), и мог легко продемонстрировать это в двойном слепом тесте.

Сочетание здорового и хорошо натренированного слуха я бы вполне мог назвать золотыми ушами. Более того, даже человек со слухом ниже среднего может после тренировок различать детали, не воспринимаемые большинством слушателей. Так что термин «золотые уши» больше относится к уровню подготовки, чем к восприятию за пределами возможностей простых смертных.

Исследователи слуха были бы очень рады найти, протестировать и задокументировать индивидов с действительно исключительными слуховыми способностям, вроде значительного расширения слышимого диапазона частот. Да, любой рад бы найти подобного «генетического урода», ведь это может стать сенсацией. Но, увы, за последние 100 лет мы не нашли ни одного такого человека, так что, возможно, его и вовсе не существует. Что ж, будем продолжать наши поиски.

Спектрофилы

Возможно, вы скептически отнеслись ко всему, что я только что написал. Конечно, ведь это совершенно не согласуется с нынешней политикой маркетинга. Теперь же давайте оставим аудиофилию и рассмотрим гипотетическое повальное увлечение видеоматериалом с широким спектром частот.



Графики чувствительности колбочек и палочек человеческого глаза, размещенные на логарифмической шкале видимого человеком спектра. Эти органы чувствительны к свету в перекрывающихся диапазонах частот — так же, как и волосковые клетки, рассмотренные нами ранее.

Человеческий глаз видит ограниченный диапазон частот светового излучения, т.е. лишь видимый спектр. Это в точности аналогично слышимому спектру звуковых волн. Так же, как и уши, глаза имеют чувствительные клетки (палочки и колбочки), которые реагируют на свет в различных, но перекрывающихся диапазонах частот.

Видимый спектр простирается примерно от 400 ТГц (темно-красный) до 850 ТГц (темно-фиолетовый). У краёв чувствительность круто спадает. Для хоть какого-то восприятия частот лишь немного выходящих за данный диапазон потребуется такая сила света, которая запросто может сжечь вашу сетчатку. И то, как и в случае с аудио, этот диапазон справедлив лишь в отношении молодых здоровых людей.

В случае с нашим повальным увлечением Широкополосным Видео, рассмотрим группу аудиофилов, не считающих, что вышеописанные данные отражают реальную действительность. Они предлагают закодировать в видео не только видимый спектр, но также инфракрасные и ультрафиолетовые частоты. Пойдем дальше: представим, что есть еще более хардкорная (причем гордящаяся этим) группировка, утверждающая, что и этого недостаточно, и видео выглядит куда более натуральным, когда включает в себя также элементы микроволнового и даже рентгеновского излучения. Для Золотого Глаза, — утверждают они, — различия при этом — просто небо и земля!

Конечно, это смешно.

Никто не видит рентгеновские лучи (или инфракрасные, или ультрафиолетовые, или микроволновое излучение). И неважно, насколько человек верит в свои возможности. Сетчатка просто-напросто не имеет датчиков для этих частот.

Вот эксперимент, который может проделать каждый: возьмите Apple'овский пульт дистанционного управления. Его светодиод излучает длину волны 980 нм (около 306 ТГц), т.е. в инфракрасном спектре. Это не так уж далеко от видимого диапазона. Возьмите с собой пульт в подвал, или в самую темную комнату вашего дома, посреди ночи, при выключенном свете. Пусть ваши глаза привыкнут к темноте.



Пульт ДУ Apple сфотографированный на цифровую камеру. Хотя эмиттер очень ярок и частота излучения не слишком далека от красной области видимого спектра, оно совершенно невидимо для глаз.

Видите ли вы светодиод пульта, когда нажимаете кнопку? Нет? Ни капельки? Попробуйте несколько других пультов; многие из них используют длину волны чуть ближе к видимому спектру, около 310-350 ТГц. Их вы также не увидите. Другие излучают свет на границе видимого диапазона (350-380 ТГц) и могут быть лишь еле-еле видны — в абсолютной темноте, с привыкшими к темноте глазами. И все они были бы ослепляюще, до боли яркими, если бы излучали свет в видимом спектре частот.

Эти околоинфракрасные светодиоды излучают в пределах от видимой границы до частот не более чем на 20% от неё отстоящих. Аудио с частотой дискретизации 192 кГц имеет частотный диапазон равный по ширине 400% слышимого. Чтобы не говорили, что я сравниваю вещи несопоставимые, отмечу, что характер спада чувствительность слуха и зрения в области граничных частот очень схож.

1. Физиология слуха
2. Ультразвук вреден
3. Семплирование, разрядность, динамический диапазон
4. Слуховые тесты
5. Как действительно улучшить звучание

[Обсудить на форуме]


Информация от спонсора

OneBooKS.ru: новые версии программ. Здесь http://onebooks.ru/ochistka-i-optimizaciya/256-cpu-control.html Вы можете скачать бесплатно CPU Control для операционных систем Windows 7/8/XP, полностью на русском языке.

Возможности человеческого слуха: какие частоты и почему слышит человек, что такое кривые равной громкости, порог слышимости, болевой порог; чем они обусловлены.
 
   
Категория: Теория | Автор: | Добавил: Audiophile
Просмотров: 47880| Рейтинг: 5.0/5, голосов: 3
Комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи. [ Регистрация | Вход ]