Тонкомпенсация

Материал из Неолурк, народный Lurkmore
Перейти к навигации Перейти к поиску
Вы так не верите звукорежисерам? Они сидели, сводили тональный баланс, а Вы так его.. 7 функциями
— ViktKors с форума Вегалаб

Тонкомпенсация (кривые Флетчера-Мэнсона, изофоны, Кривые равной громкости, стандарт ISO 226) — фундаментальный психоакустический мем, неопровержимо доказывающий, что твои уши врут тебе каждую секунду твоего жалкого существования. Суть явления сводится к тому, что человеческий слуховой аппарат — это кривой, глючный и абсолютно нелинейный кусок мяса, который воспринимает разные частоты с разной громкостью, даже если физическое звуковое давление, измеряемое бездушными приборами в децибелах, остается неизменным. Если ты включишь генератор синусоиды на частоте 1000 герц и выставишь громкость на 40 децибел, тебе будет нормально. Но если ты переключишь частоту на 50 герц, оставив те же 40 децибел, ты вообще ни хрена не услышишь, потому что для достижения субъективно той же громкости на низах тебе придется вкрутить ручку усилителя децибел эдак до 70. Именно из-за этой биологической недоработки создаются гигантские треды на форумах аудиофилов, звукорежиссеры сходят с ума при сведении миксов, а производители аппаратуры лепят на передние панели своих поделок волшебную кнопку Loudness.

История болезни[править]

В далеком 1933 году два сумрачных американских гения из лабораторий Bell Labs, Харви Флетчер и Уилден Мэнсон, решили выяснить, насколько сильно человеческое ухо искажает реальность. В те времена акустика только выходила из пеленочного возраста, и инженерам нужно было понять, как строить телефонные линии и динамики так, чтобы голос звучал разборчиво, а оборудование не потребляло лишнюю мощность на частотах, которые кожаный мешок все равно не слышит. Флетчер и Мэнсон брали подопытных студентов, сажали их в комнату, надевали на них наушники и заставляли слушать два тона: эталонный на частоте 1000 герц и тестовый на другой частоте. Подопытный должен был крутить ручку до тех пор, пока ему не покажется, что оба тона звучат одинаково громко. Поскольку субъективное восприятие — штука тонкая и зависит от того, сколько пива выпил студент накануне и не заложило ли ему уши от насморка, исследователям пришлось прогнать через эту пыточную камеру огромную толпу народа, а результаты усреднить.

В итоге получился график, похожий на кривую усмешку Джокера, где по оси абсцисс шла частота от 20 герц до 20000 герц, а по оси ординат — уровень звукового давления. Выяснилось, что мы лучше всего слышим диапазон от 2000 до 5000 герц. Это эволюционное достижение: именно в этом диапазоне плачет младенец, хрустит ветка под лапой саблезубого тигра и орет жена, требуя вынести мусор. Резонанс слухового прохода и передаточная функция слуховых косточек среднего уха (молоточка, наковальни и стремечка) усиливают эти частоты так мощно, что звуки на уровне 0 децибел (порог слышимости) уже воспринимаются мозгом. Зато на краях диапазона — в глубоком суббасе ниже 100 герц и на ультраверхах выше 10000 герц — чувствительность падает в пропасть. Чтобы услышать 20 герц так же отчетливо, как 1000 герц на громкости в 40 фон, нужно влить в динамики такую мощность, от которой начнут трястись внутренности.

Эти кривые назвали кривыми Флетчера-Мэнсона. Они стали библией для всех, кто хоть как-то связан со звуком. Но наука не стоит на месте. В 1956 году пара других ученых, Робинсон и Дадсон, решили, что наушники — это не тру, так как при нормальном слушании звук приходит спереди в виде плоской волны, отражается от торса, головы и ушных раковин, формируя так называемую функцию HRTF. Робинсон и Дадсон провели свои замеры с использованием фронтально расположенных колонок в безэховой камере. Их результаты немного разошлись с Флетчером и Мэнсоном, но именно они легли в основу первого стандарта международной организации по стандартизации, известного как ISO 226 образца 1987 года.

Казалось бы, вопрос закрыт, можно расходиться и слушать свой теплый ламповый звук. Но в конце девяностых годов японские исследователи из университета Тохоку, вооружившись современными компьютерами и высокоточными микрофонами, начали замечать, что старый стандарт безбожно врет на низких частотах. Расхождения достигали от 10 до 15 децибел. Началась паника в узких кругах акустиков. Была собрана глобальная коалиция из ученых Японии, Германии, Дании, Великобритании и США. Они заново пытали людей чистыми тонами в возрасте от 18 до 25 лет с отологически нормальным слухом. Выбор возраста не случаен: после 25 лет слух начинает необратимо деградировать, и верхняя граница воспринимаемых частот неуклонно ползет вниз, так что тридцатилетний аудиофил, покупающий кабели за 10000 долларов из бескислородной меди, физически не способен услышать разницу на 16000 герц, как бы он ни пыжился на форумах.

В результате этого титанического труда в 2003 году вышел обновленный стандарт ISO 226:2003. Ирония судьбы заключалась в том, что новые сверхточные данные оказались гораздо ближе к самым первым измерениям Флетчера и Мэнсона из 1933 года, чем к замерам Робинсона и Дадсона. Отчет сухо констатировал, что в 1956 году кто-то либо не откалибровал аппаратуру, либо пытал уставших людей, у которых мышцы среднего уха были напряжены от поездки в метро. В 2023 году стандарт снова слегка подретушировали, выпустив ISO 226:2023, но там изменения коснулись лишь жалких 0,4 децибела на частоте 20 герц, чтобы согласовать данные с порогом слышимости из параллельного стандарта ISO 389.

Физиология[править]

Если ты думаешь, что кривые равной громкости — это просто красивые линии на графике, то ты глубоко ошибаешься. За ними стоит суровый матан, который ломает мозг любому гуманитарию. Чтобы получить значение звукового давления в децибелах для любой частоты и заданного уровня громкости в фонах, международные бюрократы выкатили трехэтажную формулу. Формула номер 1 гласит, что уровень звукового давления равен 10 разделить на показатель экспоненты альфа, умножить на десятичный логарифм от некоего параметра А, вычесть модуль передаточной функции Lu и прибавить 94. При этом сам параметр А рассчитывается как 4,47 умножить на 10 в минус третьей степени, умножить на скобку, в которой 10 возведено в степень 0,025 умножить на уровень громкости в фонах, минус 1,15. И все это складывается с еще одним монструозным куском, где фигурирует порог слышимости Tf.

В приложении к стандарту дана таблица с параметрами для каждой третиоктавной полосы от 20 до 12500 герц. Да-да, именно 29 частот. Если тебе нужна частота между ними, придется интерполировать кубическими сплайнами, как это делают настоящие задроты цифровой обработки сигналов (DSP). Вся эта математика описывает двухзвенную модель восприятия. Первый этап — это линейное преобразование звука, когда волна проходит через воздух, огибает твою тупую башку, залетает в ушную раковину, резонирует в слуховом проходе и дергает барабанную перепонку. Второй этап — это нелинейная компрессия внутри улитки внутреннего уха, где волосковые клетки преобразуют механические колебания в электрические импульсы для твоего медленного мозга. Улитка работает как многополосный компрессор с бесконечным числом полос, называемых критическими диапазонами Барка. На высоких уровнях громкости (около 100 фон) кривые выравниваются, и слух становится более линейным. На низких (около 20 фон) — кривизна достигает апогея, басы и верха проваливаются в небытие.

Кнопка Loudness[править]

Именно из-за выравнивания кривых на высокой громкости и возникла главная проблема домашнего звуковоспроизведения. Когда звукорежиссер сводит трек в студии, он сидит перед мониторами дальнего или среднего поля и вваливает контрольный уровень в районе 85 децибел звукового давления (SPL). На этой громкости его слух относительно линеен. Он выстраивает идеальный баланс: бочка качает, бас жирный, вокал читается, хэты цыкают. Он записывает этот шедевр на носитель, и запись отправляется в массы.

И тут в дело вступаешь ты. Ты сидишь в своей панельной хрущевке в два часа ночи. За стеной спит жена, снизу нервный сосед с перфоратором, сверху бабка с бессонницей. Ты не можешь включить колонки на 85 децибел, иначе к тебе приедет наряд полиции. Ты тихонько крутишь ручку громкости на своем усилителе, выставляя комфортные 50 или 40 децибел. И что происходит? Музыка превращается в плоское, невыразительное, лишенное жизни радио-бубнение. Бас-гитара испарилась, бочка стала стучать как по картонной коробке, тарелки потускнели. Трек звучит как кусок дерьма. Звукорежиссер виноват? Нет. Твои колонки виноваты? Тоже нет. Виноваты твои уши и кривые Флетчера-Мэнсона. На уровне 40 фон чувствительность твоего уха к низким частотам упала децибел на 20 по сравнению с тем, что было на 85 фонах в студии.

Чтобы спасти ситуацию, инженеры еще в середине двадцатого века придумали гениальный костыль под названием тонкомпенсация (или Loudness на буржуйской аппаратуре). На потенциометр регулятора громкости делали дополнительный отвод, к которому припаивали RC-фильтр. Когда ты убавлял громкость, этот фильтр автоматически поднимал низкие и высокие частоты, искривляя амплитудно-частотную характеристику усилителя зеркально кривым равной громкости. На старых советских усилителях типа Бриг-001 или Радиотехника эта функция была обязательной. Нажимаешь кнопку ТК — и звук на малой громкости вдруг оживает, наливается соками, бас начинает мягко массировать комнату.

Но у аналоговой тонкомпенсации был один фатальный недостаток: она была тупой. Она не знала, какой уровень записи на самом носителе, она не знала чувствительность твоих колонок (сколько децибел они выдают на 1 ватт мощности), она не знала акустических свойств твоей комнаты. Фильтр просто тупо наваливал басов в зависимости от механического положения ручки громкости. Если у тебя был тихий источник звука, тебе приходилось выкручивать ручку вправо, тонкомпенсация отключалась (так как она работает только на начальных углах поворота), а звук все равно был тихим, и басов не хватало. Если источник был слишком громким (например, современный CD с жестким лимитированием), тонкомпенсация работала на минимальном делении, раздувая бас до невыносимого гудежа, а сделать чуть тише было уже невозможно без потери баланса. В итоге аудиофилы объявили тонкомпенсацию ересью, искажающей первозданный замысел творца, и производители High-End аппаратуры стали гордо выпиливать эту кнопку из своих усилителей за миллионы денег, оставляя слушателей один на один с плоским звуком на малой громкости.

Драмы[править]

Как только в дело вмешивается наука, на сцену выходят техно-задроты. Осенью 2011 года на суровом русском DIY-форуме Вегалаб, где суровые мужики годами обсуждают толщину фольги в конденсаторах и направление прокладки проводов, появился некто Nikolay_Po из Новороссийска. Он создал тред с мольбой о помощи: ему нужен был первоисточник стандарта ISO 226:2003 в математическом виде. Вся Википедия была завалена лишь векторными картинками формата SVG, нарисованными каким-то энтузиастом от руки в OpenOffice Draw. Николаю это не подходило. Его внутренний перфекционист жаждал абсолютной точности.

Николай, будучи человеком не робкого десятка, признался, что уже попытался аппроксимировать кривую для 80 фон с помощью 7 функций Гаусса. Вы только вдумайтесь в уровень отчаяния: человек брал пиксели с картинки и подгонял под них 7 нормальных распределений Гаусса в статистическом пакете R for Windows. Он добился среднеквадратичной ошибки в 0,13 децибела. Но его грызли сомнения, ведь сама картинка в Википедии была кривой. Он искал сырые данные.

Тут же в тред подтянулись завсегдатаи. Юзер anli, имеющий статус мифолога, лениво заметил, что кривые — это просто размытый социальный срез, усредненный по толпе молодых людей без значительных дефектов слуха, поэтому гнаться за точностью в доли децибела нет никакого смысла. Авторитетный ИГВИН из Ростова-на-Дону подлил масла в огонь, заявив, что кривые равной громкости — это наукообразная фантазия, не имеющая отношения к реальному музыкальному сигналу. Мол, они снимались на чистых синусоидах, а музыка — это сложный спектр с транзиентами, гармониками и шумом.

Но Николай стоял на своем. Он хотел создать идеальный синтетический тестовый сигнал, с помощью которого можно было бы настраивать автомобильные и домашние аудиосистемы на слух, без измерительных микрофонов. Идея была безумна в своей простоте: если пустить в колонки шум, отфильтрованный в точном соответствии с кривой равной громкости, то на слух этот шум должен казаться абсолютно ровным во всем диапазоне. Любой выпирающий пик или резонанс салона автомобиля сразу резанет по ушам, и его можно будет задавить эквалайзером. Николай ссылался на свой успешный опыт с алгоритмом ReplayGain 1.0, где коррекция пиков на разных частотах дала результат, который превзошел работу профессионального настройщика автозвука.

В разговор вступил ViktKors, который обрушил на Николая суровую правду жизни. Он спросил: Вы так не верите звукорежисерам? Они сидели, сводили тональный баланс, а Вы так его.. 7 функциями. ViktKors объяснял, что на громкости 90 фон тональный баланс уже выведен звукорежиссером с учетом его собственных, личных кривых Флетчера-Мэнсона. Вся эта возня с кривыми имеет смысл только для нахождения разностных характеристик при тихом прослушивании. Более того, кривые для разных людей зависят от кучи факторов: усталости, наличия насморка, фонового маскирующего шума (что в автомобиле вообще является критическим параметром, так как гул шин и двигателя сжирает весь низкочастотный диапазон). ViktKors советовал Николаю бросить математику и просто подобрать эквалайзером равномерный тональный баланс на реальной музыке под свои собственные уши.

Наш герой Николай отбивался как мог. Он утверждал, что ему интересно, как слышит коллектив, как слышит здоровая молодежь. Поскольку сам он уже постарел и его слух начал деградировать, он хотел с помощью стандарта эквализировать систему так, чтобы услышать музыку ушами молодого здорового парня. Он признался, что ошибка в 3 децибела оказалась неприемлемой, а попытка выровнять систему по обычному розовому шуму привела к провалу.

В какой-то момент в тред ворвался ash__ и бросил спасательный круг. Он нагуглил скрипт для Матлаба от некоего американского DSP-инженера Джеффа Тэкетта. Этот скрипт содержал те самые вожделенные таблицы и формулы прямо из текста ISO 226, которые хитрые капиталисты из ISO продавали за бешеные швейцарские франки, а Джефф выложил бесплатно на Matlab Central. Николай был в восторге. Он переписал код на свой любимый R, добавил кубическую сплайн-интерполяцию (так как стандарт задает только 29 точек) и выкатил в феврале 2012 года итоговый листинг. Тред закончился триумфом задротства над здравым смыслом. Николай получил свои точные циферки, хотя так и не отписался, помогло ли это ему создать идеальный тестовый сигнал, который не разрывал бы барабанные перепонки пик-фактором в 15 децибел.

Интеллектуальный ренессанс на Gearspace[править]

Переместимся во времени на полтора десятка лет вперед. Легендарный англоязычный форум Gearspace, пристанище профессиональных продюсеров, звукоинженеров и богатых собирателей железных синтезаторов. Эпоха изменилась. Теперь никто не пишет код на Матлабе для себя. Теперь люди делают плагины и продают их. Разработчик под ником caustik анонсирует релиз своего нового детища: APU Loudness Contour. Это VST-плагин, который в реальном времени применяет фильтры равной громкости. Он включает в себя все: ISO 226 образца 2003 и 2023 годов, классического Флетчера-Мэнсона, K-weighting для LUFS, A-weighting, C-weighting, ITU-R 468 и даже свежий ECMA-418.

Плагин позволяет динамически менять опорный уровень звукового давления от 20 до 120 децибел. То есть ты можешь сказать плагину: сделай мне кривую для 40 фон, но инвертируй ее. Если применить инвертированную кривую Флетчера-Мэнсона к мастер-шине с отрицательным весом, она скомпенсирует провал на низких частотах при тихом прослушивании. По сути, caustik продает за 40 баксов ту самую умную кнопку Loudness, о которой мечтали аудиофилы, только реализованную на фазолинейных FIR-фильтрах, чтобы не крутить фазу сигнала.

Форумчане начинают задавать вопросы, пытаясь понять, нахрена им это нужно. Юзер GusGranite пишет: Выглядит круто, но я слишком нуб, чтобы понять юзкейсы. Это для трансляции миксов?. Ему терпеливо объясняют, что это многоцелевой инструмент. Caustik выдает базу. Во-первых, LUFS-оптимизация. В современном стриминге балом правит стандарт ITU-R BS.1770, который использует K-взвешивание. Алгоритмы Spotify и Apple Music слушают твой трек через K-фильтр (который задирает частоты от 2000 до 4000 герц) и считают громкость. Если ты хитро эквализируешь свой микс, слегка прибрав те частоты, которые измеритель LUFS считает самыми громкими, ты можешь сделать трек физически более плотным и накачанным RMS, но алгоритм этого не заметит и не сделает трек тише при нормализации. Это грязный чит в бесконечной войне громкостей.

Во-вторых, сайдчейн-компрессия. Если повесить этот контур-фильтр в цепь детектора любого компрессора, компрессор начнет реагировать на звук не как тупая железка, реагирующая на пики напряжения, а как человеческое ухо. Обычно бочка и саб-бас несут в себе гигантскую энергию. Обычный компрессор захлебывается от низов и начинает пампить весь микс в такт бочке. Чтобы этого избежать, звукорежиссеры вешают на сайдчейн обычный обрезной фильтр низких частот (High-Pass). Но если повесить туда кривую ISO 226, компрессор станет перцептивно-взвешенным. Он будет сжимать трек именно тогда, когда он кажется громким уху, а не микрофону.

Некий Dr.Gunjah на радостях качает триал и пытается привязать ручку громкости в Рипере к параметру SPL плагина через Parameter Modulation, чтобы сделать себе идеальный мониторный контроллер. Но тут же натыкается на суровую техническую реальность: FIR-фильтры вносят задержку. Чтобы плагин мог точно повторить все изгибы кривой ISO 226, особенно на низких частотах, ему нужно много сэмплов для вычисления свертки (convolution). В минимально-фазовом режиме плагин дает задержку в 1700 сэмплов. Для сведения это не проблема, современные DAW имеют автоматическую компенсацию задержки (PDC). Но для игры на миди-клавиатуре в реальном времени или для записи вокала 1700 сэмплов — это смерть и адская рассинхронизация. Caustik обещает выпустить апдейты, добавить IIR-фильтры (биквадратные фильтры с бесконечной импульсной характеристикой), которые работают с нулевой задержкой, но ценой точности совпадения с идеальной кривой и изменения фазы.

Тема фазы в эквалайзерах — это еще одна дисциплина специальной олимпиады для звукорежиссеров. Когда ты применяешь IIR-фильтр (минимально-фазовый), он искажает фазу сигнала вокруг частоты среза. Звук может стать немного размазанным или потерять панч из-за того, что гармоники смещаются во времени друг относительно друга. Чтобы этого избежать, придумали линейно-фазовые FIR-фильтры. Они сохраняют фазу идеальной. Но законы физики обмануть нельзя. Платой за идеальную фазу становится так называемый пре-ринг (pre-ringing) — появление опережающего эха перед резкими транзиентами. Удар по рабочему барабану в линейно-фазовом эквалайзере обрастает тихим цифровым звоном, который слышен за несколько миллисекунд до самого удара. Это звучит неестественно, так как в природе эхо бывает только после звука, а не до него. В итоге звукоинженер всегда стоит перед выбором: либо испортить фазу, либо добавить цифровой пред-звон. И все это ради того, чтобы скомпенсировать кривизну своих собственных ушей.

В этом же треде появляется Yujiro Yonetsu, который пропускает плагин через программу Plugin Doctor и выкладывает скриншоты фазовых задержек, сравнивая APU Loudness Contour с великим и ужасным FabFilter Pro-Q 4. Он удивляется, почему кривые вроде одинаковые, а фаза ведет себя по-разному. Разработчик терпеливо объясняет ему разницу между IIR и FIR, чувствуя себя учителем физики в коррекционной школе. Тем временем другие пользователи ноют, что Steinberg убил поддержку формата VST2 в тринадцатом Кубейсе, и теперь все должны переходить на VST3. Драма, слезы, мольбы о скидках для старых покупателей. Обычный день на Gearspace.

Борьба с шумом[править]

Кривые равной громкости породили целое семейство так называемых взвешивающих фильтров (weighting filters). Инженеры поняли, что измерять уровень шума в аппаратуре линейно — бессмысленно. Допустим, у тебя есть два усилителя. Первый шумит на частоте 50 герц с уровнем минус 60 децибел (гул от трансформатора). Второй шумит на частоте 3000 герц с тем же уровнем минус 60 децибел (шипение транзисторов). Прибор покажет одинаковое соотношение сигнал/шум. Но если ты подключишь колонки, 50 герц ты почти не заметишь, а 3000 герц будут сверлить тебе мозг так, что захочется выкинуть этот усилитель в окно.

Поэтому были придуманы кривые A, B, C и D. Самая популярная — кривая А (A-weighting). Она грубо имитирует кривую Флетчера-Мэнсона для уровня 40 фон. Шумомеры, настроенные на dBA, жестко режут басы и ультраверха перед измерением, показывая цифру, которая больше соответствует субъективному раздражению от шума. Когда в характеристиках кулера для процессора пишут шум 20 dBA, это значит, что физически он может гудеть на 40 децибел на низких частотах, но производитель пропустил это через А-фильтр, отрезал басы и нарисовал красивые цифры для маркетологов.

Но А-взвешивание оказалось несовершенным. В 1960-х годах исследователи BBC Research и DIN (немецкий институт стандартизации) начали тестировать новые аудиокассеты с компандерным шумоподавлением Dolby. Они поняли, что чистые тона (синусоиды), на которых строился Флетчер-Мэнсон, не отражают восприятие реального широкополосного шума. Человеческое ухо анализирует звук спектрально. В улитке есть так называемые критические полосы частот. На высоких частотах эти полосы шире, чем на низких. Поэтому широкополосный белый шум (шипение пленки) собирает больше мощности в широких высокочастотных полосах и субъективно кажется громче, чем предсказывает кривая А. К тому же мозг суммирует громкость по всем возбужденным полосам.

Так появился стандарт ITU-R 468 (бывший CCIR 468). Этот фильтр имеет мощный пик на частоте 6000 герц (плюс 12 децибел!) и круто спадает по краям. Он используется в профессиональном бродкасте для измерения шума микрофонных предусилителей, радиоканалов и студийного оборудования. Он гораздо лучше коррелирует с тем, насколько сильно шипение бесит слушателя. В плагине APU Loudness Contour этот фильтр тоже есть. Если ты хочешь сделать lo-fi трек с эмуляцией кассетной пленки, ты можешь добавить белый шум, но перед этим пропустить его через фильтр 468 с отрицательным весом. Шум сразу ляжет в микс мягко, не выедая мозг на шести килогерцах.

Или вот относительно свежий стандарт ECMA-418, созданный для оценки тональности и громкости. В современном мире мы окружены шумами вентиляторов компьютерной техники, кондиционеров, серверов. Инженеры поняли, что если в равномерном шуме кулера есть ярко выраженный тональный пик (например, свист подшипника на определенной частоте), то он раздражает в десять раз сильнее, чем просто шипение. Стандарты начинают обрастать сложными психоакустическими метриками, где учитывается не только громкость, но и резкость (sharpness), тональность (tonality), шероховатость (roughness) и флуктуация (fluctuation strength). Скоро, чтобы просто измерить, насколько сильно гудит холодильник, потребуется нейросеть, эмулирующая мозг шизофреника.

Аудиофилия[править]

Вся эта научная база с ISO 226 — это кость в горле для классических аудиофилов. Аудиофил живет в магическом мире, где звук передается не перепадами давления воздуха, а мистической энергией, которая течет по направленным медным проводам, очищается родиевыми контактами сетевых вилок и полируется вакуумом в лампах 300B. Аудиофил презирает эквалайзеры. В его системе тракт должен быть абсолютно линейным: от позолоченного USB-кабеля (который передает нули и единицы как-то по-особенному тепло) до колонок стоимостью в однокомнатную квартиру.

И вот этот аудиофил включает свой тестовый диск с джазом. Звукорежиссер на студии свел этот джаз на уровне 85 децибел. Контрабас звучал плотно, щетки по тарелкам рассыпались серебром. Аудиофилу жалко свои уши (и соседей), поэтому он слушает это на уровне 60 децибел. По законам физики (и стандарту ISO 226) контрабас проваливается на 10 децибел относительно средних частот, а тарелки тускнеют. Звук становится сухим и плоским. Что делает аудиофил? Он не крутит темброблок (его просто нет на лицевой панели усилителя за 15000 долларов, потому что темброблок — это лишние элементы в цепи, разрушающие фазу и воздух). Аудиофил решает, что проблема в кабелях.

Он идет на форум и покупает межблочный кабель из серебра с добавлением золота, потому что в обзоре написали, что он улучшает артикуляцию баса и придает шелковистость верхам. Он подключает этот кабель. Эффект плацебо срабатывает мгновенно. Аудиофил слышит улучшения. Но через неделю плацебо выветривается, и он снова замечает, что контрабас не качает на тихой громкости. Тогда он покупает деревянные подставки под кабели, чтобы убрать микрофонный эффект от вибрации пола. Потом он покупает сетевой кондиционер размером с системный блок. Потом он меняет акустику на рупорную. Он тратит миллионы, пытаясь скомпенсировать кривизну своего собственного уха покупкой эзотерических железок.

А ведь достаточно было бы одного параметрического эквалайзера. Или той самой презренной кнопки Loudness. Но признать это — значит разрушить всю индустрию элитного аудио. Если всем сказать, что для идеального звука на любой громкости достаточно цифрового процессора за 200 баксов, который в реальном времени применяет инвертированную кривую Флетчера-Мэнсона к сигналу в зависимости от положения ручки громкости, то журналы типа Stereophile можно закрывать, а производителей серебряных проводов отправлять мести дворы.

Некоторые продвинутые энтузиасты (как gross и sia_2 из того же треда на Вегалабе) дошли до понимания истины. gross пишет: Самое главное в этом — привязка к реальным уровням звукового давления в вашей комнате на месте прослушивания. Без этого говорить о тонкомпенсации бессмысленно. И он абсолютно прав. Если ты не откалибровал систему, ты не знаешь, какому уровню звукового давления в децибелах соответствует текущее положение ручки. Если ты скачаешь плагин APU Loudness Contour и просто наобум начнешь крутить параметр SPL, ты будешь применять случайную кривую к случайному звуку. Чтобы это работало по науке, тебе нужен измерительный микрофон, розовый шум на выходе, калибровка 0 dBFS в DAW к реальным 85 dBSPL в точке прослушивания (так называемый стандарт K-System Боба Каца). Только тогда система сможет понять, насколько тихо ты сейчас слушаешь музыку, и какую именно дельту между кривыми 85 фон и твоими текущими фонами нужно применить к эквалайзеру. Но это сложно. Это муторно. Это требует знаний, микрофона и умения работать с графиками. Гораздо проще купить волшебный провод и верить в чудо.

Война громкостей[править]

Вся эта история с кривыми равной громкости имеет еще одну мрачную сторону, которая чуть не уничтожила музыкальную индустрию. Это явление известно как Loudness War (Война громкостей). Вспомним, что слух человека устроен так, что более громкий звук воспринимается как более качественный, плотный и насыщенный частотами (из-за того, что на высокой громкости кривые выравниваются и мы начинаем лучше слышать бас и высокие). Продюсеры и лейблы звукозаписи быстро поняли эту фишку. Если на радио играют подряд два трека, и второй трек звучит хотя бы на 1 децибел громче первого, слушатель подсознательно решит, что второй трек — хит, а первый — унылое говно.

Началась гонка вооружений. Поскольку цифровой формат CD Audio имеет жесткий потолок амплитуды — 0 dBFS (децибел полной шкалы), выше которого наступает цифровой клиппинг (жесткий срез волны, превращающий звук в хрипящий мусор), сделать музыку просто громче поворотом ручки было нельзя. Пришлось использовать компрессоры и лимитеры. Эти приборы срезали пики сигнала (удары барабанов) и подтягивали тихие звуки вверх. Разница между самым громким и самым тихим звуком (динамический диапазон) начала стремительно сокращаться. В 80-х годах на классических альбомах динамический диапазон составлял около 14-20 децибел. Музыка дышала. Барабаны хлестали, вокал имел динамику.

Но в 90-х появились цифровые кирпичные лимитеры (brickwall limiters). Альбом Oasis (What’s the Story) Morning Glory? 1995 года был скомпрессирован до усрачки. Альбом Red Hot Chili Peppers Californication 1999 года звучит так искаженно, что у аудиофилов кровоточат уши: лимитер сплющил волну так сильно, что слышен постоянный хрип и клиппинг. Апофеозом войны стал альбом Metallica Death Magnetic 2008 года, где звукорежиссеры пережали звук до RMS минус 4 децибела. Волна на графике выглядела как сплошной кирпич. Слушать это дольше десяти минут физически больно из-за слуховой усталости.

При чем здесь Флетчер-Мэнсон? При том, что компрессия делала треки субъективно ровнее по частотам на любой громкости прослушивания. Лимитер накачивал энергией басы и верха, уничтожая естественную динамику, но создавая иллюзию жирного звука. Радиостанции добавляли поверх этого свой многополосный FM-процессор (типа Orban Optimod), который еще сильнее сжимал сигнал, ориентируясь на кривые восприятия, чтобы трек звучал максимально плотно из любого дешевого кухонного приемника. В итоге музыка потеряла жизнь.

Война продолжалась до тех пор, пока стриминговые сервисы не положили ей конец алгоритмической нормализацией громкости по стандарту LUFS (Loudness Units relative to Full Scale). И тут мы возвращаемся к K-взвешиванию и ITU-R 468. Когда YouTube, Spotify и Apple Music ввели нормализацию, они сказали лейблам: Хватит делать кирпичи. Если ваш трек имеет громкость минус 5 LUFS, наш алгоритм принудительно убавит его на 9 децибел, чтобы он звучал на целевых минус 14 LUFS. И ваш сплющенный кирпич будет звучать так же громко, как классический трек 80-х с нормальной динамикой, но при этом кирпич будет звучать вяло, плоско и искаженно, а старый трек будет бить панчем барабанов.

Продюсеры начали плакать. Их лишили главного инструмента конкуренции — возможности сделать тупо громче. И тут в ход пошли новые хитрости, о которых упоминал caustik на форуме Gearspace. Поскольку алгоритм измерения LUFS использует фильтр K-weighting, который имеет спад на низких частотах (он почти не учитывает саб-бас) и подъем на высоких средних (от 2 до 4 кГц), продюсеры начали химичить со спектром. Они вырезают частоты в районе 3 кГц, чтобы обмануть алгоритм Спотифая. Алгоритм думает: Ага, тут мало энергии в самом чувствительном диапазоне уха, значит трек тихий, и не занижает громкость трека при воспроизведении. А в это время в треке колбасит саб-бас на 30 герц, который алгоритм просто проигнорировал из-за K-фильтра. В итоге трек качает клубные сабвуферы, но формально вписывается в минус 14 LUFS. Вот так акустическая наука превратилась в оружие для наебывания стриминговых платформ.

Как с этим жить[править]

В конечном итоге, все эти стандарты, ISO 226, Робинсоны, Дадсоны, Флетчеры, Мэнсоны, фильтры и компрессоры сводятся к одному экзистенциальному факту: объективной реальности звука не существует. То, что выдают твои колонки — это физика. То, что формируется в твоей голове — это психоакустика, помноженная на химию мозга, уровень стресса и форму твоих хрящей. Пытаться найти честный звук — это то же самое, что пытаться найти правильный цвет, смотря на мир через калейдоскоп.

Звукорежиссеры будут продолжать сводить треки на 85 децибел в акустически заглушенных студиях за сотни тысяч долларов. Аудиофилы будут продолжать покупать серебряные кабели и спорить о том, как влияет подставка под розетку на глубину сцены. Инженеры типа Николая с Вегалаба будут продолжать писать скрипты на языке R, пытаясь свести погрешность кривых равной громкости к сотым долям децибела, забывая, что резонанс их собственной комнаты вносит искажения в плюс-минус 15 децибел на низких частотах. Разработчики плагинов вроде APU Software будут делать изящные цифровые инструменты, продавая иллюзию контроля над неподконтрольным.

А ты? Ты просто сидишь в интернете, читаешь этот бесконечный текст и, возможно, прямо сейчас слушаешь музыку в наушниках. Твои барабанные перепонки колеблются от изменения давления воздуха. Волосковые клетки в улитке гнутся и отмирают (особенно те, что отвечают за 15000 герц, они не восстанавливаются, запомни это). Мозг получает электрические импульсы и генерирует субъективное ощущение кайфа или раздражения. И где-то в недрах этого биологического компьютера твои личные, уникальные кривые равной громкости тихо и незаметно делают свою работу, отсекая лишнее и выпячивая нужное. Потому что если бы ты слышал реальный физический мир абсолютно линейно — от инфразвука сдвигающихся тектонических плит до ультразвука работающих зарядок для телефонов — ты бы сошел с ума ровно через три секунды. Так что скажи спасибо Флетчеру и Мэнсону за то, что они первыми измерили этот спасительный биологический фильтр, который делает нашу жалкую жизнь хотя бы немного выносимой. И не забывай включать тонкомпенсацию, когда слушаешь музыку ночью. Иначе баса не будет.

Category music.png Не слушай Меркьюри, станешь слаб на афедрон
Термины:МузыкаПесниAmen breakBackmaskingCopyrightDIYDJMp3Аудиофилия (Винилофилия) • БарабанщикБасистБрейк-дансВокалистГитарастГруппа одного хитаИндиКитайские ваттыКлавишникКоричневая нотаМажореткаРевербСиндром навязчивой мелодииСтритШредЯпонский идолMCМузыкальный критикКомпакт-дискСабвуферНейрокаверWavПлейлистКомпозиторРоссийские музыкальные клипыLo-FiКаверы с говновозомТрамп в искусствеGangnam StyleWho Don't KnowОсты имиджбордДом ВдовыНео-пост-готикаМэшапПрослушивание песни до 1 минуты 30 секундыМидианствоРусский рэпОпусГолоконцертНаушники-убийцыFatFreq Scarlet MiniFATFreq Grand MaestroИмпедансный адаптер
Устройства:FL StudioS-90Tape delayTB-303БубенВирус ТиВувузелаГитара (GibsonStratocasterГитара Урал) • Зум 505КараокеМагнитофонМиталзонРояль в кустахТерменвоксТёплый ламповый звукЭлектролит из соплей девственницыКантриИзвестные исполнители кантриКантигаКлава КокаПетрович (Говновоз)SCP-4150Пытка музыкойКаверы с ШindowsПартитураBaba YetuDolby AccessКолоратурное сопраноПафосный хоралСкрипкаRussian YouTube PoopDariacoreЛяМелодияШнейне пэпэ фа втфааГанвестSmear frameИзодинамические наушникиAudeze4.4mm PentaconnSPL
СлушательГовнарьКлаббер (Объебос) • Музыкальная личностьПанкПедовкаРастаманРэперХеркаХиппиЭмоГотРиветхэд5mewmetМоя госпожа (песня)Анна АстиРафаэлла КарраМуслим МагомаевСигма БойМужицкий дождьПол Маккартни погиб в 1966 годуРадиокотВсе хиты „Пятого Измерения“Акустический джихадStressed OutПожар священной ТроиПарадиддлОраторияЛайк фмАльтернативный рокГармонияЛасковый майЮрий ХованскийСаксофонНаушникиDTSESoundРозовый КадиллакArdourDolby DigitalШтробасDark ambientNightcoreГиперпоп
Откуда музыка звучит:Epic Rap Battles of HistoryГолосЕвровидениеКазантипКошачий концертПиратские радиостанцииРадио «Маяк»Радио ШансонРейвРок-фестивальСаянское кольцоРадио РекордРадио МаякПризрак ОперыA-OneVEVOУкраинская музыкаWinampЯндекс.МузыкаЛыково ХрамNujabesDolby AtmosФлейта АзатотаДрыньИнтернационалЗмея в гитареOIIAThe Music FreaksВова СолодковБарабулька (песня)Публичный дневникПиратский металКонцертKennertonБиоцеллюлозные драйверыБасхедМогущество и величие Егора ЛетоваЭлектронный звонарьМощь жужжанияНазойливость жужжанияDan Clark AudioОсмогласие
Жанры:8-bitCore (CrabcoreNerdcoreГрайндкорМеталкор) • GachimuchiJ-RockMisheard lyricsNew AgeOi!R’n’BRock'n'rollАвторская песняАльтернативаДарк-фолкДжазЕвродэнсМетал (TRUE-DEATH-PRIMITIVE-LINUX-MITOLLГлэм-металСоветский метал) • НойзПокрытияПопсаРусский рокРусский шансонТверкингХастлХип-хоп • Электронная музыка (ДабстепДрам-энд-бэйсПампТектоник) • ДискоНейрофанкTrue Norwegian Black MetalАртемий ТроицкийТрансРэп / Гангста-рэпГачи-ремиксСинглШансонБростепНеко АркПослепетухКлассическая музыкаФонкEDMЛенинопетухИнструментальная музыкаГолубой ФейерверкДаниэль РозенфельдЛена ИльичёваSorry for Bad English!Родмэн МэнBTSПочему жеМистериумАрткорJ-CoreМатриархпанкЗаказ музыки на стриме
Исполнители:Клэр Буше (Grimes)Юрий ШатуновФредди МеркьюриРамштайнМеталликаVizzionLady GagaГруппа АнькоКсения ЦумароваБатюшкаBaccara1.Kla$Pussy RiotМихаил ГоршенёвАзисNoiseOxxxymironФилипп ЛисОлег ЯворскийИосиф КобзонТина КарольНик ЧерниковГнойныйАлёна ШвецShamanMylene FarmerЧипинкосМорской орган ЗадараЧёрная экономикаСтас БарецкийРозз УильямсТесса ВайолетЛеди ГагаРуслан СаберовТюменщикиGogol BordelloПтахаRickey FDinGDirty MonkВне зоныКаспийский грузThe Revivo ProjectGLD Music groupСлово СПБRicchi e PoveriSaivanZippOSODA LUVSkrewdriverНАИВAxizavtSewerslvtNITron (Каверы) • SlipknotМоргенштернМразишНоль (группа)Мария МаксаковаPromoDJОлег СурковЛюдвиг ван БетховенИван МарголдинСинтезаторСкриллексKREEDOFКрасиловАй, гитарист!Порнофильмы (группа)Пророк СанбойDjentBring Me the HorizonSuno.aiHatepluggСерегаЁптытьTatuСотоняАнжела ЛондонФедор ЯичныйBreakRhyme RecordsForesight211win StudioСкрипка скаибыMOZYLemaierВесна священнаяMONTAGEM CORALМаша КондратенкоИсполнители попсыАквалазы (музыкальная группа)Big Russian BossLove Live! School Idol Project
Срачи:Главная проблема музыки в РоссииНот всего семьРэп — это калТэгосрачЗапись голоса на магнитофонКлип от нейросетиЖанрозадротствоВалера, ты где?I Am The Very ModelХорошая песня, если не знать переводКультурное влияние Леди ГагиFreshTunesДорожное радиоСинти-попСплинТрансТрэш-металK-POPГранжКраут-рокПесни с датамиПросто ПутинПатриотические марши страны ПынеопииХлоГотичноЭто точно музыка?Травля ОксимиронаПаша Техник vs Виктор ЦойАкустика с, кхм, артефактамиСомнительная музыка из плохого сабвуфера
Спецсайты:Last.fm (Crypto-Fascists) • /m/ДизентерияЗайцев.нетНойзбункерRhythm gameSpotifyRobot Unicorn AttackЗвуки.руПрослушивание песни на других языкахДирижёрAptXSound BlasterDenonBass BleedАЧХАйсберг силиконовых IEM затычекFATFreq X HBB DeuceBeyerdynamicLDACРезонаторКонтрабасГромкостьЭквалайзерRebassedТонкомпенсация