Все книги Импринты Бестселлеры Бесплатные Скидки Подборки Книги людям

18+

Бесплатный фрагмент - Магия звука

Name: Магия звука
Author: Максим Батурин

Полное руководство по звукорежиссуре для начинающих

Максим Батурин

Электронная книга - 808 ₽

Объем: 1012 бумажных стр.

Формат: epub, fb2, pdfRead, mobi

Подробнее

0.00 Оценить

О книге отзывы Оглавление Читать фрагмент

МАГИЯ ЗВУКА

ПРОЛОГ

ЧТО ТЫ ИЩЕШЬ?

Ты когда-нибудь замечал, что звук — единственное, что нельзя остановить взглядом?

Свет ты закрываешь веками. Запах — зажимаешь нос. Вкус — выплевываешь. Даже боль можно притупить, зажать, перетерпеть.

Но звук… звук входит в тебя без спроса.

Он минует стражу. Ломает стены. Сворачивается клубком где-то между ребер и остается там навсегда.

Хороший звук ты чувствуешь кожей.

Плохой — зубами.

Ты держишь эту книгу не потому, что хочешь стать «звукорежиссером». Ты держишь ее, потому что однажды услышал то, что нельзя объяснить.

Может, это была нота в старом айфоновском сэмпле. Та самая, из «Hotline Bling» или «God’s Plan». Ты не знал, что это называется «сатурация ленточного магнитофона», но ты чувствовал: в этой ноте есть тепло, которого нет в других нотах.

Может, это был бас в клубе. Не звук — удар. Он вошел не через уши, а через грудину, разжал что-то внутри, и ты вдруг понял: музыка — это не про «слышу», это про чувствую.

Может, это была тишина между двумя ударами малого барабана. Длилась она ровно столько, чтобы ты перестал дышать. А потом удар — и мир снова завертелся.

Ты хочешь научиться делать так же.

Я научу.

Но сразу предупрежу: здесь нет «пяти шагов к хиту» и «секретных частот успеха». Потому что звук — это не математика. Это алхимия.

Математика работает с числами. Ты можешь просчитать резонанс комнаты, предсказать интерференцию волн, вычислить оптимальное соотношение компрессии.

Но ты не можешь просчитать мурашки.

Алхимия работает с тем, что нельзя измерить. Соотношение грязи и чистоты. Баланс между «идеально» и «живо». Момент, когда технически неправильный звук становится единственно верным.

Ты будешь ошибаться.

Ты будешь переслушивать свои старые миксы и вздрагивать. «Как я мог так выкрутить эквалайзер? Зачем я залил столько ревера? Почему бас звучит как картонная коробка?»

Ты будешь ненавидеть свои треки. Потом любить. Потом снова ненавидеть.

Это нормально.

Так выглядит путь.

В 1967 году Брайан Уилсон из Beach Boys сидел в студии и сводил вокал для «Good Vibrations». Он потратил на эту песню 90 часов — только на сведение. Продюсеры считали его сумасшедшим. Музыканты уходили в запой. Лейбл угрожал разорвать контракт.

А потом вышел сингл. И изменил всё.

Брайан не считал частоты. Он просто искал.

Ты тоже будешь искать.

Эта книга — не учебник. Это карта территории, на которую ты заходишь. Я не буду говорить тебе «делай так». Я буду говорить: «посмотри сюда, послушай вот это, обрати внимание на то».

Остальное ты найдешь сам.

Почему труба звучит как труба, а флейта — как флейта. Почему твой мозг обманывает тебя каждую секунду, пока ты слушаешь музыку. Как цифра убивает тепло — и как вернуть его обратно. Почему компрессор — это не устройство, а скальпель. Как заставить бас дышать, вокал — говорить, барабаны — летать.

И да, здесь будет техника.

Много техники.

Но техника — это не цель. Цель — слышать.

Слышать то, что не слышат другие. Слышать шум вентиляции в концертном зале за секунду до того, как дирижер поднимет палочку. Слышать, что вокалист устал еще до того, как он сам это понял. Слышать, что в этом звуке есть жизнь, а в этом — только частоты.

А теперь сделай то, с чего начинают все, кто приходит в этот цех.

Выключи телефон.

Надень наушники.

Не включай музыку.

Просто сиди в тишине 60 секунд.

Слышишь?

В тишине тоже есть звук.

Просто ты раньше не умел его слушать.

Поехали.

ЧАСТЬ I

ФИЗИКА И ФИЛОСОФИЯ ЗВУКА

ГЛАВА 1

ПЕРВЫЙ КРИК

Как рождается то, что мы называем звуком

Открывающая история

Когда ты родился, ты закричал.

Не потому что было больно. В первые секунды жизни в кровь выбрасывается коктейль из эндорфинов и катехоламинов — природное обезболивающее, которое притупляет шок от встречи с миром. Акушеры называют это «физиологическим стрессом рождения». Ты не чувствовал боли. Ты чувствовал переход.

Не потому что испугался. Страх — это сложная эмоция. Она требует памяти, прогнозирования, понимания «опасно/безопасно». У тебя не было ничего этого. Ты был чистым листом.

Ты закричал, потому что легкие впервые сжались, вытолкнули воздух, голосовые связки дрогнули — и мир отозвался.

Ты создал звук.

До этого ты девять месяцев жил в абсолютной аналоговой пещере. Сквозь околоплодные воды, через брюшную стенку, через мышцы матки до тебя доносился глухой, теплый, искаженный ритм.

Стук материнского сердца — 40–60 ударов в минуту. Это 0,7–1 Гц. Ты слышал не сам звук, а его низкочастотную пульсацию. Инфразвук. Ты чувствовал его как вибрацию всего тела.

Урчание кишечника — 100–150 Гц. Грязная, негармоническая середина. Белый шум с характером.

Приглушенный голос отца за стеной живота — резаные верха, потерявшие всю четкость выше 2 кГц. Как радио за стеной, как разговор в соседней комнате.

Это был первый микс в твоей жизни.

Низкие частоты проходили почти без потерь. Высокие — гасли, тонули, растворялись в амниотической жидкости. Ты слышал не слова, а тембр. Не ритм, а пульс. Не мелодию, а вибрацию.

Ты был звукорежиссером еще до того, как научился дышать.

А потом ты закричал.

И этот крик — 432 Гц, если ты мальчик; 448 Гц, если девочка; 440 Гц, если ты родился с абсолютным слухом и уже настраиваешься по камертону — стал твоей первой нотой.

Не случайной. Не хаотичной.

Твой первый крик — это чистый тон с минимальным уровнем гармоник. Акустический осциллятор. Синус.

Акушерка приняла его за «ребенок дышит, все в порядке».

Ты принял его за «я есть».

С этого начался твой слух.

С этого началась вся музыка.

Миф о 432 Гц: почему мы хотим верить в магию

Прежде чем мы уйдем в технику, давай разберемся с тем, что лежит на поверхности.

432 Гц.

Если ты провел в музыкальном интернете больше трех часов, ты видел эту цифру. «Частота вселенной». «Целебная вибрация». «Настройка, которую использовали древние египтяне». «Моцарт настраивал свои инструменты на 432 Гц».

Все это — ложь.

Никаких доказательств, что древние египтяне настраивали свои систры и систрумы на 432 Гц, не существует. У них не было камертонов. У них не было стандартизированной высоты тона. Более того — у них не было даже общепринятой нотной записи.

Моцарт настраивал свои инструменты на что угодно. В XVIII веке в Европе не было единого стандарта. В Вене настраивали выше, в Париже — ниже, в церквях — вообще по принципу «как орган построили». Камертон 432 Гц появился только в XIX веке как одна из многих попыток унифицировать строй.

В 1939 году международная конференция утвердила стандарт 440 Гц. Почему 440? Не потому что «мировая элита хочет сделать нас агрессивными». А потому что это удобно: 440 — круглое число, легко запомнить, легко воспроизвести.

Так почему же миф о 432 Гц так живуч?

Потому что нам хочется верить.

Хочется верить, что есть тайное знание, скрытое от непосвященных. Что мы, избранные, можем прикоснуться к чему-то большему. Что музыка — это не просто вибрация воздуха, а ключ к вселенной.

Знаешь что?

Это правда.

Только ключ — не в цифрах.

Музыка — это магия. Но магия эта живет не в частоте 432 или 528 или 1111. Она живет в промежутке между твоим ухом и мозгом. В том, как вибрация превращается в электричество, электричество — в образы, образы — в эмоции.

Ты можешь настроить свой инструмент на 432 Гц. Можешь на 440. Можешь на 415, как в барочной музыке. Можешь на 466, как в современном оркестре.

И если ты сыграешь с душой — люди заплачут.

А если без души — никто не заметит разницы.

Что такое звук: разговор с физиком

Окей. Давай теперь сухо и строго.

Я пригласил на эту страницу физика. Он будет говорить правильные слова. Твоя задача — не заскучать.

— Звук, — говорит физик, — это продольная механическая волна.

Он пишет на доске:

v = λ × f

— Скорость равна длине волны, умноженной на частоту. В воздухе при 20 градусах Цельсия скорость звука — 343 метра в секунду.

Он пишет дальше:

λ = v / f

— Длина волны обратно пропорциональна частоте. Чем выше частота, тем короче волна. 20 Гц — 17 метров. 20 000 Гц — 1,7 сантиметра.

Физик счастлив. У него есть формулы.

Я выключаю доску.

— Это все правда, — говорю я. — И это ничего не объясняет.

Физик обижается. Я продолжаю:

— Ты можешь знать длину волны бас-бочки. Ты можешь рассчитать, где в комнате будет стоячая волна. Ты можешь предсказать интерференцию. Все это полезно.

Но когда бас-бочка ударяет — ты не вычисляешь длину волны. Ты чувствуешь удар.

Когда вокалист берет высокую ноту — ты не анализируешь частоту. У тебя мурашки.

Когда гитара играет блюзовый квадрат — ты не вспоминаешь соотношение 4:1. Ты киваешь в такт.

Физик молчит. Потом говорит:

— Я понимаю. Но без меня ты бы не знал, почему бас-бочка в машине звучит иначе, чем в студии.

Он прав.

Давай договоримся.

Физика — это инструмент. Ты не играешь на инструменте, ты играешь музыку. Но без инструмента музыки не будет.

Так что давай выучим инструмент.

Частота: карта звукового спектра

Частота измеряется в герцах (Гц).

1 Гц — одно колебание в секунду.

20 Гц — 20 колебаний в секунду. Ты слышишь это как низкий гул.

20 000 Гц — 20 000 колебаний в секунду. Комариный писк.

Весь слышимый спектр — от 20 до 20 000 Гц — принято делить на диапазоны.

Суббас (20–60 Гц)

Ты почти не слышишь эти частоты. Ты чувствуешь их. Грудной клеткой, животом, позвоночником.

Орган в соборе. Сабвуфер в клубе. Гул поезда метро за три станции. В этом диапазоне живет фундамент современной электронной музыки — 808-й бас.

Проблема суббаса: его очень трудно контролировать. Длина волны — 5–17 метров. Он огибает препятствия, проходит сквозь стены, создает стоячие волны в любой комнате меньше ангара.

Если у тебя маленькая студия — ты никогда не услышишь суббас честно. Только его резонансы.

Бас (60–250 Гц)

Здесь живет ритм-секция.

Бас-бочка — 60–100 Гц.

Бас-гитара — 80–250 Гц.

Мужской вокал — 100–200 Гц (основная частота).

В этом диапазоне решается, будет ли микс плотным и мощным — или жидким и пустым.

Главная проблема баса: маскировка. Если у тебя одновременно играют бас-бочка и бас-гитара на одной частоте — они не подружатся. Они начнут драться. Победит тот, кто громче. Проигравший исчезнет из микса.

Решение: развести их по частотам. Бочке — 60 Гц, басу — 100 Гц с подъемом. Или наоборот.

Нижняя середина (250–2000 Гц)

Самый опасный диапазон.

Здесь живет все, что делает музыку разборчивой. Вокал, гитары, клавиши, верхние гармоники баса. И здесь же живет каша.

Если в этом диапазоне слишком много информации — микс превращается в гулкую, невнятную массу. Инструменты перестают быть отдельными — они сливаются в один плотный, утомительный ком.

Новички обычно вырезают середину. Им кажется: убрал середину — освободил место.

Профессионалы знают: середину нельзя вырезать. Ее нужно организовывать.

Верхняя середина (2000–6000 Гц)

Здесь живет атака.

Щелчок малого барабана. Кончик гитарного перегруза. Сибилянты вокала — «с», «ш», «ч».

Если в этом диапазоне перебор — микс режет уши.

Если недобор — микс звучит ватно, безжизненно, «издалека».

Золотое правило: верхняя середина — это специя. Ее нужно добавлять по чуть-чуть и постоянно пробовать.

Присутствие (6000–10 000 Гц)

Воздух. Детализация. Ощущение, что музыканты в комнате.

Тарелки, хай-хэт, верхние гармоники вокала, дыхание.

Здесь легко переборщить. Лишние 3 дБ на 8 кГц — и вокал начинает свистеть.

Верх (10 000–20 000 Гц)

Шипение, звон, «искры».

В современной музыке этот диапазон часто обрезают. На стриминговых платформах его все равно почти не слышно — алгоритмы сжатия режут верха первыми.

Но если убрать его совсем — микс потеряет «дороговизну».

Таблица частот: шпаргалка на всю жизнь

Инструмент Основной диапазон Атака Тело Воздух

Бас-бочка 60–100 Гц 2–4 кГц 60–80 Гц —

Малый барабан 120–250 Гц 3–5 кГц 150–200 Гц 8–10 кГц

Томы 80–400 Гц 3–5 кГц 100–300 Гц —

Хай-хэт 200 Гц — 8 кГц 3–6 кГц — 8–12 кГц

Тарелки 200 Гц — 16 кГц 1–3 кГц — 10–16 кГц

Бас-гитара 80–250 Гц 1–2 кГц 80–120 Гц 3–5 кГц

Электрогитара 150–5 кГц 2–4 кГц 200–500 Гц 5–8 кГц

Акустическая гитара 80–8 кГц 2–5 кГц 100–300 Гц 8–12 кГц

Вокал (мужской) 100–400 Гц 2–5 кГц 120–200 Гц 8–12 кГц

Вокал (женский) 200–800 Гц 2–5 кГц 250–500 Гц 8–12 кГц

Скрипка 200–10 кГц 1–4 кГц 300–600 Гц 8–12 кГц

Виолончель 80–8 кГц 1–3 кГц 100–400 Гц 6–10 кГц

Флейта 250–3 кГц 2–5 кГц 500–1000 Гц 8–12 кГц

Труба 150–10 кГц 2–5 кГц 200–500 Гц 8–12 кГц

Синтезатор любой любой любой любой

Как пользоваться этой таблицей:

Конфликт инструментов? Посмотри их основные диапазоны. Если они пересекаются — у тебя проблема.

Решение:

1. Развести по панораме (гитара слева, клавиши справа)

2. Развести по частотам (бочке 60 Гц, басу 100 Гц)

3. Развести по времени (сайдчейн: бочка ударила — бас пригнулся)

Амплитуда: сила удара

Амплитуда — это размах колебаний. Высокая волна — громко. Низкая волна — тихо.

Измеряется в децибелах (дБ).

Почему децибелы — это сложно

Потому что это не линейная шкала.

Если ты увеличишь мощность звука в 10 раз — ты получишь +10 дБ.

Если в 100 раз — +20 дБ.

Если в 1000 раз — +30 дБ.

Твои уши устроены так же. Мы слышим логарифмически.

Это эволюционная защита. Если бы мы слышали линейно — шум поезда метро был бы для нас в 10 000 раз громче шепота. Мы бы оглохли от первого чиха.

Вместо этого мозг сжимает динамический диапазон. Шепот — 30 дБ, поезд — 100 дБ. Разница в физической мощности — в миллионы раз. Разница в восприятии — в 30–40 раз.

Шкала громкости в реальном мире:

0 дБ SPL — порог слышимости. Теоретический. В реальности такого не бывает — всегда есть фоновый шум.

20 дБ SPL — тихий шепот, студия звукозаписи ночью.

30 дБ SPL — дыхание, листья шелестят.

40 дБ SPL — библиотека.

50 дБ SPL — тихий разговор.

60 дБ SPL — нормальный разговор.

70 дБ SPL — оживленная улица, пылесос.

80 дБ SPL — будильник, шумная ресторан.

85 дБ SPL — эталонная громкость сведения. Не вредно, не тихо, уши не устают 4–6 часов.

90 дБ SPL — газонокосилка.

100 дБ SPL — поезд метро, рок-концерт (без усиления).

110 дБ SPL — отбойный молоток.

120 дБ SPL — болевой порог. Начинает реально болеть.

130 дБ SPL — взлетающий самолет.

140 дБ SPL — разрыв барабанных перепонок.

Шкала громкости в цифре:

0 дБ FS — абсолютный потолок. Выше нельзя. Если сигнал касается 0 дБ FS — он обрезается, клиппует, превращается в прямоугольник.

Вся цифровая запись живет в минусах.

— 18 дБ FS — стандартный уровень записи. Рекомендуемый пик.

— 12 дБ FS — горячо, но допустимо.

— 6 дБ FS — опасно. Малейшая неточность — и клипп.

— 3 дБ FS — почти клипп.

0 дБ FS — красная лампа горит, ты проиграл.

Почему -18 дБ FS?

Потому что это дает запас для обработки. Когда ты добавляешь эквалайзер — он может поднять отдельные частоты на 6–12 дБ. Когда ты добавляешь компрессор — он может сделать пики еще выше.

Если ты записал сигнал на -6 дБ FS, у тебя запас всего 6 дБ до клиппа.

Если ты записал на -18 дБ FS, у тебя запас 18 дБ.

Профессионалы записывают тихо.

Любители записывают громко.

Профессионалы знают, что тишину можно сделать громче.

Любители не знают, что громкость нельзя сделать чище.

Фаза: невидимый убийца

Самый недооцененный, самый опасный, самый скрытый параметр звука.

Фаза — это положение волны в момент времени.

Представь качели.

Ты толкаешь качели вперед — они летят. Твой друг толкает их вперед в тот же момент — качели летят быстрее. Это синфазно.

Твой друг толкает качели назад в тот момент, когда ты толкаешь вперед — качели останавливаются. Это противофаза.

Со звуком то же самое.

Сложение фаз:

Две одинаковые волны встречаются гребень к гребню.

Амплитуда удваивается.

Громкость +6 дБ.

Вычитание фаз:

Две одинаковые волны встречаются гребень к впадине.

Амплитуда обнуляется.

Звук исчезает.

Это называется фазовое гашение.

Где это происходит постоянно:

1. Запись барабанов

Ты ставишь микрофон сверху малого барабана и микрофон снизу. Верхний ловит атаку, нижний — резонанс пружин.

Если эти микрофоны не совпадают по фазе — нижний начнет гасить верхний. Малый барабан потеряет удар, станет плоским, картонным.

Решение: инвертировать фазу на нижнем микрофоне. Кнопка с символом Ø. Попробуй оба варианта — услышишь разницу сразу.

1. Запись акустической гитары

Ты ставишь один микрофон у розетки, второй — у грифа. Красиво, стерео, объемно.

Но если микрофоны находятся на разном расстоянии — звук приходит в них в разное время. Возникает гребенчатая фильтрация.

Частоты, где волны совпадают, усиливаются. Частоты, где расходятся, гасятся. АЧХ превращается в частокол.

Решение: сдвинуть дорожки по времени. В любой DAW есть инструмент для выравнивания фазы.

1. Сведение баса и бочки

Бочка бьет на 60 Гц. Бас играет 60 Гц. Если они в фазе — бас и бочка звучат как одно целое, мощно, плотно.

Если в противофазе — они съедают друг друга. Ты выкручиваешь громкость, а баса все равно нет.

Решение: инвертировать фазу на басу. Или сдвинуть дорожку бочки на несколько миллисекунд.

1. Запись гитарного кабинета

Ты ставишь два микрофона: динамический (SM57) близко к сетке, конденсаторный — на метр дальше.

Поздравляю, у тебя фазовая проблема.

Решение: сдвинь дальний микрофон по времени так, чтобы он совпал с ближним.

Как слышать фазу

Это самое сложное.

Фазовое гашение не видно глазами. Его нельзя пощупать. Ты не можешь посмотреть на осциллограф и сказать: «Ага, вот здесь 45 градусов, нужно подправить».

Фазу нужно слышать.

Признаки фазовых проблем:

Исчезновение баса

Ты сводишь трек, выкручиваешь бас, а его все равно нет. Не тихо — а именно нет. Провал.

Тонкий, плоский звук

Инструмент, который должен звучать объемно и мощно, звучит как из консервной банки.

Плавающий центр

Ты панорамируешь вокал по центру, а он «гуляет». То чуть левее, то чуть правее.

Усталость

Микс вроде бы звучит нормально, но через 10 минут уши устают. Хочется выключить.

Простейший тест:

Сведи микс в моно.

Если при переключении в моно звук становится тише, «проваливается» — у тебя фазовые проблемы.

Если звук остается таким же плотным — фаза в порядке.

Инструменты для работы с фазой:

Auto-Align (SoundRadar) — автоматически выравнивает фазу между микрофонами. Дорого, но работает гениально.

· Phase Meter (Voxengo, Melda, родной плагин DAW) — показывает корреляцию между левым и правым каналом.

· Инвертор фазы — кнопка Ø. Бесплатно, есть в каждом канале.

Золотое правило:

Если сомневаешься — инвертируй фазу и послушай разницу. Твой выбор — тот вариант, где больше баса.

Тембр: лицо звука

Вернемся к твоему первому крику.

В нем была одна основная частота — 432 Гц. Но вместе с ней звучали обертоны.

432 × 2 = 864 Гц

432 × 3 = 1296 Гц

432 × 4 = 1728 Гц

432 × 5 = 2160 Гц

432 × 6 = 2592 Гц

432 × 7 = 3024 Гц

432 × 8 = 3456 Гц

432 × 9 = 3888 Гц

432 × 10 = 4320 Гц

И так далее, вверх, в бесконечность, пока не затухнут.

Гармонические обертоны — кратные основной частоте. Они создают музыкальный звук. Ноту. Тон.

Негармонические обертоны — не кратные. 432 × 2,7 = 1166,4 Гц. Это уже не нота, это шум.

У флейты почти нет обертонов. Только чистая нота, почти синус, стерильность, холод.

У трубы обертонов — лес. Они громкие, резкие, агрессивные. Поэтому труба режет слух на форте и звучит как бархат на пиано.

У человеческого голоса — свой уникальный набор. Поэтому ты узнаешь маму по голосу в телефоне, даже если она говорит шепотом.

Тембр — это отпечаток пальца звука.

Ты не можешь изменить его полностью. Но ты можешь формировать его.

Эквалайзером — убирать нежелательные обертоны, поднимать желательные.

Сатурацией — добавлять новые обертоны, обогащать спектр.

Компрессией — менять соотношение между атакой и затуханием.

Музыка — это баланс между гармоникой и шумом.

Слишком чисто — стерильно, мертво, скучно. Как цифровой рояль без педали.

Слишком грязно — каша, хаос, неразбериха. Как перегруженный микрофон.

Твоя задача — найти баланс.

История тембра: как мы научились любить грязь

В 1920-х годах звукорежиссеры делали всё, чтобы убрать из записи любые искажения.

Микрофоны были примитивными, лампы шумели, провода фонили. Задача была одна: поймать чистый сигнал, не испорченный оборудованием.

Считалось, что идеальная запись — это точная копия живого звука.

В 1950-х годах появился рок-н-ролл.

Гитаристы начали перегружать ламповые усилители. Звук становился грязным, рычащим, агрессивным. Инженеры в ужасе хватались за голову: «Это же искажения! Это брак!»

А публика сходила с ума.

Оказалось, что грязь — это не брак. Это характер.

В 1960-х The Beatles пришли в студию Abbey Road и сказали: «Мы хотим, чтобы звучало не как живой концерт. Мы хотим, чтобы звучало как нигде и никогда».

Инженеры начали экспериментировать. Ставили микрофоны в коридорах. Прокручивали ленту задом наперед. Пропускали вокал через динамик Лесли.

Так родилась концепция студии как инструмента.

В 1980-х появились цифровые ревербераторы, драм-машины, сэмплеры. Звук стал стерильно чистым. И — скучным.

Тогда люди начали имитировать аналоговую грязь. Покупать винтажные компрессоры. Искать старые ленточные магнитофоны. Прогревать лампы.

Сегодня мы платим тысячи долларов за плагины, которые эмулируют шум, грязь, несовершенство оборудования 50-летней давности.

Мы полюбили тембр. Не чистоту. Не стерильность. Не «правильность». А лицо.

Тишина: забытый инструмент

1952 год. Вудсток, Нью-Йорк. Концертный зал Maverick.

Композитор Джон Кейдж выходит на сцену, садится за рояль, открывает крышку.

И ничего не делает.

4 минуты 33 секунды.

Он сидит неподвижно. Потом закрывает крышку, встает и уходит.

Зал в шоке. Критики в ярости. «Это не музыка!» — кричат они.

Кейдж улыбается.

Он говорит: «Тишины не существует. Всегда есть какой-то звук».

Он прав.

В зале кашляли. Скрипели кресла. За окном проехала машина. Кто-то дышал слишком громко. Кейдж не писал тишину. Он писал контекст.

Что это значит для тебя?

Тишина — это не отсутствие звука.

Тишина — это звук, который мы договорились не замечать.

В самой заглушенной студии, в самых дорогих наушниках с активным шумоподавлением ты слышишь:

· свое дыхание

· стук сердца

· гул крови в сосудах

· шум вентиляции

· вибрацию здания

· далекий город

0 дБ — это не тишина.

0 дБ — это математическая абстракция.

В реальном мире тишины нет.

Зачем тебе это знать?

Потому что без тишины нет ритма.

Без пауз нет музыки.

Без пустоты нет формы.

Вся динамическая обработка — компрессия, гейтинг, экспандеры — это работа с границей между звуком и тишиной.

Где провести черту?

Что считать сигналом, а что — шумом?

Когда оставить шум, чтобы было живо, а когда вырезать, чтобы было чисто?

Ответь на эти вопросы — и ты поймешь о звуке больше, чем выпускник Беркли.

История тишины: от Шёнберга к Radiohead

1911 год. Арнольд Шёнберг пишет монодраму «Ожидание».

В партитуре есть такты, где оркестр молчит целых 7 секунд.

Семь секунд тишины в концертном зале — это вечность. Люди начинают кашлять, ерзать, переглядываться. Дирижер в панике — не ошибся ли он?

Шёнберг был первым, кто понял: тишина — это не пустота. Это напряжение.

1967 год. The Beatles записывают «Strawberry Fields Forever».

В середине песни, после слов «I think I know, I mean a yes…», наступает 2 секунды абсолютной тишины.

Потом — удар, и врывается оркестр.

Джордж Мартин говорил: «Мы хотели, чтобы слушатель испугался. Чтобы подумал: „А пластинка испортилась? А выключилось?“ А потом — взрыв».

1997 год. Radiohead записывают «Exit Music (For a Film)».

В конце песни — 30 секунд затухающего ревербератора. Почти тишина. Почти.

Ты ждешь, что будет дальше. А ничего не будет. Песня кончилась.

Но ты продолжаешь слушать тишину.

Великие звукорежиссеры работают не со звуком. Они работают с контрастом между звуком и тишиной.

Комната: первый эквалайзер

Прежде чем ты купишь первый плагин.

Прежде чем откроешь DAW.

Прежде чем коснешься эквалайзера.

Запомни:

Каждое помещение — это эквалайзер.

Дерево — гасит высокие частоты. Акустическая гитара в деревянной комнате звучит тепло, мягко, «по-домашнему».

Стекло — отражает верха, добавляет звона, резкости. Барабаны в комнате с панорамными окнами звучат агрессивно, «металлически».

Ковер — жрет середину. Вокал в ковровой комнате теряет разборчивость, становится глухим, «ватным».

Бетон — бубнит басом. Стоячие волны, резонансы, гулы. Нижние частоты не уходят, они накапливаются, давят на уши.

Гипсокартон — резонирует на 120 Гц. Ты будешь думать, что у тебя проблема с мониторами. А это просто стена поет.

Окно без штор — источник гребенчатой фильтрации. Звук отражается от стекла, приходит с задержкой, интерферирует с прямым сигналом.

Твоя комната не нейтральна.

Твоя комната врет.

Как это проявляется:

Ты выкручиваешь эквалайзер так, что в наушниках звучит идеально — чисто, плотно, сбалансированно.

А потом выходишь в зал, включаешь мониторы — и слышишь кашу.

Это не ты виноват.

Это комната.

Первое правило звукорежиссера:

Не доверяй комнате.

Второе правило звукорежиссера:

Подружись с комнатой.

Как подружиться с комнатой

Шаг 1. Узнай ее.

Купи измерительный микрофон. Не дорогой — Behringer ECM8000 стоит 3000 рублей и делает 95% работы.

Скачай Room EQ Wizard (бесплатно). Или Sonarworks (платно, но удобно).

Поставь микрофон в точку прослушивания.

Включи розовый шум.

Посмотри на график.

Ты увидишь горбы и провалы.

Горб на 50 Гц — гудит холодильник или вентиляция.

Провал на 120 Гц — гипсокартонная стена играет против тебя.

Пик на 3 кГц — голые стены режут уши.

Спад после 10 кГц — ковры и мягкая мебель съедают верха.

Шаг 2. Прими ее.

Ты не исправишь комнату плагинами.

Ты можешь купить мониторы за миллион, но в неправильной комнате они будут звучать как компьютерные колонки.

Ты можешь исправить только акустикой.

Бюджетная акустика:

· Басовые ловушки в углы (самый важный апгрейд)

· Панели поглощения в точки первых отражений

· Ковер на пол

· Шторы на окна

· Книжный шкаф с книгами (отличный диффузор)

Золотое правило профессионала:

Прежде чем купить монитор за 2000 долларов, потрать 500 долларов на акустику комнаты.

Дешевый монитор в правильной комнате звучит честнее, чем дорогой в неправильной.

Шаг 3. Научись слышать ее вранье.

Ты никогда не сделаешь комнату идеальной. Даже студии за миллион долларов имеют свои проблемы.

Поэтому ты должен знать:

· Где у тебя ложный бас

· Где провалена середина

· Где режут верха

И компенсировать это головой.

Если ты знаешь, что в твоей комнате провал на 120 Гц — ты не будешь выкручивать бас на +6 дБ, когда тебе покажется, что его мало. Ты скажешь себе: «Это ложь. Я не слышу бас, но он есть».

85 дБ: магическое число

Вернемся к Флетчеру и Мэнсону.

Их кривые показали: на малой громкости мы глухи к басу и верхам.

На средней — слышим более-менее честно.

На высокой — устаем за 15 минут.

Где золотая середина?

85 дБ SPL.

При этой громкости:

· Кривая Флетчера–Мэнсона почти выравнивается

· Уши не устают 4–6 часов

· Ты слышишь баланс так же, как его услышит слушатель

Как настроить 85 дБ:

1. Купи SPL-метр. Или скачай приложение (NIOSH SLM, Decibel X). Приложения ошибаются на 2–3 дБ, но для начала сойдут.

2. Включи розовый шум на всех мониторах.

3. Настрой громкость так, чтобы SPL-метр показывал 85 дБ.

4. Запомни положение регулятора громкости. Отныне это твоя рабочая позиция.

Проверка:

Посводил час на 85 дБ.

Сделай тише — до 70 дБ.

Послушай.

Если баланс сохранился — ты все сделал правильно.

Если бас пропал или верха зазвенели — ты ошибся.

Хороший микс звучит хорошо на любой громкости.

Эффект Хааса: ложь, которая звучит правдой

1949 год. Нидерланды.

Гельмут Хаас защищает диссертацию. Тема: как человек определяет, откуда идет звук.

Он обнаруживает нечто странное.

Если один и тот же звук приходит в левое ухо на 5–30 миллисекунд раньше, чем в правое — мозг решает, что звук слева.

Даже если на самом деле колонка справа играет громче.

Это называется приоритет первого вступления.

Как это используют профессионалы:

Ты хочешь, чтобы гитара звучала слева.

Ты можешь просто панорамировать ее налево — 100% L.

А можешь сделать так:

· Левая дорожка — 0 мс задержки

· Правая дорожка — копия левой, задержка 15 мс

Мозг говорит: «Звук слева».

Но наушники играют стерео.

Гитара звучит шире, объемнее, интереснее.

Правила Хааса:

· 0–5 мс — фазовая интерференция (опасно)

· 5–30 мс — эффект Хааса, приоритет первого вступления

· 30–50 мс — начинает слышаться эхо

· 50+ мс — явное эхо, задержка

Где применять:

· Удвоение гитар

· Широкие пэды

· Задники, атмосфера

· Эффекты

Где не применять:

· Бас

· Бочка

· Вокал (кроме спецэффектов)

Низкие частоты плохо локализуются. Задержка на басу создаст не ширину, а фазовую грязь.

Фантомный центр: источник, которого нет

У тебя две колонки.

Но когда ты слушаешь вокал, он звучит посередине.

Как?

Ты ставишь одинаковый сигнал на левый и правый канал.

Мозг получает два одинаковых сигнала. Время прихода — одинаковое. Громкость — одинаковая. Фаза — одинаковая.

Мозг делает вывод: «Раз в обоих ушах одно и то же — значит, источник прямо передо мной».

Это фантомный центр.

Его нет физически. Нет колонки между левой и правой.

Но мозг ее дорисовывает.

Почему это важно:

Фантомный центр — самая уязвимая точка стереосистемы.

Если ты сидишь ровно по центру — вокал звучит идеально.

Если ты сдвинешься на 30 см влево — вокал «поедет» влево. Потому что левое ухо стало ближе к левой колонке, правое — дальше от правой.

Как это лечится:

Никак. Это физика.

Но ты можешь:

1. Садиться ровно по центру.

2. Использовать мониторы с узкой диаграммой направленности.

3. Иногда — добавлять центральный монитор (дорого, редко).

Еще важнее:

Фантомный центр работает только в стерио.

Если ты сведешь трек, полагаясь только на фантомный центр, а потом кто-то включит его в моно — вокал может провалиться, исчезнуть, стать тише.

Почему? Потому что в моно левый и правый канал складываются. Если они идеально одинаковы — все хорошо. Если есть малейшая разница в фазе — происходит гашение.

Поэтому профессионалы проверяют моно-совместимость.

Всегда.

Слух: мышца, которую можно накачать

Абсолютный слух — это дар.

У 1 из 10 000 человек есть способность назвать ноту, не имея референса. Это врожденное. Как цвет глаз.

Относительный слух — это навык.

Ты можешь научиться слышать разницу между 100 Гц и 200 Гц.

Ты можешь научиться слышать компрессию 2:1 и 4:1.

Ты можешь научиться слышать реверберацию 0.8 сек и 1.2 сек.

Это не талант.

Это память.

Как тренировать слух:

1. Frequency training

Приложения: Quiztones, SoundGym, EarMaster.

Тебе дают два звука. Один с эквалайзером, другой без. Ты должен угадать частоту.

Начинай с широких диапазонов (100 Гц vs 1000 Гц).

Потом сужай (100 Гц vs 200 Гц).

Потом совсем узко (1000 Гц vs 1100 Гц).

15 минут в день. Через месяц ты будешь слышать частоты, о которых раньше не подозревал.

1. Компрессия

Сделай две дорожки: без компрессии и с компрессией 4:1.

Слушай. Запоминай ощущение «прижатости», «плоскости», «управляемости».

Потом уменьшай соотношение. 3:1, 2:1, 1.5:1.

Твоя задача — услышать момент, когда компрессия перестает быть слышна, но перестает быть полезна.

1. Реверберация

Слушай хвост.

0.3 сек — маленькая комната.

0.8 сек — жилая комната.

1.5 сек — зал.

2.5 сек — собор.

Научись определять время реверберации на слух.

1. Референсы

Каждый день слушай один коммерческий трек — критически.

Не как слушатель. Как инженер.

Где стоит бас? По центру или по бокам?

Сколько ревера на вокале?

С какой громкости начинается трек и с какой заканчивается?

Через год ты будешь смеяться над своими старыми миксами.

Через два — тебе будут платить за то, что ты слышишь.

Усталость слуха: главный враг

Через 2–3 часа непрерывной работы слух притупляется.

Это не физическая усталость ушей. Уши не устают — они просто передают сигнал.

Устает мозг.

Мозг устает интерпретировать. Различать. Сравнивать. Принимать решения.

Симптомы усталости слуха:

1. Ты начинаешь лить верхние частоты. Потому что они кажутся тихими.

2. Ты перекомпрессовываешь бас. Потому что он «потерялся».

3. Ты добавляешь громкость. Потому что «так интереснее».

4. Ты перестаешь слышать разницу между 2 и 3 дБ.

5. Ты начинаешь сомневаться в каждом решении.

Что делать:

1. Перерывы.

10 минут тишины каждый час.

Не тихой музыки. Не радио. Не подкаста.

Тишины.

Выйди из комнаты. Посмотри в окно. Выпей воды. Не думай о звуке.

1. Смена громкости.

Посводил час на 85 дБ — сделай 70 дБ.

Послушай 5 минут. Вернись к 85.

Контраст сбивает «слепоту».

2. Референсы.

Каждые 30–40 минут включай коммерческий трек, который звучит отлично.

Не чтобы копировать. Чтобы напомнить себе: «Вот как должно быть».

3. Сон.

Самый мощный плагин в твоей студии.

Бесплатный.

Работает всегда.

Утром ты включишь вчерашний микс и скажешь: «Боже, зачем я выкрутил верха на +6?»

Резюме главы 1: 20 тезисов, которые нужно выжечь в коре

1. Звук — это механическая волна. Воздух толкает воздух.

2. Частота определяет высоту тона (Гц). Бас — 20–250 Гц, середина — 250–5000 Гц, верха — 5000–20 000 Гц.

3. Амплитуда определяет громкость (дБ). 85 дБ — эталон сведения.

4. Фаза — положение волны. В противофазе звук исчезает.

5. Фазовое гашение — главный убийца баса и плотности.

6. Тембр — набор обертонов. Это лицо звука.

7. Гармонические обертоны создают музыку, негармонические — шум и текстуру.

8. Миф о 432 Гц — маркетинг. Настоящая магия не в частоте, а в исполнении.

9. Тишины не существует. Есть звук, который мы не замечаем.

10. Джон Кейдж доказал: тишина — это контекст.

11. Каждая комната — эквалайзер. Не доверяй ей, пока не измеришь.

12. Басовые ловушки важнее дорогих мониторов.

13. 85 дБ SPL — честная громкость. Своди на ней, проверяй на разной.

14. Эффект Хааса: 5–30 мс задержки создают иллюзию ширины.

15. Фантомный центр — иллюзия. Проверяй моно-совместимость.

16. Абсолютный слух — дар. Относительный — навык. Тренируй его.

17. Усталость слуха — это усталость мозга. Лечится сном и тишиной.

18. Референсы — твой якорь. Не теряй его.

19. Грязный звук может быть лучше чистого. Тембр важнее стерильности.

20. Ты был звукорежиссером еще до рождения. Теперь просто вспомни.

ЧАСТЬ I

ФИЗИКА И ФИЛОСОФИЯ ЗВУКА

ГЛАВА 2

ЧТО У ТЕБЯ В ГОЛОВЕ

Психоакустика: как мозг обрабатывает звук и почему ему нельзя доверять

Объем: 30 страниц

Слов: 12 000–15 000

Открывающая история: Слепой музыкант

1976 год. Лос-Анджелес.

Слепой пианист сидит за роялем в студии звукозаписи. Ему 22 года. Его зовут Рэй Чарльз.

Инженер говорит: «Рэй, у нас проблема. Вокал звучит плоско. Не хватает глубины».

Рэй молчит 10 секунд. Потом говорит:

«Подними 800 герц на 2 децибела. И убери 3 килогерца — там звенит воздух».

Инженер смотрит на эквалайзер. Он ничего не понимает. Он видит только частоты, числа, графики.

Рэй не видит ничего. Но он слышит.

Он слышит то, что инженер не слышит, — потому что его мозг перестроился.

Когда человек теряет зрение, зрительная кора не умирает. Она перепрофилируется. Нейроны, которые должны были обрабатывать свет, начинают обрабатывать звук.

У Рэя Чарльза в мозгу было в два раза больше слуховых ресурсов, чем у зрячего человека.

Он не видел частоты. Он чувствовал их кожей.

Эта глава — о том, как твой мозг обрабатывает звук.

О том, что он делает правильно.

И о том, где он тебя обманывает.

Потому что без этого знания ты будешь крутить ручки вслепую.

А с этим знанием ты будешь слышать то, что не слышат другие.

Анатомия слуха: как звук становится электричеством

Прежде чем говорить о психоакустике, нужно понять физику твоего слуха.

Ухо — это не просто приемник. Это сложнейший биомеханический интерфейс, который преобразует колебания воздуха в электрические сигналы со скоростью мысли.

Наружное ухо

То, что ты называешь «ухом» — ушная раковина — это антенна.

Она не просто ловит звук. Она формирует его.

Складки хряща создают микро-задержки, которые помогают мозгу определить, сверху звук или снизу, спереди или сзади. Если бы у тебя не было этих складок — ты бы не мог отличить звук, идущий спереди, от звука, идущего сзади.

Это называется HRTF — Head-Related Transfer Function.

Слуховой проход — это резонатор.

Его длина — примерно 2,5 см. Эта длина идеально резонирует на частотах 2–4 кГц. Именно поэтому человеческая речь так важна в этом диапазоне. Эволюция сделала наши уши настроенными на голос.

Среднее ухо

Барабанная перепонка — это мембрана толщиной 0,1 мм.

Она колеблется от давления звуковой волны. Слабый звук — слабое колебание. Сильный звук — сильное.

Но есть проблема.

Воздух — это газ. Жидкость во внутреннем ухе — это жидкость.

Звук в воздухе и звук в жидкости — это разные физические среды. Если бы звук ударял прямо по жидкости, 99,9% энергии терялось бы.

Природа придумала механический усилитель.

Три слуховые косточки — молоточек, наковальня, стремечко — работают как система рычагов.

Они усиливают давление в 20 раз.

Без них ты бы слышал только самые громкие звуки.

Внутреннее ухо

Улитка — это 2,5 витка, заполненных жидкостью.

Внутри улитки — базилярная мембрана. На ней сидят тысячи волосковых клеток.

Каждая волосковая клетка — это микрофон, настроенный на свою частоту.

Высокие частоты возбуждают клетки у основания улитки.

Низкие частоты — у вершины.

Когда волоски сгибаются, открываются ионные каналы. В клетку входит калий. Возникает электрический потенциал. Нейрон стреляет.

Звук стал электричеством.

Почему это важно для тебя?

Волосковые клетки не восстанавливаются.

Ты родился с запасом примерно 15 000 клеток на каждое ухо.

Каждый рок-концерт, каждый час в наушниках на максимальной громкости, каждый удар по барабану без защиты — это смерть клеток.

Они не болят. Они просто перестают работать.

Сначала умирают клетки, отвечающие за 16 кГц.

Потом — за 14 кГц.

Потом — за 12 кГц.

Ты привыкаешь. Ты думаешь: «всегда так было».

Но это не так.

Что такое психоакустика

Психоакустика — это наука о том, как мозг интерпретирует звук.

Физика говорит: вот волна, вот ее частоты, вот ее амплитуда.

Психоакустика говорит: мозг наплевал на физику.

Мозг врёт.

Он врет, потому что это эволюционно выгодно.

Если бы ты слышал все звуки с одинаковой четкостью — ты бы сошел с ума от шума собственного дыхания, стука сердца, движения мышц.

Мозг фильтрует. Усиливает. Подавляет. Искажает.

Ты никогда не слышишь реальность.

Ты слышишь интерпретацию реальности.

И эта интерпретация зависит от:

· Громкости

· Контекста

· Ожиданий

· Эмоционального состояния

· Предыдущего опыта

· Того, что ты ел на завтрак

Пример:

Тебе дают послушать два микса.

Первый — динамичный, с перепадами громкости, живой.

Второй — пережатый, плоский, громкий.

Большинство людей скажут: «Второй звучит лучше».

Почему? Потому что мозг путает громкость с качеством.

Это называется лудность-война.

Мы еще вернемся к этому.

1933 год. Bell Labs. Нью-Джерси.

Гарви Флетчер и Уайлден Мэнсон проводят самый важный эксперимент в истории аудио.

Они сажают сотни людей в звуконепроницаемую комнату.

Надевают наушники.

Начинают гонять частоты.

Протокол:

Испытуемый слышит тон 1000 Гц на громкости 40 дБ.

Потом слышит тон 100 Гц.

Задача: подстроить громкость 100 Гц так, чтобы субъективно он звучал так же громко, как 1000 Гц.

Потом 200 Гц. 500 Гц. 2000 Гц. 5000 Гц. 10 000 Гц.

Потом меняют громкость референса — 60 дБ, 80 дБ, 100 дБ.

Результат разрушил всё.

Человеческое ухо физически неравномерно.

Мы слышим середину — 2–5 кГц — как через увеличительное стекло.

Всё, что ниже и выше — проваливается.

При низкой громкости (40 дБ):

· 100 Гц нужно сделать на +20 дБ громче, чем 1000 Гц, чтобы они звучали одинаково.

· 10 000 Гц — на +15 дБ.

Ты почти глух к басу и верхам.

При средней громкости (80 дБ):

· 100 Гц — +10 дБ

· 10 000 Гц — +8 дБ

Уже лучше, но всё еще не честно.

При высокой громкости (100 дБ):

· 100 Гц — +5 дБ

· 10 000 Гц — +4 дБ

Слух выравнивается.

Что это значит для тебя?

Если ты сводишь трек тихо — ты интуитивно делаешь бас и верха громче, потому что ухо их недослышивает.

Ты выкручиваешь эквалайзер.

Добавляешь +6 дБ на суб.

Лифтуешь тарелки на 10 кГц.

А потом включаешь микс на полную мощность.

Бас рвёт динамики.

Верха режут уши.

Середина проваливается.

Это не ошибка. Это физиология.

Флетчер и Мэнсон доказали:

Ты не можешь доверять своему уху.

Ты можешь только знать про его слабости.

Кривые Флетчера–Мэнсона: инструкция по применению

График (я опишу его словами, ты найдешь в любом учебнике):

По горизонтали — частота (20 Гц — 20 кГц).

По вертикали — уровень звукового давления (дБ SPL).

На графике — семейство кривых.

Каждая кривая — это линия равной громкости.

Все точки на одной кривой субъективно звучат одинаково громко, хотя физически их громкость разная.

Самый важный вывод:

На громкости 85 дБ SPL кривая почти выпрямляется.

Разница между 100 Гц и 1000 Гц — всего 3–4 дБ.

Разница между 10 000 Гц и 1000 Гц — те же 3–4 дБ.

85 дБ — это магическое число.

При этой громкости:

· Ты слышишь бас честно

· Ты слышишь верха честно

· Уши не устают 4–6 часов

· Твой микс будет звучать сбалансированно на любой громкости

Как это использовать:

1. Купи SPL-метр.

2. Настрой мониторы на 85 дБ (розовый шум).

3. Своди на 85 дБ.

4. Проверяй на 70, 80, 90 дБ.

Хороший микс звучит хорошо везде.

Маскировка: война частот

Вернемся в ресторан.

Играет фоновая музыка. Ты разговариваешь с девушкой. Вы слышите друг друга.

Потом вступает саксофон.

Ты перестаешь слышать девушку.

Саксофон замаскировал ее голос.

Частотная маскировка:

Если два звука звучат в одном частотном диапазоне одновременно, более громкий звук делает более тихий неслышимым.

Ухо не может разделить два сигнала на одной частоте. Мозг выбирает тот, что громче, а второй просто игнорирует.

Временная маскировка:

Громкий звук может замаскировать тихий звук, который звучит до него или после.

· Предмаскировка: громкий звук маскирует тихий, который был за 5–20 мс до него.

· Постмаскировка: громкий звук маскирует тихий, который звучит до 200 мс после.

Это связано с инерцией слуховой системы. Уху нужно время, чтобы «прийти в себя» после громкого удара. Где это происходит постоянно:

1. Бас-бочка и бас-гитара.

Бочка бьет на 60 Гц. Бас играет 60 Гц.

Бочка громче? Бас исчез.

Бас громче? Бочка потеряла тело.

Решение: развести по частотам.

· Бочке — 60 Гц.

· Басу — 100 Гц с подъемом.

Или сайдчейн: бочка ударила — бас пригнулся на 3 дБ.

2. Электрогитара и вокал.

Гитара живет в диапазоне 150–5 кГц.

Вокал — 300–3 кГц.

Это прямое пересечение.

Решение: эквалайзер.

· Гитаре — резать 2–3 кГц.

· Вокалу — поднимать 2–3 кГц.

Гитара станет чуть глуше, вокал — разборчивее.

В сумме они не конфликтуют.

3. Тарелки и шипящие вокала.

Хай-хэт — 3–8 кГц.

Сибилянты («с», «ш», «ч») — те же 3–8 кГц.

Решение: de-esser на вокале.

Динамический эквалайзер, который приглушает 5–8 кГц только когда вокалист произносит шипящие.

Золотое правило маскировки:

Не пытайся сделать все инструменты слышимыми одновременно.

Решай, что важно в каждый момент времени.

Эффект коктейльной вечеринки

1953 год. Колин Черри, британский психолог, проводит эксперимент.

Испытуемому надевают наушники.

В левое ухо подают один голос.

В правое — другой.

Задача: повторять слово в слово то, что звучит в левом ухе.

Испытуемые справляются блестяще. Они игнорируют правый канал полностью.

Потом Черри меняет условия.

В левом ухе — мужской голос.

В правом — тот же мужской голос, но на полтона ниже.

Испытуемые не могут разделить каналы. Голоса сливаются в один.

Потом — мужской и женский голос. Разделяют мгновенно.

Что это значит:

Мозг использует маркеры для разделения звуков:

· Высота тона

· Тембр

· Пространственное положение

· Время прихода

· Скорость атаки

Если два звука имеют одинаковые маркеры — мозг воспринимает их как один звук.

Если маркеры разные — мозг легко разделяет их.

Как это использовать в сведении:

1. Панорама.

Разведи инструменты по стерео. Мозг получит маркер «левый» и «правый» и перестанет их путать.

2. Эквалайзер.

Сделай инструментам разную частотную окраску.

Гитара — 2 кГц с подъемом.

Клавиши — 3 кГц с подъемом.

Мозг видит: разные частоты — разные инструменты.

3. Атака.

Бочка — быстрая атака, резкий транзиент.

Бас — медленная атака, плавное тело.

Мозг видит: разные временные профили — разные источники.

Коктейльная вечеринка в твоем миксе — это не хаос.

Это твоя работа.

Локализация: как мы понимаем, откуда звук

У тебя два уха.

Они находятся в разных точках пространства.

Расстояние между ними — примерно 21 см.

Два механизма локализации:

1. Разница во времени прихода (ITD — Interaural Time Difference).

Звук слева приходит в левое ухо на 0,6–0,7 мс раньше, чем в правое.

Мозг измеряет эту разницу и говорит: «Источник слева».

Этот механизм работает для низких частот (до 1,5 кГц).

2. Разница в громкости (ILD — Interaural Level Difference).

Высокие частоты отражаются головой. Левое ухо находится в акустической тени, если источник справа.

Мозг измеряет разницу в громкости и говорит: «Источник справа».

Этот механизм работает для высоких частот (выше 1,5 кГц).

Почему это важно:

На частоте 1,5–2 кГц оба механизма работают плохо.

Это «мертвая зона» локализации.

Поэтому:

· Бас сложно локализовать. Ты чувствуешь его телом, не понимаешь, откуда.

· Верха локализуются идеально.

· Середина — сложнее, но мозг справляется по тембру.

Фантомный центр — это обман на разнице времени и громкости.

Если в левом и правом канале один и тот же сигнал, мозг интерполирует: «Раз разницы нет — значит, источник прямо по центру».

Нет колонки по центру. Но мозг ее дорисовывает.

Как ломать локализацию:

1. Моно-совместимость.

Если ты создал ширину эффектом Хааса (задержка 15 мс на правом канале), в моно левый и правый канал сложатся.

Возникнет гребенчатая фильтрация. Звук станет тоньше, тише, грязнее.

1. Фаза.

Если левый и правый канал не совпадают по фазе, мозг теряет якорь.

Ты панорамируешь вокал по центру, а он «гуляет» — то слева, то справа, то в голове.

Проверка:

Сведи в моно.

Если вокал провалился — у тебя фазовые проблемы.

Эффект precedence (приоритет первого вступления)

1949 год. Нидерланды. Гельмут Хаас.

Его диссертация перевернула всё, что мы знали о локализации.

Эксперимент:

Две колонки. Левая и правая.

Испытуемый сидит по центру.

Хаас пускает звук в левую колонку.

Через несколько миллисекунд — тот же звук в правую.

Результат:

Если задержка между звуками меньше 5 мс — мозг слышит один звук по центру. Фазовая интерференция.

Если задержка 5–30 мс — мозг слышит звук только слева. Правый игнорируется.

Если задержка 30–50 мс — начинает слышаться эхо.

Если задержка больше 50 мс — явное эхо, два отдельных звука.

Вывод:

Мозг доверяет первому звуку.

Второй звук, пришедший позже, — не имеет значения для локализации, даже если он громче.

Как это используется:

1. Ширина стерео.

Ты хочешь, чтобы гитара звучала широко.

Не панорамируй ее 100/0.

Сделай копию дорожки, задержи правую на 15 мс.

Мозг скажет: «Звук слева».

Но в наушниках играют обе колонки.

Гитара звучит объемно, воздушно, широко.

2. Удвоение вокала.

Запиши два дубля вокала.

Сдвинь второй на 10–20 мс.

Не будет эффекта «хора». Будет эффект плотности.

3. Имитация пространства.

Ранние отражения в зале приходят через 10–30 мс после прямого звука.

Создай задержку 20 мс с низким уровнем — мозг поверит, что ты в зале.

Фантомный центр: ахиллесова пята стерео

Ты сидишь в студии.

Две колонки. Правильный треугольник. Ты в центре.

Вокал звучит ровно посередине.

Но физически посередине ничего нет.

Это фантом.

Мозг дорисовал источник между двумя реальными.

Почему это уязвимо:

1. Ты должен сидеть строго по центру.

Сдвинься на 20 см влево — и вокал «поедет» влево.

Потому что левое ухо стало ближе к левой колонке, правое — дальше от правой.

Разница во времени прихода и громкости разрушила фантом.

2. Моно-совместимость.

Если твой трек включили в моно (телефон, Bluetooth-колонка, клуб с неудачной коммутацией) — левый и правый канал складываются.

Если они были идеально одинаковы — все хорошо.

Если была малейшая разница в фазе — происходит гашение.

Вокал становится тише, тоньше, может вообще исчезнуть.

Как защитить фантомный центр:

3. Проверяй моно.

Каждые 30 минут своди — включай моно.

Если вокал провалился — ищи фазовую проблему.

4. Не вешай разные обработки на левый и правый канал.

Ревербератор с разными настройками? Плохо.

Эквалайзер с разными частотами? Плохо.

Задержка на одном канале? Опасно.

5. Используй коррелометр.

В любой DAW есть плагин, показывающий фазовую корреляцию.

+1 — идеальное моно.

0 — нет корреляции, широко, но в моно провал.

— 1 — полная противофаза, в моно исчезнет.

Держи выше 0 для критических элементов (вокал, бочка, бас).

Слуховые иллюзии: чего нет, но мы слышим

Мозг не просто обрабатывает звук.

Мозг дорисовывает картину.

Иллюзия 1: Пропущенный фундамент

1940 год. Ян Левелинг, голландский физик.

Он проводит простой эксперимент: играет органную музыку без самой низкой частоты.

Испытуемые всё равно слышат бас.

Мозг видит гармоники — 2×, 3×, 4× от пропущенной частоты.

И достраивает фундамент.

Что это значит:

Ты можешь убрать суббас из записи, и слушатель все равно будет его слышать.

Это экономит мощность динамиков и место в спектре.

Иллюзия 2: Тоновый белый шум

Дай человеку послушать белый шум.

Потом добавь в шум тон 1000 Гц на очень низкой громкости.

Человек не слышит тон.

Убери тон — человек услышит тишину.

Мозг заметил изменение, но не заметил сам звук.

Иллюзия 3: Эффект МсGurk

Видео: человек говорит «га».

Звук: «ба».

Ты слышишь «да».

Мозг комбинирует зрение и слух. Если они конфликтуют — побеждает зрение.

Иллюзия 4: Парадокс Шепарда

Тон, который бесконечно поднимается вверх.

Но никогда не становится выше.

Это математическая иллюзия — наложение нескольких тонов с разной октавой.

Мозг слышит движение.

Движения нет.

Парадокс предпочтений: почему люди любят искажения

1980 год. Стэнфорд.

Исследователи дают испытуемым послушать две записи:

1. Идеально чистый цифровой вокал.

2. Тот же вокал, пропущенный через ламповый микрофонный предусилитель с легкими искажениями.

90% выбирают второй.

Почему?

Потому что искажения = информация.

Лампа добавляет четные гармоники.

2×, 4×, 6× от основной частоты.

Мозг интерпретирует эти гармоники как тепло, плотность, присутствие.

Четные гармоники (2×, 4×) — приятные, музыкальные, «ламповые».

Нечетные гармоники (3×, 5×) — агрессивные, грязные, «транзисторные».

Сатурация — это искусство добавления гармоник.

Немного — богатство.

Много — грязь.

Слишком много — шум.

Другой парадокс:

Люди говорят, что любят «естественный звук».

Но «естественный звук» в записи — это скучно.

Мы хотим гиперреальности.

Чтобы бас был гуще, чем в жизни.

Чтобы вокал был ближе, чем в жизни.

Чтобы тарелки искрились, как в жизни не искрят.

Твоя задача — не копировать реальность.

Твоя задача — создавать лучшую версию реальности.

Эмоциональная инженерия: как звук вызывает мурашки

1991 год. Польша.

Нейробиолог Яцек Щепанник сканирует мозг людей, слушающих музыку.

Когда наступает кульминация — неожиданная гармония, вступление оркестра, пик мелодии — в мозгу происходит выброс дофамина.

Те же центры, что отвечают за еду, секс, наркотики.

Музыка — это химия.

Что вызывает мурашки:

1. Нарушение ожидания.

Ты ждешь, что аккорд разрешится в тонику.

А он уходит в другую гармонию.

Мозг в шоке: «Что это было? Надо проанализировать».

И выбрасывает дофамин.

1. Плотность.

Вступление всех инструментов одновременно.

Мозг перегружен информацией.

Эмоция — восторг.

1. Тишина перед взрывом.

Кейдж был прав.

Тишина создает напряжение.

Разрыв тишины — разрядка.

Как ты можешь это использовать:

· Динамика. Не бойся делать тихо перед громко.

· Автоматизация реверберации. Убери ревер перед финальным припевом — он ударит сильнее.

· Суббас. 40 Гц не слышно, но чувствуется грудью. Это древний, доисторический сигнал: «что-то большое приближается».

Слуховая память: как мы запоминаем звук

Ты слышал песню «Smells Like Teen Spirit» тысячу раз.

Сможешь напеть партию баса?

Большинство людей — нет.

Почему?

Потому что мозг не запоминает звук как объект.

Он запоминает отношения между звуками.

· Высота мелодии относительно тоники.

· Ритмический рисунок.

· Тембр как маркер.

Как это использовать в сведении:

1. Контраст.

Если ты хочешь, чтобы запомнился вокал — сделай гитары тише в куплете и громче в припеве.

Мозг запомнит не громкость вокала, а изменение громкости.

2. Повторение.

Помести важный элемент в одно и то же место панорамы на протяжении всей песни.

Мозг привыкнет: «Вокал по центру, гитары по бокам».

3. Уникальность.

Сделай один элемент странным.

Необычный тембр, неожиданная задержка, искажение там, где его не ждут.

Мозг запомнит аномалию.

Маскотт-эффект: почему мы любим «плохой» звук

1950-е годы.

Блюзовые гитаристы играют на дешевых усилителях с рваными динамиками.

Звук — грязь, треск, перегруз.

Это брак. Инженеры в ужасе.

А публика сходит с ума.

Что произошло?

Техническое ограничение стало эстетикой.

Потом — традицией.

Потом — маркером жанра. Сегодня люди покупают плагины за 200 долларов, чтобы имитировать звук дешевого усилителя 1952 года.

Маскотт-эффект:

Дефект, который становится лицом бренда или жанра.

· Lo-fi — шум пластинки, треск, недостаток высоких частот.

· Рок — перегруз гитарного усилителя.

· Электроника — биткрашинг, алиасинг, грубая ресемплинг.

· Джаз — винтажные микрофоны, узкая полоса.

Что это значит для тебя:

Не стремись к «чистоте».

Стремись к характеру.

Иногда убрать верха — лучше, чем добавить.

Иногда добавить шум — лучше, чем убрать.

Иногда сломать — лучше, чем починить.

Золотое сечение в частотах

Субъективно.

Но есть частоты, которые почти всегда звучат хорошо.

50–60 Гц — фундамент. Точка опоры.

120 Гц — гулкость, опасная зона.

200–250 Гц — тепло.

400–600 Гц — глубина.

1000–1500 Гц — резкость.

2000–4000 Гц — присутствие.

5000–8000 Гц — воздух.

10 000–12 000 Гц — искры.

Это не законы. Это ориентиры.

Фантомные слова: почему мы слышим то, чего нет

1970 год.

Исследователи прокручивают испытуемым белый шум с вкраплениями очень тихих, почти неразборчивых слов.

Испытуемые слышат другие слова.

Те, которые ожидают услышать.

Если перед экспериментом им сказать, что в шуме спрятаны слова про еду — они слышат «хлеб», «мясо», «яблоко».

Если про политику — слышат «выборы», «президент», «закон».

В шуме не было ничего.

Мозг дорисовал смысл из хаоса.

Как это используется в музыке:

1. Белый шум в ритм-секции.

Ты добавляешь легкий белый шум синхронно с ударом бочки.

Мозг слышит: «бочка стала плотнее».

Шума почти нет. Ощущение — есть.

2. Реверберация.

Ты добавляешь ревер на вокал.

Мозг слышит: «пространство».

Ревер — это просто тысячи задержек.

Но мозг интерпретирует это как «зал».

3. Суббас.

40 Гц — ты почти не слышишь.

Но ты чувствуешь вибрацию.

Мозг говорит: «там что-то большое».

Болевой порог: почему громкость убивает музыку

120 дБ SPL.

Это предел, после которого начинается боль.

Ухо не просто слышит — оно кричит.

Но есть и другой порог.

Порог усталости.

80–85 дБ — комфортно.

90 дБ — уши устают через час.

95 дБ — через 20 минут.

100 дБ — через 5 минут.

Парадокс войны громкости:

Мы сделали музыку громче.

Мы убили динамику.

Мы убили транзиенты.

Мы убили воздух.

А люди всё равно говорят: «сделай громче».

Потому что мозг путает громкость с энергией.

Как выиграть войну, не вступая в неё:

1. Контраст.

Тихо → громко всегда звучит громче, чем просто громко.

2. Плотность.

Добавь сатурацию. Гармоники создают иллюзию громкости без увеличения пиков.

3. Суббас.

40–60 Гц — ты не слышишь, но чувствуешь.

Это «бесплатная» громкость.

Стереофония: 90 лет иллюзии

1931 год. Лондон.

Алан Блюмлейн подает патент на «систему передачи звука с использованием двух каналов».

Никто не понимает, зачем это нужно.

Радио — моно. Пластинки — моно. Кино — моно.

Зачем два канала?

Блюмлейн объясняет: «Чтобы создать иллюзию пространства».

Как это работает:

· Левое ухо — левый канал.

· Правое ухо — правый канал.

· Мозг анализирует разницу.

Tри типа стерео:

1. Интенсивностное стерео.

Разница в громкости между каналами.

Левый громче — звук слева.

2. Временное стерео. Разница во времени прихода. Задержка 15 мс — звук слева.

3. Фазовое стерео.

Разница в фазе.

Сдвиг фазы на 90 градусов — иллюзия ширины.

Что работает лучше всего:

Комбинация.

Немного громкости. Немного времени. Немного фазы.

Моно-совместимость: обратная сторона стерео

У тебя две колонки.

У твоего слушателя — один Bluetooth-динамик.

Или телефон.

Или ноутбук.

Или бар с плохой коммутацией.

Если твой микс проваливается в моно — ты проиграл.

Как проверить:

Кнопка MONO в DAW.

Если при включении:

· Вокал стал тише

· Бас исчез

· Гитары звучат как из консервной банки

У тебя фазовые проблемы.

Что делать:

1. Коррелометр.

Voxengo Span, родной плагин DAW.

+1 — идеал.

0 — риск.

— 1 — катастрофа.

2. Фаза.

Инвертируй фазу на одном из каналов.

Стало лучше? Значит, была проблема.

3. Хаас.

Задержка 15–30 мс — красиво в стерео, но в моно дает гребенчатую фильтрацию.

Используй осторожно.

Бинауральный слух: когда мы слышим ушами, которых нет

1970-е годы.

Hugo Zuccarelli изобретает «бинауральную запись».

Два микрофона, расположенные на расстоянии человеческой головы. С имитацией ушных раковин.

Ты надеваешь наушники.

Ты слышишь мир вокруг себя.

Музыканты не в голове — они в комнате.

Гитара справа — ты поворачиваешь голову, и гитара остается справа.

Это не стерео. Это реальность.

Почему это работает:

Мозг получает те же сигналы, что и при реальном прослушивании.

· Разница во времени прихода.

· Разница в громкости.

· Спектральная окраска от ушной раковины.

Где используется:

· ASMR

· Аудиокниги

· Хоррор-игры

· Экспериментальная музыка

Где не используется:

· Поп-музыка.

· Рок.

· Электроника.

Потому что в наушниках — круто.

А в колонках — фазовый ад.

Парадокс Моцарта: почему гений слышал то, чего не слышим мы

Вольфганг Амадей Моцарт мог записать услышанное один раз.

Не посмотрев в ноты.

Не взяв в руки инструмент.

Просто по памяти.

Это абсолютный слух?

Нет.

Абсолютный слух — это способность назвать ноту без референса.

Моцарт мог повторить любую услышанную музыку.

Это называется эйдетическая слуховая память.

Что это значит для тебя:

Ты никогда не будешь Моцартом.

Но ты можешь тренировать память.

Слушай трек — пытайся воспроизвести его в голове через час.

Через день.

Через неделю.

Чем лучше ты помнишь звук, тем лучше ты его создаешь.

Депривация слуха: почему тишина делает нас лучше

2012 год. Джорджтаунский университет.

Исследователи дают испытуемым задание на различение частот.

Первая группа проходит тест сразу.

Вторая — после 10 минут тишины.

Вторая группа справляется на 30% лучше.

Тишина калибрует слух.

Мозг в тишине не отдыхает — он настраивается.

Он снижает порог чувствительности.

Он обостряет частотную избирательность.

Он готовится слышать.

Как это использовать:

Перед сессией сведения — 10 минут тишины.

Перед мастерингом — 20 минут.

После 3 часов работы — 10 минут тишины.

Тишина — это усилитель.

Эффект Ранка: почему мы слышим глубину

1940 год. Австралия.

Колин Ранк исследует восприятие расстояния до источника звука.

Вывод:

Мозг определяет расстояние по соотношению прямого звука к реверберации.

Много прямого — близко.

Мало прямого — далеко.

Как это используется:

1. Громкость.

Близко = громко.

Далеко = тихо.

2. Эквалайзер.

Близко = много верха.

Далеко = мало верха (воздух режет высокие частоты).

3. Реверберация.

Близко = мало ревера.

Далеко = много ревера.

4. Ранние отражения.

Близко = задержка 5–10 мс.

Далеко = задержка 20–30 мс.

Создание перспективы:

Передний план — вокал, бочка, снейр.

Средний план — гитары, клавиши.

Задник — пэды, атмосфера, ревер.

Твой микс — это сцена.

Расставь музыкантов.

Адаптация: почему уши «привыкают» к плохому звуку

Ты заходишь в комнату с гудящим кондиционером.

Через 5 минут ты его не слышишь.

Мозг отфильтровал постоянный шум как неважную информацию.

Это адаптация.

Хорошая новость:

Ты можешь привыкнуть к плохому миксу.

Через 15 минут ты перестаешь замечать, что вокал слишком тихий, а бас гудит.

Плохая новость:

Это значит, что ты не можешь доверять своей оценке через 20 минут работы.

Решение:

Референсы.

Свежие уши.

Сон.

10 упражнений для тренировки слуха

1. Frequency ID.

Приложения: Quiztones, SoundGym, EarMaster.

Каждый день — 15 минут.

2. Compression ID.

Сделай дорожку с компрессией и без.

Слушай. Запоминай.

3. Reverb ID.

0.3 сек — маленькая комната.

0.8 сек — жилая.

1.5 сек — зал.

2.5 сек — собор.

4. EQ matching.

Возьми коммерческий трек.

Попробуй эквалайзером сделать свой трек похожим по тональному балансу.

5. Blind tests.

Сведи трек.

Не смотри на настройки.

Напиши, что ты сделал.

6. Мониторы + наушники.

Сравнивай.

Привыкай к разнице.

7. Тишина.

10 минут в день.

Просто слушай тишину.

8. Критическое слушание.

Один трек в день — не как слушатель.

Как инженер.

9. Сравнение форматов.

MP3 128 vs WAV.

Запоминай разницу.

10. Свои старые миксы.

Раз в месяц переслушивай.

Почему опытные инженеры сводят быстрее

Новичок слышит: «бас плохо звучит».

Он начинает крутить эквалайзер.

Потом компрессор.

Потом снова эквалайзер.

Потом меняет бас-гитару на другой сэмпл.

Потом возвращает всё обратно.

Час.

Профи слышит: «бас конфликтует с бочкой на 60 Гц, фаза сбита».

Он инвертирует фазу.

Готово.

30 секунд.

В чем разница?

Профи слышит не «плохо».

Профи слышит что именно плохо.

· Частота.

· Фаза.

· Динамика.

· Пространство.

Это приходит с опытом.

Субъективность: почему твой микс нравится не всем

1984 год.

Исследователи дают испытуемым послушать один и тот же трек в разных эквалайзерах.

Одни любят +3 дБ на 100 Гц.

Другие любят -2 дБ на 100 Гц.

Разница во вкусе коррелирует с формой ушной раковины.

У людей с более плоской ушной раковиной — другой HRTF.

Они объективно слышат иначе.

Твой микс — не истина в последней инстанции.

Твой микс — это твоя интерпретация.

Интуиция: когда можно не думать

Рэй Чарльз не знал частоты.

Он знал: «здесь звенит».

Миллион часов прослушивания превратились в нейронную сеть.

Он не вычислял — он чувствовал.

Это называется имплицитное обучение.

Ты не знаешь, как ты это делаешь.

Ты просто это делаешь.

Как прийти к этому:

· Часы.

· Тысячи часов.

· Ошибки.

· Исправление ошибок.

· Снова часы.

Резюме главы 2: 20 тезисов о том, как работает твой слух

1. Ухо — это биомеханический интерфейс. Волосковые клетки не восстанавливаются.

2. Психоакустика — наука о том, как мозг интерпретирует звук. Мозг врет.

3. Кривые Флетчера–Мэнсона: на малой громкости мы глухи к басу и верхам.

4. 85 дБ — магическое число. Своди на этой громкости.

5. Маскировка: громкий звук убивает тихий на той же частоте.

6. Эффект коктейльной вечеринки: мозг разделяет звуки по маркерам.

7. Локализация: разница во времени и громкости между ушами.

8. Эффект Хааса: 5–30 мс задержки создают иллюзию ширины.

9. Фантомный центр — ахиллесова пята стерео. Проверяй моно.

10. Слуховые иллюзии: мозг дорисовывает то, чего нет.

11. Парадокс предпочтений: люди любят искажения.

12. Эмоциональная инженерия: мурашки = дофамин.

13. Слуховая память: мозг запоминает отношения, не объекты.

14. Маскотт-эффект: дефект становится эстетикой.

15. Фантомные слова: мы слышим то, что ожидаем.

16. Болевой порог: громкость убивает динамику.

17. Стерео — 90 лет иллюзии. Моно-совместимость — твоя ответственность.

18. Бинауральный слух: реальность в наушниках.

19. Депривация слуха: тишина делает нас лучше.

20. Интуиция — это миллион часов практики.

ЧАСТЬ I

ФИЗИКА И ФИЛОСОФИЯ ЗВУКА

ГЛАВА 3

ЦИФРОВАЯ БЕЗДНА

Как аналоговый мир превращается в нули и единицы — и что теряется по пути

Открывающая история: Момент, когда звук умер

1979 год. Токио.

Инженеры Sony сидят в комнате без окон и смотрят на осциллограф.

Перед ними — прототип. Первый в мире коммерческий цифровой аудиоформат.

Они называют его PCM-F1.

Это коробка размером с чемодан. Она весит 15 килограммов. Она стоит как автомобиль.

И она делает то, что раньше казалось невозможным:

Превращает звук в числа.

Один из инженеров, 54-летний Норио Ога, всю жизнь проработавший с аналоговой лентой, подходит к столу.

Он приносит свою личную запись — концерт Артура Рубинштейна, записанный на студийный магнитофон в 1963 году.

— Сделайте из этого цифру, — говорит он.

Инженеры оцифровывают запись. 16 бит. 44,1 кГц.

Ога слушает 30 секунд.

— Где звук? — спрашивает он.

— Он здесь. Мы превратили его в числа. Это абсолютно точно.

— Я слышу числа. Я не слышу Рубинштейна.

Ога выключает систему, забирает свою ленту и уходит.

Через 3 года Sony выпустит первый в мире компакт-диск.

Через 10 лет аналоговая запись умрет как индустрия.

Но Ога был прав.

Цифра — это не звук.

Цифра — это чертеж звука.

Точный. Воспроизводимый. И — мертвый.

Эта глава — о том, как работает цифровой звук.

О том, что мы выиграли, перейдя на нули и единицы.

И о том, что мы потеряли.

Аналог: непрерывная линия

Представь себе прямую линию.

Она идет слева направо, плавно изгибается, поднимается, опускается.

В каждой точке этой линии есть значение. Бесконечное количество точек. Бесконечное количество значений.

Это аналоговый сигнал.

Виниловая пластинка. Магнитная лента. Человеческий голос.

Аналог — это реальность.

В реальности нет дискретных «шагов». Нет перерыва между «до» и «ре». Частота меняется непрерывно. Громкость меняется непрерывно.

Проблема аналога:

· Шум. Лента шипит, пластинка трещит, лампы фонят.

· Деградация. Каждая копия хуже оригинала.

· Нестабильность. Скорость плывет, головки размагничиваются, иглы изнашиваются.

Аналог — живой.

Но живое — умирает.

Цифра: пунктирная линия

А теперь представь, что ты берешь ту же линию и ставишь на ней точки.

Не бесконечно много. Ровно 44 100 точек в секунду.

У каждой точки есть координата — время и громкость.

Время ты измеряешь с точностью до 1/44 100 секунды.

Громкость — с точностью до 1/65 536 от максимальной.

Соедини эти точки пунктиром.

Это цифровой сигнал.

Что мы выиграли:

· Нет шума. Ноль — это ноль. Единица — это единица.

· Нет деградации. Копия идентична оригиналу. Тысячная копия идентична первой.

· Идеальная стабильность. 44 100 Гц — всегда 44 100 Гц. Не плавает, не дрейфует.

Что мы потеряли:

Мы потеряли бесконечность.

Между точками №1000 и №1001 — пустота. Там ничего нет.

Мозг дорисовывает линию между точками. Он интерполирует. Он восстанавливает.

Он делает это гениально.

Но дорисованное — не оригинал.

Дискретизация: как резать время

У тебя есть непрерывный звук.

Ты хочешь превратить его в цифру.

Шаг 1. Дискретизация.

Ты ставишь измерительный прибор, который снимает показания через равные промежутки времени.

Каждую 1/44 100 секунды — замер.

Это называется частота дискретизации (sample rate).

44 100 раз в секунду — CD-качество.

48 000 раз в секунду — видеостандарт.

96 000 — хай-энд.

192 000 — маркетинг.

Визуализация:

Аналог — это кино.

Цифра — это раскадровка.

24 кадра в секунду — мозг дорисовывает движение.

44 100 сэмплов в секунду — мозг дорисовывает звук.

Почему именно 44 100?

Теорема Котельникова–Найквиста.

Человек слышит до 20 000 Гц.

Чтобы оцифровать частоту без потерь, нужно сэмплировать с частотой минимум в два раза выше.

20 000 × 2 = 40 000.

44 100 — запас прочности + совместимость с видеоформатами 60-х.

Не магия. Инженерия.

Теорема Найквиста: закон сохранения звука

Гарри Найквист — шведский инженер, работавший на Bell Labs.

В 1928 году он сформулировал теорему, без которой не было бы цифрового звука.

Теорема звучит так:

Чтобы точно оцифровать сигнал, частота дискретизации должна быть не менее чем в два раза выше максимальной частоты в сигнале.

Простыми словами:

Если ты хочешь записать частоту 20 000 Гц, твоя частота дискретизации должна быть минимум 40 000 Гц.

Если ты хочешь записать 40 000 Гц — нужно 80 000.

Что будет, если нарушить теорему?

Алиасинг.

Частота выше половины частоты дискретизации не исчезает — она маскируется под более низкую частоту.

20 000 Гц при 44 100 — нормально.

22 050 Гц при 44 100 — предел.

22 100 Гц при 44 100 — алиасинг.

Сигнал «отражается» вниз. Ты слышишь 22 000 Гц, а на записи — 22 100 Гц? Нет. На записи будет 22 000 — (22 100 — 22 000) = 21 900.

Частота, которой не было в оригинале.

Грязь. Шум. Артефакт.

Фильтры антиалиасинга: стражи ворот

Чтобы алиасинг не происходил, в каждом аналого-цифровом преобразователе стоит фильтр нижних частот.

Он обрезает всё выше половины частоты дискретизации.

Жестко. Безжалостно. Не спрашивая.

Проблема:

Идеальных фильтров не существует.

Крутой фильтр (48 дБ/октаву) — дает фазовые искажения.

Пологий фильтр (6 дБ/октаву) — пропускает алиасинг.

Инженеры десятилетиями искали компромисс.

Over-sampling:

Решение: оцифровывать с более высокой частотой, потом фильтровать, потом прореживать.

96 кГц → фильтр → 44,1 кГц.

Больше запаса. Меньше фазовых проблем.

Битность: как измерить громкость

У тебя есть замер — точка во времени.

Теперь нужно записать, какая у этой точки громкость.

Сколькими градациями ты располагаешь?

16 бит = 65 536 градаций.

Самый тихий звук — 0. Самый громкий — 65 535.

Динамический диапазон — 96 дБ.

Этого хватает для готового трека.

24 бита = 16 777 216 градаций.

Динамический диапазон — 144 дБ.

Это запас прочности.

32 бита float = ∞.

Технически. Математически. Нельзя клипнуть.

Зачем тебе 24 бита?

При записи.

Ты выставляешь уровень так, чтобы пики были на -18 дБ FS.

Это тихо. Очень тихо.

Но у тебя запас 18 дБ до клиппа. Ты можешь спокойно работать с эквалайзером, компрессором, сатурацией — и не бояться, что сигнал перегрузится.

16 бит для записи — самоубийство.

У тебя запас 6 дБ. Одна ошибка — и клипп.

Дитepинг: искусство ошибки

Представь:

У тебя сигнал с 24-битным квантованием — 16 777 216 ступеней громкости.

Ты экспортируешь в 16 бит — 65 536 ступеней.

Что происходит с числами, которые не попадают ровно в ступеньку?

Округление.

Ошибка квантования.

На тихих фрагментах эта ошибка слышна как цифровой шум, искажение, грязь.

Решение:

Перед понижением битности ты добавляешь специально рассчитанный шум.

Очень тихий. Едва слышный.

Этот шум маскирует ошибки округления. Мозг перестает их замечать.

Это дитеринг.

Правило:

Дитеринг включается один раз, на финальном экспорте.

Не надо дитерить внутри проекта.

Не надо дитерить перед компрессором.

Не надо дитерить мастер-шину до лимитера.

Только финальный рендер.

44.1 vs 48 vs 96: война частот

44.1 кГц

Рожден в 70-х. Стандарт CD.

Достаточно для воспроизведения всего, что слышит человек.

48 кГц

Стандарт видео.

Простая математика: 24 кадра/сек × 2000 = 48 000.

88.2 / 96 кГц

High-res. Маркетинг.

Доказано слепыми тестами:

Люди не отличают 44.1 от 96 в условиях нормального прослушивания.

Зачем тогда 96?

1. Синтез.

Некоторые плагины генерируют ультразвук, который потом режется фильтрами. Работа на 96 кГц отодвигает алиасинг за пределы слышимости.

2 Запись.

Если ты хочешь замедлить аудио без потери качества — высокий сэмплрейт дает больше информации для тайм-стретча.

3. Психоакустика?

Нет. Не работает.

Мифы о высоких разрешениях

Миф 1. DSD звучит лучше PCM

DSD — формат Sony, 1 бит, 2.8 МГц.

Технически — да, аналоговее.

Практически — разница слышна только на аппаратуре дороже 20 000 долларов.

Миф 2. 192 кГц сохраняет ультразвук, который мы чувствуем кожей

Нет доказательств.

Даже если бы чувствовали — в твоих мониторах фильтр срезает всё выше 20 кГц.

Миф 3. Винил звучит теплее, потому что аналог

Винил звучит теплее, потому что:

· Срез баса ниже 50 Гц

· Спад верха выше 12 кГц

· Треск, шум, искажения

Это не преимущество аналога. Это эстетика ограничений.

Алиасинг: призрак в машине

Ты записываешь синтезатор на 44.1 кГц.

Синтезатор генерирует частоту 22 050 Гц.

Это ровно половина частоты дискретизации.

Что услышишь?

Ничего. Эта частота будет воспроизведена как 0 Гц.

Щелчок. Провал. Артефакт.

Синтезатор генерирует 22 100 Гц?

Алиасинг.

Ты услышишь 22 000 Гц.

Частота, которой нет.

Где алиасинг особенно заметен:

· Резкие форманты в синтезаторах

· Биткрашеры

· Перегруженные гитары (много верха)

· Плохие сэмплы

Как бороться:

· Работай в 96 кГц при синтезе.

· Используй плагины с oversampling.

· Не доводи синтезаторы до крайнего верха.

Jitter: когда тактовый генератор пьян

Цифровой звук работает на тактовой частоте.

Генератор отбивает ритм: «тик — тик — тик».

Каждый «тик» — один сэмпл.

Jitter — это нестабильность тактового генератора.

«Тик… тик… тик. тик…»

Время плывет.

Что слышно:

· Размытие стерео-образа

· Потеря детализации

· «Грязь» на верхах

Где возникает:

· Дешевые звуковые карты

· Плохая синхронизация (word clock)

· USB-интерфейсы без буфера

Лечится:

· Хорошими интерфейсами

· Внешними тактовыми генераторами (дорого)

· Переходом на внутреннюю синхронизацию

Цифровой клиппинг: момент смерти

0 дБ FS.

Выше нельзя.

Если сигнал пытается стать громче — он не становится громче.

Он становится прямоугольником.

Вершина синусоиды срезана. Круглая волна превратилась в квадратную.

Что слышно:

· Треск

· Грязь

· Негармонические искажения

Когда это допустимо:

· Электронная музыка

· Биткрашинг как эффект

· Современный рэп-треп

Когда это недопустимо:

· Акустика

· Джаз

· Классика

· Вокал

Float: бесконечный запас

32-битный float.

Динамический диапазон — 1528 дБ.

Это не ошибка. Тысяча пятьсот двадцать восемь децибел.

Самый тихий звук во вселенной — самый громкий звук во вселенной.

Физически это бессмысленно.

Но математически — гениально.

В float нельзя клипнуть.

Сигнал может уйти в +100 дБ FS. При рендере ты просто опустишь гейн.

Где использовать:

· Внутрипроектная обработка

· Суммирование

· Мастеринг в некоторых DAW

Где не использовать:

· Финальный экспорт (не все плееры читают float)

· Совместимость

История: война форматов

1982 год.

Sony и Philips выпускают CD.

Формат: 16 бит, 44.1 кГц, 74 минуты.

Почему 74 минуты?

Легенда гласит: потому что на CD должна была поместиться Девятая симфония Бетховена.

Правда: 74 минуты — просто технический предел носителя.

1999 год.

SACD (DSD) против DVD-Audio (24/96).

Война форматов. Маркетинг. Ложь. Деньги.

Победил MP3.

MP3: убийца качества, спасший индустрию

1993 год.

Институт Фраунгофера, Германия.

Группа инженеров создает формат, который уничтожит CD за 10 лет.

MP3.

Как это работает:

Психоакустическая модель.

Формат анализирует сигнал и отбрасывает то, что мозг всё равно не услышит.

· Частоты, замаскированные более громкими

· Тихие звуки после громких

· Частоты выше 16 кГц

Результат:

Файл в 10 раз меньше.

Качество — почти как CD.

Для 90% слушателей — неотличимо.

MP3 не убил качество.

MP3 убил иллюзию, что массовому слушателю нужно качество.

Кодеки: война продолжается

Сегодня:

· AAC — лучше MP3 при том же битрейте

· FLAC — lossless, открытый, бесплатный

· ALAC — Apple, lossless

· Ogg Vorbis — открытый, Spotify

· Opus — лучший на сегодня, 64 kbps звучит как 128 MP3

Что выбирать:

Для архива — FLAC.

Для работы — WAV.

Для стриминга — пусть платформа решает.

DSD: аналог в цифре

Direct Stream Digital.

Не 16 бит. Не 24 бита.

1 бит.

Частота дискретизации: 2 822 400 Гц.

Как это работает:

Бит может быть только 0 или 1.

0 — спад.

1 — подъем.

Сверхбыстрая последовательность нулей и единиц создает волну.

Плюсы:

· Нет фильтров антиалиасинга

· Нет ошибок квантования

· «Аналоговый» звук

Минусы:

· Сложно редактировать

· Тяжелые файлы

· Мало совместимости

Вердикт:

Для аудиофилов.

Передискретизация: искусство конвертации

У тебя 44.1. Нужно 48.

Ты не можешь просто «вставить» сэмплы.

Алгоритмы:

1. Ближайший сосед. Дешево, грубо.

2. Линейная интерполяция. Лучше.

3. Сплайн. Еще лучше.

4. Свертка. Лучшее качество, много ресурсов.

Золотое правило:

Передискретизируй один раз, в конце проекта.

Каждая конвертация — потеря.

Дизеринг: глубокое погружение

Формула:

output = round (input + random (-0.5, 0.5))

Типы шума:

1. Rectangular. Плоский шум.

2. Triangular. Мягче.

3. Noise shaping. Шум смещен в высокие частоты, где ухо менее чувствительно.

Какой выбрать:

Для большинства — triangular.

Для финального экспорта — noise shaping.

Цифровая суммация: 2+2=5

Аналоговая суммация: суммируешь сигналы, получаешь гармонические искажения, тепло, плотность.

Цифровая суммация: суммируешь сигналы, получаешь точную сумму.

Проблема:

Точная сумма звучит… плоско.

Решение:

Эмуляции аналоговой суммации.

+1–2 дБ гармоник.

· ширина.

· характер.

Цифра vs Аналог: итог битвы

Аналог:

· Живой

· Непредсказуемый

· Дорогой

· Нестабильный

· Требует обслуживания

Цифра:

· Мертвая

· Предсказуемая

· Дешевая

· Стабильная

· Не требует ничего

Выбор:

Аналог для характера.

Цифра для точности.

Оба.

10 заповедей цифрового звукорежиссера

1. Записывай в 24 бита, выставляй пики на -18 дБ FS.

2. Работай в 44.1 или 48. 96 — только если нужен тайм-стретч или синтез.

3. Не клиппи, если это не художественный прием.

4. Дитеринг — только финальный экспорт.

5. Передискретизация — зло. Делай один раз.

6. MP3 — не формат для работы.

7. Float — внутри, WAV — снаружи.

8. Алиасинг — враг. Борись оверсимплингом.

9. Фильтры антиалиасинга — необходимая жертва.

10. Цифра не пахнет.

Будущее: нейросети и реставрация

2023 год.

Нейросети умеют:

· Дорисовывать потерянные частоты

· Убирать шум без потери качества

· Превращать MP3 128 в иллюзию WAV

Что это значит:

Грань между аналогом и цифрой стирается.

Скоро мы сможем записывать на телефон и обрабатывать до студийного качества.

Вопрос:

Если нейросеть дорисует звук — это будет звук или иллюзия?

Резюме главы 3: 20 тезисов о цифровом звуке

1. Аналог — непрерывная линия. Цифра — пунктир.

2. Дискретизация — разрезание времени.

3. Битность — разрезание громкости.

4. Теорема Найквиста: частота дискретизации должна быть в 2 раза выше максимальной частоты.

5. Алиасинг — маскировка высоких частот под низкие.

6. Фильтры антиалиасинга обрезают всё выше половины сэмплрейта.

7. 44.1 кГц достаточно для воспроизведения.

8. 96 кГц полезно при синтезе.

9. 16 бит — финальный продукт.

10. 24 бита — запись и обработка.

11. 32 бита float — бесконечный запас.

12. Дизеринг — маскировка ошибок квантования шумом.

13. Дизеринг — только финальный экспорт.

14. Клиппинг — смерть сигнала.

15. Float внутри проекта — безопасно.

16. MP3 — психоакустическая модель.

17. FLAC — lossless, открытый.

18. DSD — 1 бит, 2.8 МГц, для аудиофилов.

19. Передискретизация — потеря.

20. Цифра — это инструмент. Аналог — это душа.

ЧАСТЬ I

ФИЗИКА И ФИЛОСОФИЯ ЗВУКА

ГЛАВА 4

ФАЗА — НЕВИДИМЫЙ УБИЙЦА

Почему твой микс звучит плоско, бас исчезает, а моно-совместимость превращается в кошмар

Открывающая история: Проклятие «White Album»

1968 год. Студия Abbey Road, Лондон.

The Beatles записывают «White Album». Это кошмар.

Леннон требует, чтобы его голос звучал «как будто из другого измерения».

Маккартни перезаписывает партию баса в десятый раз.

Ринго Старр сидит за барабанами и молчит — он уже неделю не разговаривает с Полом.

Но настоящая драма происходит за пультом.

Джефф Эмерик, главный инженер Abbey Road, сводит трек «While My Guitar Gently Weeps».

Звучит великолепно.

Он выводит микс на мастера.

Включает моно-проверку.

Бас исчезает.

Нет. Не становится тише.

Исчезает. Полностью.

Эмерик проверяет кабели. Проверяет патч-панель. Проверяет коммутацию. Всё идеально.

Он выключает моно. Бас есть.

Включает моно. Баса нет.

Три часа ночи. Эмерик сидит с головой в ладонях.

Джордж Мартин, продюсер, заходит в контрольную комнату с чашкой чая.

— Ты проверил фазу? — спрашивает он.

Эмерик смотрит на него пустыми глазами.

— Какую фазу?

Мартин подходит к консоли, нажимает кнопку с символом Ø на канале бас-гитары.

Бас возвращается.

Эмерик смотрит на осциллограф. Две волны — бочка и бас — стояли в противофазе и убивали друг друга.

Одна кнопка. Одна секунда. Проблема, которая мучила его четыре часа, исчезла.

В ту ночь Джефф Эмерик поклялся себе:

«Я никогда больше не пропущу фазу».

Эта глава — о том, как не пропустить фазу тебе.

Что такое фаза? (Второй заход, но теперь — навсегда)

Помнишь качели?

Ты и твой друг толкаете их.

Если вы толкаете вместе — качели летят высоко.

Если ты толкаешь вперед, а друг — назад — качели останавливаются.

Фаза — это направление движения в конкретный момент времени.

В звуке всё то же самое.

0 градусов — волна начинает движение вверх.

90 градусов — вершина.

180 градусов — начало движения вниз.

270 градусов — нижняя точка.

360 градусов — возвращение в ноль.

Противофаза — это сдвиг на 180 градусов.

Одна волна идет вверх, другая — вниз.

В момент встречи они обнуляются.

Гребень + впадина = 0.

Фазовое гашение: момент исчезновения

Это не теория. Это физика.

Две одинаковые волны.

Одна сдвинута ровно на половину периода.

Они складываются.

Тишина.

Не «тише». Не «плохо звучит».

Ничего.

Звук перестает существовать.

Где это происходит постоянно:

1. Запись барабанов.

Микрофон сверху малого барабана.

Микрофон снизу.

Верхний ловит удар палки.

Нижний ловит дребезг пружин.

Они всегда в противофазе.

Потому что мембрана движется вниз от удара — верхний микрофон фиксирует движение от себя.

Нижний микрофон с той же мембраны — движение к себе.

Полярность инвертирована.

Решение: кнопка Ø на нижнем микрофоне.

2. Запись акустической гитары.

Микрофон у розетки.

Микрофон у грифа.

Расстояние разное.

Звук приходит в разное время.

На некоторых частотах разница во времени создает сдвиг 180 градусов.

Частоты гасятся.

Решение: сдвинуть дорожки по времени.

3. Бас и бочка.

Самый частый клиент.

Бочка бьет 60 Гц.

Бас играет 60 Гц.

Если они не совпадают по фазе — они съедают друг друга.

Ты выкручиваешь громкость баса.

Баса нет.

Ты выкручиваешь еще.

Появляется грязь, но баса все равно нет.

Решение: инвертировать фазу на басу.

Как слышать фазу

Это самое сложное.

Фазу нельзя увидеть глазами. Осциллограф показывает, но в бою ты не будешь смотреть на графики.

Фазу нужно слышать.

Симптомы фазовых проблем:

1. Исчезновение баса.

Ты сводишь трек. Бочка и бас играют вместе.

Вроде громко. Вроде плотно.

Но когда они играют одновременно — звук проваливается.

Не становится тише — становится пустым.

2. Тонкий, плоский звук.

Инструмент, который должен звучать мощно и объемно, звучит как из консервной банки.

У него нет тела.

Нет грудной клетки.

Есть только атака и быстрое затухание.

3. Плавающий центр.

Ты панорамируешь вокал строго по центру.

А он гуляет.

То чуть левее, то чуть правее, то вообще в голове.

Это фазовая нестабильность между левым и правым каналом.

4. Усталость.

Микс вроде звучит нормально.

Но через 5 минут уши устают.

Хочется выключить.

Слушать неприятно, хотя вроде всё правильно.

Фазовые проблемы создают акустический хаос.

Мозг перегружается попытками интерпретировать противоречивые сигналы.

Простейший тест: моно

У тебя есть микс.

Нажми кнопку MONO в DAW.

Что происходит?

Вариант 1: Звук стал чуть тише, но плотность сохранилась.

Фаза в порядке.

Вариант 2: Бас исчез, вокал стал тонким, гитары звучат как радио.

У тебя фазовые проблемы.

Вариант 3: Звук стал громче и плотнее.

Тоже проблема. Значит, в стерео у тебя частичное гашение. Ты привык к нему, а на самом деле микс должен быть мощнее.

Моно-тест — это детектор лжи. Не пропускай мимо него ни один микс.

Коррелометр: прибор правды

В любой профессиональной DAW есть плагин, показывающий фазовую корреляцию.

Voxengo Span. iZotope Insight. Waves PAZ. Родной плагин.

Шкала от -1 до +1.

+1 — идеальная моно-совместимость.

Левый и правый канал идентичны.

Звук по центру, плотный, мощный.

0 — нет корреляции.

Левый и правый канал не связаны.

Широко, воздушно, но в моно — провал.

— 1 — полная противофаза.

Левый и правый канал зеркальны.

В стерео — ширина-ширина.

В моно — тишина.

Где должен быть иголочка:

· Вокал, бочка, бас, снейр — +0.8 … +1.

· Пэды, атмосфера, эффекты — 0 … +0.5.

· Ниже 0 — опасная зона.

Инвертор фазы: кнопка Ø

Она есть на каждом канале.

Выглядит как перечеркнутый кружок. Или символ Ø.

Что она делает:

Разворачивает фазу на 180 градусов.

То, что шло вверх, идет вниз.

То, что шло вниз, идет вверх.

Как использовать:

1. Включи моно.

2. Нажми Ø.

3. Послушай.

Стало больше баса? Плотнее звук? Значит, была проблема.

Стало хуже? Верни обратно.

Это не стыдно.

Это не «любительский метод».

Это профессиональный стандарт.

Гребенчатая фильтрация: частокол на графике

Когда один и тот же звук приходит в микрофон двумя путями — прямым и отраженным — с разницей в несколько миллисекунд, происходит гребенчатая фильтрация.

Название точное.

АЧХ становится похожа на гребень.

Пики — частоты, где волны сложились синфазно.

Провалы — где сложились в противофазе.

Как звучит:

· Тонко

· Пусто

· «Пластиково»

· Без тела

Где возникает:

· Запись гитарного кабинета двумя микрофонами

· Запись барабанов с близким и дальним микрофоном

· Работа с delay-эффектами без синхронизации

· Плохая акустика комнаты

Как лечить:

· Сдвигать дорожки по времени (Auto-Align)

· Использовать один микрофон

· Фазовая коррекция вручную

Auto-Align: магия выравнивания

SoundRadar, Auto-Align, Waves InPhase.

Плагины, которые автоматически выравнивают фазу между микрофонами.

Как работают:

1. Анализируют сигнал с двух микрофонов.

2. Измеряют разницу во времени.

3. Сдвигают одну дорожку так, чтобы волны совпали.

4. Инвертируют фазу, если нужно.

Результат:

Барабаны звучат как один инструмент, а не как набор случайных микрофонов.

Бас и бочка становятся одним целым.

Гитары — плотными и мощными.

Цена:

Дорого. Но окупается за один сеанс записи.

Запись барабанов: битва за фазу

Барабаны — это фазовая катастрофа.

7–10 микрофонов.

Разное расстояние.

Разные диаграммы направленности.

Разная полярность.

Стандартные проблемы:

1. Kick in vs Kick out.

Микрофон внутри бочки.

Микрофон снаружи бочки.

Они всегда в противофазе.

Потому что мембрана движется в обе стороны.

Решение: инвертировать фазу на kick out.

2. Snare top vs Snare bottom.

Верх — удар.

Низ — пружины.

Всегда противофаза.

Решение: инвертировать фазу на нижнем микрофоне.

3. Overheads vs close mics.

Overheads — 1–2 метра от барабанов.

Close mics — 2–5 сантиметров.

Разница во времени — 3–6 миллисекунд.

Гребенчатая фильтрация на 200–400 Гц.

Решение: сдвинуть close mics по времени так, чтобы они совпали с overheads.

Бас и бочка: братья-близнецы

Они живут в одном частотном диапазоне.

Они играют в одном ритме.

Они отвечают за одно и то же — фундамент микса.

Если они не совпадают по фазе — фундамент рушится.

Тест:

1. Включи только бочку и бас.

2. Включи моно.

3. Слушай 60–100 Гц.

Если при одновременной игре бас проваливается — у тебя фазовая проблема.

Решение 1: Инверсия.

Нажми Ø на басу.

Стало плотнее? Оставь.

Решение 2: Сдвиг.

Сдвинь бас на 1–3 миллисекунды вперед или назад.

Найди точку максимальной плотности.

Решение 3: Сайдчейн.

Бочка бьет — бас пригибается на 3 дБ.

Они не звучат одновременно — нет фазового конфликта.

Стерео-микрофоны: X/Y vs ORTF vs Blumlein

X/Y:

Два кардиоидных микрофона под 90–120 градусов.

Капсюли максимально близко.

Минимальная разница во времени.

Практически нет фазовых проблем.

Звук — плотный, сфокусированный.

ORTF:

Два кардиоидных микрофона под 110 градусов.

Расстояние между капсюлями — 17 см.

Естественная разница во времени и громкости.

Широкое, натуральное стерео.

Умеренные фазовые проблемы.

Blumlein:

Две восьмерки под 90 градусов.

Максимальное разделение.

Максимальная ширина.

Максимальный риск фазовых проблем.

Вывод:

X/Y — безопасно.

ORTF — красиво.

Blumlein — для смелых.

MS-запись: фаза как инструмент

Mid-Side.

Один микрофон направлен прямо (Mid).

Один микрофон — восьмерка, направлен в стороны (Side).

Магия:

При записи Side-канал содержит и левую, и правую информацию, но в противофазе.

При декодировании:

· Mid + Side = левый канал

· Mid — Side = правый канал

Что это дает:

1. Идеальная моно-совместимость.

2. Возможность регулировать ширину стерео постфактум.

3. Никаких фазовых проблем — всё математически точно.

Где используется:

· Классика

· Джаз

· Оркестр

· Атмосферные записи

Фаза и бас: почему 60 Гц — это 5,6 метра

Длина волны = скорость звука / частота.

343 м/с / 60 Гц = 5,6 метра.

Это важно.

60 Гц — длина волны 5,6 метра.

120 Гц — 2,8 метра.

240 Гц — 1,4 метра.

Что это значит:

Фазовое гашение на басу происходит на больших расстояниях.

Твой микрофон на бас-бочке и микрофон в зале находятся в 3 метрах друг от друга?

На 60 Гц это сдвиг ~180 градусов.

Бас исчезнет.

Вывод:

Низкие частоты требуют точного выравнивания.

Даже несколько миллисекунд задержки убивают фундамент.

Фаза и верха: сантиметры имеют значение

20 000 Гц — длина волны 1,7 сантиметра.

Сдвиг микрофона на 8 миллиметров — и ты уже потерял половину верха.

Поэтому:

· Высокочастотные микрофоны нужно позиционировать с хирургической точностью.

· Не ставь два микрофона на один источник без крайней необходимости.

· Если ставишь — проверяй фазу на верхах.

Цифровая фаза: минимально-фазовая vs линейно-фазовая

Минимально-фазовая фаза (Minimum Phase).

Стандартный режим эквалайзера.

Когда ты поднимаешь частоту — плагин добавляет фазовый сдвиг.

Звучит естественно.

Атака сохраняется.

Но фаза меняется.

Линейно-фазовая фаза (Linear Phase).

Плагин анализирует сигнал, обрабатывает его целиком, сохраняет фазу.

Нет фазового сдвига.

Есть пре-ринг — артефакт, при котором звук появляется до атаки.

Когда что использовать:

Минимально-фазовая — для большинства задач.

Линейно-фазовая — для мастеринга и критических низких частот.

Фаза и реверберация

Ревербератор создает тысячи копий сигнала с разными задержками.

Это тысячи фазовых сдвигов.

Проблема:

Если ты добавишь ревер на бас — хаос.

Фазовая каша. Потеря четкости. Грязь.

Решение:

Не вешай ревер на бас.

Не вешай ревер на бочку.

Не вешай длинный ревер на ритм-секцию.

Ревер — для верха и середины.

Бас любит сухость.

Инструменты для работы с фазой

1. Auto-Align (SoundRadar).

Автоматическое выравнивание нескольких микрофонов.

Дорого. Гениально.

2. Waves InPhase.

Ручное выравнивание + коррелометр.

3. Voxengo Span.

Бесплатный спектроанализатор с коррелометром.

4. DAW-плагины.

В Pro Tools, Logic, Cubase есть встроенные коррелометры и фазометры.

5. Фазовый тестер.

Генератор тона + осциллограф.

Дешево, сердито, требует навыков.

Фаза в мастеринге: последняя миля

На мастеринге фазу уже не исправить.

Только диагностировать.

Что смотрит мастеринг-инженер:

1. Корреляция между каналами.

2. Моно-совместимость.

3. Фазовые проблемы в суббасе.

Если ты принес мастер с фазовым гашением на 60 Гц — ты принес брак.

Фаза и человеческий слух

Мы не слышим фазу.

Мы слышим результат фазы.

· Больше баса = фаза совпадает.

· Меньше баса = фаза расходится.

· Ширина = разница в фазе между каналами.

· Моно-провал = противофаза.

Мозг не анализирует фазу.

Мозг анализирует спектр, громкость, время.

Но фаза управляет всем этим.

10 правил работы с фазой

1. Проверяй моно. Всегда. Каждый микс.

2. Инвертируй фазу при сомнении. Стало лучше — оставь.

3. Не используй эффект Хааса на басе. Только фазовая грязь.

4. Не ставь два микрофона на один источник без необходимости. Один хороший микрофон лучше двух кривых.

5. Если ставишь два микрофона — проверяй расстояние. Разница должна быть либо минимальной, либо кратной длине волны.

6. Бас и бочка — проверка номер один. Их фазовые отношения определяют весь микс.

7. Коррелометр держи в мастер-шине. Всегда.

8. Линейно-фазовые эквалайзеры — только для мастеринга. На сведении они создают больше проблем, чем решают.

9. Не паникуй. Небольшие фазовые сдвиги — это нормально. Проблема начинается, когда пропадает бас.

10. Доверяй ушам, а не глазам. Графики могут врать. Уши — нет.

История: как фаза спасла «Bohemian Rhapsody»

1975 год. Студия Rockfield, Уэльс.

Queen записывают оперную секцию «Bohemian Rhapsody».

180 вокальных дорожек.

Наслоение за наслоением.

Фредди Меркьюри поет один и тот же кусок снова и снова.

Инженер Майк Стоун сходит с ума.

180 дорожек. 180 фазовых сдвигов.

Когда он сводит всё вместе — звучит как каша.

Он пробует выравнивать вручную. Тратит три дня.

Ничего не помогает.

Тогда он берет все дорожки и сдвигает их на 15 миллисекунд.

Не спрашивай почему. Просто сдвигает.

Фазовые конфликты исчезают.

Вокал становится плотным, монолитным, божественным.

Фредди слушает и говорит:

— Это оно.

Майк Стоун никогда не рассказывал, зачем он сдвинул дорожки. Может, интуиция. Может, случайность.

Но с тех пор микро-сдвиги по времени стали стандартным приемом для утолщения вокала.

Иногда фазу не лечат.

Иногда фазу используют.

Микро-сдвиги как художественный прием

10–30 миллисекунд.

Не эхо. Не задержка. Просто легкое смещение.

Что происходит:

Мозг получает два почти одинаковых сигнала в разное время.

Он не воспринимает их как два отдельных звука.

Он воспринимает их как один звук, но толще.

Где использовать:

· Удвоение вокала.

· Удвоение гитар.

· Широкие пэды.

· Драм-машины.

Где не использовать:

· Бас.

· Бочка.

· Снейр (осторожно).

Фаза и 3D-звук

Бинауральный звук.

Dolby Atmos.

Ambisonics.

Все это — управление фазой.

Ты создаешь разницу во времени и громкости между каналами так, чтобы мозг поверил: звук пришел сверху, сзади, из-под пола.

Будущее:

Фаза перестанет быть «проблемой».

Фаза станет измерением.

Резюме главы 4: 20 тезисов о фазе

1. Фаза — положение волны в момент времени.

2. 180 градусов — полная противофаза.

3. В противофазе звук исчезает.

4. Фазовое гашение — главная причина отсутствия баса.

5. Моно-тест — детектор фазовых проблем.

6. Коррелометр: +1 идеал, 0 риск, -1 катастрофа.

7. Кнопка Ø инвертирует фазу на 180 градусов.

8. Бас и бочка — критическая зона.

9. Верхние частоты требуют сантиметровой точности.

10. Гребенчатая фильтрация — результат микро-задержек.

11. Auto-Align лечит фазовые проблемы за секунды.

12. X/Y — безопасное стерео, Blumlein — рискованное.

13. MS-запись дает идеальную моно-совместимость.

14. Минимально-фазовая обработка — естественно.

15. Линейно-фазовая обработка — без сдвига, но с пре-рингом.

16. Реверберация на бас — фазовый ад.

17. Длина волны 60 Гц — 5,6 метра.

18. Длина волны 10 кГц — 3,4 сантиметра.

19. Микро-сдвиги 10–30 мс создают иллюзию толщины.

20. Фаза — не враг. Фаза — инструмент.

ЧАСТЬ I

ФИЗИКА И ФИЛОСОФИЯ ЗВУКА

ГЛАВА 5
ЧАСТОТНЫЙ СПЕКТР ИНСТРУМЕНТОВ

Где живут басы, где прячется вокал и почему гитары вечно лезут без очереди

Открывающая история: Слепой тест Дюка Эллингтона

1956 год. Ньюпорт, Род-Айленд.

Дюк Эллингтон стоит за кулисами джазового фестиваля. Ему 57 лет. Он не слышит верхние частоты уже десять лет — возрастная потеря слуха.

Но он только что записал альбом, который взорвет мир.

«Ella Fitzgerald Sings the Duke Ellington Songbook».

Продюсер Норман Гранц подходит к нему с наушниками.

— Дюк, послушай финальный микс. Скажи, что тут не так.

Эллингтон надевает наушники. Слушает 30 секунд. Снимает их.

— Убери 320 герц на контрабасе, — говорит он. — Там звенит дека.

Гранц смотрит на инженера. Инженер смотрит на график эквалайзера.

На 320 Гц — пик +4 дБ.

Гранц опускает частоту на 3 дБ.

Контрабас перестает «гудеть», становится упругим, прозрачным.

— Как ты это услышал? — спрашивает Гранц.

Эллингтон улыбается:

— Я не слышу. Я знаю, где должен звучать контрабас. А где не должен.

Он не слышал частоту.

Он знал инструмент.

Эта глава — о том, как узнать каждый инструмент.

Где он живет.

С кем конфликтует.

Что любит.

Чего боится.

Потому что, когда ты знаешь инструмент, тебе не нужен эквалайзер.

Ты просто ставишь микрофон в правильное место.

Частотный спектр: карта боевых действий

Весь слышимый спектр — от 20 до 20 000 Гц.

Мы делим его на зоны.

Суббас: 20–60 Гц

Не слышно — чувствуешь.

Фундамент.

Точка опоры.

Бас: 60–250 Гц

Ритм-секция.

Тело.

Мощь.

Нижняя середина: 250–2000 Гц

Все инструменты.

Каша.

Битва.

Верхняя середина: 2000–6000 Гц

Атака.

Присутствие.

Резь.

Присутствие: 6000–10 000 Гц

Воздух.

Детали.

Шипение.

Верх: 10 000–20 000 Гц

Искры.

Блеск.

Ничего важного.

Бас-бочка (Kick Drum)

Диапазон: 40–120 Гц

Атака: 2–5 кГц

Тело: 60–100 Гц

Суб-зона: 40–60 Гц

Грязь: 200–400 Гц

Что она делает:

Бас-бочка — это удар в грудь.

Не в уши — в грудь.

Хорошая бочка не звучит — она бьет.

Частотный портрет:

· 40–60 Гц — суб-фундамент. В клубе ты чувствуешь это животом. Дома — только если у тебя сабвуфер. В наушниках — почти не слышно, но без этого бочка звучит плоско.

· 60–100 Гц — основное тело. То, что мы называем «бум». Здесь решается, будет ли бочка толстой или худой.

· 100–200 Гц — опасная зона. Если здесь перебор — бочка начинает гудеть, а не бить. Становится похожа на картонную коробку.

· 2–5 кГц — атака. Щелчок. «Клик». То, что позволяет услышать бочку на телефоне. Без этого бочка — просто бас.

Конфликты:

· С бас-гитарой (60–100 Гц)

· С томом (80–120 Гц)

· С бас-синтезатором (40–80 Гц)

Что любят профи:

· Атаку на 3–4 кГц.

· Тело на 60–80 Гц.

· Режекторный фильтр ниже 40 Гц (уберегает от инфразвука).

· Суб-гармоники (добавляют 40 Гц из 80 Гц).

Малый барабан (Snare Drum)

Диапазон: 120–250 Гц

Атака: 3–6 кГц

Тело: 150–200 Гц

Резонанс пружин: 200–400 Гц

Грязь: 400–800 Гц

Что он делает:

Малый барабан — это хлесткий удар.

Он должен разрезать микс.

Он должен быть слышен даже на телефоне.

Он — ритмический якорь.

Частотный портрет:

· 120–150 Гц — низ снейра. Если здесь поднять — барабан звучит «больше», но теряет атаку.

· 150–250 Гц — тело. Полнота. «Мясо».

· 200–400 Гц — пружины. Если здесь перебор — слышно противное дребезжание. Если недобор — снейр звучит мертво.

· 3–6 кГц — атака. Щелчок палки. Без этого снейр теряется в миксе.

· 8–10 кГц — воздух тарелок. Если ты записываешь снейр отдельно — здесь можно смело резать.

Конфликты:

· С гитарой (150–400 Гц)

· С вокалом (200–500 Гц)

· С томом (120–250 Гц)

· С хай-хэтом (3–6 кГц)

Что любят профи:

· Параллельную компрессию — снейр становится жирным, но не теряет атаку.

· Сатурацию на 200 Гц — добавляет тепла.

· Ревер на 1–2 секунды — только на параллельный канал, чтобы не размазывать атаку.

Том-томы (Toms)

Диапазон: 70–400 Гц

Атака: 3–5 кГц

Тело: 80–300 Гц (в зависимости от размера)

Грязь: 200–400 Гц

Что они делают:

Томы — это акцент.

Они не играют постоянно.

Они врываются.

Они должны звучать мощно и быстро затухать.

Частотный портрет:

· 70–120 Гц — большой напольный том. Фундамент.

· 120–200 Гц — средний том.

· 200–400 Гц — малый том (подвесной).

Проблема томов:

Они резонируют.

Удар — и том продолжает звучать на своей резонансной частоте. Иногда секунду. Иногда две.

В быстром пассаже томы превращаются в кашу.

Решение:

· Эквалайзер: найти резонансную частоту и вырезать ее узким колоколом на -6–9 дБ.

· Гейт: отсекать хвост после 300–500 мс.

· Компрессия: быстрая атака, быстрый релиз.

Хай-хэт (Hi-Hat)

Диапазон: 200 Гц — 8 кГц

Атака: 3–6 кГц

Тело: 200–400 Гц

Шипение: 8–12 кГц

Что он делает:

Хай-хэт — это ритмическая пыльца.

Он не несет гармонии.

Он не дает баса.

Он просто говорит: «время идет, ритм не останавливается».

Частотный портрет:

· 200–400 Гц — «грязь» хай-хэта. Если здесь перебор — он звучит как кастрюля.

· 3–6 кГц — атака. Щелчок тарелок.

· 8–12 кГц — шипение, воздух, «искры».

Конфликты:

· С тарелками (весь диапазон)

· С вокальными сибилянтами (5–8 кГц)

· С гитарой (3–6 кГц)

Что любят профи:

· Режекторный фильтр ниже 200–300 Гц. Там у хай-хэта нет ничего полезного, только грязь.

· Легкую сатурацию — добавляет «вес» тонкому звуку.

· Автоматизацию громкости — в куплете тише, в припеве громче.

Тарелки (Cymbals)

Диапазон: 200 Гц — 20 кГц

Атака: 1–3 кГц

Шипение: 8–16 кГц

Грязь: 200–600 Гц

Что они делают:

Тарелки — это атмосфера.

Они создают ощущение пространства, воздуха, дороговизны.

Проблема тарелок:

Они бесконечны.

Одна тарелка звучит 5–10 секунд. Десять тарелок — звучат вечно.

В плохом миксе тарелки заливают всё.

Частотный портрет:

· 200–600 Гц — грязь. Здесь нет ничего красивого, только гул. Режь смело.

· 1–3 кГц — атака. Удар палочки.

· 8–16 кГц — шипение, воздух, «серебро».

Конфликты:

· С хай-хэтом (весь диапазон)

· С вокалом (8–12 кГц)

· С синтезаторами (8–16 кГц)

Что любят профи:

· Режекторный фильтр ниже 300–400 Гц.

· Мягкий спад после 16 кГц.

· Параллельную компрессию — только на самых важных моментах.

· Никогда — реверберацию на тарелки. Они сами себе ревербератор.

Бас-гитара

Диапазон: 40–400 Гц

Атака: 1–2 кГц

Тело: 80–120 Гц

Гармоники: 400–4 кГц

Грязь: 200–400 Гц

Что она делает:

Бас-гитара — это мост.

Между ритмом (бочка) и гармонией (аккорды).

Без баса музыка есть. Но она — плоская.

Частотный портрет:

· 40–80 Гц — суб-фундамент. Есть только у 5-струнных басов и синтезаторов.

· 80–120 Гц — основное тело. То, что мы называем «бас».

· 120–200 Гц — нижняя середина. Если здесь перебор — бас гудит, маскирует бочку.

· 200–400 Гц — опасная зона. Грязь, «картон», невнятность.

· 1–2 кГц — атака. Щипок пальцем, удар медиатора. То, что позволяет услышать бас на телефоне.

Конфликты:

· С бочкой (60–100 Гц)

· С томом (80–120 Гц)

· С гитарой (200–400 Гц)

Что любят профи:

· DI + микрофон. DI — для четкости, микрофон — для тепла.

· Сплит по частотам: бочке 60 Гц, басу 100 Гц.

· Сатурацию на 100–200 Гц — добавляет гармоники, бас становится слышен даже на маленьких колонках.

· Компрессию 4:1, медленная атака, средний релиз.

Электрогитара

Диапазон: 80 Гц — 6 кГц

Атака: 2–4 кГц

Тело: 200–500 Гц

Грязь: 150–300 Гц

Верх: 5–8 кГц

Что она делает:

Электрогитара — это стена.

Она не солирует (в рок-миксе). Она создает текстуру, плотность, агрессию.

Частотный портрет:

· 80–150 Гц — низ гитары. В рок-миксе здесь обычно режут. Это место баса и бочки.

· 150–300 Гц — грязь. Если здесь перебор — гитара звучит как картон, маскирует вокал.

· 300–500 Гц — тело. Теплота, глубина.

· 2–4 кГц — атака. Хруст, агрессия, присутствие.

· 5–8 кГц — воздух. Щелчок медиатора, дыхание.

Конфликты:

· С вокалом (300–3 кГц) — главная война.

· С клавишами (300–5 кГц).

· С басом (150–300 Гц).

Что любят профи:

· Режекторный фильтр ниже 80–100 Гц.

· Вырез 200–300 Гц на -3–6 дБ.

· Подъем 2–4 кГц для атаки.

· Стерео-разнесение: две гитары, панорамированные 100% L / 100% R.

· Разные тембры: одна гитара с большим количеством верха, другая — с большим количеством середины.

Акустическая гитара

Диапазон: 80 Гц — 12 кГц

Атака: 2–5 кГц

Тело: 100–300 Гц

Воздух: 8–12 кГц

Грязь: 300–600 Гц

Что она делает:

Акустическая гитара — это естественность.

Она должна звучать как дерево и струны, а не как плагин.

Частотный портрет:

· 80–150 Гц — корпус. Глубина, фундамент.

· 150–300 Гц — тепло. Здесь живет характер инструмента.

· 300–600 Гц — опасная зона. Если здесь перебор — гитара звучит как коробка.

· 2–5 кГц — атака пальцев, щипок.

· 8–12 кГц — воздух, звон струн.

Конфликты:

· С вокалом (200–600 Гц)

· С клавишами (200–5 кГц)

Что любят профи:

· Два микрофона: один у розетки, второй у грифа.

· Малую дозу компрессии (2:1, медленная атака).

· Никакого ревера или очень мало — акустика сама создает пространство.

· Эквалайзер: легкий подъем 5–8 кГц для воздуха, режектор ниже 80 Гц.

Вокал (мужской)

Диапазон: 80–500 Гц

Форманты: 2–5 кГц

Сибилянты: 5–8 кГц

Воздух: 8–12 кГц

Грязь: 200–400 Гц

Что он делает:

Вокал — это главное.

Всё остальное — аккомпанемент.

Частотный портрет:

· 80–120 Гц — фундамент. Есть только у очень низких басов. Обычно здесь режут.

· 120–200 Гц — тепло. Если здесь перебор — вокал звучит «в грудь», глухо.

· 200–400 Гц — грязь. Самая опасная зона. Здесь живут корпусные резонансы, «коробка».

· 400–800 Гц — глубина. Приятная, теплая середина.

· 1–2 кГц — резкость. Здесь вокал начинает «вылезать» из микса.

· 2–5 кГц — присутствие. То, что делает вокал разборчивым.

· 5–8 кГц — сибилянты. «С», «Ш», «Ч», «Ц».

· 8–12 кГц — воздух. Дороговизна, близость.

Конфликты:

· С гитарой (200–5 кГц) — главная война.

· С клавишами (200–5 кГц).

· С бэк-вокалом (весь диапазон).

Что любят профи:

· Режекторный фильтр ниже 80–100 Гц.

· Мягкий вырез 200–400 Гц, если вокал звучит «в коробку».

· Подъем 2–5 кГц для разборчивости.

· De-esser на 5–8 кГц.

· Компрессию 3:1 — 4:1, средняя атака, средний релиз.

· Параллельную компрессию для плотности.

· Ревер — только на параллельный канал, короткий (0.8–1.2 сек).

Вокал (женский)

Диапазон: 150–1000 Гц

Форманты: 2–5 кГц

Сибилянты: 5–8 кГц

Воздух: 8–14 кГц

Грязь: 300–600 Гц

Что он делает:

То же самое, что мужской.

Только выше.

Частотный портрет:

· 150–300 Гц — тепло. Ниже у женщин обычно ничего нет.

· 300–600 Гц — грязь. Здесь живут носовые резонансы.

· 1–2 кГц — резкость.

· 2–5 кГц — присутствие.

· 5–8 кГц — сибилянты.

· 8–14 кГц — воздух.

Конфликты:

· С гитарой (весь диапазон)

· С клавишами (весь диапазон)

· Со струнными (весь диапазон)

Что любят профи:

· Режекторный фильтр ниже 100–150 Гц.

· Вырез 300–600 Гц, если вокал звучит гнусаво.

· Подъем 3–5 кГц для яркости.

· De-esser агрессивнее, чем на мужском вокале.

· Стерео-удвоение на припевах.

Бэк-вокал

Диапазон: зависит от пола и партии

Что он делает:

Бэк-вокал — это поддержка.

Он не должен быть громче основного вокала.

Он не должен быть в том же частотном диапазоне.

Он не должен быть в центре.

Частотный портрет:

· Те же частоты, что и у основного вокала, но с вырезом середины.

Конфликты:

· С основным вокалом (весь диапазон)

Что любят профи:

· Режекторный фильтр выше, чем на основном вокале (150–200 Гц).

· Вырез 2–4 кГц на -3–6 дБ — уступаем место главному голосу.

· Панорама: 30% L, 30% R, 50% L, 50% R.

· Короткий ревер (0.6–0.8 сек).

· Меньше компрессии, чем на основном вокале.

Синтезатор (пэды)

Диапазон: любой

Что они делают:

Пэды — это фон.

Они создают атмосферу, гармоническую подушку, настроение.

Они не должны привлекать внимание.

Частотный портрет:

Зависит от синтезатора. Может быть что угодно.

Главное правило пэдов:

Если пэд привлекает внимание — он плохой пэд.

Конфликты:

· Со всем, если неправильно настроен.

Что любят профи:

· Режекторный фильтр ниже 200–300 Гц.

· Режекторный фильтр выше 8–10 кГц.

· Вырез 1–3 кГц на -3–6 дБ — освобождаем место для вокала и гитар.

· Много ревера.

· Много хоруса/фленжера.

· Широкую панораму.

Синтезатор (лид)

Диапазон: любой

Что он делает:

Лид — это мелодия.

Он должен быть слышен, но не перебивать вокал.

Частотный портрет:

Зависит от синтезатора.

Конфликты:

· С вокалом (1–5 кГц)

· С гитарой (1–5 кГц)

Что любят профи:

· Подъем на атакующих частотах (2–4 кГц).

· Режекторный фильтр ниже 200–300 Гц (если это не бас-лид).

· Меньше ревера, чем у пэдов.

· Автоматизацию громкости: тише в куплете, громче в припеве.

Фортепиано

Диапазон: 27 Гц — 4 кГц

Атака: 2–5 кГц

Тело: 100–500 Гц

Грязь: 300–600 Гц

Что оно делает:

Фортепиано — это весь оркестр в одном инструменте.

У него есть басы, середина, верха.

У него есть атака и затухание.

У него есть педаль, которая все маскирует.

Проблема фортепиано:

Оно занимает весь спектр.

От 27 Гц до 4 кГц.

Если ты оставишь фортепиано в полном спектре — оно сожрет весь микс.

Решение:

Решать, какая часть фортепиано нужна в каждой секции.

· В куплете — только верхний регистр.

· В припеве — добавляем басы.

· Солирует — полный спектр.

· Аккомпанирует — режем середину.

Струнные (скрипка, альт, виолончель, контрабас)

Скрипка: 200 Гц — 10 кГц

Альт: 130 Гц — 8 кГц

Виолончель: 80 Гц — 6 кГц

Контрабас: 40 Гц — 4 кГц

Что они делают:

Струнные — это эмоция.

Они могут звучать нежно и агрессивно.

Они могут тянуть ноту бесконечно.

Они всегда немного расстроены (темперация не совпадает с натуральным строем).

Конфликты:

· Со всем, особенно с вокалом и гитарами.

Что любят профи:

· Минимальный эквалайзер.

· Много воздуха (8–12 кГц).

· Меньше ревера, чем кажется нужным.

· Широкую панораму.

Духовые (труба, саксофон, тромбон)

Труба: 150 Гц — 10 кГц

Саксофон: 80 Гц — 8 кГц

Тромбон: 60 Гц — 6 кГц

Что они делают:

Духовые — это мощь.

Они могут быть тихими и бархатными.

Они могут быть громкими и режущими.

Проблема духовых:

Они очень громкие в живую.

В записи — часто теряют характер.

Решение:

· Близкий микрофон.

· Мягкая компрессия.

· Никакого ревера на трубе.

Оркестр: баланс тысяч

Оркестр — это 80–100 человек.

80–100 источников звука.

Частотный портрет:

Весь спектр. От 30 Гц (контрабас, туба) до 16 кГц (скрипки, флейта, треугольник).

Конфликты:

Все конфликтуют со всем.

Как это сводить:

1. Не лезь.

Оркестр свел себя сам за 300 лет эволюции.

Дирижер уже все сделал.

Твоя задача — не испортить.

1. Микрофоны.

Главный микрофон — на расстоянии.

Близкие микрофоны — только для солистов.

2. Панорама.

Как сидят музыканты — так и панорамируй.

Первые скрипки слева, виолончели справа, контрабасы справа-сзади.

3. Эквалайзер.

Только если очень нужно.

И очень мягко.

Таблица конфликтов: кто с кем дерется

Инструмент Конфликтует с Частота

Бочка Бас-гитара 60–100 Гц

Бочка Том 80–120 Гц

Малый барабан Гитар 150–400 Гц

Малый барабан Вокал 200–500 Гц

Том Бас 80–120 Гц

Хай-хэт Вокал (сибилянты) 5–8 кГц

Хай-хэт Тарелки 3–12 кГц

Бас-гитара Бочка 60–100 Гц

Бас-гитара Гитара 200–400 Гц

Электрогитара Вокал 300–3 кГц

Электрогитара Клавиши 300–5 кГц

Акустическая гитара Вокал 200–600 Гц

Вокал Гитара 300–3 кГц

Вокал Клавиши 300–3 кГц

Пэды Все Весь спектр

Фортепиано Все Весь спектр

Как разрешать конфликты: три метода

Метод 1. Эквалайзер.

Найти частоту конфликта.

Вырезать у менее важного инструмента.

Поднять у более важного.

Метод 2. Панорама.

Развести по стерео.

Гитара слева, клавиши справа.

Мозг перестает их путать.

Метод 3. Время.

Сайдчейн.

Бочка ударила — бас пригнулся на 3 дБ.

Удар прошел — бас вернулся.

Как научиться слышать частоты

Упражнение 1. Эквалайзер-свип.

Возьми розовый шум или барабанный луп.

Поставь параметрический эквалайзер.

Сделай узкий пик +12 дБ.

Медленно веди по спектру от 20 Гц до 20 кГц.

Запоминай:

· 50 Гц — гул

· 100 Гц — тепло

· 200 Гц — коробка

· 400 Гц — гнусавость

· 1 кГц — резкость

· 2 кГц — атака

· 4 кГц — присутствие

· 8 кГц — шипение

· 16 кГц — воздух

Упражнение 2. Frequency training apps.

Quiztones.

SoundGym.

EarMaster.

15 минут в день.

Упражнение 3. Анализ референсов.

Возьми коммерческий трек.

Поставь спектроанализатор.

Смотри, где у него бас, середина, верх.

Слушай, как это звучит.

Мифы о частотах

Миф 1. Бас должен быть громким.

Бас должен быть ощутимым.

Громкость и ощущение — разные вещи.

Миф 2. Верха добавляют дороговизну.

Верха добавляют усталость.

Дороговизну добавляет баланс.

Миф 3. 50 Гц нужно всем.

50 Гц нужно только тем, кто играет на 50 Гц.

Акустической гитаре 50 Гц не нужно.

Вокалу 50 Гц не нужно.

Тарелкам 50 Гц не нужно.

Миф 4. Середина — это грязь.

Середина — это информация.

Без середины нет разборчивости.

Нет вокала.

Нет гитар.

Нет музыки.

Золотые частоты: шпаргалка

50–60 Гц — фундамент микс.

100 Гц — тепло баса и бочки.

200 Гц — грязь, коробка, картон.

400 Гц — глубина/гнусавость.

800 Гц — резкость.

1.5 кГц — агрессия.

3 кГц — присутствие.

5 кГц — атака.

8 кГц — шипение.

12 кГц — воздух.

Резюме главы 5: 20 тезисов о частотном спектре

1. Каждый инструмент имеет свой частотный дом.

2. Бочка живет на 60–100 Гц, атака на 3–4 кГц.

3. Снейр — 150–250 Гц, атака на 3–6 кГц.

4. Томы резонируют — ищи и режь их частоту.

5. Хай-хэту не нужно ниже 300 Гц.

6. Тарелкам не нужно ниже 400 Гц.

7. Бас-гитара — 80–120 Гц, атака на 1–2 кГц.

8. Электрогитара — враг вокала на 300–3 кГц.

9. Акустическая гитара — не коробка, режь 300–600 Гц.

10. Вокал — главный. Остальные уступают.

11. Мужской вокал — 120–200 Гц тепло, 200–400 Гц грязь.

12. Женский вокал — 300–600 Гц грязь.

13. Бэк-вокал — уже, тише, по бокам.

14. Пэды — фон. Режь середину.

15. Лиды — мелодия. Не лезь в вокал.

16. Фортепиано занимает всё. Решай, что нужно.

17. Струнные — эмоция. Не перерабатывай.

18. Духовые — мощь. Близкий микрофон.

19. Оркестр — не трогай баланс.

20. Конфликты решаются EQ, панорамой и временем.

ЧАСТЬ I

ФИЗИКА И ФИЛОСОФИЯ ЗВУКА
ГЛАВА 6

ГРОМКОСТЬ И ДИНАМИЧЕСКИЙ ДИАПАЗОН

Почему твой трек тише коммерческих релизов, война громкости и как выиграть, не проиграв

Открывающая история: День, когда умерла динамика

1994 год. Лос-Анджелес. Студия A&M.

Инженер Владо Меллер заканчивает мастеринг альбома «Vitalogy» группы Pearl Jam.

Он выводит финальный трек на ленту.

Прослушивает.

Улыбается.

Динамика живая. Басы упругие. Верха воздушные.

В комнату заходит менеджер лейбла.

— Почему это тише, чем Nirvana? — спрашивает он.

Владо объясняет про динамический диапазон, про усталость слуха, про художественную ценность.

Менеджер смотрит на него как на идиота.

— Сделай громче.

Владо вздыхает.

Он подкручивает лимитер на 2 дБ.

Потом еще на 2.

Потом еще.

— Еще громче.

Он убирает лимитер, ставит мультибанд-компрессию.

Режет транзиенты.

Срезает верха.

Убивает воздух.

— Вот, — говорит менеджер. — Теперь звучит как хит.

Владо Меллер молчит.

Он только что участвовал в убийстве динамического диапазона.

Через 10 лет эту войну назовут Loudness War.

Она идет до сих пор.

Эта глава — о громкости.

О том, как мы ее измеряем.

О том, как мы ее создаем.

И о том, как мы ее убиваем.

Что такое громкость?

Казалось бы, простой вопрос.

Чем сильнее волна — тем громче звук.

Но человек — не прибор.

Физическая громкость — это амплитуда волны. Измеряется в децибелах звукового давления (дБ SPL).

Воспринимаемая громкость — это то, как мозг интерпретирует эту амплитуду.

И эти две величины никогда не совпадают.

Потому что:

1. Ухо неравномерно (Флетчер–Мэнсон).

2. Длительность звука влияет на восприятие.

3. Частотный состав влияет на восприятие.

4. Контекст влияет на восприятие.

5. Предыдущий звук влияет на восприятие.

Простой пример:

Удар молотка по стальной плите — 120 дБ, но длится 0,1 секунды.

Мозг говорит: «громко, но терпимо».

Гул турбины самолета — 110 дБ, но длится часами.

Мозг говорит: «снимите это, я схожу с ума».

Одна и та же громкость.

Разное восприятие.

Децибел: логарифмическое проклятие

Децибел — это не единица измерения.

Это отношение.

Бел — десятикратное увеличение мощности.

1 Бел = 10 раз.

2 Бела = 100 раз.

3 Бела = 1000 раз.

Децибел — одна десятая Бела.

0 дБ = 1 раз (исходный уровень)

10 дБ = 10 раз

20 дБ = 100 раз

30 дБ = 1000 раз

Почему это важно:

Если ты увеличиваешь громкость на 3 дБ — ты удваиваешь мощность сигнала.

Но ухо слышит это как едва заметное изменение.

Если ты увеличиваешь на 10 дБ — ухо слышит как в два раза громче.

А физическая мощность выросла в 10 раз.

Логарифмическая шкала сжимает реальность.

Это эволюционная защита.

И профессиональная головная боль.

Три шкалы децибел: не путай

1. дБ SPL (Sound Pressure Level).

Звуковое давление в воздухе.

0 дБ SPL — порог слышимости.

20 дБ SPL — шепот.

60 дБ SPL — разговор.

85 дБ SPL — эталон сведения.

120 дБ SPL — болевой порог.

140 дБ SPL — разрыв барабанных перепонок.

Это про реальный мир.

2. дБ FS (Full Scale).

Цифровая шкала.

0 дБ FS — абсолютный потолок.

— 6 дБ FS — нормальный пик записанного сигнала.

— 18 дБ FS — стандартный уровень трекинга.

— ∞ — тишина.

В цифре нет ничего выше 0.

0 — это смерть.

3. LUFS (Loudness Units Full Scale).

Воспринимаемая громкость.

Средняя громкость трека с учетом психоакустики.

— 24 LUFS — классическая музыка.

— 16 LUFS — тихий рок.

— 12 LUFS — громкий поп.

— 8 LUFS — максималдомайниздец.

Стриминги нормализуют по LUFS.

Spotify: -14 LUFS.

Apple Music: -16 LUFS.

YouTube: -13 LUFS.

Если ты сделаешь трек громче -8 LUFS — Spotify просто убавит его до -14.

Ты убил динамику — и получил тот же уровень громкости.

Динамический диапазон: тишина vs громкость

Динамический диапазон — это разница между самым тихим и самым громким звуком.

В реальном мире:

Шепот — 30 дБ SPL.

Рок-концерт — 110 дБ SPL.

Динамический диапазон: 80 дБ.

В цифре:

16 бит — 96 дБ.

24 бита — 144 дБ.

32 бита float — 1528 дБ (бессмысленно).

В готовом треке:

Классика — 40–50 дБ динамического диапазона.

Джаз — 30–40 дБ.

Рок — 20–30 дБ.

Поп — 10–20 дБ.

Современный трап — 3–6 дБ.

Динамический диапазон умирает.

Что убивает динамику

1. Компрессия.

Каждый раз, когда ты сжимаешь динамический диапазон, ты делаешь тихие звуки громче, а громкие — тише.

Разница между самым тихим и самым громким уменьшается.

2. Лимитирование.

Ты берешь все пики и просто обрезаешь их.

Сигнал становится прямоугольником.

Динамика — плоской линией.

3. Сатурация.

Гармоники маскируют транзиенты.

Ухо перестает слышать разницу между ударом и телом.

4. Наслоение.

100 дорожек вместо 20.

Каждая дорожка добавляет шум.

Шум заполняет тишину.

5. Страх тишины.

Продюсеры боятся, что слушатель подумает: «музыка кончилась».

Поэтому они заполняют каждый миллисекунд.

История войны громкости

1950-е: Винил.

Физическое ограничение.

Слишком громкий бас — игла выпрыгивает из канавки.

Динамический диапазон — 50–60 дБ.

1960-е: Рок.

The Beatles, The Rolling Stones.

Динамика живая.

Тихо — громко — тихо.

Художественный прием.

1970-е: Дорогая моя студия.

Steely Dan, Pink Floyd.

Динамика как часть звука.

$100 000 за альбом.

Никто не просит «сделать громче».

1980-е: CD.

64 дБ динамического диапазона.

Нет физических ограничений.

Инженеры: «Ого, можно сделать громко!»

1990-е: Первые жертвы.

Red Hot Chili Peppers, «Californication».

Альбом звучит отлично в студии.

На CD — клиппинг, грязь, искажения.

Продюсер: «Так надо, это стиль».

2000-е: Ад.

Metallica, «Death Magnetic».

Клиппинг на каждом треке.

Фанаты в ярости.

Продюсер: «Мы хотели, чтобы звучало современно».

2010-е: Капитуляция.

Стриминги вводят нормализацию громкости.

Война проиграна.

Но уши уже мертвы.

Парадокс громкости

Тест:

Испытуемым дают послушать два трека.

Первый — динамичный, живой, с перепадами громкости.

Второй — пережатый, плоский, максимально громкий.

90% говорят: второй звучит лучше.

Почему?

Мозг путает громкость с качеством.

Громкий звук = энергичный = успешный = профессиональный.

Тихий звук = слабый = любительский = скучный.

Это нейробиология.

Дофамин выбрасывается на стимул.

Громкий стимул — больше дофамина.

Но только первые 30 секунд.

Через минуту наступает усталость.

Через две — раздражение.

Через три — слушатель выключает трек.

Ты выиграл битву за первый клик.

Ты проиграл войну за удержание.

Как измерить громкость правильно

Пиковый уровень (Peak).

Самый громкий момент трека.

Измеряется в дБ FS.

Средний уровень (RMS — Root Mean Square).

Средняя громкость за определенный промежуток.

Приблизительная, но полезная метрика.

LUFS (Loudness Units Full Scale).

Средняя громкость с учетом психоакустики.

Momentary LUFS — 400 мс.

Short-term LUFS — 3 секунды.

Integrated LUFS — весь трек.

True Peak.

Пиковый уровень после цифро-аналогового преобразования.

Цифровой клиппинг на 0 дБ FS может дать True Peak +3 дБ после конвертации.

Стандарты:

Spotify: -14 LUFS Integrated, -1 dB True Peak.

Apple Music: -16 LUFS, -1 dB True Peak.

YouTube: -13 LUFS, -1 dB True Peak.

CD: нет стандарта, но традиционно -9..-12 LUFS.

Динамический диапазон в цифрах

Жанр Динамический диапазон (DR) LUFS

Классика 18–22 DR -24..-20

Джаз 14–18 DR -20..-16

Рок 70-х 12–16 DR -18..-14

Рок 90-х 10–14 DR -16..-12

Поп 2000-х 8–12 DR -14..-10

Современный поп 6–10 DR -12..-8

Метал 5–8 DR -10..-6

Трап / EDM 3–6 DR -8..-4

DR — Dynamic Range, единица измерения, где 1 = ~1 дБ динамического диапазона.

Наблюдение:

За 40 лет динамический диапазон популярной музыки сократился в 4 раза.

Как выиграть войну громкости, не вступая в нее

Стратегия 1: Контраст.

Тихо → громко всегда звучит громче, чем просто громко.

Динамический диапазон 10 дБ.

Куплет на -18 LUFS.

Припев на -8 LUFS.

Мозг говорит: «ОГО, ПРИПЕВ УДАРИЛ».

Стратегия 2: Плотность.

Субъективная громкость = не только амплитуда, но и количество звуков.

Инструментовка.

Наслоение.

Палитра.

Куплет — гитара + вокал.

Припев — + бас, + барабаны, + синтезатор, + бэк-вокал.

Это бесплатная громкость.

Стратегия 3: Суббас.

40–60 Гц.

Ты почти не слышишь это ушами.

Но ты чувствуешь грудью.

Мозг интерпретирует вибрацию как «мощь».

Стратегия 4: Сатурация.

Гармонические искажения.

Четные гармоники.

Ухо слышит их как «громче», хотя пики не изменились.

Калибровка мониторов: 85 дБ

Вернемся к главе 2.

85 дБ SPL — эталон.

Как настроить:

1. Купи SPL-метр. Или скачай приложение.

2. Включи розовый шум на всех мониторах.

3. Настрой громкость так, чтобы SPL-метр показывал 85 дБ.

4. Запомни положение регулятора.

Что это дает:

· Ты слышишь бас и верха честно.

· Твои уши не устают 4–6 часов.

· Твой микс будет звучать сбалансированно на любой громкости.

Проверка на разной громкости

Тест:

1. Свел трек на 85 дБ.

2. Убавь громкость до 70 дБ.

3. Слушай.

Что должно произойти:

Бас станет чуть тише (кривые Флетчера–Мэнсона).

Верха станут чуть тише.

Баланс должен сохраниться.

Что происходит в плохом миксе:

Бас пропадает совсем.

Вокал проваливается.

Тарелки начинают доминировать. Значит, ты свел на слишком высокой громкости и перекомресировал бас.

Исправление:

Сбалансируй микс на 70 дБ.

Проверь на 85.

Проверь на 95.

Хороший микс звучит хорошо везде.

Клиппинг: враг или друг?

Цифровой клиппинг:

Сигнал касается 0 дБ FS.

Вершина волны срезана.

Прямоугольник.

Негармонические искажения.

Звучит:

Треск.

Грязь.

Усталость.

Аналоговый клиппинг:

Лампа перегружена.

Транзистор насыщен.

Лента перенасыщена.

Звучит:

Тепло.

Плотность.

Характер.

Парадокс:

Люди покупают плагины за $200, чтобы имитировать аналоговый клиппинг.

И случайно получают цифровой клиппинг, думая, что это одно и то же.

Это не одно и то же.

Лимитер: последняя линия обороны

Лимитер — это компрессор с бесконечным соотношением.

Сигнал достиг порога — сигнал остановился.

Что происходит:

Все пики выше порога срезаны.

Динамический диапазон схлопнут.

Громкость выросла.

Цена:

Транзиенты убиты.

Атака исчезла.

Звук стал плоским.

Хороший лимитер:

· Убирает 1–3 дБ пиков.

· Сохраняет атаку.

· Не слышен.

Плохой лимитер:

· Убирает 6–12 дБ пиков.

· Превращает барабаны в картонку.

· Слышен на каждом ударе.

Современный мастеринг: игра в защиту

2020-е.

Война громкости закончена.

Стриминги нормализуют.

Слушатели не могут сделать громче — платформа делает тише.

Новая стратегия:

— 14 LUFS Integrated.

— 1 dB True Peak.

Динамический диапазон 10–12 DR.

Достаточно громко.

Достаточно динамично.

Достаточно для Spotify.

История: Стивен Спилберг и война громкости в кино

1998 год.

Стивен Спилберг заходит в зал Dolby.

Показывают тестовый ролик. Взрывы, стрельба, музыка.

Спилберг выходит через 10 минут.

— У меня болят уши, — говорит он.

Инженеры объясняют: так теперь делают, громче = лучше.

Спилберг качает головой.

— Я хочу, чтобы зритель смотрел фильм. А не выживал в нем.

Dolby выпускает стандарт диалоговой громкости.

С тех пор в кино:

Диалог — 85 дБ.

Взрыв — 105 дБ.

Динамический диапазон — 20 дБ. Никто не жалуется, что тихо.

Динамика как художественный прием

Pink Floyd — «The Dark Side of the Moon».

Первый трек начинается с сердцебиения.

30 дБ SPL.

Шепот.

Ты прижимаешься к колонкам.

Потом — взрыв саксофона.

100 дБ SPL.

Ты подпрыгиваешь в кресле.

Это динамика.

Radiohead — «Kid A».

Тишина.

Шум.

Снова тишина.

Электронный писк.

Тишина.

Том Йорк не боялся, что слушатель уйдет.

Он знал: тишина заставляет слушать внимательнее.

Почему мы боимся тишины

1999 год. Napster.

Бесплатная музыка.

Миллионы треков.

Среднее время прослушивания — 30 секунд.

Продюсеры в панике.

«Если трек не зацепит за первые 5 секунд — слушатель переключит».

Рождение intro-less музыки.

Никаких вступлений.

Сразу припев.

Сразу громко.

Сразу максимум.

2009 год. Spotify.

Плейлисты.

Shuffle mode.

Трек должен звучать громко в контексте предыдущего трека.

И следующего.

И любого соседа.

Динамика умерла.

Динамика в разных жанрах

Классика:

Динамика — это всё.

Pianissimo vs Fortissimo.

40 дБ разницы.

Дирижер контролирует 100 человек.

Джаз:

Динамика — это разговор.

Тихие пассажи.

Взрывы соло.

Слушатель внутри клуба.

Рок:

Динамика — это удар.

Тихо — громко.

Куплет — припев.

Стих — взрыв.

Электроника:

Динамика — это наслоение.

Не громче, а плотнее.

Не тише, а прозрачнее.

Поп:

Динамики нет.

Ровно.

Громко.

Всегда.

10 заповедей громкости

1. Своди на 85 дБ SPL.

2. Проверяй на 70 и 90 дБ.

3. Не клиппи, если это не художественный прием.

4. Лимитер — последняя инстанция, а не первый плагин.

5. -14 LUFS — твой друг.

6. True Peak -1 dB — твой спаситель.

7. Суббас дает иллюзию громкости без убийства пиков.

8. Контраст громче, чем просто громкость.

9. Плотность аранжировки громче, чем компрессия.

10. Тишина — не враг. Тишина — инструмент.

Будущее: громкость умирает

2023 год.

Apple Music — -16 LUFS.

Spotify — -14 LUFS.

YouTube — -13 LUFS.

Тренд: вниз.

Слушатели устали.

Уши болят.

Люди хотят слышать динамику.

Парадокс:

Войну громкости выиграли не инженеры.

Не продюсеры.

Не лейблы.

Ее выиграли алгоритмы.

Они просто сделали все треки одинаково тихими.

Практикум: как измерить свой микс

Инструменты:

· YouLean Loudness Meter (бесплатно)

· iZotope Insight

· Waves WLM

· Родной луфс-метр в DAW

Протокол:

1. Поставь метр на мастер-шину.

2. Воспроизведи весь трек от начала до конца.

3. Смотри Integrated LUFS.

4. Смотри True Peak Max.

5. Смотри Dynamic Range (DR).

Целевые показатели:

· Поп/рок/электроника: -14..-12 LUFS, -1 dB TP, DR 8–10

· Джаз/акустика: -18..-16 LUFS, -1 dB TP, DR 12–14

· Классика: -24..-20 LUFS, -1 dB TP, DR 16–20

Словарь терминов громкости

дБ SPL — звуковое давление в воздухе. Реальный мир.

дБ FS — цифровая шкала. 0 = потолок.

LUFS — воспринимаемая громкость. Стандарт стримингов.

RMS — средняя громкость (приближение).

Peak — максимальный пик.

True Peak — пик после конвертации.

Dynamic Range — разница между самым тихим и самым громким.

Loudness War — 30-летняя война, которую никто не выиграл.

Клиппинг — обрезание пиков.

Лимитер — автоматический убийца динамики.

Нормализация — алгоритм, который делает все треки одинаково тихими.

Резюме главы 6: 20 тезисов о громкости

1. Громкость физическая и воспринимаемая — разные вещи.

2. Децибел — логарифмическое отношение, не единица измерения.

3. дБ SPL — реальный мир.

4. дБ FS — цифровой потолок.

5. LUFS — воспринимаемая громкость, стандарт стримингов.

6. Динамический диапазон умирает 30 лет.

7. Войну громкости начали CD, выиграли алгоритмы.

8. 85 дБ SPL — эталон сведения.

9. Хороший микс звучит сбалансированно на любой громкости.

10. Мозг путает громкость с качеством.

11. Контраст громче, чем просто громкость.

12. Плотность аранжировки — бесплатная громкость.

13. Суббас — бесплатная громкость.

14. Сатурация — бесплатная громкость.

15. Цифровой клиппинг — враг.

16. Аналоговый клиппинг — инструмент.

17. Лимитер — последняя линия обороны, а не первый шаг.

18. Spotify: -14 LUFS.

19. Apple Music: -16 LUFS.

20. Динамика возвращается.

ЧАСТЬ I
ФИЗИКА И ФИЛОСОФИЯ ЗВУКА
ГЛАВА 7

АНАЛОГ VS ЦИФРА

Почему старая лента звучит «теплее», эмуляции никогда не догонят оригинал и имеет ли это вообще значение

Открывающая история: Прощание с лентой

2006 год. Лондон. Студия Abbey Road.

Компания EMI закрывает последнюю фабрику по производству магнитной ленты.

Рабочие стоят у конвейера, который работал без остановки 40 лет.

Последняя бобина.

Последний метр.

Последний дюйм.

Кто-то плачет.

Через месяц студия Abbey Road получит новые цифровые консоли.

Через год — продаст все аналоговые магнитофоны коллекционерам.

Через пять лет — будет сдавать их в аренду за бешеные деньги хипстерам, которые хотят «тот самый звук».

Кен Скотт, главный инженер Abbey Road, работавший с Beatles, сидит в пустой контрольной комнате.

Журналист спрашивает:

— Цифра звучит хуже?

Кен молчит 10 секунд.

— Нет, — говорит он. — Цифра звучит точнее. Проблема в том, что точность — не то, что мы ищем.

— А что мы ищем?

— Мы ищем лицо.

Эта глава — о лице.

О том, почему аналоговые искажения стали эстетикой.

О том, что мы потеряли, перейдя на нули и единицы.

И о том, что мы приобрели.

Что такое аналог?

Аналоговый сигнал — непрерывный.

Между точкой А и точкой Б — бесконечное количество значений.

Виниловая пластинка.

Магнитная лента.

Ламповый усилитель.

Человеческий голос.

Свойства аналога:

1. Непрерывность. Нет квантования. Нет ступенек.

2. Шум. Лента шипит. Лампы фонят. Пластинка трещит. Провода гудят. Аналог никогда не бывает «чистым».

3. Деградация. Каждая копия хуже оригинала. 10-я копия — уже каша. 100-я — белый шум.

4. Нестабильность. Скорость плывет. Напряжение скачет. Температура влияет. Влажность влияет. Фаза луны влияет.

5. Характер. Ошибки повторяются. Шум имеет свой цвет. Деградация имеет свой вкус.

Аналог — живой.

Поэтому он умирает.

Что такое цифра?

Цифровой сигнал — дискретный.

44 100 точек в секунду.

65 536 градаций громкости.

Между точками — пустота.

Свойства цифры:

1. Дискретность. Точки. Ступеньки. Квантование.

2. Тишина. 0 — это 0. 1 — это 1. Шума нет. Чистота. Стерильность.

3. Идеальная копия. 1000-я копия идентична первой. Никакой деградации. Бессмертие.

4. Стабильность. Частота не плывет. Громкость не скачет. Фаза луны не влияет.

5. Безликость. Ошибок нет. Характера нет. Вкуса нет.

Цифра — мертва.

Поэтому она вечна.

Великий миф: аналог теплее

Технически: «теплота» = четные гармоники.

Когда аналоговое устройство (лампа, лента, транзистор) перегружается, оно генерирует гармоники.

· Четные гармоники (2×, 4×, 6×) — приятные, музыкальные, «теплые».

· Нечетные гармоники (3×, 5×, 7×) — агрессивные, грязные, «холодные».

Аналог генерирует и те, и другие.

Но из-за физики лампы — чуть больше четных.

Цифра не генерирует гармоники.

Цифра просто воспроизводит то, что записала.

Теплота — это искажения.

Теплота — это ошибка.

Теплота — это характер.

Лампа: 100 лет обмана

1906 год. Ли Де Форест изобретает триод.

Устройство для усиления сигнала.

Огромное. Хрупкое. Дорогое.

Побочный эффект:

Когда лампа приближается к пределу своих возможностей, она начинает мягко обрезать сигнал.

Не прямоугольником, как цифра.

А плавной кривой.

Гармоники:

· 2-я гармоника — громко.

· 3-я гармоника — тихо.

· 4-я гармоника — еще тише.

· 5-я — едва слышно.

Это «ламповое тепло».

1960-е: транзистор.

Дешевле. Меньше. Надежнее.

Но транзистор обрезает жестко.

Нечетные гармоники.

«Транзисторный звук» = холодный, резкий, «каменный».

1970-е: инженеры ищут компромисс.

1980-е: цифра убивает лампу.

1990-е: все хотят обратно лампу.

2020-е: плагины за $300 эмулируют лампу 1958 года.

Лента: искусство насыщения

1940-е. Германия.

Нацистские инженеры изобретают высокочастотное подмагничивание.

Магнитная лента становится пригодной для музыки.

1950-е. Америка.

Les Paul записывает на ленту.

Он открывает явление: ленточное насыщение.

Когда магнитный слой перенасыщен, он перестает линейно записывать сигнал.

Результат:

· Сжатие динамики.

· Добавление гармоник.

· Плавный спад верха.

· Шум.

Звук становится «плотным».

Проблема:

Оригинальная лента — Ampex 456 — снята с производства в 2002 году.

Сегодняшние эмуляции — это эмуляции эмуляций.

Винил: эстетика ограничений

1948 год. Columbia Records выпускает 12-дюймовый LP.

33⅓ об/мин.

20 минут на сторону.

Динамический диапазон — 55 дБ.

Физические ограничения:

1. Басы. Слишком громкий бас — игла выпрыгивает из канавки. Приходится резать ниже 50 Гц и сужать стерео-базу.

2. Верха. Слишком яркий верх — игла изнашивается. Приходится смягчать выше 12 кГц.

3. Длина. 20 минут на сторону. Если альбом длиннее — режешь динамику, урезаешь частоты.

4. Шум. Треск, шипение, пыль, статика.

Что мы полюбили:

· Тепло отсутствия верха.

· Мягкость отсутствия баса.

· Уют треска и шипения.

Винил — это не преимущество.

Винил — это эстетика ограничений.

Цифра: рождение стерильности

1982 год. Sony и Philips выпускают CD.

16 бит. 44,1 кГц. 74 минуты.

Динамический диапазон — 96 дБ.

Отсутствие шума.

Отсутствие треска.

Отсутствие деградации.

Идеальная запись.

Проблема:

Идеальная запись — скучная.

Нет тепла лампы.

Нет плотности ленты.

Нет уюта винила.

Нет жизни.

Люди говорят: «Цифра звучит мертво».

Они правы.

Эмуляция: охота за призраком

1996 год. Waves выпускает первый плагин-эмуляция.

Q10 — параметрический эквалайзер.

Никакого «тепла». Никакой «лампы». Просто EQ.

2001 год. Universal Audio выпускает LA-2A.

Первая эмуляция лампового компрессора.

$300.

Инженеры не верят: «Это же просто код».

2005 год. Waves SSL 4000 Collection.

Эмуляция легендарной консоли.

Каждый инженер покупает.

Каждый инженер вздыхает: «Не то».

2010 год. Slate Digital VCC.

Виртуальная консоль.

Суммация, гармоники, перегруз.

«Почти как аналог».

2020 год. Acustica Audio.

Конволюция. Сэмплы реальных консолей.

150 ГБ на жестком диске.

«Теперь точно как аналог».

Нет. Не как аналог.

Почему эмуляции не догоняют оригинал

Причина 1. Нелинейность.

Аналог нелинеен.

Он реагирует на сигнал по-разному в зависимости от:

· Громкости

· Частоты

· Предыдущего сигнала

· Температуры

· Влажности

· Настроения техника

Цифра линейна.

Математика не плачет.

Причина 2. Шум.

Аналоговый шум — хаотичный, живой, дышащий.

Цифровой шум — псевдослучайный, повторяющийся, скучный.

Причина 3. Случайность.

В аналоге нет двух одинаковых ламп.

Нет двух одинаковых плат.

Нет двух одинаковых копий.

В цифре — каждый байт идентичен.

Эмуляция — это портрет.

Оригинал — это человек.

Парадокс: цифра эмулирует аналог, который эмулировал цифру

2000-е.

Инженеры восстанавливают старые записи.

Они берут мастер-ленту 1967 года.

Оцифровывают в 24/96.

Чистят шум.

Выравнивают частоты.

Убирают треск.

Звучит чисто.

Звучит мертво.

Они добавляют эмуляцию ленты.

Эмуляцию лампы.

Эмуляцию винила.

Звучит как 1967 год.

Но 1967 год пытался звучать чисто.

2024 год пытается звучать как 1967.

Мы сделали круг.

Аналоговая суммация: 2+2=5

В цифре: 1 +1 = 2.

В аналоге: 1 +1 = 2.1.

Потому что:

Каждая консоль, каждый кабель, каждый транзистор добавляет микро-искажения.

При суммировании эти искажения накапливаются.

Результат:

Ширина.

Глубина.

«Воздух».

Цифровые эмуляции аналоговой суммации:

· Добавляют гармоники.

· Сдвигают фазу.

· Добавляют шум.

Стоят $300–1000.

Работают?

Достаточно, чтобы инженеры платили.

Громкость: аналог vs цифра

Аналоговый клиппинг:

Плавный.

Гармонический.

Приятный.

Цифровой клиппинг:

Резкий.

Негармонический.

Неприятный.

Почему?

Аналог обрезает волну по кривой.

Цифра обрезает волну по прямой.

Это вся разница.

Слепые тесты: слышим ли мы разницу?

1980-е. Первые слепые тесты CD vs винил.

Испытуемые не отличают.

2000-е. 44.1 vs 96.

Не отличают.

2010-е. Эмуляция ленты vs реальная лента.

Не отличают.

Критики:

— Тесты неправильные!

— Оборудование дешевое!

— Уши испытуемых мертвые!

Правда:

Большинство людей не слышат разницу.

Инженеры думают, что слышат.

Профи иногда действительно слышат.

Но цена аналога — 100x цифры. Стоит ли? Только ты решаешь.

История: как цифра спасла The Beatles

1995 год.

Джордж Мартин продюсирует «Anthology».

Нужно свести старые записи 60-х.

Ленты изношены.

Скорость плавает.

Фаза плывет.

Шум.

Мартин пробует на аналоговой консоли.

3 часа — 1 трек.

Звучит плохо.

Он вызывает цифрового инженера.

Pro Tools.

Выравнивание времени.

Фазовая коррекция.

Шумоподавление.

30 минут — 1 трек.

Звучит как 1966 год. Только чище.

Мартин говорит:

— Я ненавижу цифру. Но я люблю, когда звучит хорошо.

Гибрид: лучшее из двух миров

2024 год.

Запись: Аналог + Цифра.

Лента для характера.

Pro Tools для удобства.

Обработка: Аналог + Цифра.

LA-2A на вокал.

FabFilter на EQ.

1176 на барабаны.

Pro-Q на мастеринг.

Сведение: В цифре.

Мастеринг: В цифре (или на ленту, если бюджет позволяет).

Никто не работает чисто в аналоге.

Никто не работает чисто в цифре.

Все гибриды.

Стоимость: экономика аналога

Аналоговая студия, 1975:

Консоль: $500 000.

Ленточник: $50 000.

Компрессоры: $10 000 × 10.

Эквалайзеры: $5 000 × 10.

Микрофоны: $3 000 × 20.

Итого: $1 000 000+.

Аналоговая студия, 2024:

Консоль (винтаж): $500 000+.

Ленточник (восстановленный): $30 000.

Outboard: $5 000–30 000 за единицу.

Обслуживание: $10 000/год.

Цифровая студия, 2024:

Компьютер: $3 000.

DAW: $500.

Интерфейс: $1 000.

Мониторы: $2 000.

Плагины: $1 000.

Итого: $7 500.

Разница: 100x.

Кому нужен аналог сегодня?

1. Аудиофилы.

Им 60+.

У них деньги.

Они помнят, как звучала музыка в 1972 году.

Они готовы платить $50 000 за проигрыватель.

2. Коллекционеры.

Покупают лампы 1958 года.

Хранят в сейфах.

Никогда не используют.

3. Хипстеры.

Им 25.

Они слушают MP3.

Но покупают винил для Instagram.

4. Профессионалы с бюджетом.

Записывают на ленту, потому что клиент заплатил.

Или потому что хотят почувствовать себя Джорджем Мартином.

5. Ты?

Нужен ли тебе аналог?

Нет.

Хочешь ли ты аналог?

Это другой вопрос.

Мифы об аналоге

Миф 1. Аналог звучит «теплее».

Теплее — значит «с гармониками».

Цифра может добавить гармоники.

Эмуляции могут добавить гармоники.

Реальная лента стоит $300/час.

Миф 2. Винил звучит лучше CD.

Винил звучит иначе.

Мягче. Темнее. Шумнее.

«Лучше» — вопрос вкуса.

Миф 3. Аналог честнее.

Аналог врет.

Всегда. Непрерывно.

Это его свойство.

Миф 4. Цифра мертва.

Цифра — холст.

Ты делаешь ее живой.

Мифы о цифре

Миф 1. 192 кГц звучит лучше.

Нет. 44.1 достаточно.

Двойной слепой тест: никто не отличает.

Миф 2. 24 бита нужно только для мастеринга.

24 бита нужно для записи.

16 бит — для финала.

Миф 3. Плагины — это «ненастоящее».

Плагины — это инструменты.

Хороший музыкант звучит хорошо на любом инструменте.

Миф 4. Цифра все упрощает.

Цифра упрощает технику.

Но усложняет выбор.

Раньше у тебя было 3 компрессора.

Теперь — 300.

Философия: инструмент vs результат

Студент спрашивает мастера:

— Какой микрофон лучше для вокала?

— Тот, который у тебя есть.

— А какой предусилитель?

— Тот, который подключен к микрофону.

— А какой компрессор?

— Компрессор не важен. Важен голос. И песня.

Ученик уходит.

Мастер думает:

«Я мог бы сказать ему правду: Neumann U87, Neve 1073, LA-2A.

Но тогда он потратит $15 000 и будет думать, что звук в деньгах.

А звук — не в деньгах.

Звук — в ушах».

10 заповедей аналогового/цифрового мышления

1. Аналог — это характер. Цифра — это чистота.

2. Характер нужен не всегда. Чистота нужна не всегда.

3. Эмуляции достаточно для 99% задач.

4. 1% оставь для тех, у кого есть деньги на оригинал.

5. Никто не слышит разницу в слепом тесте. Кроме тебя. Но ты — не твой слушатель.

6. Винил — это эстетика, не качество.

7. Лента — это дорогое удовольствие.

8. Лампа — это красивая старость.

9. Цифра — это молодость и свобода.

10. Результат важнее инструмента.

История: как Radiohead вернулись к аналогу

2011 год. Лос-Анджелес.

Radiohead записывают «The King of Limbs».

Полностью в цифре.

Ableton.

Лэптопы.

MIDI-контроллеры.

Том Йорк недоволен.

«Звучит как… программа».

2016 год. Лос-Анджелес.

Radiohead записывают «A Moon Shaped Pool».

Лента. Консоль. Лампы.

Полуинчевый магнитофон.

Никакого автотюна.

Никакого грида.

Звучит тепло. Живо. Человечно.

Том Йорк улыбается:

«Я не знаю, звучит ли это лучше.

Но звучит иначе.

И это иначе — то, что я искал».

Будущее: гибридная нормальность

2024 год.

Никто не спорит об аналоге vs цифре.

Это спор 90-х.

Сегодня:

· Запись: в цифру, через аналоговые преампы (или эмуляции).

· Обработка: 50/50.

· Сведение: в цифре.· Мастеринг: в цифре, с аналоговым лимитером (или без).

Завтра:

· Нейросети будут эмулировать любую лампу.

· Ты не отличишь эмуляцию 2030 года от реальной лампы 1958 года.

· Аналог станет музеем.

· Цифра станет всем.

Резюме главы 7: 20 тезисов об аналоге и цифре

1. Аналог — непрерывный. Цифра — дискретная.

2. Аналог шумит. Цифра молчит.

3. Аналог деградирует. Цифра вечна.

4. Аналог имеет характер. Цифра стерильна.

5. Теплота = четные гармоники = искажения.

6. Лампа дает мягкий клиппинг и четные гармоники.

7. Транзистор дает жесткий клиппинг и нечетные гармоники.

8. Лента сжимает динамику и режет верха.

9. Винил — эстетика ограничений.

10. CD — идеальная запись, скучная запись.

11. Эмуляции — портреты, не оригиналы.

12. Но портретов достаточно.

13. Слепые тесты: разница не слышна большинству.

14. Гибрид — лучшее из двух миров.

15. Аналог стоит 100× дороже цифры.

16. Аналог не сделает твою музыку лучше.

17. Твои уши сделают твою музыку лучше.

18. Мифы об аналоге — маркетинг.

19. Мифы о цифре — маркетинг.

20. Результат важнее инструмента.

ЧАСТЬ I

ФИЗИКА И ФИЛОСОФИЯ ЗВУКА
ГЛАВА 8

СТОЯЧИЕ ВОЛНЫ И КОМНАТНЫЕ МОДЫ

Почему в твоей студии бас либо гудит, либо исчезает, и как сделать так, чтобы комната не врала

Открывающая история: Комната, которая пела

1993 год. Сиэтл. Студия London Bridge.

Звукорежиссёр Рик Парашар заканчивает сведение альбома Soundgarden «Superunknown».

Он выключает мониторы.

В комнате тишина.

Но бас продолжает звучать.

Рик оглядывается. Мониторы выключены. Амплифайеры обесточены. Инструменты молчат.

Бас звучит.

Он выходит в коридор. Бас звучит.

В туалет. Бас звучит.

На улицу. Бас затихает.

Он возвращается в студию.

Бас снова здесь.

Рик вызывает техника. Терик приносит измерительный микрофон, включает розовый шум, смотрит на анализатор спектра.

Пик на 63 Гц. +18 дБ.

— У тебя здесь мода, — говорит техник.

— Какая мода?

— Комнатная. Длина твоей комнаты — 5,4 метра. Это половина длины волны 63 Гц.

Рик смотрит на стены.

Стены молчат.

Но они поют.

Эта глава — о том, почему стены поют.

О том, как комната убивает твои миксы.

И о том, что с этим делать, когда у тебя нет денег на акустических архитекторов.

Что такое стоячая волна?

Вернёмся к озеру.

Ты бросаешь камень. Волна бежит к берегу.

Волна ударяется о берег. Волна бежит обратно.

Волна встречается с новой волной.

Если расстояние до берега ровное, волны начинают складываться.

Гребень + гребень = большая волна.

Впадина + впадина = большая впадина.

Волна перестаёт двигаться.

Она стоит на месте.

Это стоячая волна.

В комнате всё то же самое.

Звук от монитора летит к стене.

Отражается.

Летит обратно.

Встречается с новым звуком.

Если расстояние между стенами кратно половине длины волны — звук усиливается.

Если расстояние между стенами кратно четверти длины волны — звук гасится.

Комната не нейтральна.

Комната — резонатор.

Физика комнатных мод

Комнатная мода — это стоячая волна, которая возникает между двумя параллельными поверхностями.

Три измерения:

1. Осевые моды — между передней и задней стеной.

2. Тангенциальные моды — между четырьмя стенами.

3. Косвенные моды — между всеми шестью поверхностями.

Формула расчёта:

f = (c / 2) × √ ((nx/Lx) ² + (ny/Ly) ² + (nz/Lz) ²)

Где:

· c — скорость звука (343 м/с)

· Lx, Ly, Lz — длина, ширина, высота комнаты

· nx, ny, nz — порядок моды (1, 2, 3…)

Для нормальных людей:

Длина комнаты 5 метров → частота моды = 343 / (2 × 5) = 34,3 Гц.

Длина комнаты 4 метра → 42,9 Гц.

Длина комнаты 3 метра → 57,2 Гц.

Это базовые моды.

Будут ещё вторые гармоники:

· 5 м: 34 Гц и 68 Гц

· 4 м: 43 Гц и 86 Гц

· 3 м: 57 Гц и 114 Гц

И третьи:

· 5 м: 34, 68, 102 Гц

· 4 м: 43, 86, 129 Гц

· 3 м: 57, 114, 171 Гц

Твоя комната — это орган.

Он играет на своих частотах.

Не спрашивая тебя.

Частотный портрет комнаты

Возьмём типичную спальню-студию:

Длина: 4,2 м

Ширина: 3,5 м

Высота: 2,5 м

Осевые моды:

Измерение Длина (м) Базовая мода 2-я гармоника 3-я гармоника

Длина 4,2 41 Гц 82 Гц 123 Гц

Ширина 3,5 49 Гц 98 Гц 147 Гц

Высота 2,5 69 Гц 138 Гц 207 Гц

Тангенциальные моды (примеры):

· 4,2 × 3,5: √ ((1/4,2) ² + (1/3,5) ²) × 171,5 = 64 Гц

· 4,2 × 2,5: 53 Гц

· 3,5 × 2,5: 60 Гц

Косвенные моды:

· 4,2 × 3,5 × 2,5: 72 Гц

Что мы видим:

· Пики на: 41, 49, 53, 60, 64, 69, 72, 82, 98, 123, 138, 147 Гц

· Провалы между ними

Комната — это эквалайзер.

С 20 дБ горбами и провалами.

Как звучат комнатные моды

Горб на 40–50 Гц:

Бас гудит.

Одна нота длится вечность.

Микс кажется «жирным» в студии.

В машине — пустым.

Горб на 60–70 Гц:

Бочка звучит как картонка.

Гул, а не удар.

Ты выкручиваешь эквалайзер, пытаясь убрать «грязь».

А это не грязь. Это комната.

Горб на 100–120 Гц:

Бас-гитара «мычит».

Томы звучат как коровы.

Вокал теряет разборчивость.

Провал на 80–100 Гц:

Бочки нет.

Ты выкручиваешь бас на +6 дБ.

Думаешь: «наконец-то слышно».

Выезжаешь из студии.

Баса слишком много.

Провал на 150–200 Гц:

Снейр тонкий, плоский, без тела.

Ты добавляешь 200 Гц.

Добавляешь ещё.

Снейр становится гулким, но тела всё равно нет.

Это не ты.

Это комната.

Почему маленькие комнаты хуже больших

Закон физики:

Частота моды = скорость звука / (2 × расстояние).

Большая комната (8 м):

Моды: 21 Гц, 43 Гц, 64 Гц…

Плотно? Нет.

Разреженно.

Маленькая комната (3 м):

Моды: 57 Гц, 114 Гц, 171 Гц, 228 Гц… Густо.

Проблема маленьких комнат:

1. Моды выше по частоте.

Они попадают прямо в рабочий диапазон — 50–200 Гц.

2. Моды плотнее.

Больше пиков и провалов на октаву.

3. Зона прослушивания ближе к стенам.

Ты сидишь в эпицентре мод.

Вывод:

Большая комната прощает ошибки.

Маленькая комната — наказывает.

Твоя спальня 12 м² — худшая комната для сведения.

Но у тебя нет другой.

Значит, будешь работать с этой.

Коррекция комнаты: Sonarworks и другие

2015 год. Латвия.

Группа инженеров выпускает Sonarworks Reference.

Идея: измерить комнату, создать инверсную кривую, исправить АЧХ в цифре.

Как работает:

1. Измерительный микрофон в точке прослушивания.

2. Розовый шум во всех мониторах.

3. Анализ: горбы и провалы.

4. Создание EQ-кривой.

5. Плагин на мастер-шине, который режет горбы и поднимает провалы.

Результат:

Ты слышишь ровную АЧХ.

Не комнату — а мониторы.

Цена:

$300 за софт.

$100 за микрофон.

Проблема:

Это коррекция только АЧХ.

Не времени. Не фазы. Не реверберации.

Sonarworks не лечит комнату.

Sonarworks надевает на тебя очки.

Очки vs хирургия

Sonarworks, Dirac, IK ARC — это очки.

Ты видишь чётко.

Но комната осталась прежней.

Акустическая обработка — это хирургия.

Ты удалил стоячую волну.

Ты вылечил реверберацию.

Комната стала другой.

Что выбрать?

У тебя нет денег на хирургию?

Купи очки. Это лучше, чем ничего.

У тебя есть $500 на басовые ловушки?

Купи ловушки.

Очки потом.

Идеал:

Хирургия + очки.

Акустика + коррекция.

Мифы о комнатной акустике

Миф 1. Яйцевидные поролоновые панели убивают бас.

Нет.

Они убивают верха.

Бас проходит сквозь них как сквозь бумагу.

Миф 2. Книжный шкаф — хороший диффузор.

Книжный шкаф — отличный диффузор.

Если в нём книги разного размера.

И если он не пустой.

Миф 3. Дорогие мониторы исправят комнату.

Нет.

Дорогие мониторы просто громче врут.

Миф 4. Маленькая комната не лечится.

Лечится.

Просто сложнее.

Миф 5. У меня нет проблем с комнатой.

Есть.

Ты просто к ним привык.

Бюджетная акустика: $500

Самый важный апгрейд:

Басовые ловушки в углы.

Не за диваны. Не за шторы.

В углы. Где встречаются две стены.

Или стена + потолок.

Минимальный набор:

1. 4 басовые ловушки в вертикальные углы.

2. 2 панели поглощения в точки первых отражений.

3. Ковёр на пол (если пол голый).

4. Шторы на окна (если окна голые).

Цена:

· Басовые ловушки: DIY — $100, готовые — $200–300.

· Панели: DIY — $50, готовые — $100–200.

· Ковёр: $50–100.

· Шторы: $50–100.

Итого: $250–700.

Результат:

Гул уменьшился на 50%.

Реверберация упала с 0,8 сек до 0,4 сек. Ты начал слышать бас.

DIY: сделай сам

Басовые ловушки:

· Минеральная вата (Rockwool, Ursa).

· Плотность: 40–60 кг/м³.

· Толщина: 10–20 см.

· Ткань: акустически прозрачная (мешковина, хлопок).

· Каркас: дерево.

Панели поглощения:

· Та же минвата.

· Толщина: 5–10 см.

· Воздушный зазор 5–10 см за панелью.

Диффузоры (сложно):

· Деревянные бруски разной глубины.

· Формула: последовательность квадратов.

Гугли: «DIY bass trap», «DIY acoustic panel».

Сэкономишь $500.

Потратишь 2 выходных.

Измерения: как узнать свою комнату

Шаг 1. Купи измерительный микрофон.

Behringer ECM8000 — $70.

Dayton Audio EMM-6 — $80.

MiniDSP UMIK-1 — $100 (USB, удобно).

Шаг 2. Скачай Room EQ Wizard.

Бесплатно.

Сложно.

Гугли туториалы.

Шаг 3. Проведи измерение.

Микрофон в точку прослушивания.

Розовый шум в мониторы.

30 секунд.

Шаг 4. Смотри на график.

Горбы — твои моды.

Провалы — твои антимоды.

Время реверберации — RT60.

Шаг 5. Не паникуй.

У всех так.

Что делать с графиком

Шаг 1. Найди самый большой горб.

Обычно 40–80 Гц.

+12–18 дБ.

Шаг 2. Поставь басовую ловушку в угол.

Измерь снова.

Горб упал на 3–6 дБ.

Шаг 3. Поставь вторую ловушку.

Измерь.

Ещё -3 дБ.

Шаг 4. Третью, четвёртую.

Убывающая отдача.

После 4 ловушек — +3 дБ за каждую следующую.

Шаг 5. Панели в точки первых отражений.

Убирают гребёнку на 1–4 кГц.

АЧХ становится ровнее.

Шаг 6. Sonarworks.

Сглаживает остатки.

Время реверберации: RT60

RT60 — время, за которое звук затухает на 60 дБ.

Идеал для студии:

· Большая комната: 0,3–0,4 сек.

· Маленькая комната: 0,2–0,3 сек.

· Контрольная комната: 0,2–0,25 сек.

· Жилая комната: 0,4–0,6 сек.

Твоя спальня без обработки:

0,6–1,2 сек.

Слишком долго:

Реверберация комнаты маскирует детали.

Ты добавляешь верха, которых не хватает.

В наушниках микс звенит.

Слишком коротко:

Комната «мёртвая».

Ты переслушиваешь.

Добавляешь ревер в DAW.

В наушниках — баня.

Цель: 0,2–0,3 сек.

Точка прослушивания: где сидеть

Золотое правило:

35–45% длины комнаты от передней стены.

Не у стены.

Не ровно посередине.

Почему:

У стены — пик давления (горб на басу).

По центру — пик скорости (провал на басу).

Идеал:

Длина комнаты: 5 м.

Позиция: 1,8–2,2 м от передней стены.

Треугольник:

Мониторы и голова — равносторонний треугольник.

1–1,5 м сторона.

Мониторы: ближнее поле

Ближнее поле — 1–1,5 м.

Почему:

Прямой звук громче отражённого.

Комната меньше влияет.

Правило:

Мониторы на 10–15 дБ громче, чем отражения.

Это достижимо только в ближнем поле.

Дальнее поле — 2–3 м.

Только в больших студиях.

Только с акустикой.

Ближнее поле — твой друг.

Не ставь мониторы далеко.

Сабвуфер: друг или враг

Проблема:

Ты не слышишь суббас в своих мониторах.

Ты покупаешь сабвуфер.

Ты ставишь его в угол.

Результат:

+18 дБ на 40 Гц.

Стоячая волна в квадрате.

Ты никогда не сделаешь хороший микс.

Как правильно:

1. Сабвуфер не в угол.

2. Сабвуфер между мониторами, по центру.

3. Кроссовер 80–100 Гц.

4. Калибровка громкости: саб на 3 дБ тише мониторов.

Лучше вообще без саба.

Научись слышать суббас в наушниках.

Наушники: спасение или ловушка

Плюсы наушников:

· Нет комнаты.

· Нет стоячих волн.

· Слышно суббас.

· Можно работать ночью.

Минусы наушников:

· Нет кросс-фида (левый канал слышит только левое ухо).

· Нет естественной локализации.

· Усталость слуха быстрее.

· Фантомный центр — в голове, не перед тобой.

Решение:

· 70% времени — мониторы.

· 30% времени — наушники.

· Проверка в наушниках — обязательно.

· Сведение только в наушниках — риск.

Как слышать комнату

Упражнение 1. Хлопок.

Хлопни в ладоши в центре комнаты.

Слышишь гул? Это мода.

Слышишь треск? Это отражения от голых стен.

Упражнение 2. Bass sweep.

Включи синусоиду 20–200 Гц.

Медленно веди вверх.

Где громче — там горб.

Где тише — там провал.

Упражнение 3. Ходьба.

Включи басовый трек.

Ходи по комнате.

Бас меняется каждые 50 см.

Упражнение 4. Моно-проверка.

Включи моно.

Сядь в позицию.

Сдвинься на 30 см влево.

Звук изменился? Это комната.

История: Брайан Ино и комната как инструмент

1977 год. Берлин.

Брайан Ино записывает альбом «Before and After Science».

Он ставит микрофоны в коридоре студии Hansa.

Не в зале. Не в изоляции. В коридоре.

Звук отражается от бетонных стен, от мраморного пола, от стеклянной двери.

Гребёнка. Гул. Хаос.

Ино слушает и говорит:

— Это красиво.

Он не боролся с комнатой.

Он использовал её.

1981 год. Нью-Йорк.

Ино продюсирует Talking Heads, «Remain in Light».

Он записывает барабаны в холле.

В фойе.

В лифте.

— У каждой комнаты есть голос, — говорит он.

— Моя работа — не заглушить его.

— Моя работа — записать дуэт.

Философия: бороться или дружить

Два подхода:

1. Академический.

Комната должна быть мёртвой.

RT60 = 0,2 сек.

АЧХ = прямая линия.

Никаких отражений.

Никакого характера.

2. Творческий.

Комната — это инструмент.

Гул — это тепло.

Реверберация — это глубина.

Отражения — это объём.

Кто прав?

Оба.

Академия:

Контроль. Предсказуемость. Чистота.

Творчество:

Характер. Случайность. Жизнь.

Твой выбор.

Чек-лист: 10 шагов к честной комнате

1. Измерь комнату. Узнай её частоты.

2. Поставь басовые ловушки в углы.

3. Поставь панели в точки первых отражений.

4. Поставь ковёр на пол.

5. Повесь шторы на окна.

6. Настрой позицию прослушивания.

7. Настрой треугольник мониторов.

8. Калибруй громкость (85 дБ).

9. Измерь снова. Посмотри разницу.

10. Добавь Sonarworks для финальной коррекции.

Бюджет: $500–1000.

Время: 2 дня.

Результат: ты наконец слышишь правду.

10 главных тезисов о комнате

1. Стоячие волны — результат отражений от параллельных стен.

2. Частота моды = скорость звука / (2 × расстояние).

3. Маленькие комнаты проблемнее больших.

4. Углы — эпицентр басовых мод.

5. Басовые ловушки в углах — самый важный апгрейд.

6. Точки первых отражений убивают гребёнку.

7. RT60 должен быть 0,2–0,3 сек для маленькой студии.

8. Sonarworks — очки, не хирургия.

9. Наушники не заменяют комнату.

10. Дружи с комнатой или борись. Но знай, что выбрал.

ЧАСТЬ I
ФИЗИКА И ФИЛОСОФИЯ ЗВУКА
ГЛАВА 9

КАК СЛЫШАТЬ ТО, ЧТО НЕ СЛЫШАТ ДРУГИЕ

Тренировка слуха, критическое слушание и превращение любителя в профессионала

Открывающая история: Урок Брюса Свидина

1976 год. Лос-Анджелес. Студия A&M.

Двадцатидвухлетний ассистент приносит кофе Брюсу Свидину — человеку, который записывал «Pet Sounds», «Good Vibrations» и еще 150 золотых альбомов.

Брюс сидит за пультом и слушает один и тот же такт уже 20 минут.

— Что ты слышишь? — спрашивает Брюс, не оборачиваясь.

Ассистент мнется. Ему кажется, что он слышит барабаны, бас, гитару, вокал. Всё звучит… нормально.

— Я не знаю, — говорит он. — Всё хорошо.

— Неправильно, — отрезает Брюс. — «Хорошо» — это не диагноз. Диагноз — это «малому барабану не хватает 3 килогерц, бас на полдецибела пережимает бочку, а вокал на 0,3 децибела громче, чем нужно».

Ассистент смотрит на пульт. Там нет цифр. Только круглые ручки.

— Как вы это слышите? — шепчет он.

Брюс поворачивается.

— Я не слышу. Я знаю. Потому что я слушал этот барабан 10 тысяч часов. Я слушал этот бас 10 тысяч часов. Я слушал этот вокал 10 тысяч часов.

— И что мне делать?

Брюс улыбается.

— Начать первые 10 тысяч часов. Прямо сейчас.

Эта глава — о первых 10 тысячах часов.

О том, как тренировать уши.

О том, как слышать частоты, компрессию, реверберацию.

О том, как превратить «нравится/не нравится» в «+3 дБ на 200 Гц».

Миф о таланте

Абсолютный слух — это дар.

У 1 из 10 000 человек есть врожденная способность назвать ноту без референса.

У тебя, скорее всего, нет.

Поздравляю.

Тебе не нужно тратить жизнь на попытки угадать, что за нота играет.

Относительный слух — это навык.

У 9 999 из 10 000 человек есть способность научиться слышать разницу между 100 Гц и 200 Гц.

Это не генетика.

Это память.

Как работает обучение слуха:

1. Ты слышишь звук А.

2. Ты слышишь звук Б.

3. Мозг запоминает разницу.

4. При повторе мозг узнает эту разницу.

5. Через 100 повторений мозг узнает мгновенно.

Это не магия.

Это нейропластичность.

Три уровня слушания

Уровень 1. Эмоциональный.

Ты слышишь музыку.

Тебе нравится/не нравится.

Ты не знаешь почему.

99% людей живут здесь.

Уровень 2. Аналитический.

Ты слышишь инструменты.

Ты слышишь громкость, панораму.

Ты можешь сказать: «гитара слева, бас по центру».

10% инженеров живут здесь.

Уровень 3. Диагностический.

Ты слышишь частоты.

Ты слышишь компрессию.

Ты слышишь реверберацию в миллисекундах.

Ты слышишь фазовые сдвиги.

1% профи живут здесь.

Твоя цель: Уровень 3.

Анатомия слуховой памяти

Мозг не запоминает звук как файл.

Мозг запоминает отношения:

· Эта частота выше/ниже предыдущей.

· Этот звук громче/тише предыдущего.

· Этот инструмент ближе/дальше предыдущего.

Слуховая память — это сеть сравнений.

Чем больше у тебя референсных точек, тем точнее сравнение.

Пример:

Ты слышишь 100 Гц.

Мозг говорит: «Это ниже, чем 200 Гц, выше, чем 50 Гц, похоже на 100 Гц из вчерашнего трека».

Тренировка слуха — это создание референсных точек.

Упражнение 1. Frequency ID — 15 минут в день

Цель: Научиться слышать частоты.

Инструменты:

· Quiztones (iOS/Android, $10)

· SoundGym (веб, подписка)

· EarMaster (веб/десктоп)

· Твой эквалайзер + розовый шум

Метод:

1. Слушаешь розовый шум.

2. Плагин добавляет пик на случайной частоте.

3. Ты должен угадать: 100 Гц, 200 Гц, 500 Гц, 1 кГц, 2 кГц, 5 кГц, 10 кГц.

4. Проверяешь ответ.

5. Повторяешь.

Прогресс:

· Неделя 1: 50% правильно.

· Неделя 4: 70% правильно.

· Неделя 12: 90% правильно.

· Месяц 6: ты слышишь разницу между 2 кГц и 2.5 кГц.

Частотные якоря: запомни эти звуки

50 Гц — гул трансформатора, бас-бочка в рэпе.

100 Гц — тепло, мужской вокал.

200 Гц — коробка, грязь, картон.

400 Гц — глубина/гнусавость.

800 Гц — резкость, телефон.

1 кГц — присутствие.

2 кГц — атака, хруст.

4 кГц — сибилянты, шипение.

8 кГц — воздух.

16 кГц — искры, комар.

Как запомнить:

· 50 Гц: включи бас-бочку, вырежи всё выше 60 Гц.

· 100 Гц: включи бас-гитару, вырежи всё выше 120 Гц.

· 200 Гц: включи малый барабан, добавь +12 дБ на 200 Гц — звучит как картонка.

· 400 Гц: включи вокал, добавь +12 дБ на 400 Гц — звучит гнусаво.

18+

Книга предназначена
для читателей старше 18 лет

Бесплатный фрагмент закончился.

Купите книгу, чтобы продолжить чтение.