BEATNER FMРейтинг: 11194

ОСНОВЫ ЦИФРОВОГО ЗВУКА.

18-11-2022 | 21:58

Просмотров:128Сегодня:1

В основе цифрового аудио лежит математическое представление звуковой волны. Цифровой мир развивается очень быстро, и нет ничего удивительного в том, что многим цифровые технологии кажутся сложными. Цель этой статьи – объяснить, что такое цифровой звук, не вдаваясь в сложные математические подробности. Чтобы разобраться, что такое цифровой звук, нужно в первую очередь понять, что внутри компьютера нет никаких звуков, а есть только одна математика.

Звук – это вибрация молекул. Математически звук может быть точно описан как «волна». У него есть максимальное пиковое значение (горб волны) и минимальное значение (прогиб). Если вы когда-нибудь видели графическое изображение звуковой волны, то заметили, что звук всегда изображается кривой, постоянно пересекающей ось X. Это означает, что природа звука «периодична». Любой звук имеет гребень волны и прогиб, положительный период и отрицательный. Это называется циклом. Так вот, основное понятие – все звуки имеют хотя бы один цикл. Следующая важная идея заключается в том, что любая периодическая функция может быть математически представлена серией синусоид. Другими словами, даже самый сложный звук – это всего лишь набор синусоидальных волн. Голос может постоянно изменять свою громкость и высоту тона, но в любой момент звучания голос является только набором синусоидальных волн. И, наконец, третье: волны частотой выше 22 кГц нас не интересуют, потому что физически мы не можем их услышать. Предположим, я говорю в микрофон. Микрофон преобразует мой голос в непрерывный электрический ток. Этот электрический ток бежит по проводу через какой-нибудь усилитель и, в конце концов, попадает в аналогово-цифровой преобразователь. Помните, что компьютер не хранит звуки, а хранит математические значения, так что нам нужно что-то, что преобразует аналоговый ток в последовательность единиц и нулей. Говоря простым языком, конвертер делает быстрые снимки звуковой волны, называемые семплами, и каждому семплу присваивает значение амплитуды. И здесь мы подходим к двум основным понятиям, которые помогут объяснить природу цифрового звука. Эти понятия – время и амплитуда.

Битность звука.

В цифровом мире нет ничего непрерывного – все имеет определенное математическое значение. В аналоговом мире звуковая волна достигнет своего пикового значения, и все значения от 0 дБ до пика будут существовать. А в цифровом сигнале существует ограниченное число возможных значений амплитуды. Представьте аналоговый звук как кого-то, плавно поднимающегося на эскалаторе, в то время как цифровой звук – кто-то, кто поднимается по лестнице, и в течение времени он находится либо на одной ступеньке, либо на другой. Или, скажем, есть значения 50 и 51. Так вот, в аналоговом звуке может быть какое-нибудь промежуточное значение 50,46, а в цифровом звуке это значение будет округлено до 50. Это означает, что фактически звуковая волна искажается. А так как аналоговый сигнал непрерывен, то это округление значений происходит постоянно в процессе конвертации. Это называется ошибкой квантования, и звучит это как странный шум. Но давайте представим лестницу с большим количеством ступенек, высота которых меньше. Теперь у нас есть значения 50, а за ним 50,2, а за ним 50,4, а за ним 50,6 и т.д. Аналоговый сигнал со значением амплитуды 50,46 теперь округлится не до 50, а до 50,4. Это важное усовершенствование, которое не избавляет полностью от ошибок квантования, но в значительной степени снижает их влияние. Увеличение битности по своей сути является увеличением числа ступенек на лестнице с уменьшением их высоты. При уменьшении ошибки квантования снижается уровень шумов. Вы спросите, а зачем мне нужно это знать? Дело в том, что в современной музыке используется очень много компрессии. Стало вполне обычным достигать максимальной плотности звука, сжимая и зачастую пережимая записанный инструмент или голос, а потом еще снова обрабатывать компрессором уже весь микс. Помните, что одним из главных недостатков компрессии является повышение уровня шумов! После компрессии совершенно незаметные погрешности квантования внезапно становятся слышимыми. Особенно заметным это становится в наиболее тихих частях песен, например, где остается звучать только один инструмент, или когда в конце песни все инструменты начинают плавно затухать. Более высокая битность при записи позволит вам добиться значительно меньшего уровня шума.

Ширина диапазона частот и частота дискретизации.

Частота дискретизации, возможно, наиболее спорный вопрос в мире цифровой аудиозаписи. Частота дискретизации определяет, как быстро компьютер делает те самые снимки звука, о которых мы говорили в начале. Большинство людей полагает, что чем чаще делать эти снимки (вообще этот процесс больше похож на пульсацию, чем на фотосъемку), тем полученные результаты больше будут похожи на непрерывный звук. А значит на аналоговый звук. Но это не совсем так. Помните, цифровой мир состоит из математики, а не из звуков. Звук в своей основе – набор синусоидальных составляющих. И для определения синусоиды необходимо всего три контрольных значения. Так вот, для того, чтобы правильно описать синусоидальные составляющие, частота дискретизации (семплирования) должна быть хотя бы в 2 раза выше частоты звука. И если мы не слышим звуки выше 22 кГц, или синусоидальные волны, чей цикл повторяется более 22 000 раз в секунду, то все что нам нужно – это делать 44 000 снимков в секунду. Вот откуда появилась всем известная частота дискретизации: 44,1 кГц. Помните, цифровой звук – это не столько звук, сколько математика. Как только поступают данные с аналогово-цифрового преобразователя, компьютер преобразует биты в гладкую непрерывную кривую звуковой волны. И не важно, сколько у вас контрольных точек, 3 или 300, построенный по ним компьютером звук будет звучать одинаково. А что же на счет частот дискретизации 88,2, 96 и 192 кГц? Во-первых, еще не на 100% доказано, что человек слышит звуки только до 22 кГц. Во-вторых, в аналогово-цифровом преобразователе используется ограничение по частоте. При частоте семплирования 44,1 кГц обрезаются частоты выше 22 кГц. Это может вызывать искажения на частотах ниже 22 кГц, называемые «алиасингом» (наложение частот). Кроме того, определенные программные плагины, в частности эквалайзеры, страдают искажением фазы на высоких частотах. Искажение происходят на границе диапазона частот, который подвергается эквализации. Если ваш диапазон частот ограничен 22 кГц и вы хотите поднять уровень ВЧ с помощью эквалайзера, то поднятые высокие частоты оборвутся на 22 кГц резко, а не плавно. Так или иначе подобные эффекты искажают звук. Теоретически запись при 16 битном кодировании на частоте дискретизации 44,1 кГц будет звучать так же, как и при 24 битном кодировании на 192 кГц. Но на практике во втором случае хвосты записи будут чище, более прозрачно будет звучать реверберация, верхний диапазон частот будет более гладким, и значительно меньше будет проявляться эффект алиасинга.