Как в цифровом аудио битность (разрядность) связана с искажениями и разрешением (динамическим диапазоном)?
Любые данные, включая и аудио, в цифровом устройстве передаются, обрабатываются и хранятся в виде двоичного кода: единиц и нулей, наличия или отсутствия напряжения на входе цифровых схем. Если посмотреть на прямоугольный сигнал, который выдает тактовый опорный генератор, то это уже есть непрерывный поток единиц и нулей - битов, к которым привязываются все остальные сигналы, включая и сами данные.
Чтобы цифровое устройство могло выполнять свои базовые функции - передавать, обрабатывать и хранить данные, поток битов нужно разбить на ячейки, "смысловые" кусочки, цифровые "слова", чтобы они могли уже представлять данные. Длина цифрового "слова" может быть 8, 16, 24, 32, 64 и т.д. бит. Цифровое "слово" состоящее из 8 бит называется байтом и процессор, например, в компьютере "понимает" его как единое смысловое целое; прямо как в языке - мы же не буквально воспринимаем идиомы типа "когда рак на горе свистнет" или "бабушка надвое сказала", а извлекаем смысл "никогда" и "неизвестно".
Таким образом, битность или разрядность аудио данных может быть 8, 10, 12, 14, 16, 18, 20, 24, 32 и т.д. бит. Чем больше битность, тем длиннее цифровые "слова", тем бОльшая "ёмкость", "вместимость" у каждого "слова". И если нужно без искажений и в полном объеме оцифровать очень громкий аудио сигнал или очень яркий, насыщенный видео сигнал, то цифровые "слова" должны быть длинными. Бытовая аналогия. Жидкость объемом 3 литра вся не поместится в однолитровой банке, потому что однолитровая банка способна вместить в себя только 1 литр, значит, два литра из трех перельются через край и пропадут. Но если взять банку объемом 3 литра и налить в нее наши три литра жидкости, то все три литра сохранятся, но в банке не останется свободного места на тот случай, если исходной жидкости окажется чуть больше. Но если взять банку объемом 5 литров и налить в нее три литра жидкости, то и все три литра сохранятся, и в банке еще останется свободное резервное место. Эта аналогия с банками призвана помочь понять связь между динамическим диапазоном и битностью, между разрешением и разрядностью - чем выше битность (объем банки) , тем больший динамический диапазон (объем сохраненной жидкости) можно оцифровать (сохранить).
Как вы уже поняли, разрядность (битность) в первую очередь влияет на амплитудную характеристику сигнала и не оказывает влияния на частотную характеристику, которая ограничивается только частотой дискретизации. https://www.vsetutonline.com/forum/s...d.php?t=267174
Вот так выглядит синусоидальный сигнал 1 кГц разрядностью 32 bit с уровнем громкости превышающей 0 дБ на 3 дБ:
Как видите, разрядности 32 bit более чем достаточно, чтобы вместить ненормально громкий сигнал без каких-либо искажений. Обратите внимание, какая чистая спектрограмма.
А вот так выглядит тот же синусоидальный сигнал 1 кГц с уровнем громкости превышающей 0 дБ на 3 дБ, но сохраненный в файл с разрядностью 16 bit :
Все пики, которые были выше 0 дБ, срезаны и синусоида превратилась почти в меандр (прямоугольный сигнал). На спектрограмме видно, что гармоник (искажений) более чем. Поэтому при мастеринге в 16 битных программах нужно следить, чтобы уровень громкости фонограмм был ниже 0 дБ.
А вот еще такие искажения сигнала появятся, если снижать разрядность:
сигнал 10 кГц с разрядностью 32 bit - спектрограмма чистая
сигнал 10 кГц с разрядностью 16 bit - в спектрограмме вырос лес гармоник
сигнал 10 кГц с разрядностью 8 bit - лес гармоник стал непроходимым
Поэтому в контексте поста "Улучшится ли звук, если сжатый формат типа mp3 разжать в PCM и увеличить битность?" https://www.vsetutonline.com/forum/s...d.php?t=267156 и в баночной аналогии - это то же самое, что перелить один литр воды из однолитровой банки в пятилитровую.
А вот так обстоят дела с очень тихими звуками:
44.1 сигнал 1 кГц разрядностью 24 bit громкостью -60 дБ - лес гармоник, шумовая полка (noise floor) не выше - 100 дБ
динамический диапазон расположен между 0 дБ и вершинами "леса" гармоник\шума и составил 100-105 дБ.
44.1 сигнал 1 кГц разрядностью 16 bit громкостью -60 дБ - лесище гармоник до - 60 дБ
а теперь динамический диапазон сузился до 55-60 дБ
Последний раз редактировалось shurik_pronkin; 05.10.2024 в 22:12.