Показать сообщение отдельно
Старый 11.05.2024, 17:53   #6
Дмитрий
Администратор
 
Аватар для Дмитрий
 
Турниров выиграно: 1

Регистрация: 12.12.2008
Адрес: Москва прошлого тысячелетия.
Сообщений: 253,004
Сказал(а) спасибо: 45,242
Поблагодарили 270,872 раз(а) в 102,015 сообщениях
Дмитрий репутация неоспоримаДмитрий репутация неоспоримаДмитрий репутация неоспоримаДмитрий репутация неоспоримаДмитрий репутация неоспоримаДмитрий репутация неоспоримаДмитрий репутация неоспоримаДмитрий репутация неоспоримаДмитрий репутация неоспоримаДмитрий репутация неоспоримаДмитрий репутация неоспорима
По умолчанию

. Теперь <Цифровой процесс>

(1) Формат записи: возможность Хайрез записи и народное творчество записи в формате 96 кГц/24 бит или выше. По этому пункту у меня нет никаких претензий. Даже наоборот, я горячо его поддерживаю. Дело в том, что при записи такие параметры квантования позволяют делать на бытовой записывающей аппаратуре фонограммы, годные для профессиональной обработки и, соответственно, получения в результате качественной музыки и другой аудиопродукции. Иными словами, это стимулирует народное творчество. Чем больше, тем лучше?

Следующие пункты хороши и логичны при условии, что ваш аудиокомплекс имеет возможность записи и обработки фонограмм. Для аппаратуры воспроизведения такие параметры квантования избыточны. Однако рынок фонограмм высокого разрешения уже достаточно большой, да и фильмы с киношными параметрами записи доступны для наслаждения, поэтому нижеследующие пункты с требованием цифровых процессов 96/24 можно считать вполне уместными. Следующие пункты конкретизируют другие части цифрового тракта воспроизведения и передачи аудиоинформации и опять-таки сводятся к тем же значениям квантования — 96/24 или больше. Прочтите их сами, а я акцентирую ваше внимание на третьем подпункте. Воспроизводящая аппаратура должна уметь работать с файлами как минимум с форматами FLAC и WAV, а записывающая — с FLAC или WAV. Следующий параграф касается организации контроля качества при производстве изделия, заявляемого на логотип Hi-Res. На мой взгляд, эти требования, мягко говоря, странны, так как вносят в процесс контроля качества субъективные критерии оценки: нравится, не нравится.

(3) Менеджер по контролю качества аудио/звука должен нести ответственность за окончательное решение, поскольку продукт Hi-Res Audio должен быть сертифицирован в соответствии со стандартами оценки звука каждой компании. Этот подпункт шедевральный.

За слухачом-аудиофилом последнее слово. Великолепно. Далее следуют требования не очень важные. Беспроводной Hi-Res Wireless и потеря звука нам не важны. Они касаются логотипа для беспроводных устройств. Вы можете прочесть их самостоятельно. Можно обратить внимание на то, что для беспроводных технологий можно использовать протоколы с потерей данных, и 40 кГц уже не оговорены. Перечислены блютус-протоколы, которые уже сертифицированы на логотип Hi-Res Audio Wireless, и производители техники, желающие использовать эти протоколы, должны получить разрешение у JAS на их использование. Резюме формальной стороны хайреза. Итак, с формальной стороной вопросы мы разобрались. Резюмирую, цифровая аудиоаппаратура должна быть с параметрами квантования 96 кГц/24 бит или больше, а аналоговая – должна воспроизводить ультразвук до 40 кГц. Причем значение затухания на этой частоте не нормируется.

Теперь практическая часть. Про странности. Практическая сторона Hi-Res. С громкостью в кинофильмах я уже упомянул. То есть фонограммы для кино имеют довольно большой динамический диапазон, который вроде бы и требует увеличения глубины квантования, но в принципе и без нее существенного ухудшения качества тихих звуков не ощущается. Однако раз в 24 бита и клиппинг. В природе существуют глубины квантования 24 бита и больше, значит, они для чего-то нужны. И вот для чего. Они нужны для записи фонограмм с большим динамическим диапазоном. Основной акцент на слове «запись». Основной глюк, что может случиться при записи музыки или звука в кино, это клиппинг. То есть когда сигнал превышает максимальное значение, которое конкретное устройство может записать без искажений.

При клиппинге сигнал ломается без возможности его восстановления. Это как если бы вы начали размахивать вазой в комнате с низким потолком. Очень скоро ваза разобьется вдребезги. На худой конец ее можно склеить. Так же и поврежденный участок фонограммы тоже можно дорисовать всякими искусственными интеллектами, но, сами понимаете, это уже будут другая ваза и другой сигнал. Вот так выглядит клиппинг на осциллограмме. Это нормальный уровень записи. А это уже испорченная запись получается. Вот он обрезан. Кстати, в доцифровую эпоху звук писали на магнитофоны. Для магнитной записи тоже существует потолок, правда, чуть мягче, и он частотозависимый. А дно или ил — это шумы магнитной ленты. Нам необходимо одновременно записать и мелких крабиков, так чтобы они не затерялись в иле, а артиста, размахивающего вазой, чтобы она не разбилась.


Динамический диапазон сигнала, который можно записать на магнитофон без системы шумопонижения, не превышает 65 дБ. Это совсем немного. В цифровом формате это соответствовало бы примерно 11 битам. Даже не 16. И тем не менее тогда и музыку записывали, и звуковое кино процветало. Положение спасали аналоговые компрессоры и лимитеры — устройства, сжимающие динамический диапазон. Они автоматически на тихих звуках делают усиление больше — вытаскивают крабиков из ила, а на громких его уменьшают — подвязывают руки, чтобы артист ими сильно не размахивал.

В цифровую эпоху тоже используют аналоговые компрессоры и лимитеры, но их применяют для специфических задач. Итак, для того чтобы в процессе записи и вазы не побить, и крабиков наловить, необходимо либо сделать выше потолок, либо опустить дно, либо меньше размахивать руками. В цифровой записи можно только опустить дно. Была глубина 16 бит, станет 24 бита. Теперь мы имеем возможность записать и очень громкие сигналы, и микроскопически тихие. С одной стороны динамического диапазона 96 дБ при 16 битах вполне хватает почти всегда, но если мы начнем вытягивать цифровым компрессором слабые звуки, на которые приходилось всего несколько отсчетов, то при увеличении их громкости появятся и артефакты аппроксимации, то есть повышенные нелинейные искажения, и шумы со дна.

В этом случае спасает глубина 24 бита. Ее хватает для записи любой музыки и звуков. Нужно только выставить уровень записи таким, чтобы самый громкий звук фонограммы не превышал 0 dВ/Fs. На практике выбирают -6 dВ/Fs, про запас. Теперь при уменьшении динамического диапазона под любые каналы связи и носители информации артефакты обработки будут сведены к минимуму. Однако при записи фонограмм бывают случаи, когда при всех правильных регулировках тракта записи вдруг артист так глубоко распереживется, что орет во все горло и ваза цепляет потолок. Отлично, но второй раз он уже так не сыграет, а фонограмма уже испорчена. Тоска-печаль. Да, хорошо бы еще больше расширить динамический диапазон, чтобы клиппинга вообще никогда не было. ОК, сказали разработчики, и для этого случая предложили еще углубиться. Теоретически и практически углубиться можно сколь угодно глубоко, хоть до 32 бит — сделать динамический диапазон с космическими 196 дБ. Можно-то можно, но аналоговая часть и микрофоны имеют динамический диапазон в два миллиона раз хуже. Что же делать? И решили схитрить. Разделить динамический диапазон на несколько частей и для каждой из них сделать свой аналоговый канал и свой АЦП. Затем объединить цифровые потоки в один с глубиной 32 бита с плавающей запятой. С такой аппаратурой можно вообще не регулировать уровень записи. Любой звук запишется и громкий без клиппинга, и тихий без шумов.


Эксперимент. 120 дБ динамического диапазона в одном файле. Вот как такой сигнал выглядит в аудиоредакторе. Перед вами интересный файл. Формат 32 бита с плавающей запятой. В нем есть три фрагмента: вот один, тут что-то видно на спектрограмме; второй пустой почти, вы ничего не услышите здесь; и здесь видно что-то. Послушаем каждый из участков. Тут почти ничего не слышно. Здесь пустой участок. Я даже не буду долго слушать. Здесь ничего не слышно. И нормальный участок. Это файл с уровнем записи плюс 40 дБ. И здесь участок: «А сейчас с клиппированием». Теперь смотрите, что мы сделаем. Мы усилим эти участки. Это участок я усилю на 15, 30, 45 дБ. Запомнили — 45 дБ. Тут, оказывается, сигнал есть какой-то. «Это запись с уровнем 0 дБ». Теперь сделаем почти то же самое с пустым участком. Здесь вообще ничего не было слышно. 15, 30, 45, 60, 75, 90, 105 — на 105 дБ я усилил. «Этот фрагмент записывается с уровнем минус 60 дБ. Вы его, скорее всего, сейчас не слышите. И теперь участок с клиппированием. Мы усиление уменьшим на 9 дБ. «А сейчас с клиппированием». Никакого клиппирования. Сигнал чистенький, просто идеальный. То есть смотрите: у нас в одном файле сигналы с разницей почти в 120 дБ. Важный момент: формат 32 бита с плавающей запятой нужен и оправдан лишь для записи. Если 32 бита и воспроизведение звука предварительно не скорректировать динамический диапазон такой записи — уменьшить уровень клиппированных фрагментов и увеличить очень тихие сигналы, которые утонули бы в аналоговом тракте, — мы услышим и искажения, и ограничения, а тихих звуков вообще не услышим.

Воспроизведении 32-битных фонограмм с плавающей запятой происходит в формате с фиксированной запятой, иногда они предварительно конвертируются в 24 или 16 бит. Иными словами, хайрез 32 бита при воспроизведении практического смысла не имеет. Теперь настало время раздвинуть пространство оцифровки винила с большим разрешением и с разрешения соответствующих органов уйти в прошлое. Я обещал рассказать о нереальной части спектра сигналов.

Настало время разобраться и с частью моего вдохновляющего комментария про оцифровку винила с повышенными параметрами квантования. Я даже смотрел одно видео, где его автор демонстрировал наличие в оцифрованной пластинке ультразвукового спектра. Вообще-то в этом нет ничего удивительного. Сейчас мы посмотрим, как на грампластинке, априори не имеющей в спектре фонограммы частот выше 20, а, скорее всего, даже 16 кГц, появляется ультразвук.

Вот я специально сделал цифровую запись с пластинки. Пластинка оригинальная, настоящая, древняя, аналоговой эпохи.
Можно даже сказать, граммофонной эпохи.

♪ Я не знаю, я не знаю, что со мною. ♪ ♪ Что сжигает грудь мою. ♪

В этой фонограмме точно нет ультразвука, надеюсь, сообразили почему. Итак, я записал непосредственно с головки на рекордер с параметрами 196 кГц/32 бит, плавающая запятая. Открываем фонограмму в аудиоредакторе. И что же у нас на спектре? Интересно. При записи на пластинку ультразвука не было, а тут сплошняком до предела. Теоретически должно быть до 98 кГц. Реально до 88. Выше, скорее всего, аналоговая часть моего рекордера завалила. Давайте проанализируем, что же это за ультразвук? Для этого я обрежу слышимую часть спектра – ниже 22 кГц обрезаем. Отлично. Теперь нам надо послушать, что же это за ультразвук? Откуда ультразвук на виниле?

Так как мы с вами не летучие мыши, да и через канал связи ультразвук не пролезает, я перенесу этот спектр в слышимую часть диапазона, так же как слушают дельфинов. На 36 полутонов или на 8 октав вниз. Внимание! Да… Вот. Ларчик просто открывается: комбинация гармоник и интермодуляционных составляющих. Откуда они взялись? А откуда они вообще берутся? Образуются на нелинейных элементах. Во-первых, нелинейные искажения при записи примерно 1,5%. А у старых пластинок вообще мрак. Во-вторых, головка звукоснимателя имеет примерно такие же искажения. Вот вам и результат. И что же мы будем слышать при воспроизведении такой хайрез оцифровки?

Вернемся на шаг перед переносом спектра. Это ультразвук. Теперь мы воспроизведем этот ультразвук через реальный усилитель с реальными акустическими системами. Усилитель с горем пополам будем считать суперлинейным, а вот с акустическими системами так поступать нельзя. Это самый нелинейный элемент в тракте звуковоспроизведения. В лучшем случае в среднечастотном участке диапазона воспроизводимых частот коэффициент гармоник может быть порядка 0,1%, а по краям может достигать и 20%. В редакторе я внесу эту нелинейность.


Хайрез хуже нехайреза? Конечно, не 20%, а меньшее значение. В результате у нас появилось «нечто» в слышимой части спектра. Это результат интермодуляционных искажений. Да, они не очень большие, но они есть. Получается, что в хайрез фонограмме искажений больше, чем в нехайрез! Я могу усилить эти искажения. Вот как они звучат. Кстати, вполне может быть, что такие искажения кому-то нравятся, а кое-кто даже считает их признаком повышенной детализации. Мне точно такое не нравится. Это фонограмма – конечно, экстремальный случай, но я сделал запись пластинки периода пика развития винила. Вот, пожалуйста, та же картина. Теперь, как надо бы поступить с такой оцифровкой.


Рациональный способ записи винилового хайреза. Да, есть смысл сделать оцифровку с повышенными бит- и сэмплрейтом. В этом случае будут меньше заметны артефакты обработки фонограммы. Из этой фонограммы нужно убрать щелчки от пыли и царапин, уменьшить шум. Если есть рокот, то убрать его. Вроде всё. Теперь даже если вы хотите оставить фонограмму в формате хайрез, то всё равно нужно отрезать спектр выше 20 кГц — нафиг нам сдались лишние компоненты от нелинейности.
Готово.

Эта фонограмма в формате 44,1/16 будет звучать точно так же. И перед децимацией и транкейтом фильтрация с частотой среза ниже частоты Найквиста обязательна. В некоторых редакторах и DAW-ах есть галочка «включить антиалиасинговый фильтр». Если вы не делали фильтрации, эту галочку нужно поставить. . Выводы. Краткие выводы. Хайрез и хай дефинишн как лингвистическая сущность вполне поняты, логичны, она есть и имеет право на существование.

Однако экстенсивное и бездумное увеличение значений параметров квантования с целью якобы повышения качества звуковоспроизведения — это тупость.
Оно нарушает принцип целесообразности. Это всё равно, что построить для себя громадный стокомнатный дворец, но жить в нем только в одной комнате. Необходимо иметь ту задачу, для решения которой действительно необходимы повышенные значения параметров квантования. Я вам показал примеры. Логотип Hi-Res – это однозначно весьма талантливая маркетинговая фишка, решающая задачу подстегивания спроса и получения прибыли, естественно, за наш с вами счет. Предсказание апофеоза. А теперь предсказание.

В 2027 году настанет апофеоз дебилизации аудиофилов всего мира – спецификация Hi-Res преобразуется до суперхайреза.
Аудиофилы всех стран будут свято верить, что старый Hi-Res 96/24 – это говно, а новый суперхайрез 192/32 – это минимально необходимый формат для утонченного гиперправильнодетализированного волшебного звука.

Вот, пожалуй, всё. Теперь у вас есть дополнительная информация для принятия решения, нужен ли вам этот хайрез или нет. А я… А я по-прежнему… Ах, да. С вами был Александр Щербин. Познавайте мир.
__________________
О нас думают плохо лишь те, кто хуже нас. А те, кто лучше нас, им просто не до нас.
--Омар Хайям

Обновления по запросу — на Я.Ди. «Мэйл-облако» для тех, кто помогает нашему интернет-проекту, и для тех, кто хотел бы это делать, но пока не знает, как.

Помогая форуму ВТО, вы прежде всего помогаете себе! А не делаете что-то абстрактное для «других», совершенно незнакомых и безразличных вам людей.
Дмитрий вне форума   Ответить с цитированием