Все Тут Online

Все Тут Online (https://vsetutonline.com/forum/index.php)
-   В гостях у Юрия (shurik_pronkin) (https://vsetutonline.com/forum/forumdisplay.php?f=944)
-   -   Как mp3 сжимает аудиоданные? (https://vsetutonline.com/forum/showthread.php?t=267208)

shurik_pronkin 09.10.2024 19:16

Как mp3 сжимает аудиоданные?
 
Высокая степень сжатия mp3 обусловлена тем, что в mp3-файле в первую очередь хранятся не данные об изменении амплитуды (громкости) определенной частоты звукового сигнала во времени - собственно синусоиды, на которые нужно много места и большой битрейт, а лишь данные об их спектре, на которые места\битрейта нужно многократно меньше:

https://i124.fastpic.org/big/2024/10...10be659bff.png

В верхней части рисунка изменение амплитуды гармонического сигнала частотой 100 Гц во времени, а в нижней - спектр этого сигнала, который имеет только частотную и амплитудную характеристики и не имеет временнОй. И теперь битрейт нужно потратить на кодирование всего лишь этих столбиков высотой в заданную амплитуду на заданной частоте, а не на всю синусоиду. Кстати, перенос ИНФОРМАЦИИ о сигнале из временной области в частотную и есть преобразование Фурье:

https://i124.fastpic.org/big/2024/10...9babc825c3.jpg

Но mp3-файл ведь нужно воспроизводить, а это будет происходить не в моменте, а во времени, поэтому привязка к временнОй шкале в любом случае должна быть. Для этой цели до преобразования Фурье исходный звуковой поток нарезается как бы на "кадры" (фреймы) аналогичные кадрам в видео файлах и вот они уже и трансформируются в спектр, причем, "спектральное содержание" соседних фреймов получается в большинстве случаев схожее, что увеличивает степень компрессии. Перед фреймированием звуковой поток также подготавливается определенным образом: фильтром обрезаются все частоты выше 16 кГц; удаляются маскируемые звуки по частоте (частотная маскировка), например, на фоне громкого звука какой-либо частоты никто не услышит тикающих часов, поэтому более тихие звуки близкие по частоте сразу перед и сразу после громкого звука удаляются; удаляются маскируемые звуки и по времени (временнАя маскировка) - если в одном фрейме сигнал громкий, то в соседнем фрейме на этой частоте весь звук можно просто убрать - все равно после громкого звука в раннем фрейме мы как бы "оглохнем" на 50 микросекунд;

Это исходный wav - весь спектр ровный, однородный, в нем нет фрагментации, дырок в спектре, выпавших участков

https://i124.fastpic.org/big/2024/10...257b5ff7dd.jpg


A это исходный wav сжатый в mp3 - в нем появились выпавшие участки - результат фреймирования, временнОй и частотной маскировки и т.п.


https://i124.fastpic.org/big/2024/10...2bb11db24f.jpg

левый стереоканал записывается как сумма каналов, деленная пополам (среднее арифметическое), а правый как разность каналов; и еще некоторые ухищрения позволяющие сэкономить на битрейте.

При воспроизведении mp3-алгоритм производит обратную трансформацию из частотного спектрального содержимого отдельного "кадра" во временУю амплитудно-частотную, т.е. из спектральных "палок" синтезируются новые синусоиды разной частоты, масштабируются по амплитуде, и складываются\накладываются - в итоге получается новая похожая на исходную волна соответствующая ей по спектру. Все фреймы-"кадры" либо встык, либо с перехлестом, последовательно "проигрываются" по пометкам в файле и получается непрерывная звуковая волна.

Дмитрий 09.10.2024 19:48

В интернете не утихают споры, кто кого и как наеbал! Особенно яркие там, где никакой аудиочеккер не покажет истинного положения вещей. Это раздел записи с магнитной ленты. Редкие записи, которые спецом изначально mp3, чтобы в дальнейшем продавать WAV-оригинал! Они нигде в принципе не издавались, советский магнитиздат и музыка советского подполья записывается с цифры из эм-пэ-три файла на магнитную ленту и заново оцифровывается. Вновь представляется в интернете как lossless, WAV, FLAC, но естественно не первая копия.

Споры протекают агрессивно и там чуть ли не до драки). Там где деньги, распил бабла, там и войны и споры!
В современной реальности это то, что сейчас происходит в мире. Фэйки-враньё в СМИ, запутанные действия многоходовочек, вирусы... всеобщее отупление... ...

Проверка на наличие нулевого фрема (фрейма содержащего тишину) это и есть один из основных способов проверки на апконверт.

Самый быстрый и эффективный. Далее, если тот кто хочет наебать "продвинутый" хмырь и обрезал сэмпл в редакторе, идет вычитание сигнала одного канала из сигнала другого канала...

Дмитрий 09.10.2024 19:51

Способ № 1. Предпосылкой к рождению этого способа является одна специфическая особенность кодирования аудио в .MP3.

Кодирование данных в .MP3 происходит не целиком, а частями - аудио данные разбиваются на, так называемые «фреймы», длительностью 50 мс, и каждый фрейм анализируется и сжимается кодером отдельно. Тонкости этого процесса здесь описывать не будем.

Главным является то, что самый первый фрейм в созданном в результате кодирования файле .MP3 оказывается пустым (или, точнее, почти пустым). А, значит, при обратном декодировании .MP3 в .WAV-файл, полученный аудио поток будет содержать «полную тишину» (сигнал с нулевой амплитудой) протяженностью около 25-40 мс (в зависимости от кодера, использованного для компрессии).

Таким образом, аудио трек на неоригинальном аудио CD (в случае, если его передний край не подрезали специально перед созданием CD) характеризуется наличием короткого участка «полной тишины». Чтобы проверить, не имеем ли мы дело как раз с таким треком, нужно загрузить .WAV-файл в редактор, подобрать масштаб по амплитудной и временнОй шкале, и в случае «успеха» мы увидим картину, похожую на представленную ниже на скрине.

https://i.imgur.com/BK3TKP3.png

shurik_pronkin 10.10.2024 12:50

Цитата:

Сообщение от Дмитрий (Сообщение 772103)
...

Самый быстрый и эффективный. Далее, если тот кто хочет наебать "продвинутый" хмырь и обрезал сэмпл в редакторе, идет вычитание сигнала одного канала из сигнала другого канала...

Так характерные только для mp3 "шумы" хорошо видны на спектрограмме :) поэтому и без наличия первого нулевого кадра mp3 можно идентифицировать

Дмитрий 10.10.2024 12:57

shurik_pronkin, не-а... не видны!
тек более если там и шумы пленки и другие аналоговые артефакты

Дмитрий 10.10.2024 13:03

shurik_pronkin, во-первых надо стрелочкой всем показать где видны, а во-вторых взять и определить на нескольких примерах по мгновенному спектру.

Это как в теме, где про "чистый синус"

Дмитрий 10.10.2024 13:11

shurik_pronkin, это прикладным -- имеющим чисто практическое значение должно быть! Должно быть исключительно прикладным — то есть иметь исключительно практическое значение!

Вот тогда будет не 142, а 142 тысячи просмотров и все проверят всё в чем сомневаются!

Это огромная тема! Там может и ATRAC мини диск с потерями быть, так распространяли например на Горбушке!
И те только. Масса вариантов!

Дмитрий 10.10.2024 13:27

Тот кто денежку получает, торгует этим, это чуть ли профессионально делает! А мы будем бесплатно проверять. Да? :)
shurik_pronkin бросит опытный взгляд на спектрограмму и выдаст без подробного спектрального анализа?

Джонка 10.10.2024 13:31

В общем я тщательно ищу есть ли в сети фонограмма в лозлесс. Если нет, то приходится эмпетришки. Пример - очень нравится альбом "Кровь и луна" группы ХОЛОДНЫЙ ДОЖДЬ. Везде в сети только 160 мр3. А песни душевные. Слушаю.

Дмитрий 10.10.2024 13:49

Джонка,
Если очень нравится, надо искать и купить, и если магнитная лента, то не одну копию, а несколько копий!

Если нашел в сети - необходимо проверить!


Часовой пояс GMT +3, время: 07:46.

Powered by vBulletin® Version 3.8.2
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd. Перевод: zCarot