Показать сообщение отдельно
Старый 14.09.2025, 20:58   #11
Дмитрий
Администратор
 
Аватар для Дмитрий
 
Турниров выиграно: 1

Регистрация: 12.12.2008
Адрес: Москва прошлого тысячелетия.
Сообщений: 209,533
Сказал(а) спасибо: 45,506
Поблагодарили 272,166 раз(а) в 102,732 сообщениях
Дмитрий репутация неоспоримаДмитрий репутация неоспоримаДмитрий репутация неоспоримаДмитрий репутация неоспоримаДмитрий репутация неоспоримаДмитрий репутация неоспоримаДмитрий репутация неоспоримаДмитрий репутация неоспоримаДмитрий репутация неоспоримаДмитрий репутация неоспоримаДмитрий репутация неоспорима
По умолчанию

Обучается же модель ИИ через Python, librosa, иначе как ей объяснить...

...обучение модели ИИ для создания CUE-файлов, особенно для автоматического определения таймингов треков и пауз в оцифровках винила (например, для альбома Jean-Michel Jarre - Zoolook (1984) с файлами 1 СТОРОНА.wav и 2 СТОРОНА.wav), логично реализовать через Python с использованием библиотеки librosa для анализа аудио. ИИ для точной разметки пауз и треков, чтобы решить проблему несовпадения таймингов и трудоёмкости ручного процесса.

Данные: Набор оцифровок винила (WAV) с известными таймингами (например, из Discogs или ручной разметки).
Библиотека: librosa для анализа аудио (поиск пауз по уровню громкости).
Метаданные: Парсинг из Discogs API для названий треков, исполнителей, жанра.

Модель: Простая модель на основе правил (анализ тишины) или нейросеть (например, CNN для классификации пауз), если у нас есть обучающий набор данных.

Почему librosa:
librosa.effects.split определяет паузы (тишина ниже порога, например, 30 дБ), что заменяет ручную разметку.

Обучение модели:
Сбор данных: Соберите датасет из WAV-файлов винилов и соответствующих CUE-файлов с точными таймингами (например, из Discogs или ручной разметки в редакторе).

Предобработка:
Загрузите WAV с librosa.load.
Используйте librosa.effects.split для поиска пауз.
Сопоставьте паузы с треками из CUE.

Простая модель (правила):
Если паузы чёткие (тишина 1–2 сек), librosa даёт тайминги напрямую.
Исключите паузы для первых треков сторон (как в вашем случае).

Нейросеть (если нужен сложный анализ):
Используйте CNN (например, с tensorflow или pytorch) для классификации аудиофрагментов на "пауза" и "трек".
Обучите на датасете с метками (паузы/треки).
Пример датасета: WAV-файлы с разметкой пауз (0–2 сек тишины, помеченные как "пауза").

Используется Discogs API для автозаполнения (названия, композиторы).
__________________
О нас думают плохо лишь те, кто хуже нас. А те, кто лучше нас, им просто не до нас.
--Омар Хайям

Обновления по запросу — на Я.Ди. «Мэйл-облако» для тех, кто помогает нашему интернет-проекту, и для тех, кто хотел бы это делать, но пока не знает, как.

Помогая форуму ВТО, вы прежде всего помогаете себе! А не делаете что-то абстрактное для «других», совершенно незнакомых и безразличных вам людей.
Дмитрий вне форума   Ответить с цитированием