BDK писал(а): ↑24 июл 2016, 10:18
если сделать сэмпл в виде спектра он будет иметь ровно тот же объем что и сэмпл в виде волны. Это если без сжатия. Но кроме того сэмпл в виде спектра очень хорошо поддается сжатию поскольку очень редко в реальных звуках нужны все 1000 гармоник. Ну а алгоритмизация спектрального сэмпла позволяет сжать его еще больше. В принципе это чем-то похоже на mp3-сжатие - там тоже работают со спектром. Или ogg-сжатие. В общем мы видим что в принципе такое сжатие может быть без заметной потери качества. Кроме того в данном случае вообще не нужно вести речь о достоверности передачи сэмплов - это всё же синтезатор для электронной музыки где звуки должны быть просто красивыми но не обязательно точно похожими на классические инструменты (или даже скорей обязательно совсем не похожими

) - а значит можно получить сжатие еще больше чем в mp3 и ogg.
Meta разработала аудиокодек EnCodec на ИИ — сжимает в 10 раз сильнее, чем MP3 при том же качестве
Компания Meta представила новый звуковой кодек EnCodec, который использует методы машинного обучения для повышения степени сжатия без потери качества — в результате он способен сжимать аудио в 10 раз сильнее, чем MP3 при том же качестве. Об этом сообщает издание Ars Technica.
Кодек EnCodec может применяться как для потоковой передачи звука в режиме реального времени, например, при телефонных звонках в районах нестабильной связи, так и при кодировании для последующего сохранения в файлах.
Разработчики сообщили, что система сжатия EnCodec состоит из трёх частей. Сначала кодировщик преобразует несжатые данные в специальный формат с более низким битрейтом. Затем полученный формат сжимается до необходимого размера, но сохраняется важная информация, которая будет использована для восстановления исходного сигнала. В конечном итоге декодер в режиме реального времени преобразует сжатые данные обратно в звуковые волны с помощью нейронной сети.
В компании отмечают, что нейросеть грамотно сжимает звук и разница между звуков до и после сжатия не будет восприниматься человеческим слухом. Нейросети для сжатия звука используются давно, однако Meta первой применила технологию к стереозвуку при 48 кГц.
Технология EnCodec по-прежнему находится на стадии разработки и тестирования. Разработчики не говорят о сроках её внедрения в свои сервисы и поддержке другими компаниями.
https://3dnews.ru/1076848/meta-razrabot ... imaet-zvuk