Meta представила аудиокодек, который сжимает 10-кратно по сравнению с MP3
Компания представила кодек на основе искусственного интеллекта, который сжимает аудио в десять раз без потери качества.
Encodec может сжать поток данным MP3 со скоростью 64 Кбит/с в 6 Кбит/с при сохранении того же качества. Кодек может кодировать и декодировать аудиоданные в режиме реального времени на одном ядре ЦП без ущерба для процесса. По словам представителей компании, этот метод может значительно улучшить качество звука при низкоскоростных соединениях, например, при телефонных звонках с нестабильным соединением.
Трехступенчатая система Encodec начинается с преобразования несжатых данных в специальный формат с более низким битрейтом. Далее алгоритм сжимает полученный формат до необходимого размера, сохраняя наиболее важную информацию, которая позднее будет использована для восстановления исходного сигнала. В конце кодек преобразует сжатые данные обратно в аудио, используя нейронную сеть.
Разработчики Meta пояснили, что они первые использовали нейронную сеть к стереозвуку с частотой дискретизации 48 кГц. Под эту категорию попадают почти все музыкальные CD и большинство музыки в сети.
Читать на dev.by