Ученые МТУСИ усовершенствовали формат файлов MP3. Теперь он позволяет сохранять высокое качество звука при меньшем размере файла и дает возможность уменьшить объем музыкальных файлов на 20%. Способ также позволяет удерживать качество фонограмм даже при снижении объема файла вдвое. Эффективность метода уже подтверждена измерениями и экспертизами, в которых люди отмечали, что изменения в звуке практически не заметны даже при записи на пониженной скорости.
Метод улучшения качества MP3
Ученые МТУСИ разработали способ сохранять качество цифрового звука без увеличения объема файла. Более того, с его помощью можно уменьшить размер файла на 20%. Обычно для уменьшения объема архивов звука используют форматы вроде MP3, но они добавляют новые искажения. Новые алгоритмы решают эту проблему: они сохраняют качество даже при снижении объема файла вдвое.

Этот метод позволяет сохранять качество даже тогда, когда у цифровой звукозаписи есть недостатки, уловимые уху, в отличие от аналогового метода, где шумы менее ощутимы и человек их всё равно слышит благодаря особенностям слуха.
— Формат MP3, несмотря на популярность, имеет недостатки. Например, при оцифровке аналогового сигнала (импульсно-кодовой модуляции, ИКМ) в цифровой на скорости 250–270 Кбит/с теряются нюансы, так называемые атаки, которые определяют насыщенность звука и его разборчивость, — заявили в пресс-службе университета.

Новый метод улучшает качество MP3 даже при скорости 56 Кбит/с — звук становится таким же качественным, как при базовой 16-разрядной ИКМ (самой популярной кодировке звука). Это подтверждено измерениями и опросами людей. Также специалисты запатентовали алгоритм «не искажающего компандирования», иными словами, способ эффективного сжатия без появления искажений и шумов в процессе преобразования звуковой дорожки из аналогового вида в цифровой.
— Метод сжимает динамический диапазон до 10–15 дБ, но звук передается без искажений. А качество даже при использовании 16-битного формата сравнимо с 32-битным входным сигналом, то есть негативные стороны 16 бит снижены, — добавили в МТУСИ.

Таким образом, этот метод сохраняет звук до тех пор, пока цифровое представление не «ломается» — в отличие от аналогового, где шумы меньше и человек всё равно слышит звук. Благодаря этому MP3 на скорости 56 Кбит/с звучит так же хорошо, как стандартный сигнал. Исследования подтверждают это: люди почти не замечают разницы, отметили ученые.
Кому пригодится новый алгоритм
Цифровой звук сейчас применяется везде: на стриминговых платформах, в подкастах, аудиокнигах, озвучке видеоигр, фильмах, видеороликах, голосовых сообщениях, видеозвонках, умных колонках, голосовых помощниках. Он используется даже в слуховых аппаратах, отмечает гендиректор группы компаний ST IT, эксперт рынка TechNet НТИ Антон Аверьянов.
— Проблема в том, что тихие звуки в «цифре» часто теряются. По старым стандартам до половины данных просто вылетает, а чтобы это исправить, требуется увеличивать размер файлов, что плохо сказывается на пользователях. Эта проблема весьма актуальна, особенно при низких битрейтах или в условиях ограниченной памяти и пропускной способности. Искажения проявляются в таких аспектах, как потеря тихих звуков, шумы, «металлический» оттенок или смазанность. Например, в MP3 при 56–128 Кбит/с теряется до 50% данных, что заметно ухудшает качество — звук становится плоским, детали пропадают, — сказал он.

Предложенное решение оптимально для студий звукозаписи, стриминговых платформ и компактных устройств с ограниченным объемом памяти, резюмировал эксперт.
Для успешного применения данной технологии необходимо не только массовое ее внедрение, например на стриминговых сервисах, но и общее повышение качества звукопроизводящей аппаратуры. В целом современные среднесегментные смартфоны уже обладают хорошим звуком, а значит, новый формат имеет перспективы, отметил директор Центра спортивного программирования, алгоритмической робототехники, кибербезопасности и киберспорта Уфимского университета науки и технологий Святослав Пегов.

Как отметил IT-специалист Иван Калмыков, технология в области предобработки сигналов действительно может стать прорывом: например, алгоритмы на базе адаптивной фильтрации шумов позволяют снизить битрейт потокового аудио до 24 Кбит/с без потери разборчивости речи.
— Перспектива замены MP3 более современными алгоритмами выглядит обоснованной. Сейчас такие решения типа SoundStream от Google уже демонстрируют качество 128 Кбит/с на скорости 3 Кбит/с — это хорошие цифры. На мой взгляд, исследование ученых по моделированию аудиокорректоров закладывает базу для инноваций, как у Google, — добавил эксперт.

Патентованные методы предварительной обработки и компандирования открывают путь к более эффективным студийным архивам и потоковой передаче аудио высокого качества даже при низких битрейтах, считает ведущий эксперт в области ИИ «Университета 2035» Ярослав Селиверстов.
— Возможность передавать качество 32-разрядного сигнала через 16-разрядный поток — колоссальное достижение в условиях ограниченных ресурсов. Это особенно перспективно для мобильных приложений, облачного хранения и ИИ-систем, где объем и точность критичны. Такую разработку можно считать не только перспективной, но и системообразующей для нового этапа цифрового звука, — добавил он.
Особый интерес представляет технология предварительной обработки сигнала, которая может повысить качество звука при низких битрейтах. Это может пригодиться в онлайн-вещании, подкастинге и даже в киберспорте, где важна четкость звуковой составляющей без избыточного потребления трафика. Также перспективно применение новых алгоритмов в студийной работе — например, для сжатия многодорожных фонограмм без потери субъективного качества, уточнил IT-эксперт кафедры киберспорта факультета игровой индустрии и киберспорта университета «Синергия» Даниил Аржаков.

Такие разработки могут стать основой не только для улучшения существующих форматов вроде MP3, но и для создания новых стандартов кодирования звука, учитывающих современные требования к экономии ресурсов и высокому уровню восприятия. Особенно это актуально в условиях роста потребления медиаконтента и необходимости оптимизации инфраструктуры хранения и доставки данных, подвел итог эксперт.