что такое скорость потока аудио

Что такое битрейт? Подробная характеристика

что такое скорость потока аудио. Смотреть фото что такое скорость потока аудио. Смотреть картинку что такое скорость потока аудио. Картинка про что такое скорость потока аудио. Фото что такое скорость потока аудио

Битрейт – это не просто непонятное слово, это важнейший показатель аудио или видео. Вы уже знакомы с этой характеристикой медиафайлов? Если нет – приступайте к нашем обзору, мы подробно рассказываем все необходимое!

Что это такое

Битрейт (ширина потока/ ширина пропускной полосы) – это количество бит (единиц информации), используемых для передачи и обработки данных за секунду времени воспроизводимого файла. Иначе говоря – минимальное значение канала, способного пропускать поток без задержек. Мерой измерения служат биты/сек и производные величины – кбит/сек, мбит/сек и другие.

Разобрались, что это за битрейт видео/ аудио? Вы удивитесь, но существует несколько разновидностей ширины пропускной полосы. Доходчиво объясняем, на какие типы можно поделить.

Для КС:ГО есть минимальные требования устройства? Ответ читай уже в этой статье

Существует несколько режимов сжатия потока – стоит изучить каждый из них. Важно понимать все тонкости – только так можно окончательно разобраться, что это такое – битрейт.

Как мы и сказали выше, типов всего три. Пройдемся по каждому.

Постоянный (Constant bitrate, CBR)

Заданное значение не меняется на всем протяжении файла: каждой секунде соответствует определенное – и одинаковое – количество закодированных бит данных (даже когда речь о тишине). Используется чаще при обработке файлов с постоянными характеристиками звучания и изображения.

Переменный (Variable, VBR)

Заданное пользователем число автоматически меняется программой-кодером в процессе кодирования (для каждого кадра, согласно его характеристикам). Такая технология используется для достижения наилучшего соотношения размера и качества.

Усредненный (Average, ABR)

Усредненный битрейт – это сочетание первых двух типов! Используется при создании крупных проектов – при небольшом размере файла можно добиться высочайшего качества кодирования, при этом точность расчета размера значительно выше. Значение в кбит/сек задается пользователем (как при CBR), а программа уже варьирует его в определенных пределах (как при VBR).

Изучение существующих типов позволяет понять, на что влияет битрейт видео и аудио. Чем выше этот показатель, тем выше качество готового мультимедиа-продукта! Это степень сжатия – чем сильнее сигнал сжимается, тем хуже качество и меньше размер. И наоборот!

Стандартные значения

Обязательно нужно запомнить общепринятые стандарты – ориентируйтесь на них при работе с определенным видом контента. Сначала битрейт аудио:

Давайте поговорим о том, какой битрейт видео выбрать! Приводим усредненные значения, которыми можно пользоваться – в зависимости от ситуации. Если вы внимательно изучите список, то поймете, как сильно отличаются цифры.

Существует усредненное значение, которое можно выставлять почти всегда.

При этом нужно учитывать и формат видеоролика! Для наглядности, какой битрейт лучше для видео 1920х1080 в SDR и HDR? В первом случае лучше выставить выставить 8 и 12 mbps (60 кадров/с), а во втором – уже 10 и 15 mbps.

Что такое FPS и какой является оптимальным? Узнай в источнике

Как изменить показатель

Вы уже знаете все о ширине потока – пора разобраться, как узнать битрейт видео и поменять его. В большинстве случаев вам не требуется стороннее программное обеспечение.

Сторонние сервисы нужны, чтобы поменять значение – существует масса онлайн-конвертеров или приложений для десктопа. Рекомендуем обратить внимание на Online Audio Converter, Diktorov.net, AIMP, online-convert.com.

Подробно рассказали, что такое битрейт видео и аудио, привели стандартные значения, рассказали о разновидностях. Теперь вы сможете подобрать оптимальное число и изменить его при необходимости!

Источник

Битрейт

Битрейт (англ. bit rate ) — буквально, скорость прохождения битов информации. Битрейт принято использовать при измерении эффективной скорости передачи информации по каналу, то есть скорости передачи «полезной информации» (помимо таковой, по каналу может передаваться служебная информация — например, стартовые и стоповые биты при асинхронной передаче по RS-232 или контрольные символы при избыточном кодировании). Скорость передачи информации, учитывающую полную пропускную способность канала, измеряют в бодах.

Содержание

Значения

Термин битрейт используется в двух основных значениях:

Битрейт выражается битами в секунду (бит/c, bps), а также производными величинами с приставками кило- (кбит/с, kbit/s, kbps), мега- (Мбит/с, Mbit/s, Mbps) и т. д.

Характеристика цифрового звука и видео

В форматах потокового видео и аудио (например, MPEG и MP3), использующих сжатие c потерей качества, параметр «битрейт» выражает степень сжатия потока и, тем самым, определяет размер канала, для которого сжат поток данных. Чаще всего битрейт звука и видео измеряют в килобитах в секунду (англ. kilobit per second, kbps ), реже — в мегабитах в секунду (только для видео).

Существует три режима сжатия потоковых данных:

Постоянный битрейт

Постоянный битре́йт — вариант кодирования потоковых данных, при котором пользователь изначально задаёт необходимый битрейт, который не меняется на протяжении всего файла.

Его главное достоинство — возможность довольно точно предсказать размер конечного файла.

Однако вариант с постоянным битрейтом не очень подходит для музыкальных произведений, звучание которых динамично изменяется во времени, так как не обеспечивает оптимального соотношения размер/качество.

Переменный битрейт

С переменным битрейтом кодек выбирает значение битрейта исходя из параметров (уровня желаемого качества), причём в течение кодируемого фрагмента битрейт может изменяться. При сжатии звука нужный битрейт определяется на основе психоакустической модели. Данный метод даёт наилучшее соотношение качество/размер выходного файла, однако точный его размер оказывается очень плохо предсказуем. В зависимости от характера звука (или изображения, в случае кодирования видео), размер полученного файла может отличаться в несколько раз.

Усреднённый битрейт

Усреднённый битрейт является гибридом постоянного и переменного битрейтов: битрейт в кбит/c задаётся пользователем, а программа варьирует его в некоторых пределах. Однако, в отличие от VBR, кодек с осторожностью использует максимально и минимально возможные значения битрейта, дабы не рисковать выйти за заданную пользователем среднюю величину. Также этот метод позволяет наиболее гибко задавать битрейт (для аудио это может быть любым числом между 8 и 320 кбит/с, против чисел, кратных 16 в методе CBR) и с гораздо большей (по сравнению с VBR) точностью предсказывать размер выходного файла.

См. также

Ссылки

Полезное

Смотреть что такое «Битрейт» в других словарях:

Битрейт — Характеристика степени сжатия аудиофайла. Определяется количеством информации, обрабатываемой за единицу времени. Чем выше битрейт, тем выше качество звука и больше объем файла … Глоссарий терминов бытовой и компьютерной техники Samsung

битрейт — см. bitrate … Русский индекс к Англо-русскому словарь по музыкальной терминологии

Переменный битрейт — Битрейт (англ. bitrate) буквально, скорость прохождения битов информации. Битрейт принято использовать при измерении эффективной скорости передачи информации по каналу, то есть скорости передачи «полезной информации» (помимо таковой, по каналу… … Википедия

Постоянный битрейт — Битрейт (англ. bitrate) буквально, скорость прохождения битов информации. Битрейт принято использовать при измерении эффективной скорости передачи информации по каналу, то есть скорости передачи «полезной информации» (помимо таковой, по каналу… … Википедия

Усреднённый битрейт — Битрейт (англ. bitrate) буквально, скорость прохождения битов информации. Битрейт принято использовать при измерении эффективной скорости передачи информации по каналу, то есть скорости передачи «полезной информации» (помимо таковой, по каналу… … Википедия

VBR — Битрейт (англ. bitrate) буквально, скорость прохождения битов информации. Битрейт принято использовать при измерении эффективной скорости передачи информации по каналу, то есть скорости передачи «полезной информации» (помимо таковой, по каналу… … Википедия

Видео — (от лат. video смотрю, вижу) электронная технология формирования, записи, обработки, передачи, хранения и воспроизведения сигналов изображения, основанная на принципах телевидения, а также аудиовизуальное произведение, записанное … Википедия

Источник

Что такое битрейт видео и аудио

Увлекаетесь созданием видео или цените высокое качество в фильмах? Наверняка вам встречалось такое понятие как битрейт. Оно всегда сопутствует техническим характеристикам видеозаписей и по его величине определяется, насколько качественная картинка будет в файле. Работая с конвертерами, вы не раз встретите эту характеристику, поэтому желательно хорошо понимать, за что она отвечает и как влияет на итоговый продукт: ролик или аудиофайл.

Содержание:

Что такое битрейт

Чтобы узнать, что такое битрейт, стоит разобраться, как устроена видеопередача информации. Любой ролик — это сменяющаяся череда картинок. Дабы не появлялось «ощущения слайд-шоу», скорость смены изображений должна быть как минимум 24 кадра/сек. Каждый кадр имеет параметры: ширину и высоту. Чем они выше, тем больше пикселей помещается в одной картинке — тем выше качество.

Каждая «точка», составляющая кадр, имеет вес, и равняется он 1 байту. Возьмём одну Full HD картинку и посчитаем её вес — выйдет порядка двух мегабайт (1920×1080=2 073 600). Таким образом одна секунда видео, содержа в себе 24 кадра, весила бы 48 Мб. Здесь появляется понятие битрейта — это сила сжатия видеоролика.

Т.е. нужный файл, кодируясь, становится меньше в весе. Но от сильного сжатия он может также потерять в качестве. Конечно, на самом деле всё не так однозначно — многое зависит от кодека, который используется для кодирования. Так называется непосредственный способ сжатия. Так, видео в разных форматах, но с одинаковым битрейтом, могут выдавать разные по качеству картинки. Также применимо понятие «битрейт аудио», который обозначает силу сжатия, но уже для аудиопотока.

Виды битрейта

Углубляясь в тему, стоит отметить, что битрейт не всегда бывает одинаковым. И речь сейчас не о количественном показателе, а о делении на виды. Чтобы грамотно работать с конвертацией мультимедиа, почитайте о трёх типах битрейта: постоянный, переменный и усреднённый, являющийся гибридом первых двух.

Постоянный битрейт (CBR)

Как понятно из названия, этот вид битрейта является неизменным во время воспроизведения файла. Такой метод сжатия позволяет довольно точно определить размер выходного файла и обеспечить равномерное качество на протяжении всего просмотра или прослушивания. Но в развлекательной индустрии постоянный битрейт используется редко в силу невозможности подстроить его под динамичное воспроизведение, за счёт чего файлы получаются больше, чем могли бы.

Переменный битрейт (VBR)

Этот вид битрейта гибок и устойчив к изменениям, вследствие чего может подстраиваться под объект воспроизведения и выдавать оптимальный показатель «размер/качество». Например, для кадров или отрезков музыки с пониженной плотностью информации, битрейт уменьшится, тем самым уменьшая вес объекта.

Усредненный битрейт

Этот вид — компромисс между вышеназванными. Проблема переменного битрейта в том, что изменения автоматизированы, и иногда может произойти чрезмерное сжатие. Усреднённый битрейт позволяет пользователю самому задать диапазон, в котором будет происходить вариация сжатия. Правда, техника его использования не так проста и применяется в основном на профессиональных студиях при работе над серьёзными проектами. Дополнительный плюс усреднённого битрейта — он позволяет точнее рассчитать вес файла даже при изменении силы сжатия.

Как узнать битрейт файла

Как же вычислить силу сжатия видео, а соответственно узнать степень его качества. Обрадуем — никаких специальных программ не понадобится, данные о битрейте файла являются основными и доступны для просмотра любому пользователю. Для этого кликните по объекту правой кнопкой мыши и выберите «Свойства». В открывшемся окне найдите вкладку «Подробно», а затем «Скорость передачи данных». Там и будет указан битрейт видео. Если вам нужна информация про аудиофайл — ищите пункт «Скорость потока». Правда, есть несколько форматов, у которых доступ к битрейту усложнён — например, MKV-файлы. Для них нужно воспользоваться специализированным софтом, например MediaInfo.

Какое значение битрейта выставлять

Теперь самое интересное: какой битрейт выбирать при перекодировании фильмов и музыки? Какой битрейт лучше для видео 1920×1080, например?

Естественно, однозначного ответа нет. Нужно учитывать множество факторов: для какой аудитории делается контент, какие кодеки будут участвовать в сжатии и т.д. Ориентируясь на средние значения, для Full HD видео можно сузить диапазон приблизительно до 5-8 Мбит/с для стандартной частоты кадров (FPS). Для повышенной (48-60 FPS) стоит брать значения от 7,5 до 12 Мбит/с. Для аудиодорожки нижним порогом качества является 192 кбит/с, после этого начнутся уже слышимые невооружённым ухом негативные изменения.

Примеры стандартных битрейтов аудио

Чтобы лучше ориентироваться в качестве музыки или голосовых записей, предлагаем вам ознакомиться с таблицей усреднённых значений. Сюда входят варианты кодирования со сжатием (MP3) и без (FLAC, WAVE).

Стандартные битрейты видео

Как изменить битрейт

Чтобы самостоятельно поменять битрейт, вам понадобится качественная программа ВидеоМАСТЕР. Это уникальный конвертер с функциями видеоредактора, который позволит задать пользовательскую силу сжатия, а вдобавок улучшить картинку в фильме, произвести нарезку, перевернуть видео и многое другое. Скачайте ВидеоМАСТЕР произведите установку и приступайте к работе.

Шаг 1. Загрузка видео

Открыв главное меню софта, найдите на левой панели кнопку «Добавить» и кликните по ней. Выберите «Добавить видео или аудио», если нужно изменить только один объект или «Добавить папку», чтобы загрузить сразу несколько.

что такое скорость потока аудио. Смотреть фото что такое скорость потока аудио. Смотреть картинку что такое скорость потока аудио. Картинка про что такое скорость потока аудио. Фото что такое скорость потока аудио

Также можно сделать запись с вебки или скачать видео с сайта

Шаг 2. Изменение битрейта

Успешно загрузив нужные файлы, щёлкните по кнопке «Параметры», расположенной под окном выбора формата.

что такое скорость потока аудио. Смотреть фото что такое скорость потока аудио. Смотреть картинку что такое скорость потока аудио. Картинка про что такое скорость потока аудио. Фото что такое скорость потока аудио

Можно выбрать любой кодек: h.264, MPEG4, HEVC

По нажатию появится окно с дополнительными настройками для загруженного файла. Там находится параметр «битрейт» — отдельно для видео и аудио. Кликнув по этому пункту, вы увидите выпадающий список с разными значениями. Остаётся выбрать подходящее вам и нажать «Применить». Таким же образом настраивается битрейт аудио. В этом меню можно задать необходимый кодек, размер и частоту кадра, формат файла и прочие доп. настройки.

Шаг 3. Конвертация

Остаётся только указать папку для сохранения конечного файла и нажать кнопку «Конвертировать», находящуюся под плеером предпросмотра. Процесс завершится буквально за пару минут. Кроме непосредственно форматов в программе есть пресеты для кодирования ролика под мобильный телефон или планшет. Также присутствует инструмент для загрузки видео прямо на YouTube — надо лишь ввести в программу свой логин и пароль от аккаунта.

Теперь вы знаете, как запросто изменить битрейт любого видео или аудио. С программой ВидеоМАСТЕР не составит труда повысить качество видео и добиться его максимального соотношения с размером файла. Данная утилита проста в управлении, обладает приятным русскоязычным меню, а главное — предоставляет широкий набор инструментов для работы с записями. Скачайте ВидеоМАСТЕР сейчас — и все проблемы с битрейтом видеофайлов будут решены!

Популярные вопросы:

Зависит от значения FPS (frames per second). Так обозначается частота смены кадров в секунду. При нормальной частоте (24-30 FPS) битрейт составит 8 Мбит/с. Если ФПС высокий — это повлияет и на битрейт — он станет больше, примерно 12Мбит/с.

Напрямую. Чем выше битрейт, тем лучше качество видео, а значит повышается и вес итогового файла. При сильном сжатии можно добиться совсем незначительного размера, но в музыке или фильме появятся заметные изъяны.

Источник

«Заметки на полях» (FAQ)

Часто задаваемые вопросы (и ответы) на околозвуковые темы технического характера

Кратко об истории и характеристиках стандартов MPEG.

1) Рассмотрим комплект MPEG-1. Этот комплект, в соответствии со стандартами ISO, включает в себя три алгоритма различного уровня сложности: Layer (уровень) I, Layer II и Layer III. Общая структура процесса кодирования одинакова для всех уровней. Для каждого уровня определен свой формат записи бит-потока и свой алгоритм декодирования. Алгоритмы MPEG основаны в целом на изученных свойствах восприятия звуковых сигналов слуховым аппаратом человека (то есть кодирование производится с использованием так называемой «психоакустической модели»).

Кратко об алгоритме кодирования. Входной цифровой сигнал сначала раскладывается на частотные составляющие спектра. Затем этот спектр очищается от заведомо неслышных составляющих – низкочастотных шумов и наивысших гармоник, то есть фактически фильтруется. На следующем этапе производится значительно более сложный психоакустический анализ слышимого спектра частот. Это делается в том числе с целью выявления и удаления «замаскированных» частот (частот, которые не воспринимаются слуховым аппаратом в виду их приглушения другими частотами). После всех этих манипуляций из цифрового аудио сигнала исключается больше половины информации. Затем, в зависимости от уровня сложности используемого алгоритма, может быть также произведен анализ предсказуемости сигнала. Кроме этого, базируясь на том, что человеческое ухо способно различать направление звучания только средних частот, то в случае, когда кодируется стерео сигнал, его можно превратить в совмещенный стерео (joint stereo). Это значит, что фактически происходит отделение верхних и нижних частот и их кодирование в моно варианте (средние частоты остаются в режиме стерео). Далее, в случае появления, например, «тишины» в одном из каналов, «пустующее» место заполняется информацией либо повышающей качество другого канала, либо просто не поместившейся до этого. В довершение ко всему проводится сжатие уже готового бит-потока упрощенным аналогом алгоритма Хаффмана (Huffman), что позволяет также значительно уменьшить занимаемый потоком объем.

Комплект MPEG-1 предусмотрен для кодирования сигналов, оцифрованных с частотой дискретизации 32, 44.1 и 48 КГц. Как было указано выше, комплект MPEG-1 имеет три уровня (Layer I, II и III). Эти уровни имеют различия в обеспечиваемом коэффициенте сжатия и качестве звучания получаемых потоков. Layer I позволяет сигналы 44.1 КГц / 16 бит хранить без ощутимых потерь качества при скорости потока 384 Кбит/с, что составляет 4-х кратный выигрыш в занимаемом объеме; Layer II обеспечивает такое же качество при 194 Кбит/с, а Layer III – при 128 (или 112). Выигрыш Layer III очевиден, но скорость компрессии при его использовании самая низкая (надо отметить, что при современных скоростях процессоров это ограничение уже не заметно). Фактически, Layer III позволяет сжимать информацию в 10-12 раз без ощутимых потерь в качестве.

2) Стандарт MPEG-2 был специально разработан для кодирования ТВ сигналов вещательного телевидения, поэтому на рассмотрении MPEG-2 мы бы не останавливались, если бы в апреле 1997 этот комплект не получил «продолжение» в виде алгоритма MPEG-2 AAC (MPEG-2 Advanced Audio Coding – продвинутое аудио кодирование). Стандарт MPEG-2 AAC стал результатом кооперации усилий института Fraunhofer, компаний Sony, NEC и Dolby. MPEG-2 AAC является технологическим приемником MPEG-1. Существует несколько разновидностей этого алгоритма: Homeboy AAC, AT&T a2b AAC, Liquifier AAC, Astrid/Quartex AAC и Mayah AAC. Наиболее высокое качество звучания по сравнению c MPEG-1 Layer III обеспечивают две предпоследние реализации. Все приведенные разновидности алгоритма AAC не являются совместимыми между собой.

Также, как и в комплекте аудио стандартов кодирования MPEG-1, в основе алгоритма AAC лежит психоакустический анализ сигнала. Вместе с тем, алгоритм AAC имеет в своем механизме множество дополнений, направленных на улучшение качества выходного аудио сигнала. В частности, используется другой тип преобразований, улучшена обработка шумов, изменен банк фильтров, а также улучшен способ записи выходного бит-потока. Кроме того, AAC позволяет хранить в закодированном аудиосигнале т.н. «водяные знаки» (watermarks) – информацию об авторских правах. Эта информация встраивается в бит-поток при кодировании таким образом, что уничтожить ее становится невозможно не разрушив целостность аудиоданных. Эта технология (в рамках Multimedia Protection Protocol) позволяет контролировать распространение аудиоданных (что, кстати, является препятствием на пути распространения самого алгоритма и файлов, созданных с помощью него). Следует отметить, что алгоритм AAC не является обратно совместимым (NBC – non backwards compatible) с уровнями MPEG-1 несмотря на то, что он представляет собой продолжение (доработку) MPEG-1 Layer I, II, III.

MPEG-2 AAC предусматривает три различных профиля кодирования: Main, LC (Low Complexity) и SSR (Scaleable Sampling Rate). В зависимости от того, какой профиль используется во время кодирования, изменяется время кодирования и качество получаемого цифрового потока. Наивысшее качество звучания (при самой медленной скорости компрессии) обеспечивает основной Main профиль. Это связано с тем, что профиль Main включает в себя все механизмы анализа и обработки входного потока. Профиль LC упрощен, что сказывается на качестве звучания получаемого потока, сильно отражается на скорости компрессии и, что более важно, декомпрессии. Профиль SSR также представляет собой упрощенный вариант профиля Main.

Говоря о качестве звука, можно сказать, что поток AAC (Main) 96 Кбит/с обеспечивает качество звучания, аналогичное потоку MPEG-1 Layer III 128 Кбит/с. При компрессии AAC 128 Кбит/с, качество звучания ощутимо превосходит MPEG-1 Layer III 128 Кбит/с.

4) Стандарт MPEG-7, разработка которого еще не окончена, вообще в корне отличается от всех иных стандартов MPEG. Стандарт разрабатывается не для установления каких-то рамок для передачи данных или типизации и описания данных какого-то конкретно рода. Стандарт предусмотрен как описательный, предназначенный для регламентации характеристик данных любого типа, вплоть до аналоговых. Использование MPEG-7 предполагается в тесной связи с MPEG-4. Выпуск в свет MPEG-7 намечен на 2001 год.

Для удобства обращения со сжатыми потоками, все алгоритмы MPEG разработаны таким образом, что позволяют осуществлять декомпрессию (восстановление) и воспроизведение потока одновременно с его получением (download) – потоковая декомпрессия «на лету» (stream playback). Эта возможность очень широко используются в интернете, где скорость передачи информации ограничена, а с использованием подобных алгоритмов появляется возможность обрабатывать информацию прямо во время ее получения не дожидаясь окончания передачи.

Что такое CBR и VBR?

Как известно, результатом кодирования сигнала с помощью такого алгоритма, как, например, MPEG-1 Layer III (MP3) (или некоторых других алгоритмов), является бит-поток с фреймовой (блочной) структурой. Это объясняется тем, что кодирование исходного потока производится не целиком, а по частям. То есть фактически исходный поток разделяется на блоки определенной фиксированной длины, затем каждый блок (фрейм) в отдельности подвергается кодированию и результат (кодированный блок информации) направляется в результирующий поток (будь то файл или поток данных).

Каковы отличия режимов CBR, VBR и ABR? (применительно к кодеру Lame)

Прежде чем начать разговор, уточним две детали:

1. Кодирование в MP3 происходит поблочно: кодируемый файл разбивается на фреймы (кадры) с одинаковым интервалом, каждый кадр кодируется и записывается в выходной поток; таким образом, выходной поток также имеет кадровую структуру.

2. Фреймы могут быть закодированы не на любом битрейте, а только на одном из входящих в таблицу стандартных для MPEG1 Layer III битрейтов: 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320. Кодирование на любых промежуточных битрейтах («freeformat») стандартом не предусмотрено.

Люди, использующие VBR в Lame, обычно аргументируют это фразой: «я хочу получать постоянное качество, а не постоянный битрейт». Действительно, ведь в музыке бывают простые пассажи, на которые вполне хватает и 128 Кбит/сек (например паузы между песнями), а бывают и сложные, на которых человек с хорошим слухом, хорошей аудио картой и прочей аудиоаппаратурой услышит дефекты компрессии даже на 320 Кбит/сек. На самом деле такой аргумент не совсем равомочен.

Даже в режиме CBR, mp3-кодер может перераспределять биты во времени, выделяя большее или меньшее количество бит во время сложного или простого пассажей, что позволяет в целом улучшить качество звучания. Такое перераспределение бит делается за счёт так называемого резервуара бит: во время кодирования простых пассажей кодер тратит на них не весь заданный пользователем битрейт, а лишь около 90%, около 10% экономится в резервуаре для кодирования сложных мест (изначально резервуар пуст). При кодировании сложных пассажей кодер будет использовать все 100% указанного битрейта и добавлять дополнительные биты из резервуара (если таковые имеются, то есть если резервуар не пуст). К сожалению, в соответствии со стандартом, размер резервуара ограничен. Это означает, что если простой сигнал продолжается достаточно долго, резервуар накапливает свой объем до определенных максимально допустимых пределов и далее кодирование идёт уже с использованием всех 100% битрейта. И обратная ситуация: если сложный сигнал продолжается достаточно долго, из резервуара (постепенно) забираются все сэкономленные биты и далее кодирование идёт с использованием уже теперь всех 100% битрейта.

Главное отличие ABR от CBR в том, что в CBR все фреймы обязаны быть одного размера (то есть битрейт для всех фреймов должен быть одинаков), в ABR же это ограничение снято, соответственно, существует возможность вместо стандартного весьма ограниченного по размеру резервуара использовать практически бесконечный «виртуальный» резервуар. Выглядит это приблизительно следующим образом.

Простые пассажи кодируются меньшим количеством бит, на них берётся примерно 95% от указанного битрейта B, но теперь остаток не откладывается в резервуар, кодер просто берёт фрейм с меньшим битрейтом. Возникающая разница (оставшиеся биты) записывается в стандартный резервуар (не выбрасывать же оставшиеся биты. ). Пример. Допустим пришел «простой» пассаж. Тогда кодер берет все биты (если таковые есть) в резервуаре (настоящем), потом ищет ближайший стандартный битрейт, при котором суммарное количество бит, получившееся для этого фрейма (все биты из резервуара + взятый битрейт), составит 95% от заданного пользователем битрейта B, производит кодирование, а лишние биты (если они остались) снова сохраняет в резервуаре.

Методы оценки сложности сигнала

Таким образом, основное отличие CBR, ABR и VBR, как вы уже наверное поняли из сказанного выше, состоит в использовании разных методов подсчёта необходимого для кодирования каждого фрейма количества бит.

Методы оценки сложности сигнала: метод 1 (VBR)

Первый метод основан на вычислении «психоакустической маскировки» и «ошибки кодирования». Этот метод используется в VBR и теоретически должен был бы давать максимальное качество если бы психоакустическая модель Lame’а была идеальна. В основе этого метода лежит очень простая идея: на кодирование выделяется минимальное количество бит, необходимое для выполнения условия: [ошибка_кодирования] Какие методы кодирования стерео информации используются в алгоритмах MPEG (и других)?

Существует несколько методов кодирования стерео аудио информации в стандарте ISO11172-3 (MPEG-1 Layer 1,2,3).

Dual Channel. Этот режим предполагает кодирование стерео каналов, как абсолютно независимых. Иными словами, в этом режиме кодирование аудио информации происходит отдельно в каждом канале без использования корреляций между ними. Как и следует из названия, этот режим главным образом предназначен для кодирования двух параллельных но различных каналов (например, речь на английском и немецком языках), а не стерео (т.е. не два канала, несущих информацию о стерео картине). Этот режим не рекомендуется использовать для кодирования стерео сигнала, так как существуют проигрыватели (например, madplay), проигрывающие по умолчанию только один канал если поток помечен как Dual Channel.

Stereo. Этот режим отличается от предыдущего только тем, что в режиме Dual Stereo во время кодирования для каждого канала используется свой резервуар (об этом в обсуждении вопроса об отличиях ABR/VBR/CBR), а в этом режиме оба канала кодируются с использованием общего резервуара. Иных различий между режимами нет.

При кодировании в MPEG-1 имеются две разновидности этого метода.

Intensity Stereo. В этом режиме в верхнем частотном диапазоне так же происходит кодирование общей составляющей обоих каналов, как и в случае MS Stereo, но вместо кодирования разностной составляющей в верхнем диапазоне частот происходит просто регистрация и запись мощностей сигналов в левом и правом каналах в каждой частотной полосе начиная с некоторой определенной. Иными словами весь сигнал разбивается на полосы, фактическому кодированию подвергается только нижний диапазон частот side-канала, а в верхнем частотном диапазоне начиная с определенной полосы происходит не кодирование сигнала в каждой полосе, а лишь регистрация мощностей сигнала в каждой полосе. Кодирование стерео сигнала в нижнем частотном диапазоне осуществляется в режиме MS Stereo или просто Stereo.

Таким образом, в режиме Joint Stereo фактически происходит кодирование лишь общей составляющей каналов, а стерео на высоких частотах «воссоздается» (если такой термин здесь уместен, а лучше «синтезируется») в соответствующем канале путем умножения общего сигнала на известные (сохраненные при кодировании) значения мощностей частотных участков в соответствующем канале.

Можно предположить, что приблизительно аналогичные методы кодирования стерео аудио информации применяются и в других алгоритмах компрессии аудио.

Какие параметры предпочтительны при кодировании MP3?

Этот вопрос не имеет однозначного ответа. Каждый человек подбирает себе параметры кодирования в зависимости от конкретной задачи. Если речь идет о кодировании голоса или другой звуковой информации при малых требованиях к качеству, то кодирование можно производить на минимальных битрейтах, вплоть до 8 Кбит/с (при данном битрейте полоса частот ограничивается 2,5 КГц, что сравнимо с телефонной линией).

Если же стоит вопрос о кодировании аудио данных с CD (44.1 KГц / 16 бит / стерео), то на этот счет существует масса мнений. Большинство пользователей почему-то убеждено, что битрейта 128 Кбит/c достаточно для кодирования аудио CD-качеcтва без потерь. На самом деле это не так. В этом легко убедиться, если прослушать (даже на аппаратуре среднего качества) сначала оригинал, а затем полученный MP3. MP3 будет отличаться как минимум «сухостью» звучания, не говоря уже о появлении некоторых посторонних «позвякиваний», скрежета и других помех.. Это обусловлено тем, что используемая при кодировании психоакустическая модель оставляет только «жизненно необходимые» частоты, отфильтровывая замаскированные и слабослышимые. Причем это проявляется тем больше, чем с меньшим битрейтом производится кодирование. Основываясь на опыте можно предположить, что битрейт, достаточный для «точной» передачи CD-звучания, лежит в пределах от 192 до 320 Кбит/с (в зависимости от кодируемого аудио сигнала и, конечно, самого слушателя). Безусловно, при таком кодировании объем, занимаемый полученным MP3-потоком, увеличивается пропорционально поднятию битрейта.

Какие альтернативные MPEG-1 Layer III (MP3) алгоритмы компрессии существуют?

Действительно, на MP3 свет клином не сошелся. Параллельно MP3 появляются и развиваются не менее, а иногда, и более прогрессивные алгоритмы компрессии звука. Перечислять все алгоритмы нет надобности. Следует отметить только, что существуют алгоритмы по своим возможностям и качеству во многом превосходящие MP3. Один из таких алгоритмов это MPEG-2 AAC.

MPEG-2 AAC. MPEG-2 Advanced Audio Coding – продвинутое аудио кодирование) стал результатом кооперации усилий института Fraunhofer, компаний Sony, NEC и Dolby. MPEG-2 AAC является технологическим приемником MPEG-1. Существует несколько разновидностей этого алгоритма: Homeboy AAC, AT&T a2b AAC, Liquifier AAC, Astrid/Quartex AAC и Mayah AAC. Наиболее высокое качество звучания по сравнению c MPEG-1 Layer III обеспечивают две предпоследние реализации. Все приведенные разновидности алгоритма AAC не являются совместимыми между собой.

Так же, как и в комплекте аудио стандартов кодирования MPEG-1, в основе алгоритма AAC лежит психоакустический анализ сигнала. Вместе с тем, алгоритм AAC имеет в своем механизме множество дополнений, направленных на улучшение качества выходного аудио сигнала. В частности, используется другой тип преобразований, улучшена обработка шумов, изменен банк фильтров, а также улучшен способ записи выходного бит-потока. Кроме того, AAC позволяет хранить в закодированном аудио сигнале т.н. «водяные знаки» (watermarks) – информацию об авторских правах. Эта информация встраивается в бит-поток при кодировании таким образом, что уничтожить ее становится невозможно не разрушив целостность аудио данных. Эта технология (в рамках Multimedia Protection Protocol) позволяет контролировать распространение аудиоданных (что, кстати, является препятствием на пути распространения самого алгоритма и файлов, созданных с помощью него). Следует отметить, что алгоритм AAC не является обратно совместимым (NBC – non backwards compatible) с уровнями MPEG-1 не смотря на то, что он представляет собой продолжение (доработку) MPEG-1 Layer I, II, III.

Говоря о качестве звука, можно сказать, что поток AAC 96 Кбит/с обеспечивает качество звучания, аналогичное потоку MPEG-1 Layer III 128 Кбит/с. При компрессии AAC 128 Кбит/с, качество звучания ощутимо превосходит MPEG-1 Layer III 128 Кбит/с.

Несколько слов необходимо сказать и о другом прогрессивном алгоритме TwinVQ(Transform-domain Weighted Interleave Vector Quanization), разработанном фирмой Nippon Telegraph and Telephone Corp. (NTT) в Human Interface Laboratories и лицензированном фирмой Yamaha (продукты от Yamaha, основанные на TwinVQ, распространяются под торговой маркой SoundVQ). Этот метод позволяет сжимать цифровые потоки с коэффициентом компрессия до 1:20. При этом качество звучания потока TwinVQ при 96 Кбит/с практически идентично качеству звучания потока MPEG-1 Layer III (при 128 Кбит/с) и MPEG-2 AAC (при 96 Кбит/с). Алгоритм TwinVQ позволяет кодировать данные во всем диапазоне слышимых частот (до 22 КГц) и, также как и MPEG, производить декодирование и воспроизведение потока одновременно с его получением (stream playback). Кстати, говоря об алгоритме TwinVQ следует сказать также, что трудоемкость этого алгоритма намного выше трудоемкости, например, алгоритма MPEG-1 Layer III, так что программы-компрессоры, основанные на алгоритме TwinVQ работают в 5-10 раз медленнее, чем Layer III-компрессоры. Следует сказать также, что наработки TwinVQ используются в стандарте MPEG-4. По различным оценкам, TwinVQ в нижнем диапазоне частот превосходит по качеству MPEG-1 Layer III, уступая ему на верхних частотах. TwinVQ поддерживает кодирование с переменным битрейтом (VBR), а также имеет поддержку т.н. несимметричного битрейта, когда разные каналы кодируются с отличными битрейтами.

Алгоритм PAC (Perspective Audio Coding) от Bell Labs & Lucent Technologies. По различным данным обеспечивает аналогичное (или выше) MPEG-1 Layer III 128 Кбит/с качество звучания при 64 Кбит/с. Поддерживаются также 96 и 128 Кбит/с. Алгоритм позволяет потоковое воспроизведение (stream playback). Имеет встроенный механизм защиты. Обладает высокой скоростью компрессии.

Можно ли осуществить преобразование из одного потокового формата аудио данных в другой?

Можно ли осуществить преобразование WAV в MIDI, WAV в трекерный модуль?

Таким образом, для того, чтобы, скажем, преобразовать оцифрованную музыку в формат MIDI необходимо качественно проанализировать весь исходный цифровой поток и однозначно определить, звучание каких инструментов необходимо будет задействовать в выходном MIDI-файле. То есть, фактически необходимо точно идентифицировать инструменты, входящие в композицию. Однако эта проблема, по крайней мере на сегодняшний день, почти не решаема. Посудите сами: для того, чтобы правильно определить звучание какого инструмента происходит в данный момент, нужно, грубо говоря, однозначно знать спектры всех возможных инструментов. И затем, сравнивая спектр звучащего инструмента с набором спектров известных инструментов, определить звучание какого инструмента мы слышим. Но в тоже время мы знаем, что спектр одного и того же инструмента может сильно измениться даже при небольшом изменении силы воздействия на него, а это в свою очередь означает, что однозначно получить спектр мы не можем. Но все сказанное касалось звучания только одного инструмента. А что же будет со спектром сигнала, если в него входит звучание сразу нескольких инструментов? Спектр изменится коренным образом! Вы скажете, что можно, наверное, определить звучание по формантным областям. Да, это возможно, однако говорить все же о точности определения не приходится. Да и проблема-то не заканчивается точной идентификацией инструментов. В дальнейшем придется точно определять тональности звучания, расстановку во времени и тому подобное. По этой причине можно сделать однозначный вывод: качественное преобразование цифровых потоков в MIDI невозможно в принципе.

Справедливости ради нужно сказать, что существует некоторое количество программ, которые позволяют переводить простые одноголосые композиции в MIDI-партитуру.

Можно ли перевести цифровой поток в трекерный модуль? Нет, нельзя по приведенным выше причинам. Более того, так как в трекерных модулях (в отличие от MIDI) хранятся кроме команд и сами используемые в композиции инструменты, то для того, чтобы перевести поток в трекерный модуль, из него нужно вычленить звучание отдельных инструментов. А эта задача равносильна вычленению, например, голоса из песни (караоке). То есть, это возможно в какой-то мере, но вычленение несомненно будет крайне некачественным, так как спектры инструментов чаще всего наложены друг на друга.

Можно ли выделить из аудио потока звучание конкретного инструмента или голоса?

Что же касается вычленения звучания каких-то инструментов, то этот вопрос аналогичен предыдущему (точнее, третий абзац предыдущего вопроса).

Таких способов много. Попробуем их перечислить.

Какой метод сравнения двух аудио сигналов можно признать наиболее точным?

Сначала договоримся, что речь идет о сравнении двух сложных непериодических сигналов, представленных в цифровом виде. Далее все зависит от стоящей перед экспериментатором задачи. Вероятно, все сводится к двум вариантам: физическое сравнение двух сигналов (то есть сравнение точности совпадения форм сигналов) и субъективное сравнение, когда целью является оценка «похожести» звучания двух сигналов.

Второй вариант, целью которого является субъективное сравнение разницы в звучании двух сигналов, очень часто применим при оценке качества алгоритмов компрессии аудио. Вообще, целью большинства аудио кодеков (за исключением специализированных, например, вокодеров или кодеков для передачи ограниченного спектра частот) является в максимально меньшем объеме данных сохранить аудио информацию как можно более приближенную по качеству к оригинальному звучанию. Другими словами, задача сводится к обеспечению субъективно сходного с оригиналом качества звучания и никак ни объективного физического сходства форм (огибающих) оригинального и декодированного сжатого сигналов. В этом случае, применимость описанных выше методов сравнения может быть очень спорна, так как форма сигналов может совпадать очень слабо, а субъективное качество звучания оригинального и восстановленного сжатого сигналов при этом почти не изменится. Тогда для сравнения сигналов можно воспользоваться несколькими разновидностями спектрального анализа, каждый из которых, тем не менее, имеет массу недостатков.

Первый заключается в графическом сравнении результирующих АЧХ оригинального и восстановленного сжатого сигналов за какой-то промежуток времени. Под понятием «результирующая АЧХ» подразумевается график зафиксированных пиковых значений амплитуд частотных составляющих сигнала за некоторый промежуток времени. Таким образом, взяв два одинаковых промежутка сравниваемых сигналов и построив их результирующие АЧХ, по совпадению (не совпадению) графиков АЧХ можно приблизительно оценить уровень потерянных частотных составляющих в сжатом сигнале, а также увидеть полосы частот, где эти потери наиболее выражены. Однако этот метод является статичным, то есть он абсолютно не учитывает изменение сигналов в динамике, что является очень важным, так как часто встречаются случаи, когда результирующие АЧХ сигналов почти совпадают, однако звучание сравниваемых промежутков сигналов отличается коренным образом даже на слух.

Третий метод представляет собой более конкретизированный предыдущий, он заключается в построении АЧХ для каждого сканируемого окна БПФ. Однако эта задача не лишена тех же проблем, что и предыдущий метод, и, кроме того, производить сравнение графически крайне неудобно, даже если представить всю обсчитанную спектральную картину сигнала в трехмерном виде.

Очевидно, что идеального метода сравнения сигналов не существует. Поэтому в каждом конкретном случае пользуются наиболее подходящим по точности и удобству методом сравнения, руководствуясь только соображениями целесообразности.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *