что такое zero span на спектроанализаторе
Что такое zero span на спектроанализаторе
Agilent. Анализаторы спектра. Словарь терминов
Страница: 1 2 3
Детектирование мгновенного значения (Sample): режим дисплейного детектирования, при котором в каждой точке отображается мгновенное значение видеосигнала в произвольно заданной точке (например, в конце) частотного и/или временного интервала, представляемого данной точкой.
Детектирование отрицательного максимума (Negative peak): режим дисплейного детектирования, при котором каждая дисплейная точка содержит минимальное значение видеосигнала для данной части обзора частот и/или временного интервала, представляемого точкой.
Детектирование положительного максимума (Positive peak): режим дисплейного детектирования, при котором каждая дисплейная точка отображает максимальное значение видеосигнала для данной части обзора частоты и/или временного интервала, представляемого точкой.
Детектирование среднего (Average detection): метод детектирования, при котором суммируется мощность в некотором частотном интервале. Часто применяется для измерения сложных сигналов, сигналов с цифровой модуляцией и других сигналов с шумоподобными характеристиками. Сегодняшние анализаторы фирмы Agilent обычно предлагают три варианта детектирования среднего: усреднение мощности (среднеквадратичное), когда измеряется истинное значение мощности в рамках частотного блока; усреднение амплитуды (напряжения), когда измеряется средняя величина амплитуды в рамках частотного блока; логарифмическое усреднение мощности (видео-усреднение), когда измеряется логарифмическая амплитуда огибающей сигнала в дБ.
Детектор огибающей (Envelope detector): элемент цепи, сигнал на выходе которого повторяет огибающую, но не мгновенные вариации входного сигнала. В супергетеродинном анализаторе спектра сигнал на вход детектора огибающей поступает с последней ПЧ, а на выходе получается видео-сигнал. Если настроить наш анализатор на нулевой обзор, детектор огибающей демодулирует входной сигнал, и мы сможем увидеть на экране модулирующий сигнал в зависимости от времени.
Диапазон дисплея (Display range): откалиброванный для определенного режима и масштаба диапазон дисплея. См. Линейный дисплей (Linear display) и Логарифмический дисплей (Log display), а также Масштабный коэффициент (Scale factor).
Диапазон измерения (Measurement range): отношение (в дБ) максимального уровня сигнала, который можно измерить (обычно, максимальный безопасный входной уровень), к наименьшему достижимому среднему уровню шума. Обычно это отношение всегда намного больше, чем можно получить за одно измерение. См. Динамический диапазон (Dynamic range).
Динамический диапазон (Dynamic range): отношение (в дБ) между наибольшим и наименьшим сигналами на входе анализатора спектра, которые одновременно могут быть измерены с заданной точностью. Динамический диапазон обычно важен при измерении искажений или продуктов интермодуляции.
Динамический диапазон дисплея (Display dynamic range): максимальный динамический диапазон, при котором на дисплее могут одновременно наблюдаться наименьший и наибольший сигналы. Для анализаторов с максимальным логарифмическим разрешением экрана в 10 дБ/деление, действительный динамический диапазон (см. Динамический диапазон (Dynamic range)) может быть больше, чем динамический диапазон дисплея.
Достоверность масштаба дисплея (Display scale fidelity): погрешность измерения относительной разности амплитуд на анализаторе спектра. Логарифмические и линейные усилители ПЧ, которые присутствуют в анализаторах с аналоговой секцией ПЧ, не обладают идеальной линейной или логарифмической характеристикой, и потому вносят погрешность. У современных анализаторов спектра с цифровой секцией ПЧ достоверность масштаба дисплея значительным образом улучшена.
Дрейф (Drift): очень медленное (относительно времени развертки) изменение положения сигнала на экране в результате изменения частоты гетеродина как функции развертки управляющего напряжения. Основными причинами дрейфа являются температурная нестабильность и старение источника опорной частоты в анализаторе спектра.
Единицы (измерения) (Units): размерности измеряемых величин. В анализаторах спектра обычно уточняются при измерении амплитуд. В современных анализаторах спектра доступные единицы измерения амплитуды обычно дБм (децибел на милливатт рассеиваемой мощности на номинальном сопротивлении), дБмВ (децибел на милливольт), дБмкВ (децибел на микровольт), Вольт и, на некоторых приборах, Ватт. В анализаторах Agilent используются все перечисленные как в линейном, так и в логарифмическом масштабе.
Звездная диаграмма (Constellation diagram): вид представления данных измерения, обычно использующийся при анализе сигналов с цифровой модуляцией, когда детектированные символьные точки отображаются на графе IQ.
Зеркальные (мнимые) частоты (Image frequencies): два или более действительных сигнала на входе анализатора спектра, которые генерируют отклики на ПЧ при одной и той же частоте гетеродина. Поскольку продукты смешения появляются при одинаковых частотах гетеродина и ПЧ, различить их невозможно.
Зеркальный (мнимый) отклик (Image response): отображаемый на экране сигнал, который на самом деле отстоит на два значения ПЧ от частоты, на которую настроен анализатор. Для каждой гармоники гетеродина существует одна пара мнимых откликов: один на ПЧ ниже, другой на ПЧ выше частоты гетеродина. Обычно мнимые отклики наблюдаются только на приборах без преселекции.
Идентификация сигналов (Signal identification): процедура, активируемая вручную или автоматически, которая показывает, происходит ли конкретный отклик на дисплее анализатора спектра от той смесительной моды, на которую настроен прибор. Если процедура автоматическая, то она может либо изменить настройку анализатора, чтобы отобразить сигнал на корректной смесительной моде, либо указать частоту сигнала и предоставить пользователю выбор: игнорировать сигнал или перенастроить анализатор надлежащим образом. В случае приборов с преселекцией обычно в такой процедуре нужды не возникает.
Интермодуляционные искажения (Intermodulation distortion): нежелательные частотные составляющие, появляющиеся в результате взаимодействия двух или более спектральных компонент сигнала при его прохождении через нелинейное устройство (смеситель, усилитель). Нежелательные составляющие связаны с основными компонентами суммами и разностями основных и прочих гармоник, т.е. f1±f2, 2f1±f2, 2f2±f1, 3f1±f2 и т.д.
Квази-пиковое детектирование (Quasi-peak detector, QPD): тип детектирования, при котором выход есть функция амплитуды сигнала и частоты повторения импульсов. Квази-пиковый детектор присваивает больший вес сигналам с более высокой повторяемостью импульсов. В предельном случае, такой детектор будет выдавать такие же значения, как и детектор максимума, если измеряться будет сигнал постоянной амплитуды (непрерывный волновой сигнал).
Коэффициент шума (Noise figure): отношение, обычно в дБ, значения сигнал/шум на входе устройства (смеситель, усилитель) к значению сигнал/шум на выходе этого устройства.
Линейный масштаб дисплея (Linear display): режим дисплея, при котором вертикальное отклонение на экране прямо пропорционально напряжению входного сигнала. Нижняя граница масштабной сетки при этом соответствует 0 В, а верхняя граница, опорный уровень – какому-то ненулевому значению, которое зависит от конкретной модели анализатора. На большинстве современных анализаторов мы сами выбираем опорный уровень, и тогда коэффициент масштаба дисплея получается путем деления опорного уровня на количество делений дисплея. Хотя режим дисплея линеен, современные анализаторы спектра позволяют выводить значения опорного уровня и маркеров в дБ, дБмкВ, дБмВ и, в некоторых случаях, в вольтах и ваттах.
Логарифмический масштаб дисплея (Log display): режим дисплея, при котором вертикальное отклонение пропорционально логарифму напряжения входного сигнала. Дисплей калибруют, выбирая значение верхней границы масштабной сетки – опорного уровня – и коэффициент масштаба в дБ/деление. В анализаторах Agilent нижняя граница соответствует 0 В для масштабных коэффициентов 10 дБ/деление и больше, поэтому нижняя граница в этих случаях не калибруется. Современные анализаторы спектра позволяют выводить значения опорного уровня и маркеров в дБм, дБмкВ, дБмВ, вольтах и иногда в ваттах. В старых анализаторах выбора отображаемых единиц измерения не было, и обычно это были дБм.
Маркер (Marker): визуальный индикатор, который можно поместить в любое место отображаемой трассы. Показания маркера дают абсолютную величину частоты и амплитуды в данной точке трассы. Амплитуда указывается в выбранных единицах. Также см. Дельта-маркер (Delta marker) и Шумовой маркер (Noise marker).
Масштабный коэффициент (Scale factor): калибровка вертикальной оси дисплея в терминах «на одно деление».
Многостанционный доступ с временным разделением каналов (TDMA, Time division multiple access): способ цифровой связи, при котором несколько коммуникационных потоков разделяются по времени, что позволяет им всем одновременно использовать один частотный канал.
Многостанционный доступ с кодовым разделением (CDMA, Code division multiple access): способ цифровой связи, при котором несколько коммуникационных потоков закодированы ортогонально, что позволяет им занимать один и тот же частотный канал. Эта популярная технология широко применяется во многих мобильных системах связи.
Множественные отклики (Multiple responses): Два или более откликов на дисплее анализатора спектра от единственного входного сигнала. Множественные отклики появляются только тогда, когда перекрываются смесительные моды, и гетеродин перестраивается в достаточно широком диапазоне, так что входной сигнал смешивается на более чем одной моде. Обычно не встречаются в приборах с преселекторами.
Модуль вектора погрешности (EVM, Error vector magnitude): мера качества в системах цифровой связи. Это модуль векторной разности идеального опорного сигнала и измеряемого сигнала в заданный момент времени.
Нулевой обзор (Zero span): ситуация, при которой гетеродин анализатора спектра остается фиксировано настроенным на определенную частоту, так что анализатор становится фиксировано-настроенным приемником. Полосой приемника становится полоса разрешения (ПЧ). Вариации амплитуды сигнала отображаются в зависимости от времени. Во избежание какой-либо потери информации о сигнале, полоса разрешения должна быть столь же широкой, как и полоса сигнала. Во избежание сглаживания, видео-полоса должна быть шире полосы разрешения.
Опорный уровень (Reference level): откалиброванное вертикальное положение на дисплее, которое используется в качестве опоры для измерения амплитуд. Опорный уровень обычно располагается на верхней границе масштабной сетки дисплея.
Остаточная частотная модуляция (ЧМ) (Residual FM): собственная кратковременная нестабильность генератора при отсутствии прочих видов модуляции. В случае анализатора спектра мы обычно расширяем это понятие на ситуацию гетеродина с разверткой. Остаточная ЧМ обычно описывается величиной размаха между экстремумами, поскольку их легче всего измерить на экране, если они вообще наблюдаются.
Остаточные отклики (Residual responses): дискретные отклики, наблюдаемые на дисплее анализатора при полном отсутствии входного сигнала.
Отображаемый средний уровень шума (Displayed average noise level): уровень шума, как он виден на экране анализатора после установки достаточно узкой видео-полосы, чтобы уменьшить пиковые шумовые флуктуации до такой степени, что шум выглядит практически прямой линией. Понятие обычно относят к собственному шуму анализатора, возникающего внутри прибора, как мере чувствительности, и обычно выражают в дБм в условиях минимальной полосы разрешения и минимального входного ослабления.
Agilent. Анализаторы спектра. Словарь терминов (страница 3)
Паразитные отклики (Spurious responses) : любые неверные отклики, наблюдаемые на анализаторе спектра, источниками которых является входной сигнал. Продукты внутреннего искажения, мнимые и множественные отклики – это все примеры паразитных откликов.
Полный обзор (Full span) : для большинства современных анализаторов понятие полного обзора означает такую полосу обзора частоты, которая включает в себя весь диапазон настройки анализатора. Это относится к однополосным радиочастотным анализаторам и микроволновым анализаторам вроде приборов серий ESA и PSA, в которых используются полупроводниковые переключатели между нижним (без преселекции) и верхним (с преселекцией) диапазонами.
Замечание: у некоторых старых приборов термин «полный обзор» относился к поддиапазону частот. Например, у модели Agilent 8566B, микроволнового анализатора спектра с механическим переключением между нижним и верхним диапазонами, полным обзором именовался либо нижний поддиапазон, либо верхний поддиапазон с преселекцией.
Полоса обзора частоты (Frequency span) : диапазон частот, представленный горизонтальной осью дисплея. Обычно полоса обзора частот – это полный обзор от края до края экрана. У некоторых старых приборов обзор частоты (ширина сканирования) описывался в терминах «на одно деление».
Полоса разрешения (Resolution bandwidth) : ширина полосы разрешающего фильтра (ПЧ) анализатора спектра на некотором уровне ниже точки минимальных вносимых потерь (максимальной точки отклонения на дисплее). Для анализаторов Agilent задается полоса по уровню 3 дБ; для некоторых других приборов – полоса по уровню 6 дБ.
Полосовая избирательность (Bandwidth selectivity) : мера способности анализатора различать сигналы с неравными амплитудами. Также называется фактором формы (shape factor). Полосовая избирательность – это отношение полосы по уровню 60 дБ к полосе по уровню 3 дБ для данного разрешающего фильтра (ПЧ). В некоторых анализаторах вместо полосы по уровню 3 дБ используют полосу по уровню 6 дБ. В любом случае, полосовая избирательность – это показатель того, насколько круто поднимается и спадает «юбка» АЧХ фильтра.
Предусилитель (Preamplifier) : внешний малошумящий усилитель, который улучшает чувствительность системы «предусилитель/анализатор» по сравнению с чувствительностью при самостоятельном использовании анализатора.
Преселектор (Preselector) : перестраиваемый полосовой фильтр, предваряющий входной смеситель в анализаторе спектра, который отслеживает надлежащую моду смешения. Преселекторы обычно используются на частотах выше 2 ГГц. Они в значительной степени устраняют множественные и зеркальные (мнимые) отклики, а также в определенных условиях для некоторых сигналов могут улучшить динамический диапазон.
Просачивание гетеродина (LO feedthrough) : отклик на дисплее, когда анализатор спектра настроен на 0 Гц, т.е. когда гетеродин настроен на частоту ПЧ. Просачивание гетеродина можно использовать как маркер 0 Гц, и частотной погрешности при этом нет.
Просачивание ПЧ (IF feedthrough) : подъем отображаемой кривой основного сигнала на дисплее из-за того, что входной сигнал частоты, равной ПЧ, проходит через входной смеситель. Обычно, такая потенциальная проблема характерна только для анализаторов без преселекции. Подъем всей кривой одновременно происходит из-за того, что сигнал всегда находится на промежуточной частоте, т.е. не требуется смешения с сигналом гетеродина. Равномерность (Flatness) : см. Частотная характеристика (Frequency response).
Разрешение (Resolution) : см. Разрешение по частоте (Frequency resolution).
Растровый дисплей (Raster display) : телевизионный дисплей, в котором изображение создается благодаря электронному лучу, который падает на экран, быстро сканирует по горизонтали и медленно по вертикали, а также стробируется в нужные моменты времени. Скорость сканирования достаточно велика, чтобы создать немерцающее изображение. Также см. Векторный дисплей (Vector display) и Время развертки (Sweep time). Режим дисплейного детектирования (Display detector mode): способ, которым обрабатывается информация о сигнале, прежде чем отобразиться на дисплее. См. детектирование положительного максимума, отрицательного максимума, среднего значения и нормальное.
Режим розенфелл (Rosenfell) : режим дисплейного детектирования, при котором отображаемое в каждой точке значение зависит от того, рос ли и спадал видеосигнал в течение частотного и/или временного интервала, представляемого этой точкой. Если сигнал только рос или только спадал, отображается максимальное его значение. Если сигнал и рос и спадал, то максимальное значение из интервала отображается в нечетной дисплейной точке, а минимальное – в четной. Для предотвращения потери информации о сигнале, который проявляется только в четных интервалах, максимальное значение в этом интервале также запоминается, а в следующем (нечетном) интервале отображается наибольшее из двух максимальных значений: либо запомненное из предыдущего интервала, либо максимальное из текущего.
Режим смешения (Смесительная мода) (Mixing mode) : описание конкретных условий, при которых возникает определенный отклик на анализаторе спектра. Мода смешения, например, 1+, обозначает гармонику гетеродина, которая используется для процесса смешения, и тот факт, что входной сигнал лежит выше (+) или ниже (-) этой гармоники.
Сигнал опорной амплитуды (Amplitude reference signal) : сигнал с прецизионной амплитудой и частотой, используемый анализатором для автокалибровки.
Спектр (Spectrum) : набор синусоидальных волн различных частот и амплитуд, с корректными фазовыми соотношениями, которые в совокупности своей составляют конкретный сигнал временной области.
Спектральная составляющая (компонента) (Spectral component) : одна из синусоидальных волн, составляющих спектр сигнала.
Средний уровень шума (Average noise level) : см. Средний отображаемый уровень шума (Displayed average noise level).
Стабильность частоты (Frequency stability) : общее понятие, включающее в себя кратковременную и долговременную нестабильность гетеродина. Напряжение развертки, управляющее гетеродином, определяет место отображения сигнала на дисплее. Любая долговременная вариация частоты гетеродина (дрейф) относительно напряжения развертки, заставляет сигнал медленно смещаться по горизонтали на дисплее. Кратковременная нестабильность гетеродина может проявиться как случайная фазовая модуляция или фазовый шум сигнала, стабильного при иных условиях.
Точность полосы обзора (Span accuracy) : погрешность отображаемой величины разности частот между двумя любыми сигналами на дисплее.
Усиление/ослабление ПЧ (IF gain/attenuation) : подстройка вертикального положения сигнала на экране без изменения уровня сигнала на входном смесителе. При подстройке уровень опорного сигнала изменяется соответственно.
Фазовый шум* (Phase noise) : см. Шумовые боковые полосы (Noise sidebands).
Фактор формы (Shape factor) : см. Полосовая избирательность (Bandwidth selectivity).
Цифровая ПЧ (Digital IF) : архитектура современных анализаторов спектра, в которой сигнал оцифровывается почти сразу после преобразования с понижением частоты от радиочастоты до промежуточной частоты (ПЧ). Начиная с этой точки, вся последующая обработка сигнала осуществляется методами цифровой обработки сигналов.
Цифровой дисплей (Digital display) : технология, при которой оцифрованная информация о трассе, хранящаяся в памяти прибора, отображается на экране. Отображаемая трасса при этом – последовательность точек, организованных так, чтобы изображать непрерывную кривую. И хотя количество точек по умолчанию у разных моделей анализаторов различно, большинство современных приборов дают возможность пользователю выбирать желаемое разрешение экрана путем выбора количества отображаемых точек. Дисплей обновляется (заново считывает данные из памяти) в режиме без мерцания; данные в памяти обновляются со скоростью развертки. Практически все сегодняшние анализаторы оборудованы плоскими ЖК-дисплеями, а не аналоговыми ЭЛТ-экранами, которые использовались в старых приборах.
Частотная точность (Frequency accuracy) : погрешность, с которой отображается частота сигнала или его спектральной составляющей, либо в абсолютном смысле, либо относительно другого сигнала или спектральной компоненты. Спецификации для абсолютной и относительной частотной точности даются отдельно.
Частотная характеристика (Frequency response) : вариации отображаемой амплитуды сигнала в зависимости от частоты (равномерность). Обычно выражается в ± дБ относительно среднего значения между экстремумами. Также может выражаться относительно сигнала калибратора.
Частотное разрешение (Frequency resolution) : способность анализатора различать близко расположенные по частоте спектральные компоненты и раздельно отображать их на экране. Разрешение компонент с одинаковой амплитудой описывается полосой разрешения. Способность разрешать компоненты, не равные по амплитуде, характеризуется и полосой разрешения, и полосовой избирательностью.
Частотный диапазон (Frequency range) : минимальная и максимальная частоты, между которыми может перестраиваться анализатор. И хотя обычно максимальная частота ограничивается коаксиальным входом анализатора, многие микроволновые приборы могут расширять свой диапазон при помощи использования внешних подключаемых смесителей.
Чистота спектра* (Spectral purity) : см. Шумовые боковые полосы (Noise sidebands).
Чувствительность (Sensitivity) : уровень минимального синусоидального сигнала**, который можно наблюдать на анализаторе спектра, обычно при оптимизированных условиях – минимальной полосе разрешения, нулевом радиочастотном ослаблении на входе и минимальной видео-полосе. Компания Agilent определяет чувствительность как отображаемый средний уровень шума. Синусоида такого уровня должна быть на 2 дБ выше отображаемого шума.
Шумовой маркер (Noise marker) : маркер, значение которого показывает уровень шума в полосе 1 Гц спектральной плотности мощности шума. При выборе шумового маркера включается режим детектирования среднего значения, значения некоторого количества последовательных точек трассы (количество зависит от конкретной модели прибора) около маркера усредняются, и эта усредненная величина нормализуется к эквивалентному значению в полосе 1 Гц спектральной плотности мощности шума. При нормализации учитываются режим детектирования, полоса, а также воздействие логарифмического усилителя, если выбран логарифмический режим дисплея.
Шумовые боковые полосы (Noise sidebands) : модуляционные боковые полосы, которые обозначают кратковременную нестабильность гетеродина (главным образом, первого гетеродина) анализатора спектра. Модулирующий сигнал – это шум в самой цепи гетеродина и/или цепи стабилизации гетеродина, а боковые полосы являются спектром этого шума. Процесс смешения переносит любую нестабильность гетеродина на продукты смешения, так что боковые полосы появляются у любой спектральной составляющей, достаточно высоко отстоящей от широкополосного уровня шума. Поскольку боковые полосы – это шум, их уровень относительно спектральной составляющей зависит от полосы разрешения. Шумовые боковые обычно описывают в терминах дБн/Гц (мощность в полосе 1 Гц относительно несущей) на заданной отстройке от несущей, где несущая – это наблюдаемая на экране спектральная составляющая.
Что такое zero span на спектроанализаторе
Спектроанализатор – прибор для измерения и отображения спектра сигнала – распределения энергии сигнала по частотам. В этой статье рассматриваются основные виды анализаторов спектра и иллюстрируется их применение для редактирования и реставрации звука. Особое внимание уделяется современным анализаторам, основанным на FFT – быстром преобразовании Фурье.
Зачем анализировать спектр?
Традиционно в цифровой звукозаписи аудиодорожка представляется в виде осциллограммы, отображающей форму звуковой волны (waveform), то есть зависимость амплитуды звука от времени. Такое представление достаточно наглядно для опытного звукорежиссёра: осциллограмма позволяет увидеть основные события в звуке, такие как изменения громкости, паузы между частями произведения и зачастую даже отдельные ноты в сольной записи инструмента. Но одновременное звучание нескольких инструментов на осциллограмме «смешивается» и визуальный анализ сигнала становится затруднительным. Тем не менее, наше ухо без труда различает отдельные инструменты в небольшом ансамбле. Как же это происходит?
Когда сложное звуковое колебание попадает на барабанную перепонку уха, оно с помощью серии слуховых косточек передаётся на орган, называемый улиткой. Улитка представляет собой закрученную в спираль эластичную трубочку. Толщина и жёсткость улитки плавно меняются от края к центру спирали. Когда сложное колебание поступает на край улитки, это вызывает ответные колебания разных частей улитки. При этом резонансная частота у каждой части улитки своя. Таким образом улитка раскладывает сложное звуковое колебание на отдельные частотные составляющие. К каждой части улитки подходят отдельные группы слуховых нервов, передающие информацию о колебаниях улитки в головной мозг (более подробно о слуховом восприятии можно прочитать в статье «Основы психоакустики» И. Алдошиной в журнале «Звукорежиссер» №6, 1999). В результате в мозг поступает информация о звуке, уже разложенная по частотам, и человек легко отличает высокие звуки от низких. Кроме того, как мы вскоре увидим, разложение звука на частоты помогает различить отдельные инструменты в полифонической записи, что значительно расширяет возможности редактирования.
Полосовые спектроанализаторы
Первые звуковые анализаторы спектра разделяли сигнал на частотные полосы с помощью набора аналоговых фильтров. Дисплей такого анализатора (рис. 1) показывает уровень сигнала во множестве частотных полос, соответствующих фильтрам.
На рис. 2 приведён пример частотных характеристик полосовых фильтров в анализаторе, удовлетворяющем стандарту ГОСТ 17168-82. Такой анализатор называется третьоктавным, так как в каждой октаве частотного диапазона имеется три полосы. Видно, что частотные характеристики полосовых фильтров перекрываются; их крутизна зависит от порядка используемых фильтров.
Важным свойством спектроанализатора является баллистика – инерционность измерителей уровня в частотных полосах. Она может регулироваться заданием скорости нарастания (атаки) и спада уровня. Типичное время атаки и спада в таком анализаторе – порядка 200 и 1500 мс.
Полосовые спектроанализаторы часто применяются для настройки АЧХ (амплитудно-частотной характеристики) акустических систем на концертных площадках. Если на вход такому анализатору подать розовый шум (имеющий одинаковую мощность в каждой октаве), то дисплей покажет горизонтальную линию, с возможной поправкой на вариацию шума во времени. Если розовый шум, проходя через звукоусилительную систему зала, исказился, то изменения его спектра будут видны на анализаторе. При этом анализатор, как и наше ухо, будет малочувствителен к узким провалам АЧХ (менее 1/3 октавы).
Преобразование Фурье
Преобразование Фурье – это математический аппарат для разложения сигналов на синусоидальные колебания. Например, если сигнал x(t) непрерывный и бесконечный по времени, то его можно представить в виде интеграла Фурье:
Интеграл Фурье собирает сигнал x(t) из бесконечного множества синусоидальных составляющих всевозможных частот ω, имеющих амплитуды Xω и фазы φω.
На практике нас больше интересует анализ конечных по времени звуков. Поскольку музыка не является статичным сигналом, её спектр меняется во времени. Поэтому при спектральном анализе нас обычно интересуют отдельные короткие фрагменты сигнала. Для анализа таких фрагментов цифрового аудиосигнала существует дискретное преобразование Фурье:
Здесь N отсчётов дискретного сигнала x(n) на интервале времени от 0 до N–1 синтезируются как сумма конечного числа синусоидальных колебаний с амплитудами Xk и фазами φk. Частоты этих синусоид равны kF/N, где F – частота дискретизации сигнала, а N – число отсчётов исходного сигнала x(n) на анализируемом интервале. Набор коэффициентов Xk называется амплитудным спектром сигнала. Как видно из формулы, частоты синусоид, на которые раскладывается сигнал, равномерно распределены от 0 (постоянная составляющая) до F/2 – максимально возможной частоты в цифровом сигнале. Такое линейное расположение частот отличается от распределения полос третьоктавного анализатора.
FFT-анализаторы
FFT (fast Fourier transform) – алгоритм быстрого вычисления дискретного преобразования Фурье. Благодаря ему стало возможным анализировать спектр звуковых сигналов в реальном времени.
Рассмотрим работу типичного FFT-анализатора. На вход ему поступает цифровой аудиосигнал. Анализатор выбирает из сигнала последовательные интервалы («окна»), на которых будет вычисляться спектр, и считает FFT в каждом окне для получения амплитудного спектра Xk. Вычисленный спектр отображается в виде графика зависимости амплитуды от частоты (рис. 3). Аналогично полосовым анализаторам, обычно используется логарифмический масштаб по осям частот и амплитуд. Но из-за линейного расположения полос FFT по частоте спектр может выглядеть недостаточно детальным на нижних частотах или излишне осциллирующим на верхних частотах.
Если рассматривать FFT как набор фильтров, то, в отличие от полосовых фильтров третьоктавного анализатора, фильтры FFT будут иметь одинаковую ширину в герцах, а не в октавах. Поэтому розовый шум на FFT-анализаторе будет уже не горизонтальной линией, а наклонной, со спадом 3 дБ/окт. Горизонтальной линией на FFT-анализаторе будет белый шум – он содержит равную энергию в равных линейных частотных интервалах.
Параметр N – число анализируемых отсчётов сигнала – имеет решающее значение для вида спектра. Чем больше N, тем плотнее сетка частот, по которым FFT раскладывает сигнал, и тем больше деталей по частоте видно на спектре. Для достижения более высокого частотного разрешения приходится анализировать более длинные участки сигнала. Если сигнал в пределах окна FFT меняет свои свойства, то спектр будет отображать некоторую усреднённую информацию о сигнале со всего интервала окна.
Когда нужно проанализировать быстрые изменения в сигнале, длину окна N выбирают маленькой. В этом случае разрешение анализа по времени увеличивается, а по частоте – уменьшается. Таким образом, разрешение анализа по частоте обратно пропорционально разрешению по времени. Этот факт называется соотношением неопределённостей.
Весовые окна
Если частота тона совпадает с одной из частот сетки FFT, то спектр будет выглядеть «идеально»: единственный острый пик укажет на частоту и амплитуду тона (рис. 4, белый график).
Если же частота тона не совпадает ни с одной из частот сетки FFT, то FFT «соберёт» тон из имеющихся в сетке частот, скомбинированных с различными весами. График спектра при этом размывается по частоте (рис. 4, зелёный график). Такое размытие обычно нежелательно, так как оно может закрыть собой более слабые звуки на соседних частотах. Можно также заметить, что амплитуда максимума зелёного графика ниже реальной амплитуды анализируемого тона. Это связано с тем, что мощность анализируемого тона равна сумме мощностей коэффициентов спектра, из которых этот тон составлен.
(наведите мышь для выбора изображения)
Чтобы уменьшить эффект размытия спектра, сигнал перед вычислением FFT умножается на весовые окна – гладкие функции, похожие на гауссиан, спадающие к краям интервала. Они уменьшают размытие спектра за счёт некоторого ухудшения частотного разрешения. Если рассматривать FFT как набор полосовых фильтров, то весовые окна регулируют взаимное проникновение частотных полос.
Простейшее окно – прямоугольное: это константа 1, не меняющая сигнала. Оно эквивалентно отсутствию весового окна. Одно из популярных окон – окно Хэмминга. Оно уменьшает уровень размытия спектра примерно на 40 дБ относительно главного пика.
Весовые окна различаются по двум основным параметрам: степени расширения главного пика и степени подавления размытия спектра («боковых лепестков»). Чем сильнее мы хотим подавить боковые лепестки, тем шире будет основной пик. Прямоугольное окно меньше всего размывает верхушку пика, но имеет самые высокие боковые лепестки. Окно Кайзера обладает параметром, который позволяет выбирать нужную степень подавления боковых лепестков.
Другой популярный выбор – окно Хана. Оно подавляет максимальный боковой лепесток слабее, чем окно Хэмминга, но зато остальные боковые лепестки быстрее спадают при удалении от главного пика. Окно Блэкмана обладает более сильным подавлением боковых лепестков, чем окно Хана.
Для большинства задач не очень важно, какой именно вид весового окна использовать. Главное, чтобы оно было. Популярный выбор – Хан или Блэкман. Использование весового окна уменьшает зависимость формы спектра от конкретной частоты сигнала и от её совпадения с сеткой частот FFT.
Рисунок 4 сделан для синусоид, однако, исходя из него, нетрудно представить, как будет выглядеть спектр реальных звуковых сигналов. Каждый пик в спектре будет иметь некоторую размытую форму, в зависимости от своей частоты и выбранного весового окна.
Чтобы компенсировать расширение пиков при применении весовых окон, можно использовать более длинные окна FFT: например, не 4096, а 8192 отсчета. Это улучшит разрешение анализа по частоте, но ухудшит по времени.
Спектрограмма
Часто возникает необходимость проследить, как спектр сигнала меняется во времени. FFT-анализаторы помогают сделать это в реальном времени при воспроизведении сигнала. Однако в ряде случаев оказывается удобна визуализация изменения спектра во всём звуковом отрывке сразу. Такое представление сигнала называется спектрограммой. Для её построения применяется оконное преобразование Фурье: спектр вычисляется от последовательных окон сигнала (рис. 5), и каждый из этих спектров образует столбец в спектрограмме.
По горизонтальной оси спектрограммы откладывается время, по вертикальной – частота, а амплитуда отображается яркостью или цветом. На спектрограмме гитарной ноты на рис. 6 видно развитие звучания: оно начинается с резкой атаки и продолжается в виде гармоник, кратных по частоте основному тону 440 Гц. Видно, что верхние гармоники имеют меньшую амплитуду и затухают быстрее, чем нижние. Также на спектрограмме прослеживается шум записи – равномерный фон тёмно-синего цвета. Справа показана шкала соответствия цветов и уровней сигнала (в децибелах ниже нуля).
(наведите мышь для выбора изображения)
Если менять размер окна FFT, становится хорошо видно, как меняется частотное и временное разрешение спектрограммы. При увеличении окна гармоники становятся тоньше, и их частота может быть определена более точно. Однако размывается во времени момент атаки (в левой части спектрограммы). При уменьшении размера окна наблюдается обратный эффект.
Особенно полезна спектрограмма при анализе быстро меняющихся сигналов. На рис. 7 показана спектрограмма вокального пассажа с вибрато. По ней легко определить такие характеристики голоса, как частота и глубина вибрато, его форма и ровность, наличие певческой форманты. По изменению высоты основного тона и гармоник прослеживается исполняемая мелодия.
(наведите мышь для выбора изображения)
Применения спектрограммы
Современные средства реставрации звука, такие как программа iZotope RX, активно используют спектрограмму для редактирования отдельных частотно-временных областей в сигнале. С помощью этой техники можно найти и подавить такие нежелательные призвуки, как звонок мобильного телефона во время важной записи, скрип стула пианиста, кашель в зрительном зале и т.п.
Проиллюстрируем использование спектрограммы для удаления свиста поклонников из концертной записи.
На рис. 8 свист легко находится: это светлая кривая линия в районе 3 кГц. Если бы частота свиста была постоянной, то его можно было бы подавить с помощью режекторного фильтра. Однако в нашем случае частота меняется. Для выделения свиста на спектрограмме удобно воспользоваться инструментом «волшебная палочка» из программы iZotope RX II. Одно нажатие приводит к выделению основного тона свиста, повторное нажатие выделяет гармоники. После этого свист можно удалить, просто нажав на клавишу Del. Однако более аккуратный способ – воспользоваться модулем Spectral Repair: это позволит избежать «дыр» в спектре после удаления свиста. После применения этого модуля в режиме ослабления с вертикальной интерполяцией (Attenuate vertically) свист практически полностью исчезает из записи: как визуально, так и на слух.
Еще одно полезное применение спектрограммы – анализ присутствия в записи следов компрессии MP3 или других кодеков с потерями. У большинства записей оригинального (несжатого) качества частотный диапазон простирается до 20 кГц и выше; при этом энергия сигнала плавно спадает с ростом частоты (как на рис. 6, 7). В результате психоакустической компрессии верхние частоты сигнала квантуются сильнее нижних, и верхняя граница спектра сигнала обнуляется (как на рис. 8). При этом частота среза зависит от содержания кодируемого сигнала и от битрейта кодера. Ясно, что кодер стремится обнулять только те частоты в сигнале, которые в данный момент не слышны (замаскированы). Поэтому частота среза, как правило, меняется во времени, что образует на спектрограмме характерную «бахрому» с островками энергии на тёмном фоне.
Спектрограмма часто позволяет найти в записи дефекты, которые неочевидны при прослушивании, но могут сказаться при последующей обработке. Например, паразитная наводка от ЭЛТ-видеомонитора на частоте 15–16 кГц может ускользнуть от уха пожилого звукорежиссёра. Однако спектрограмма ясно покажет её в виде горизонтальной линии (рис. 9) и позволит уточнить частоту для настройки режекторного фильтра.
Аналогичная ситуация иногда возникает и с низкочастотными помехами, такими как задувание ветра в микрофон или постоянная составляющая (смещение по постоянному току, DC offset). Они могут располагаться на инфранизких частотах и не обнаруживать себя без помощи спектроанализатора или осциллографа.
Заключение
Среди опытных звукорежиссёров старой школы распространено мнение, что анализировать и редактировать сигналы следует исключительно на слух, не полагаясь на индикаторы и анализаторы. Разумеется, анализаторы – не панацея в случае отсутствия слуха. Вряд ли кто-то серьёзно воспринимает идею сведения композиции «по приборам».
Не отрицая важности критического прослушивания звука на каждой стадии редактирования, мы всё же предлагаем использовать анализаторы спектра в тех задачах, где это может привести к более точным результатам. Конечно, можно определить на слух паразитный тон на частоте 15 кГц и подобрать режекторный фильтр подходящей добротности для его удаления. Но намного проще увидеть этот тон на спектроанализаторе и сразу более точно оценить его свойства: «плывёт» ли частота, есть ли боковые пики. В конечном счёте, это позволит более аккуратно удалить помеху. Аналогичная ситуация и со многими другими задачами редактирования, особенно – в реставрации звука.
Спектр и спектрограмма – способы представления звука, более близкие к слуховому восприятию, нежели осциллограмма. Надеюсь, что эта статья откроет новые возможности в анализе и редактировании звука для тех, кто ранее с этими представлениями не работал.