Как убрать вокал в izotope rx7
Как достать чистую акапеллу из трека в несколько кликов (iZotope RX)
Всем привет, сегодня мы поговорим о том, как из практически любого трека вытащить акапеллу. Сразу скажу, что это будет не студийное качество, но при хорошем желании можно немножко «поиздеваться» с обработкой и получить что-то более- менее «слушабельное».
Итак, что нам понадобится:
1. Standalone версия iZotope RX Advanced
2. Трек, из которого нам нужна акапелла
3. Внимательность и терпение, поехали…
Открываем «iZotope RX», нас встречает такое окно:
Следующий шаг – это открыть нужный нам трек, над которым мы будем «издеваться». Жмем на «Open File» или же просто переносим нужный материал в окошко «Drag & Drop»
Для себя в качестве объекта я выбрал трек от Gareth Emery & Annabel – «You’ll Be OK».
После открытия трека, нас встречает вот такая картина:
Теперь нам нужно зайти в пункт «Music Rebalance», находится он справа в окне модулей
Находим, жмем на «Music Rebalance», и нас встречает меню данного модуля
Я кратко опишу пункты данного окна и не буду углубляться в детали, так как нам от этого модуля на данный момент нужен только один пункт – это «Voice». Итак,
Приступим к редактированию.
Нажимаем на «Preview», тем самым запускаем прослушивание трека
Далее, убираем ручки громкости «Bass»/ «Percussion»/ «Other» в положение «-Inf.», иначе говоря просто полностью уменьшаем громкость сигнала.
Теперь перейдем к самому важному, к регулятору «Voice»
Здесь нам потребуется только ручка «Sensitivity», с помощью данного параметра настройте более подходящий по звуку сигнал, да искажения будут – это факт. Но иначе если достать акапеллу попросту негде и ее нет в свободном доступе, вариантов у нас нет.
После настройки нажимаем на опцию «Render»
И ожидаем пока алгоритм полностью избавится от звуков, которые нам не пригодились
Далее, наблюдаем такую картину
На рисунке видно, что остались участки только с акапеллой, все лишние звуки насколько это возможно удалены. А мы получили такой результат:
Осталось только сохранить отредактированный материал, для этого выполняем следующие действия: нажимаем «File — Export» или просто комбинацию клавиш «Ctrl + E», открывается окно экспорта, где мы можем выбрать «Формат»/ «Битрейт»/ и прочие настройки вплоть до «Нормализации» и «Лимитинга» экспортированного файла, далее нажимаем «OK» — «Выбираем папку сохранения» и нажимаем на «Сохранить»
Вот и всё, чем я сегодня хотел с Вами поделиться, надеюсь способ был максимально понятный и краткий.
С Вами был Nelson Norman, увидимся.
iZotope RX 8 — краткий обзор основных функций
Немного истории об iZotope RX.
Изначально iZotope RX изначально позиционировался, как инструмент реставрации звука. В 2007 году была была выпущено первое приложение под название RX, а до того разработчики работали над созданием плагинов для подавления шума.
Но после того, как стало понятно, что нужно иметь визуальное представление работы, появились разработки программной среды. Основу RX представляет спектрограмма, очень гибкая, прописывающаяся со множеством настроек.
В 2007 году ещё нельзя было сказать, что iZotope RX — это программа флагман в области реставрации и анализа звука. Но сегодня, глядя на rx 8 я бы сказал, что это уже полноценная Daw для редактирования аудио и обработки. Сегодня iZotope RX напоминает Adobe Audition в редакторе Edit или Sound Forge.
Это, по сути, однодорожечный аудиоредактор, но с расширенными возможностями реставрации и обработки звука. В нем нет мультитрека и вряд ли это нужно, хотя может быть разработчики пойдут по этому пути.
Но, что касается работы со звуком, с его спектром, то RX — идёт впереди всех.
В RX 8 очень огромное обилие встроенных алгоритмов для работы со звуком. iZotope RX 8 позволит вам буквально, за несколько кликов улучшить качество звука, чтобы это ни было:
Да rx по-прежнему работает, как дополнение к другим daw через плагины, но все же это уже самостоятельная программа и при чем давно. Это своего рода фотошоп для звука.
Что может делать iZotope RX?
Согласитесь, что это очень крутые возможности. Ещё лет 15 назад такое и представить было сложно, что звук можно редактировать так визуально.
Из этого примера видно, что анализ звука — занятие не только звукорежиссёров!
Итак, RX8 создан для борьбы с самыми распространёнными недостатками звукового сигнала, но сегодня выглядит, как самостоятельная Daw для работы со звуком.
Вот какими модулями снабжён iZotope RX8:
Ух! Очень огромный списочек. Rx — очень мощная программа для работы со звуком. По каждому плагину можно писать отдельную статью.
Реставрационная обработка голоса в iZotope RX
Голос – это то, что чаще всего звучит в наших записях, будь то записи лекции учёного мужа или песни популярного (или не очень) исполнителя. Наше ухо особенно чутко именно к этому инструменту передачи информации: музыкальной, эмоциональной, бытовой, философской – да практически какой угодно. И чем естественнее звучит голос в записи – тем легче нам его воспринимать.
Так как звукозаписывающая аппаратура имеет дело не только со звуковыми волнами из нашего голосового аппарата, но и с потоком воздуха, который из этого же аппарата и выходит (ибо если он через голосовой аппарат не проходит, то нет и голоса), то ей свойственно улавливать не только звук голоса, но и звук от столкновения воздушной струи с аппаратурой. Именно этим вызваны основные проблемы записи голоса, и хотя они решаются различного рода фильтрами на этапе записи, всё же часто требуется и дополнительное исправление при обработке звука.
Исправлению типичных дефектов записи голоса и посвящены фильтры программы iZotope RX, о которых мы сегодня поговорим.
Breath Control: контролируем дыхание
Наверняка многим знакома ситуация, когда на дорожке с вокалом или речью записалось слишком много шума от вдыхаемого и выдыхаемого воздуха. Ослабить артефакты подобного рода и призван фильтр Breath Control.
У этого фильтра есть два режима функционирования: «силовой» (gain) и «целевой» (target). Переключаются они выбором соответствующего флажка слева, и соответствующим образом меняется и левый ползунок, показывающий либо уровень (level) силы подавления (в децибелах), либо целевой уровень дыхания (в децибелах по полной шкале).
Работая в силовом режиме, фильтр ослабляет любой «дыхательный» шум на одно и то же число децибел. Такой режим работы полезен, когда надо быстро ослабить шумное дыхание. Однако у него есть побочный эффект: на то же число децибел ослабляются и совсем слабые вздохи, которые можно было бы и не трогать, и которые, не нарушая целостности восприятия голоса, придают его звучанию большую естественность.
Для предотвращения подобных явлений и предназначен «целевой» режим, который трогает шум дыхания тем меньше, чем он тише.
Правый ползунок – Sensitivity (чувствительность) отвечает за то, что программа посчитает шумом дыхания и в конечном итоге попытается ослабить. Чем выше чувствительность, тем более дотошно работает программа, но тем выше и вероятность ложного срабатывания.
Флажок Output breath only (выводить только дыхание) позволяет проконтролировать чувствительность фильтра и убедиться, что он не уберёт ничего лишнего.
Приводим в порядок согласные звуки: de-ess
Пожалуй, de-ess – один из немногих фильтров, название которого можно не переводить: это фильтр, направленный против избытка звука [с]. И не только его одного: ведь для звукозаписывающего оборудования проблемны все шипящие и свистящие звуки, порождающие мощную струю воздуха.
Фильтры такого типа имеют весьма почтенную историю. Классический фильтр работал по следующему принципу: находил по характерным высоким частотам шипящие и свистящие звуки и ослаблял общую громкость всего звука на момент их звучания. Именно так работают многие «де-эссеры» по сей день, в том числе цифровые.
Однако со временем появились и более сложные алгоритмы, что мы и можем наблюдать в фильтре de-ess iZotope RX (рис. 2).
В интерфейсе фильтра присутствует возможность выбора алгоритма (algorithm): классический (classic) и спектральный (spectral). Как нетрудно догадаться, классический алгоритм работает по принципу, описанному выше, в то время как спектральный, в свою очередь, понижает громкость лишь на определённых частотах, не затрагивая всё, что ниже этих частот, а также не затрагивая фоновые шумы.
Применение более сложного алгоритма расширило возможности фильтра, и если мы заглянем в список шаблонов обработки, предложенных разработчиками (раскрывающийся список в самом верху окна обработки), то мы увидим, что одним голосом дело не ограничивается: фильтр, соответствующим образом настроенный, также предполагается использовать для обработки акустической гитары и барабанов.
Посмотрим, какие настройки доступны в этом фильтре.
Порог срабатывания (threshold) определяет уровень сигнала, с которого фильтр начинает компрессию шипяще-свистящих звуков. Уровень сигнала может быть определяем как относительно (relative), так и абсолютно (absolute). В первом случае порог срабатывания будет подстраиваться под общий уровень сигнала в каждый момент времени, во втором – ориентироваться на постоянное значение. Переключениями между этими двумя режимами достигается нажатием или снятием флажка Absolute под ползунком порога срабатывания. По умолчанию флажок снят – действует относительный режим.
Частота среза (Cutoff frequency) определяет нижнюю границу работы фильтра. Всё, что ниже определённой частоты, указанной в герцах, не будет затронуто фильтром. Таким образом мы можем защитить гласные звуки голоса от избыточного редактирования.
Скорость (speed) – высокая (fast) и низкая (slow). Отвечает не за быстроту алгоритма работы фильтра, как можно было бы подумать, а за быстроту атаки и релиза фильтра – то есть за скорость его включения и выключения при реакции на сигнал, нуждающийся в обработке. Эта скорость реакции у фильтров компрессионного типа (в том числе у де-эссера), как правило, не мгновенна.
Выбирается оптимальная скорость на слух. Общее правило тут такое: если фильтр избыточно сглаживает резкие звуки транзиентов, вероятно, он реагирует слишком быстро, и скорость атаки/релиза необходимо снизить. Если же высокие частоты стали звучать слишком тихо, значит, они не успевают восстановиться до нужного уровня после срабатывания фильтра в медленном режиме, и следует увеличить скорость фильтра.
Настройки здесь, как видим, не очень гибкие: есть возможность выбора только между двумя вариантами. Поэтому слушаем, сравниваем и выбираем лучшее для каждого случая звучание.
Ещё два интересных параметра регулируются чуть ниже.
Первый из них – это воссоздание спектра (spectral shaping). При 0 % все шипяще-свистящие звуки остаются такими же, как были, только становятся тише. Но в некоторых случаях само по себе их качество в оригинальной записи оставляет желать лучшего, и тогда можно воссоздать их с помощью этой функции. Наилучшее количество подмешиваемого воссозданного сигнала определяем на слух.
Можно управлять не только количеством воссозданного сигнала, но и его характером. За это отвечает движок «наклон спектра» (spectral tilt). Искусственно сгенерированные шипяще-свистящие звуки создаются на основе шума с определённой амплитудно-частотной характеристикой. Так, белый шум (white) представляет из себя шум, равномерно распределённый по всем частотам, в то время как розовый (pink) и, в ещё большей степени, коричневый (brown) шум убывают к высоким частотам и возрастают к низким. На слух коричневый и розовый шумы воспринимаются как более «тёплые», чем белый.
По умолчанию генерируемый шум близок к розовому, но можно, в зависимости от желаемого характера звучания, делать его звучание как «теплее», так и «холодней».
ога срабатывания. По умолчанию флажок снят – действует относительный режим.
Частота среза (Cutoff frequency) определяет нижнюю границу работы фильтра. Всё, что ниже определённой частоты, указанной в герцах, не будет затронуто фильтром. Таким образом мы можем защитить гласные звуки голоса от избыточного редактирования.
Скорость (speed) – высокая (fast) и низкая (slow). Отвечает не за быстроту алгоритма работы фильтра, как можно было бы подумать, а за быстроту атаки и релиза фильтра – то есть за скорость его включения и выключения при реакции на сигнал, нуждающийся в обработке. Эта скорость реакции у фильтров компрессионного типа (в том числе у де-эссера), как правило, не мгновенна.
Выбирается оптимальная скорость на слух. Общее правило тут такое: если фильтр избыточно сглаживает резкие звуки транзиентов, вероятно, он реагирует слишком быстро, и скорость атаки/релиза необходимо снизить. Если же высокие частоты стали звучать слишком тихо, значит, они не успевают восстановиться до нужного уровня после срабатывания фильтра в медленном режиме, и следует увеличить скорость фильтра.
Настройки здесь, как видим, не очень гибкие: есть возможность выбора только между двумя вариантами. Поэтому слушаем, сравниваем и выбираем лучшее для каждого случая звучание.
Ещё два интересных параметра регулируются чуть ниже.
Первый из них – это воссоздание спектра (spectral shaping). При 0 % все шипяще-свистящие звуки остаются такими же, как были, только становятся тише. Но в некоторых случаях само по себе их качество в оригинальной записи оставляет желать лучшего, и тогда можно воссоздать их с помощью этой функции. Наилучшее количество подмешиваемого воссозданного сигнала определяем на слух.
Можно управлять не только количеством воссозданного сигнала, но и его характером. За это отвечает движок «наклон спектра» (spectral tilt). Искусственно сгенерированные шипяще-свистящие звуки создаются на основе шума с определённой амплитудно-частотной характеристикой. Так, белый шум (white) представляет из себя шум, равномерно распределённый по всем частотам, в то время как розовый (pink) и, в ещё большей степени, коричневый (brown) шум убывают к высоким частотам и возрастают к низким. На слух коричневый и розовый шумы воспринимаются как более «тёплые», чем белый.
По умолчанию генерируемый шум близок к розовому, но можно, в зависимости от желаемого характера звучания, делать его звучание как «теплее», так и «холодней».
Ослабляем «взрывные» звуки речи: de-plosive
«Взрывные» звуки при записи речи или вокала – это, по сути, тот же шум ветра, задувающего в микрофон (см. предыдущую статью), только кратковременный.
Логика работы этого фильтра, соответственно, похожа на логику работы фильтра de-wind. Разница в том, что этот фильтр заточен именно под голос.
Параметров регулировки здесь немного: это чувствительность фильтра к взрывным звукам (Sensitivity), сила их подавления (Strength) и порог частоты (Frequency limit), выше которой фильтр не будет влиять на сигнал.
Важное замечание по работе фильтра от разработчиков: на корректность его работы может влиять эквализация низких частот. Поэтому ослаблять низкие частоты в сигнале рекомендуется уже после применения фильтра de-plosive.
Определить оптимальную пороговую частоту можно по спектрограмме сигнала: яркие вертикальные всплески (более яркие, чем сигнал, на фоне которого они происходят) в нижней части спектра.
Лишние звуки артикуляции: слюни, шлепки губ. Фильтр MouthDe-click
Наконец, среди звуков, не украшающих записи голоса, можно выделить звуки, связанные с артикуляцией самого человека. Эти звуки чувствительная техника также нередко улавливает при записи в избыточном количестве.
Для таких чавкающих, шлёпающих, хлюпающих артефактов есть свой фильтр под названием Mouth De-click (то есть устранение «щелчков» ротового аппарата). На рисунке 4 мы можем видеть его интерфейс.
Чувствительность фильтра (Sensitivity) отвечает за область его работы: какой сигнал фильтр распознает как нежелательный и требующий ослабления, а какой оставит в покое.
Frequency skew (то есть фильтр по частоте) позволяет сфокусироваться на более низких или, напротив, на более высоких частотах.
Наконец, Click widening (расширение области щелчка) может быть полезно для таких звуков, которые не прекращаются сразу же после «щелчка» в них (например, шлепки губ).
В некоторых случаях, как указывают разработчики, фильтр оптимальным образом срабатывает при двукратном применении: первый раз он удаляет сильные артефакты, второй — более слабые, бывшие ранее замаскированными более сильными.
Ослабление искажений звука в iZotope RX
В прошлый раз мы обещали рассказать о том, что делать, если помехи проникли в сам основной сигнал. Такое случается не так уж редко.
В цифровую эпоху наиболее частая причина подобных помех — это «перегруз», он же клиппинг. Звуковой волне тесно в пространстве, модулируемом цифровым способом, она вырывается за пределы этого диапазона. Как следствие — резкая потеря вершин звуковой волны со всей информацией, которая была около вершины. Звук с такими потерями начинает звучать искажённо.
Не лучше ситуация с аналоговыми носителями. Слишком громкий звук также способствует искажениям (возможно, вы слышали, как плохо звучат на пластинках советского производства шипящие и свистящие звуки человеческой речи ближе к концу дорожки). И, конечно же, переписанные несколько раз магнитные плёнки… здесь искажения звука словно врастают в самую его плоть, так что, кажется, становятся с ним неразрывным целым…
Впрочем, неразрывным ли? С этим и попробуем сейчас разобраться.
De-clip: устранение цифрового перегруза
Поскольку работа с изначально цифровым звуком сегодня более распространена, то и начнём мы с наиболее актуальной для такого звук проблемы — то есть проблемы перегруза. Для её решения предназначен фильтр de-clip.
Как определить, что звук нуждается в лечении этим фильтром? Прежде всего — по звучанию. Однако кое-что может нам подсказать и форма самой звуковой волны (рис. 1). На рисунке мы видим, что вершины некоторых волн «обрублены». Это явный сигнал к действиям, первым из которых и будет применение фильтра de-clip.
Рассмотрим окно управления фильтром (рис. 2). Видно, что регулируемых настроек не так много. Слева расположен регулятор порога срабатывания фильтра (Threshold).
Мы установили порог срабатывания на значении громкости, чуть меньшем, чем уровень перегруза (-0,2 dB). Практика показывает, что иногда для более качественного результата бывает полезным опустить порог срабатывания фильтра чуть ниже. Главное — не переусердствовать, потому что слишком низкий уровень срабатывания фильтра может своей излишней обработкой испортить ту часть сигнала, которая искажена не была.
Правее расположен регулятор качества (Quality). Качество рекомендуется ставить высокое (High).
Ещё один важный регулятор называется Makeup gain и регулирует общий выходной уровень сигнала. На рисунке уровень понижен на 7,2 dB. Это значит, что сигнал на выходе будет существенно тише оригинала (рис. 3). Плюс такого занижения уровня сигнала в том, что у программы появляется место для того, чтобы подрисовать волнам недостающие пики и не создать при этом новых перегрузок взамен старых.
Флажок постлимитера (Post-limiter) также предотвращает перегрузку выходного файла, но другим способом: он понижает уровень самых громких восстановленных волн, не влияя на более тихие, то есть, что видно и из названия, работает по принципу лимитера.
Напоследок следует отметить, что фильтр работает и с аналоговыми перегрузками. Правда, в этом случае тяжелее определить порог срабатывания фильтра, поскольку на гистограмме аналоговый перегруз проявляет себя не столь явно.
К сожалению, не всегда этот фильтр полностью решает проблему звука, испорченного перегрузом. Однако есть и хорошая новость: существует фильтр, работающий ещё радикальнее, и называется он Deconstruct.
Деконструкция звука
Рассмотрим модуль Deconstruct программы iZotope RX Audio Editor (рис. 4). Из названия модуля можно понять, что он каким-то образом «деконструирует» звук, разлагая его на разные составляющие и регулируя силу этих составляющих в конечном сигнале в зависимости от того, как мы его настроим.
В нашем распоряжении есть следующие регуляторы: Tonal gain (уровень тоновой составляющей сигнала в децибелах), Noisy gain (уровень шумовой составляющей сигнала в децибелах), Transient gain (уровень транзиентов; активен только при отмеченном флажке Separate transients); Tonal/noisy balance (баланс тона и шума; регулирует положение «границы» между тем, что программа считает тоном, а что шумом) и, наконец, Artifact smoothing (сглаживание артефактов работы фильтра; от этого зависит «мягкость» полученного результата в восприятии слушателем).
Чем отличается этот модуль от традиционного «шумодава»? Традиционный шумоподавитель направлен против фонового шума и не трогает (по крайней мере, призван не трогать) полезный сигнал. Этот же модуль рассчитан на работу с шумом «внутри» полезного сигнала, «загрязняющим» его. Подчеркнём — именно с избыточным шумом, поскольку какие-то шумовые элементы, как правило, присутствуют в естественных тембрах (характерный «воздушный» призвук в тембре флейты или шум механики фортепиано при нажатии клавиш). Устранение таких естественных шумов, мягко говоря, не способствует реалистичности звучания. Следовательно, наша задача при работе с шумами — не устранить их полностью, а всего лишь сделать их количество адекватным и таким образом ослабить ощущение «грязи», возникающее при прослушивании.
Теперь — несколько подробнее о самих регуляторах.
Tonal gain и Noisy gain: регулируют громкость тоновой и шумовой составляющей в результирующем сигнале. Если увести ручку одного из этих регуляторов (например, шума) в «минус бесконечность» (на практике, как правило, не требуется действовать так радикально), это будет означать, что программа уберёт из сигнала всё то, что посчитает шумом. А вот что она им посчитает, будет зависеть от других регуляторов.
Artifact smoothing – смягчает границу между тоновым сигналом и шумом. Применительно к максимальным настройкам это будет означать, что даже при команде убрать весь тон из сигнала он не уберётся целиком, а лишь станет значительно тише по отношению к шуму. Если же мы поставим этот регулятор на ноль, то программа проведёт границу между тоном и шумом максимально жёстко, а такая жёсткость редко воспринимается человеческим слухом хорошо. Однако для того, чтобы максимально точно понять, где провести искомую границу, можно на время увести этот движок в ноль. Главное, поняв это на предварительном прослушивании, не забыть его вернуть на какое-нибудь из умеренных значений перед непосредственно обработкой.
Модуль «Transient gain» обнаруживает в файле транзиенты и усиливает их. К сожалению, нельзя настроить его чувствительность: что считать транзиентом, а что нет. Так или иначе, но ослабление транзиентов помогает бороться с паразитными щелчками (типа виниловых). Их усиление, по идее, должно способствовать более выраженной атаке в звуке, но на практике (особенно на не очень чистых изначально записях) в большей степени способствует усилению тех самых щелчков, которые как раз хорошо бы ослабить.
Для чего хорош этот фильтр?
Как было сказано выше, он ослабляет не «фоновый шум», а избыток «грязи» как таковой: искажения от аналогового «перегруза», щелчки винилового проигрывателя. Справляется он и с неравномерными фоновыми шумами.
Однако поскольку характер у этого фильтра достаточно агрессивный, нередко требуются более тонкие, более частные инструменты, о которых мы расскажем в следующей статье.