что такое khz в музыке
Цифровое представление аналогового аудиосигнала. Краткий ликбез
Дорогие читатели, меня зовут Феликс Арутюнян. Я студент, профессиональный скрипач. В этой статье хочу поделиться с Вами отрывком из моей презентации, которую я представил в университете музыки и театра Граца по предмету прикладная акустика.
Рассмотрим теоретические аспекты преобразования аналогового (аудио) сигнала в цифровой.
Статья не будет всеохватывающей, но в тексте будут гиперссылки для дальнейшего изучения темы.
Чем отличается цифровой аудиосигнал от аналогового?
Аналоговый (или континуальный) сигнал описывается непрерывной функцией времени, т.е. имеет непрерывную линию с непрерывным множеством возможных значений (рис. 1).
Цифровой сигнал — это сигнал, который можно представить как последовательность определенных цифровых значений. В любой момент времени он может принимать только одно определенное конечное значение (рис. 2).
Аналоговый сигнал в динамическом диапазоне может принимать любые значения. Аналоговый сигнал преобразуется в цифровой с помощью двух процессов — дискретизация и квантование. Очередь процессов не важна.
Дискретизацией называется процесс регистрации (измерения) значения сигнала через определенные промежутки (обычно равные) времени (рис. 3).
Квантование — это процесс разбиения диапазона амплитуды сигнала на определенное количество уровней и округление значений, измеренных во время дискретизации, до ближайшего уровня (рис. 4).
Дискретизация разбивает сигнал по временной составляющей (по вертикали, рис. 5, слева).
Квантование приводит сигнал к заданным значениям, то есть округляет сигнал до ближайших к нему уровней (по горизонтали, рис. 5, справа).
Эти два процесса создают как бы координатную систему, которая позволяет описывать аудиосигнал определенным значением в любой момент времени.
Цифровым называется сигнал, к которому применены дискретизация и квантование. Оцифровка происходит в аналого-цифровом преобразователе (АЦП). Чем больше число уровней квантования и чем выше частота дискретизации, тем точнее цифровой сигнал соответствует аналоговому (рис. 6).
Уровни квантования нумеруются и каждому уровню присваивается двоичный код. (рис. 7)
Количество битов, которые присваиваются каждому уровню квантования называют разрядностью или глубиной квантования (eng. bit depth). Чем выше разрядность, тем больше уровней можно представить двоичным кодом (рис. 8).
Данная формула позволяет вычислить количество уровней квантования:
Если N — количество уровней квантования,
n — разрядность, то
Обычно используют разрядности в 8, 12, 16 и 24 бит. Несложно вычислить, что при n=24 количество уровней N = 16,777,216.
При n = 1 аудиосигнал превратится в азбуку Морзе: либо есть «стук», либо нету. Существует также разрядность 32 бит с плавающей запятой. Обычный компактный Аудио-CD имеет разрядность 16 бит. Чем ниже разрядность, тем больше округляются значения и тем больше ошибка квантования.
Ошибкой квантований называют отклонение квантованного сигнала от аналогового, т.е. разница между входным значением и квантованным значением
(
)
Большие ошибки квантования приводят к сильным искажениям аудиосигнала (шум квантования).
Чем выше разрядность, тем незначительнее ошибки квантования и тем лучше отношение сигнал/шум (Signal-to-noise ratio, SNR), и наоборот: при низкой разрядности вырастает шум (рис. 9).
Разрядность также определяет динамический диапазон сигнала, то есть соотношение максимального и минимального значений. С каждым битом динамический диапазон вырастает примерно на 6dB (Децибел) (6dB это в 2 раза; то есть координатная сетка становиться плотнее, возрастает градация).
Ошибки квантования (округления) из-за недостаточного количество уровней не могут быть исправлены.
50dB SNR
примечание: если аудиофайлы не воспроизводятся онлайн, пожалуйста, скачивайте их.
Теперь о дискретизации.
Как уже говорили ранее, это разбиение сигнала по вертикали и измерение величины значения через определенный промежуток времени. Этот промежуток называется периодом дискретизации или интервалом выборок. Частотой выборок, или частотой дискретизации (всеми известный sample rate) называется величина, обратная периоду дискретизации и измеряется в герцах. Если
T — период дискретизации,
F — частота дискретизации, то
Чтобы аналоговый сигнал можно было преобразовать обратно из цифрового сигнала (точно реконструировать непрерывную и плавную функцию из дискретных, «точечных» значении), нужно следовать теореме Котельникова (теорема Найквиста — Шеннона).
Теорема Котельникова гласит:
Если аналоговый сигнал имеет финитный (ограниченной по ширине) спектр, то он может быть восстановлен однозначно и без потерь по своим дискретным отсчетам, взятым с частотой, строго большей удвоенной верхней частоты.
Вам знакомо число 44.1kHz? Это один из стандартов частоты дискретизации, и это число выбрали именно потому, что человеческое ухо слышит только сигналы до 20kHz. Число 44.1 более чем в два раза больше чем 20, поэтому все частоты в цифровом сигнале, доступные человеческому уху, могут быть преобразованы в аналоговом виде без искажении.
Но ведь 20*2=40, почему 44.1? Все дело в совместимости с стандартами PAL и NTSC. Но сегодня не будем рассматривать этот момент. Что будет, если не следовать теореме Котельникова?
Когда в аудиосигнале встречается частота, которая выше чем 1/2 частоты дискретизации, тогда возникает алиасинг — эффект, приводящий к наложению, неразличимости различных непрерывных сигналов при их дискретизации.
Как видно из предыдущей картинки, точки дискретизации расположены так далеко друг от друга, что при интерполировании (т.е. преобразовании дискретных точек обратно в аналоговый сигнал) по ошибке восстанавливается совершенно другая частота.
Аудиопример 4: Линейно возрастающая частота от
100 до 8000Hz. Частота дискретизации — 16000Hz. Нет алиасинга.
Аудиопример 5: Тот же файл. Частота дискретизации — 8000Hz. Присутствует алиасинг
Пример:
Имеется аудиоматериал, где пиковая частота — 2500Hz. Значит, частоту дискретизации нужно выбрать как минимум 5000Hz.
Следующая характеристика цифрового аудио это битрейт. Битрейт (bitrate) — это объем данных, передаваемых в единицу времени. Битрейт обычно измеряют в битах в секунду (Bit/s или bps). Битрейт может быть переменным, постоянным или усреднённым.
Следующая формула позволяет вычислить битрейт (действительна только для несжатых потоков данных):
Битрейт = Частота дискретизации * Разрядность * Количество каналов
Например, битрейт Audio-CD можно рассчитать так:
44100 (частота дискретизации) * 16 (разрядность) * 2 (количество каналов, stereo)= 1411200 bps = 1411.2 kbit/s
При постоянном битрейте (constant bitrate, CBR) передача объема потока данных в единицу времени не изменяется на протяжении всей передачи. Главное преимущество — возможность довольно точно предсказать размер конечного файла. Из минусов — не оптимальное соотношение размер/качество, так как «плотность» аудиоматериала в течении музыкального произведения динамично изменяется.
При кодировании переменным битрейтом (VBR), кодек выбирает битрейт исходя из задаваемого желаемого качества. Как видно из названия, битрейт варьируется в течение кодируемого аудиофайла. Данный метод даёт наилучшее соотношение качество/размер выходного файла. Из минусов: точный размер конечного файла очень плохо предсказуем.
Усреднённый битрейт (ABR) является частным случаем VBR и занимает промежуточное место между постоянным и переменным битрейтом. Конкретный битрейт задаётся пользователем. Программа все же варьирует его в определенном диапазоне, но не выходит за заданную среднюю величину.
При заданном битрейте качество VBR обычно выше чем ABR. Качество ABR в свою очередь выше чем CBR: VBR > ABR > CBR.
ABR подходит для пользователей, которым нужны преимущества кодирования VBR, но с относительно предсказуемым размером файла. Для ABR обычно требуется кодирование в 2 прохода, так как на первом проходе кодек не знает какие части аудиоматериала должны кодироваться с максимальным битрейтом.
Существуют 3 метода хранения цифрового аудиоматериала:
Несжатый (RAW) формат данных
Другой формат хранения несжатого аудиопотока это WAV. В отличие от RAW, WAV содержит заголовок файла.
Аудиоформаты с сжатием без потерь
Принцип сжатия схож с архиваторами (Winrar, Winzip и т.д.). Данные могут быть сжаты и снова распакованы любое количество раз без потери информации.
Как доказать, что при сжатии без потерь, информация действительно остаётся не тронутой? Это можно доказать методом деструктивной интерференции. Берем две аудиодорожки. В первой дорожке импортируем оригинальный, несжатый wav файл. Во второй дорожке импортируем тот же аудиофайл, сжатый без потерь. Инвертируем фазу одного из дорожек (зеркальное отображение). При проигрывании одновременно обеих дорожек выходной сигнал будет тишиной.
Это доказывает, что оба файла содержат абсолютно идентичные информации (рис. 11).
Кодеки сжатия без потерь: flac, WavPack, Monkey’s Audio…
При сжатии с потерями
акцент делается не на избежание потерь информации, а на спекуляцию с субъективными восприятиями (Психоакустика). Например, ухо взрослого человек обычно не воспринимает частоты выше 16kHz. Используя этот факт, кодек сжатия с потерями может просто жестко срезать все частоты выше 16kHz, так как «все равно никто не услышит разницу».
Другой пример — эффект маскировки. Слабые амплитуды, которые перекрываются сильными амплитудами, могут быть воспроизведены с меньшим качеством. При громких низких частотах тихие средние частоты не улавливаются ухом. Например, если присутствует звук в 1kHz с уровнем громкости в 80dB, то 2kHz-звук с громкостью 40dB больше не слышим.
Этим и пользуется кодек: 2kHz-звук можно убрать.
Кодеки сжатия с потерям: mp3, aac, ogg, wma, Musepack…
Частоты от 15 кГц и выше: зачем и почему
Последнее время, перечитывая на ночь спецификации, я диву даюсь, в какие ультразвуковые дали устремились современная акустика, усилители и источники. Во времена, когда пустые сигаретные пачки Marlboro и рекламные буклеты фирмы Technics было принято передавать по наследству, вся роскошь аудиовеликолепия укладывалась в заветные 20 Гц – 20 кГц.
Сегодня, если ты будешь кокетничать, как Rolls-Roys с мощностью двигателя, если не предъявишь контрастность картинки один к миллиону, тебя продадут с молотка. На этом фоне консервативные производители стерео выглядят скромнягами: подумаешь, в колонках теперь указывают верхнюю границу в 30 кГц, а в усилителях подняли планку всего-то в пять раз — до 100 кГц. Что все это значит, для чего сделано и как к этому относиться?
Так называемые «высокие частоты» имеют долгую историю и вошли, можно сказать, в область фольклора. Любой бесконечно далекий от мук выслушивания кабеля охламон в состоянии высказать претензию — «что-то высоких маловато». Во времена магнитных перезаписей заветного «цыканья» катастрофически не хватало, а то что имелось — таяло на суровых механизмах отечественных кассетников, как снег по весне. Практически все усилители имели две регулировки. Баску служила ручка о ста герцах, а чтобы все «звучало по-человечески», выкручивался на максимум второй регулятор полосы в 10 кГц.
Для изощренных любителей корежить амплитудно-частотную характеристику выпускались отдельные эквалайзеры, в которых ползунки, как правило, ставились галочкой, задирая края диапазона и проваливая средние частоты. С включенным «садомазоэквалайзером» велась и магнитная перезапись. Насчет искажений фазы никто не парился. Сегодня, если верить спецификациям на компоненты, проблемы с высокими частотами остались давно позади. От себя могу сказать, что с цифровым контентом по крайней мере характеристики никуда не уплывут, и музыка будет звучать стабильно хорошо. Или стабильно плохо, ха-ха. Так все-таки, как относиться к бойким характеристикам от нуля до ста килогерц?
По правилам хорошего тона к цифрам частотного диапазона следует соблюдать и указывать неравномерность (в децибелах). Не все утруждаются это делать, особенно грешат производители наушников. Приведенные в спецификациях границы частотного диапазона сами по себе ничего не говорят, лишь указывают, что к данному устройству был приложен технический сигнал так называемого «розового шума». Можно, не указывая неравномерность, и радиоприемнику записать хоть от нуля до 500 кГц.
Для адекватного, неокрашенного звучания важно, чтобы отклик был как можно более линеен, т.е. имел одинаковый уровень на каждой полосе. Для усилителей и источников предельная неравномерность составляет плюс-минус 0,5 дБ, для акустики — 3 дБ.
Начиная с 90-х в хайфае убрали регуляторы тембров от греха подальше. И правильно сделали, кстати говоря, хотя именно в АС они бы не помешали. При установке в реальном помещении колонки демонстрируют куда большие, чем 3 дБ пики/провалы АЧХ, и советы выровнять некрасивый звук сетевым кабелечком выглядят сущим издевательством.
Официально считается, что человек в состоянии различать звуки от 20 Гц до 20 кГц. Это совпадает с порогом воспроизведения компакт-диска — половина частоты дискретизации 44,1 стерео сигнала, т.е. 22,05 кГц. В хайрезах 24/192 значение верхнего предела теоретически может достигать соответственно 96 кГц, чего на практике никто не делает: никто не хочет семплировать пустоту, раздувая и без того немалый файл. В настоящее время наибольшее хождение получили как коммерческие, так и самодельные записи (например, виниловые рипы) в 24 бит/96 кГц. До 48 кГц частотного диапазона можно вместить что угодно и кого угодно. Да только кто туда пойдет?
Если вы закажете у районного сурдолога процедуру проверки слуха, то, как правило, получите аудиограмму до 8 кГц, а свыше прибор и не станет рисовать, он на это не рассчитан. Врачами считается, что для нормальной жизни больше 8 кГц и не надо. Знаменитый, так называемый «ультразвуковой» прикол для собачек на финальной канавке грампластинки 1967 года был записан на частоте всего-то 15 кГц. Вы можете раздобыть тестовые сигналы и попробовать расслышать ВЧ, начиная с десятки. Для кого-то будет неприятным сюрпризом остановиться на 16 кГц, но не спешите расстраиваться.
Знаменитый, так называемый «ультразвуковой» прикол для собачек на финальной канавке грампластинки 1967 года был записан на частоте всего-то 15 кГц
За исключением духового органа (10 кГц), который также умеет издавать и самые низкие звуки, свыше 4 кГц не играет ни один инструмент, даже флейта-пикколо. Другое дело, обертона: они могут карабкаться повыше — до 16 кГц у вокала, скрипки и пикколо. Область от 14 до 20 кГц и отвечает за создание «воздуха» в фонограмме. А любимое народное «цыкание» тарелочек спокойно уложилось гораздо ниже — в диапазон от 7 до 12 кГц. Вот на все эти некрупные цифры и ориентировались производители стереоаппаратуры 70-х.
А что же тогда находится в HD-записях свыше 20 кГц? Да мало ли что. Говорят, в ультразвуковой области могут залегать какие-то неучтенные ранее, а потому дико ценные обертона, которые человек (особенно такой мнительный, как аудиофил) способен если не слышать, то ощущать. Если посмотреть частотку HD-трека, картина бывает разная. У кого-то видно применение фильтра на тех же сакраментальных 20 кГц, а дальше ничего и нет. У кого-то жизнь наблюдается до 48 кГц. Что это может быть?
Как правило — ультразвуковые шумы квантования, какие-то резонансы, например, системы винилового картриджа. Значит ли это, что аудио 24/96 и выше — обман народа? Совершенно не значит, потому что мы получаем не только расширение частотной полосы, но и вынос ошибок квантования куда подальше, где их не слышно, увеличение запаса динамического диапазона. Проще говоря, HD-фонограмму сложнее испортить при записи, поэтому даже виниловые рипы в домашних условиях на 24/96 звучат более разборчиво и выразительно, чем на стандартных 16/44.1. Так что хоть и слышим мы, дай бог, чтобы до 18 кГц, а музыку лучше слушать в HD-изданиях. Как ни крути компакт-дисками.
Что такое звук: его громкость, кодирование и качество
Еще рассмотрим дискретизацию, форматы и мощность звука. Но сначала дадим определение музыки, как упорядоченному звуку — противоположность неупорядоченному хаотическому, который мы воспринимаем, как шум.
Что такое звук
Даже при разговоре вы слышите своего собеседника потому, что он воздействует на воздух. Также, когда вы играете на музыкальном инструменте, бьете ли вы по барабану или дергаете струну, вы производите этим колебания определенной частоты, которой в окружающем воздухе производит звуковые волны.
Звуковые волны бывают упорядоченные и хаотические. Когда они упорядоченные и периодические (повторяются через какой-то промежуток времени), мы слышим определенную частоту или высоту звука.
То есть мы можем определить частоту, как количество повторения события в заданный промежуток времени. Таким образом, когда звуковые волны хаотичны, мы воспринимаем их как шум.
Но когда волны упорядочены и периодически повторяются, то мы можем измерить их количеством повторяющихся циклов в секунду.
Частота дискретизации звука
Частота дискретизации звука — это количество измерений уровня сигнала за 1 секунду. Герц (Гц) или Hertz (Hz) — это научная единица измерения, определяющая количество повторений какого-то события в секунду. Эту единицу мы будем использовать!
Частота дискретизации звука
Наверное, вы очень часто видели такую аббревиатуру — Гц или Hz. Например, в плагинах эквалайзеров. В них единицами измерения являются герцы и килогерцы (то есть 1000 Гц).
Давайте я открою плагин эквалайзера и покажу вам как это выглядит. Вам, наверное, знакомы эти цифры.
С помощью эквалайзера вы можете ослаблять или усиливать определенные частоты в пределах слышимого человеком диапазона.
Здесь у меня запись звуковой волны, которая была сгенерирована на частоте 1000 Гц (или 1 кГц). Если увеличить масштаб и посмотреть на ее форму, то мы увидим, что она правильная и повторяющиеся (периодическая).
Повторяющиеся (периодическая) звуковая волна
В одной секунде здесь происходит тысяча повторяющихся циклов. Для сравнения, давайте посмотрим на звуковую волну, которую мы воспринимаем как шум.
Неупорядоченный звук
Тут нет какой-то конкретной повторяющейся частоты. Также нет определенного тона или высоты. Звуковая волна не упорядочена. Если мы взглянем на форму этой волны, то увидим, что в ней нет ничего повторяющегося или периодического.
Давайте перейдем в более насыщенную часть волны. Мы увеличиваем масштаб и видим, что она не постоянная.
Неупорядоченная волна при масштабировании
Из-за отсутствия цикличности мы не в состоянии услышать какую-то определенную частоту в этой волне. Поэтому мы воспринимаем ее как шум.
Смертельный уровень звука
Стоит сразу сказать, что по нормативным нормам, безопасным уровнем громкости шума считается не более 55 дБ (децибел) днем и 40 дБ ночью. Даже при длительном воздействии на слух, этот уровень не нанесет вреда.
Уровни громкости звука | ||
---|---|---|
(дБ) | Определение | Источник |
0 | Совсем не лышно | |
5 | Почти не слышно | |
10 | Почти не слышно | Тихий шелест листьев |
15 | Еле слышно | Шелест листвы |
20 — 25 | Едва слышно | Шепот человека на расстоянии 1 метр |
30 | Тихо | Тиканье настенных часов (допустимый максимум по нормам для жилых помещений ночью с 23 до 7 часов) |
35 | Довольно слышно | Приглушенный разговор |
40 | Довольно слышно | Обычная речь (норма для жилых помещений днем с 7 до 23 часов) |
45 | Довольно слышно | Разговор |
50 | Отчетливо слышно | Пишущая машинка |
55 | Отчетливо слышно | Разговор (европейская норма для офисных помещений класса А) |
60 | Шумно | (норма для контор) |
65 | Шумно | Громкий разговор (1м) |
70 | Шумно | Громкие разговоры (1м) |
75 | Шумно | Крик и смех (1м) |
80 | Очень шумно | Крик, мотоцикл с глушителем |
85 | Очень шумно | Громкий крик, мотоцикл с глушителем |
90 | Очень шумно | Громкие крики, грузовой железнодорожный вагон (7м) |
95 | Очень шумно | Вагон метро (в 7 метрах снаружи или внутри вагона) |
100 | Крайне шумно | Оркестр, гром (по европейским нормам, это максимально допустимое звуковое давление для наушников) |
105 | Крайне шумно | В старых самолетах |
110 | Крайне шумно | Вертолет |
115 | Крайне шумно | Пескоструйный аппарат (1м) |
120-125 | Почти невыносимо | Отбойный молоток |
130 | Болевой порог | Самолет на старте |
135 — 140 | Контузия | Взлетающий реактивный самолет |
145 | Контузия | Старт ракеты |
150 — 155 | Контузия, травмы | |
160 | Шок, травма | Ударная волна от сверхзвукового самолета |
165+ | Разрыв барабанных перепонок и легких | |
180+ | Смерть |
Скорость звука в км в час и метры в секунду
Скорость звука — это скорость распространения волн в среде. Ниже даю таблицу скоростей распространения в различных средах.
0 ºС | м/с | км/ч |
---|---|---|
Воздух | 331 | 1191.6 |
Водород | 1284 | 4622.4 |
Азот | 334 | 1202.4 |
Аммиак | 415 | 1494.0 |
Ацетилен | 327 | 1177.2 |
Гелий | 965 | 3474.0 |
Железо | 5950 | 21420.0 |
Золото | 3240 | 11664.0 |
Кислород | 316 | 1137.6 |
Литий | 6000 | 21600.0 |
Метан | 430 | 1548.0 |
Угарный газ | 338 | 1216.8 |
Неон | 435 | 1566.0 |
Ртуть | 1383 | 4978.0 |
Стекло | 4800 | 17280.0 |
Углекислый газ | 259 | 932.4 |
Хлор | 206 | 741.6 |
Скорость звука в воздухе намного меньше чем в твердых средах. А скорость звука в воде намного выше, чем в воздухе. Составляет она 1430 м/с. В итоге, распространение идет быстрее и слышимость намного дальше.
Мощность звука
Мощность звука — это энергия, которая передается звуковой волной через рассматриваемую поверхность за единицу времени. Измеряется в (Вт). Бывает мгновенное значение и среднее (за период времени).
Давайте продолжим работать с определениями из раздела теория музыки!
Высота и нота
Высота — это музыкальный термин, который обозначает почти тоже самое, что и частота. Исключение составляет то, что она не имеет единицы измерения. Вместо того чтобы определять звук количеством циклов в секунду в диапазоне 20 — 20 000 Гц, мы обозначаем определенные значения частот латинскими буквами.
Музыкальные инструменты производят периодические звуковые волны правильной формы, которые мы называем тонами или нотами.
Давайте посмотрим на звуковую волну в 1 кГц. Сейчас я увеличу масштаб, и вы увидите каково расстояние между циклами.
Звуковая волна в 1 кГц
Теперь давайте взглянем на волну в 500 Гц. Тут частота в 2 раза меньше и расстояние между циклами больше.
Звуковая волна в 500 Гц
Теперь возьмем волну в 80 Гц. Тут будет еще шире и высота намного ниже.
Звук в 80 Гц
Мы видим взаимосвязь между высотой звука и формой его волны.
Давайте я покажу вам еще один пример!
Ниже волна в 440 Гц. Это стандарт в мире музыке для настройки инструментов. Соответствует он ноте ля.
Чистая звуковая волна в 440 Гц
Мы слышим только основной тон (чистую звуковую волну). Если увеличить масштаб, то увидим, что она периодическая.
А теперь давайте посмотрим на волну той же частоты, но сыгранную на пианино.
Периодический звук пианино
Посмотрите, она тоже периодическая. Но в ней есть небольшие дополнения и нюансы. Все они в совокупности и дают нам понятие о том, как звучит пианино. Но помимо этого, обертона обуславливают и тот факт, что одни ноты будут иметь большее сродство к данной ноте чем другие.
Для примера можно сыграть туже ноту, но на октаву выше. По звучанию будет совсем иначе. Однако она будет родственной предыдущей ноте. То есть это та же нота, только сыгранная на октаву выше.
Такая родственная связь двух нот в разных октавах обусловлена наличием обертонов. Они постоянно присутствуют и определяют насколько близко или отдаленно определенные ноты связаны друг с другом.
[bctt tweet=»Традиционной нотации высота ноты обуславливает ее расположение на нотном стане или нотоносце.» username=»Muzrock_com»]
Сейчас я покажу вам с помощью нотного редактора. Здесь мы видим, как записывается нота ля.
Помимо традиционного представления нот на нотном стане, в современных музыкальных редакторах вы можете встретить другую систему записи и редактирования нот. Чаще всего она представляет собой пианинную сетку или таблицу.
Слева мы видим клавиатуру пианино. А справа, соответствующие каждой ноте, прямоугольники.
В принципе, такая система не отличается от классической выше. Просто способ представления высоты нот реализован по-другому. Точно также, когда мы говорим 440 Гц или ля, мы имеем одну и ту же высоту или частоту звука.
Свойства и качество звука
Свойства звука — это его физические особенности, которые можно измерить. Сюда входит частота колебаний, их продолжительность и амплитуда. Еще относится и состав колебаний. То есть сочетание простейших колебаний в сложное.
А вот отражение физических свойств в наших ощущениях (то, что мы чувствуем) называется качеством звука. Сюда относится высота и длительность звука. А также громкость и тембр.
Высота звука зависит от частоты колебаний. Чем чаще колебания, тем выше звук. Чем реже колебания, тем ниже звук.
Длительность зависит от продолжительности колебаний.
Громкость зависит от амплитуды колебаний. Например, после удара по гитарной струне, можно увидеть, что она начнет колебаться в разные стороны. Чем шире эти колебания, тем громче звук. Ширина этого размаха называется амплитудой колебаний.
Если сильно ударим по струне, то амплитуда будет большой. Соответственно, мы услышим громкий звук. Если легонько тронем пальцем струну, то амплитуда будет маленькой. В таком случае, звук будет тихим.
Тембр — это обертоновая окраска звука. Она позволяет нам различать звуки одной высоты, но исполненные разными инструментами или голосами.
Кодирование звука
Кодирование звука — это процесс преобразования колебаний воздуха в колебания электрического тока с последующей дискретизацией аналогового сигнала. То есть такое кодирование необходимо нам для дальнейшей работы со звуком уже на компьютере.
А поскольку мы на ПК не можем работать с аналоговым сигналом, в таком случае мы должны преобразовать его в цифровой. Так мы можем к примеру, с помощью специальных компьютерных программ для создания звука работать с самим сигналом.
Для преобразования сигнала используются специальные аналого-цифровые преобразователи (АЦП). В компьютере это обычно звуковые карты.
Форматы звука
Форматы звука предназначены для представления аудио данных с последующим хранением на электронных носителях. Есть три основные группы:
Теперь вы знаете, что такое звук и каковы его характеристики. Также мы дополнительно рассмотрели такие понятия, как частота, высота и нота. А также как они соотносятся друг с другом.