Разница между аналоговыми и цифровыми аудиовходами на ПК

Очень часто мы слышим такие определения, как «цифровой» или «дискретный» сигнал, в чем его отличие от «аналогового»? Суть различия в том, что аналоговый сигнал непрерывный во времени (голубая линия), в то время как цифровой сигнал состоит из ограниченного набора координат (красные точки). Если все сводить к координатам, то любой отрезок аналогового сигнала состоит из бесконечного количества координат.
У цифрового сигнала координаты по горизонтальной оси расположены через равные промежутки времени, в соответствии с частотой дискретизации. В распространенном формате Audio-CD это 44100 точек в секунду. По вертикали точность высоты координаты соответствует разрядности цифрового сигнала, для 8 бит это 256 уровней, для 16 бит = 65536 и для 24 бит = 16777216 уровней. Чем выше разрядность (количество уровней), тем ближе координаты по вертикали к исходной волне.

Аналоговыми источниками являются: винил и аудиокассеты. Цифровыми источниками являются: CD-Audio, DVD-Audio, SA-CD (DSD) и файлы в WAVE и DSD форматах (включая производные APE, Flac, Mp3, Ogg и т.п.).

Звук – что это?

Звук представляет собой физическое явление. Это упругие волны механических колебаний, распространяющиеся в газообразной, твердой или жидкой среде. Под звуком чаще рассматривают те колебания, которые воспринимаются животными и людьми. Основными характеристиками звука считаются амплитуда и спектр частот. Для людей второй показатель колеблется в диапазоне 16-20Гц – 15-20 кГц. Все что ниже этого диапазона, называют инфразвуком, выше – ультразвуком (до 1 ГГц) или гиперзвуком (от 1 ГГц). Громкость звука формирует звуковое давление и его эффективность, форма колебаний и их частота, а вот высота звука зависит от величины звукового давления и частоты.

Аналогово цифровое преобразование

Звуковой сигнал может быть аналоговым или цифровым. Если рассматривать аналоговый сигнал, исходящий из аналоговой аппаратуры, то представляет он собой непрерывный электрический сигнал. Цифровой звук – это сигнал, представленный дискретными численными значениями его амплитуды. То есть такой сигнал записывается в виде чисел, а считывается он компьютерной техникой.

Аналоговый звук можно преобразовать в цифровой путем обработки аналогового сигнала, придавая ему численных значений. Сделать это можно в два этапа. Первый – дискретизация, в ходе которой из сигнала, который необходимо преобразовать, в определенные временные промежутки выбирают величины по заданным значениям. Второй – квантование: процесс разбиения значений, полученных в ходе дискретизации значений амплитуды звука с максимально приближенной точностью.

В аналогово-цифровом преобразовании точные значения не используются – все величины указываются округленными, поскольку из-за ограничения оперативной памяти приборов реальное значение амплитуды указать невозможно – оно бесконечное.

1.4. Oversampling

Сущность данной техники заключается в применении более высоких, как правило, в четыре раза, частот дискретизации. Таким образом,если исходная частота дискретизации составляет 44.1 KHz, то сигнал будет оцифрован с частотой в 176.4 KHz (44.1 × 4), что позволяет присутствовать в сигнале частотам до 88.2 KHz, что, в свою очередь, снимает проблематичность применения аналоговых фильтров с реалистичной крутизной затухания. В последствии, уже оцифрованный сигнал, содержащий информацию в частотном диапазоне от постоянного тока ( 0 Hz) до 88.2 KHz (половина частоты дискретизации), подвергается цифровому фильтрованию с целью исключения из сигнала частот выше 20 KHz. В последнюю очередь производится понижение частоты дискретизации уже оцифрованного и отфильтрованного сигнала, а проще говоря, производится отбрасивание каждых трех замеров амплитуды (семплов) из четырех. Общий принцип работы данной техники показан на схеме 4.

Следует отметить, что чем выше частота дискретизации тем более детальным будет представление аналогового сигнала. Теоритически, на непрерывной прямой (аналоговый сигнал) можно поставить бесконечное количество точек, которые будут ее описывать. Таким образом, чем больше таких точек, тем более детально можно будет описать исходный сигнал. Однако, кроме самой частоты, большую роль играет устойчивость или постоянство отсчетов.

Частота дискретизации и разрядность

Эти два понятия часто рассматривают во время описания цифровых записывающих приборов. Итак, частота дискретизации означает частоту, с которой фиксируется частотность отсчетов входных сигналов записывающим устройством. Когда аналоговый звук преобразовывают в цифровой, он записывается отдельными отсчетами, то есть значениями интенсивности сигнала в конкретные временные периоды.

Частота дискретизации чаще всего имеет следующие стандартные значения:

  • 44,1 кГц;
  • 48 кГц;
  • 96 кГц.

Чтобы получить лучшее качество цифровой записи, следует использовать большую частоту дискретизации: за счет большего количества отсчетов за секунду времени улучшается качество преобразованного звука.

А что же такое разрядность? Когда речь заходит о записывающих устройствах, мы часто слышим такие единицы измерения информации, как 16 бит, 24 бита и т.д. Обозначают они количество единиц информации, которыми можно изобразить значение отсчетов, получаемых при цифровой записи (причем каждого отсчета в отдельности). В этом случае качество получаемого звука тем выше, чем большая величина единицы измерения. Однако стоит учесть, что не от количества бит зависит значение интенсивности звука, а от точности его представления.

Аудио. Цифровое и аналоговое аудио

Несмотря на то, что большую часть внешней информации мы усваиваем с помощью зрения, звуковые образы для нас ничуть не менее важны, а часто даже и более. Попробуйте посмотреть кино с выключенным звуком – через 2-3 минуты вы потеряете нить сюжета и интерес к происходящему, каким бы большим ни был экран и качественным изображение! Поэтому в немом кино за кадром играл тапер. Если же убрать изображение и оставить звук, кино вполне можно «слушать» как увлекательную радиопостановку.

Слух доносит до нас информацию о том, чего мы не видим, поскольку сектор визуального восприятия ограничен, а ухо улавливает звуки, доносящиеся со всех сторон, дополняя зрительные образы

Слух доносит до нас информацию о том, чего мы не видим, поскольку сектор визуального восприятия ограничен, а ухо улавливает звуки, доносящиеся со всех сторон, дополняя зрительные образы. При этом наш слух с большой точностью может локализовать невидимый источник звука по направлению, расстоянию, скорости перемещения.

Звук научились преобразовать в электрические колебания задолго до изображения. Этому предшествовала механическая запись звуковых колебаний, история которой началась еще в 19 веке.

Ускоренный прогресс, включая возможность передачи звука на расстояние, стал возможен благодаря электричеству, с появлением усилительной техники, акустоэлектрических и электроакустических и преобразователей – микрофонов, звукоснимателей, динамических головок и прочих излучателей. Сегодня звуковые сигналы передаются не только по проводам и через эфир, но и по оптоволоконным линиям связи, в основном в цифровом виде.

Акустические колебания преобразуются в электрический сигнал обычно с помощью микрофонов. Любой микрофон имеет в своем составе подвижный элемент, колебания которого порождают ток или напряжение определенной формы. Наиболее распространенный тип микрофона – динамический, представляющий собой «динамик наоборот». Колебания воздуха приводят в движение мембрану, жестко связанную со звуковой катушкой, находящейся в магнитном поле. Конденсаторный микрофон, по сути, и есть конденсатор, одна из обкладок которого колеблется в такт со звуком, а вместе с ней изменяется емкость между обкладками. В ленточных микрофонах используется тот же принцип, только одна из пластин свободно подвешена. Схож с конденсаторным электретный микрофон, пластины которого в процессе колебаний сами вырабатывают электрический заряд, пропорциональный амплитуде колебаний. Многие модели микрофонов имеют встроенный усилитель (уровень сигнала непосредственно с акусто-электрического преобразователя очень мал). В отличие от микрофона, звукосниматель электромузыкального инструмента регистрирует колебания не воздуха, а твердого тела: струны или деки инструмента. Головка звукоснимателя считывает канавку грампластинки с помощью иглы, механически соединенной с подвижными катушками, находящимися в магнитном поле, либо магнитами, если катушки неподвижны. Либо колебания иглы передаются на пьезоэлемент, который при механических воздействиях вырабатывает электрический заряд. В магнитной записи звуковой сигнал записывается на магнитную ленту, а затем считывается специальной головкой. Наконец, в кинематографе традиционно была принята оптическая запись: с краю пленки наносилась непрозрачная звуковая дорожка, ширина которой менялась в такт со сигналом, и при протягивании пленки через проекционный аппарат электрический сигнал снимался с помощью фотосенсора.

В синтезаторах звук рожается непосредственно в виде электрических колебаний, здесь отсутствует первичное преобразование акустических волн в электрический сигнал.

Современные источники звука осень разнообразны, и все большее распространение получают цифровые носители: компакт-диски, DVD, хотя сохраняются еще и виниловые пластинки. Мы продолжаем слушать радио, как эфирное, так и кабельное (радио-точки). Звук сопровождает телепередачи и кинофильмы, не говоря уже о таком привычном явлении, как телефония. Все больший удельный вес в мире аудио получает компьютер, позволяющий с удобством архивировать, комбинировать и обрабатывать звуковые программы в виде файлов. В век цифровых технологий оцифрованная речь и музыка передается по цифровым каналам, включая сеть Интернет, без серьезных потерь на транспортировку. Это обеспечивается цифровым кодированием, и потери возникают исключительно из-за сжатия, которое чаще всего при этом используется. Однако на цифровых носителях его либо нет вовсе (CD, SACD), либо применяются алгоритмы сжатия звука без потерь (DVD Audio, DVD Video). В остальных случаях степень сжатия определяется требуемым уровнем качества фонограммы (файлы MP3, цифровая телефония, цифровое телевидение, некоторые типы носителей).


Рис. 1. Преобразование акустических звуковых колебаний в электрический сигнал

Обратное преобразование из электрических колебаний в акустические осуществляются с помощью громкоговорителей, встроенных в радиоприемники и телевизоры, а также отдельных акустических систем, головных телефонов.

Звуком называют акустические колебания в диапазоне частот от 16 Гц до 20 000 Гц

Звуком называют акустические колебания в диапазоне частот от 16 Гц до 20 000 Гц. Ниже (инфразвук) и выше (ультразвук) человеческое ухо не слышит, да и в пределах звукового диапазона чувствительность слуха весьма неравномерна, ее максимум приходится на частоту 4 кГц. Чтобы слышать звуки всех частот одинаково громко, нужно воспроизводить их с разным уровнем. Такой прием, называемый тонкомпенсацией, часто реализуется в бытовой аппаратуре, хотя результат его нельзя признать однозначно положительным.

Рис. 2. Кривые равной громкости
(Нажмите на изображение для увеличения)
Физические свойства звука обычно представляются не в линейных, а в относительных логарифмических величинах – децибелах (дБ), поскольку это гораздо нагляднее в цифрах и компактнее на графиках (в противном случае пришлось бы оперировать с величинами, имеющими множество нулей до запятой и после, и вторые с легкостью потерялись бы на фоне первых). Отношение двух уровней A и B в дБ (скажем, напряжения или тока) определяется как:

Сu [дБ] = 20 lg A/B. Если же речь идет о мощностях, то Сp [дБ] = 10 lg A/B.

Кроме частотного диапазона, определяющего чувствительность человеческого слуха к высоте звука, существует также понятие диапазона громкостей, который показывает чувствительность уха к уровню громкости и охватывает интервал от самого тихого звука, различимого слухом (порог чувствительности), до самого громкого, за которым лежит болевой порог. Порог чувствительности принят как звуковое давление в 2 х 10-5 Па (Паскаль), а болевой порог – давление, в 10 миллионов раз большее. Иными словами, диапазон слышимости, или отношение давления самого громкого звука, к самому тихому, составляет 140 дБ, что заметно превосходит возможности любой аудио аппаратуры ввиду ее собственных шумов. Только цифровые форматы высокого разрешения (SACD, DVD Audio) подбираются к теоретическому пределу динамического диапазона (отношение самого громкого звука, воспроизводимого аппаратурой, к уровню шума) 120 дБ, компакт-диск обеспечивает 90 дБ, виниловая пластинка – порядка 60 дБ.


Рис. 3. Диапазон чувствительности слуха

Только цифровые форматы высокого разрешения (SACD, DVD Audio) подбираются к теоретическому пределу динамического диапазона

Шумы всегда присутствуют в звуковом тракте. Это как собственные шумы усилительных элементов, так и внешние наводки. Искажения сигнала делятся на линейные (амплитудные, фазовые) и нелинейные, или гармонические. В случае линейных искажений спектр сигнала не обогащается новыми компонентами (гармониками), изменяются лишь уровень или фаза уже существующих. Амплитудные искажения, нарушающие изначальные соотношения уровней на разных частотах, приводят к слышимым искажениям тембра. Долгое время считалось, что фазовые искажения некритичны для слуха, однако на сегодня доказано обратное: и тембр, и локализация звука в значительной мере зависимы от фазовых соотношений частотных компонентов сигнала.

Любой усилительный тракт нелинеен

Любой усилительный тракт нелинеен, поэтому всегда возникают гармонические искажения: новые частотные компоненты, отстоящие по частоте в 3, 5, 7 и т.д. от порождающего их тона (нечетные гармоники) или в 2, 4, 6 и т.д. раз (четные). Порог заметности гармонических искажений сильно варьирует: от нескольких десятых и даже сотых долей процента до 3-7%, в зависимости от состава гармоник. Четные гармоники менее заметны, поскольку находятся в консонансе с основным тоном (разница по частоте в два раза соответствует октаве).

Помимо гармонических, имеют место интермодуляционные искажения, представляющие собой разностные продукты частот спектра сигнала и их гармоник. Например, на выходе усилителя, на вход которого подано две частоты 8 и 9 Гц (при достаточно нелинейной его характеристике) появится третья (1 кГц), а также целый ряд других: 2 кГц (как разность вторых гармоник основных частот) и т.д. Интермодуляционные искажения особенно неприятны на слух, поскольку порождают множество новых звуков, включая диссонансные по отношению к основным.

То, что сможет услышать аудиофил и не только услышать, но и объяснить звукорежиссер, может оказаться совершенно незаметным для обычного слушателя

Шумы и искажения в значительной степени маскируются сигналом, однако они и сами маскируют сигналы малого уровня, которые исчезают или теряют отчетливость. Поэтому чем выше отношение сигнал/шум, тем лучше. Фактическая чувствительность к шумам и искажениям зависит от индивидуальных особенностей слуха и его натренированности. Уровень шумов и искажений, не влияющий на передачу речи, может быть абсолютно неприемлемым для музыки. То, что сможет услышать аудиофил и не только услышать, но и объяснить звукорежиссер, может оказаться совершенно незаметным для обычного слушателя.

ПЕРЕДАЧА АНАЛОГОВОГО АУДИО

Традиционно аудио сигналы передавались по проводам, а также эфиру (радио).

Различают небалансную линию передачи (классическая проводная) и балансную. Небалансная имеет в своем составе два провода: сигнальный (прямой) и обратный (земля). Такая линия весьма чувствительна к внешним помехам, поэтому для передачи сигнала на большие расстояния не подходит. Часто реализуется с помощью экранированного провода, экран при этом соединяется с землей.


Рис. 4. Небалансная экранированная линия

Балансная линия предполагает три провода: два сигнальных, по которым течет один и тот же сигнал, но в противофазе, и землю. На приемной стороне синфазные помехи (наведенные на оба сигнальных провода) взаимно вычитаются и полностью исчезают, а уровень полезного сигнала удваивается.


Рис. 5. Балансная экранированная линия

Небалансные линии обычно применяются внутри приборов и при небольших расстояниях, в основном в пользовательских трактах. В профессиональной же сфере господствует балансная.

На рисунках точки подключения экрана показаны условно, поскольку их приходится каждый раз подбирать «по месту» для достижения наилучших результатов. Чаще всего экран подключается только на стороне приемника сигнала.

Небалансные линии обычно применяются внутри приборов и при небольших расстояниях, в основном в пользовательских трактах. В профессиональной же сфере господствует балансная

Аудиосигналы нормируются по уровню действующего напряжения (0,707 от амплитудного значения):

  • микрофонный 1-10 мВ (для микрофонов без встроенного усилителя),
  • линейный 0,25-1 В, обычно 0,7 В.

На выходе усилителя мощности, с которого сигнал поступает на громкоговорители, его уровень гораздо выше и может достигать (в зависимости от громкости) 20-50 В при токах до 10‑20 А. Иногда – до сотен вольт, для трансляционных линий и озвучивания открытых пространств.

Используемые кабели и разъемы:

  • для балансных линий и микрофонов – экранированная пара (часто витая), 3-контактные разъемы XLR или клеммы, винтовые или зажимные;


Рис. 6. Разъемы для балансных линий: клеммы и XLR

  • для небалансных линий – экранированный кабель, разъемы RCA («тюльпан»), реже DIN (а также ГОСТ), а также различные штекеры;


Рис. 7. Разъемы для небалансных линий: RCA, 3,5-мм и 6,25-мм штекеры

  • для мощных сигналов для громкоговорителей – неэкранированные (за редким исключением) акустические кабели большого сечения, клеммы или зажимы, разъемы типа «банан» или «игла»


Рис. 8. Разъемы акустических кабелей

Качество разъемов и кабелей играет ощутимую роль, особенно в высококачественных аудио системах

Качество разъемов и кабелей играет ощутимую роль, особенно в высококачественных аудио системах. Имеют значение материалы проводника и диэлектрика, сечение, геометрия кабеля. В самых дорогих моделях межблочных и акустических кабелей применяется сверхчистая медь и даже цельное серебро, а также тефлоновая изоляция, отличающаяся минимальным уровнем диэлектрической абсорбции, увеличивающей потери сигнала, причем неравномерно по полосе частот. Рынок кабельной продукции очень разнообразен, часто разные модели одинакового качества отличаются друг от друга лишь ценой, причем во много раз.

Любые кабели характеризуются потерями аналогового сигнала, которые растут с ростом частоты и расстояния передачи. Потери определяются омическим сопротивлением проводника и контактов в разъемах, а также распределенными реактивными составляющими: индуктивностью и емкостью. По сути, кабель представляет собой фильтр низких частот (режет высокие).

Помимо передачи на разные расстояния, сигналы часто приходится разветвлять и коммутировать. Коммутаторы (селекторы входов) являются неотъемлемой частью многих компонентов аудиотракта, как профессионального, так и пользовательского. Существуют и специализированные усилители-распределители, разветвляющие сигнал и обеспечивающие согласование с линией передачи и другими компонентами по уровню и импедансам (а также часто компенсирующих спад на высоких частотах) и коммутаторы, обычные (несколько входов и один выход) и матричные (множество входов и выходов).

ОБРАБОТКА АНАЛОГОВОГО АУДИО

Любая обработка аналогового аудиосигнала сопровождается определенными потерями его качества (возникают частотные, фазовые, нелинейные искажения), однако она необходима. Основные виды обработки следующие:

  • усиление сигнала до уровня, нужного для передачи, записи или воспроизведения громкоговорителем: подав сигнал с микрофона на динамик, мы ничего не услышим: требуется предварительно усилить его по уровню и мощности, обеспечив при этом возможность регулировки громкости.


Рис. 9

  • фильтрация по частотам: от полезного звукового диапазона (20 Гц – 20 кГц) отсекают инфразвук, который на определенных частотах вреден для здоровья, и ультразвук. Во многих случаях диапазон намеренно сужают (речевой телефонный канал имеет полосу от 300 Гц – 3400 Гц, существенно ограничена полоса частот метровых радиостанций). Для акустических систем, имеющих как правило 2-3 полосы, также необходимо разделение, которое осуществляется обычно в фильтрах кроссоверов уже на уровне усиленного (мощного) сигнала.


Рис. 10. Схема кроссовера для трехполосной акустической системы

  • коррекция по частотам (эквалайзинг): регулировка тембра, компенсация неравномерной отдачи из-за акустических свойств помещения, компенсация потерь в линиях передачи, студийная обработка с целью достижения нужной «окраски» звука, подавление паразитной акустической обратной связи («свиста») и т.д.


Рис. 11. Пример прибора-эквалайзера

  • подавление шумов: существуют специальные схемы динамического шумопонижения, которые анализируют сигнал и сужают полосу пропорционально уровню и частоте ВЧ-составляющих («денойзеры», «дехиссеры»). При этом шум, находящийся выше полосы сигнала, отрезается, а оставшийся более или менее маскируется самим сигналом. Подобные схемы всегда приводят к весьма заметной на слух деградации сигнала, но в отдельных случаях их применение уместно (например, при работе с записанной речью или в переговорных радиостанциях). Для аналоговой звукозаписывающей техники также используются шумоподавители на основе компрессоров/экспандеров («компандерные», например, системы Dolby B, dbx), работа которых на слух менее заметна.
  • воздействие на динамический диапазон: для того чтобы воспроизведение музыкальных программ на обычных бытовых системах, включая автомобильные магнитолы, было достаточно сочным и выразительным, динамический диапазон сжимают, делая звучание тихих звуков более громким. В противном случае, не считая отдельных всплесков фортиссимо (на классической музыке), придется слушать тишину из динамиков, особенно с учетом шумной окружающей обстановки. Для этой цели служат приборы, называемые компрессорами. В некоторых случаях, наоборот, требуется расширить динамический диапазон, тогда применяются экспандеры. А чтобы исключить превышение максимального уровня, которое приведет к клиппированию (ограничение сигнала сверху, сопровождаемое очень высокими нелинейными искажениями, воспринимаемыми как хрип), в студиях используются лимитеры. Они как правило обеспечивают «мягкое» ограничение, а не просто срезают верхушки сигнала;

Рис. 12. Пример студийного процессора динамической обработки звука

  • спецэффекты для студий, ЭМИ и пр.: в распоряжении звукорежиссеров и музыкантов имеется большое количество спец-техники для придания звучанию нужной окраски или получения определенного эффекта. Это различные дистортеры (звук электрогитары становится хриплым, зернистым), приставки вау-вау (модуляция по амплитуде, вызывающая характерный «квакающий» эффект), энхенсеры и эксайтеры (приборы, влияющие на окраску звука, в частности, могущие придавать звучанию «ламповый» оттенок); фленжеры, хорусы и т.д.


Рис. 13. Примеры процессоров и приставок для электрогитар

  • смешивание звуков, эхо/реверберация: запись на студиях обычно ведется в многоканальном виде, затем с помощью микшеров фонограмма сводится в нужное количество каналов (чаще всего 2 или 6). При этом звукорежиссер может «выдвинуть вперед» тот или иной солирующий инструмент, записанный на отдельной дорожке, изменить соотношение громкостей разных дорожек. Иногда на сигнал накладываются многократные копии меньшего уровня с определенным сдвигом по времени, тем самым имитируется естественная реверберация (эхо). В настоящее время подобные и прочие эффекты достигаются в основном с помощью сигнальных процессоров, обрабатывающих цифровой сигнал.


Рис. 14. Современный микшерный пульт

ЗАПИСЬ АНАЛОГОВОГО АУДИО

Считается, что механическая запись звука была впервые реализована Эдисоном в 1877 году, когда он изобрел фонограф – валик, покрытый слоем мягкой станиоли, на который иглой, передающей колебания воздуха, наносился след (впоследствии вместо станиоли использовался воск, а сам метод стали называть глубинной записью, поскольку дорожка модулировалась по глубине). Однако в том же году француз Шарль Кро подал заявку в Академию наук по поводу своего изобретения – звук записывался на плоском стеклянном диске, покрытым сажей, с помощью соединенной с мембраной иглы, получалась поперечная дорожка, затем диск предполагалось просвечивать и снимать с него фотокопии для тиражирования (сам способ еще предстояло разработать). В конце концов поперечная запись, которая оказалась намного совершеннее глубинной, дала начало грамзаписи. В мире появились три компании, серийно выпускавших пластинки (CBS в Америке, JVC в Японии, Odeon в Германии – эта компания подарила миру двустороннюю пластинку) и аппараты для их воспроизведения. От Дойче Граммофон (Германия) произошло название «граммофон», от Пате (Франция) – патефон. Затем начали производить портативные патефоны с раструбом на шарнире, с электрическим двигателем вместо ручного привода, позже – с электромагнитными адаптерами. Пластинки становились все совершеннее, вмещали больше материала по времени звучания, расширялся диапазон частот, первоначально ограниченный 4 кГц. На смену хрупкому шеллаку пришел винилит, а недолговечные стальные иглы уступили место сапфировым, затем и алмазным. Началась эпоха стерео: в одной канавке нарезались две дорожки под углом в 45°. К началу 80-х годов прошлого века, когда наметилась глобальный переход к цифровому формату звука, виниловая пластинка подошла в апогее своего развития.


Рис. 15. Граммофон, патефон, электропроигрыватель

Магнитная запись более совершенна и издавна применялась в студиях. Первый аппарат для магнитной записи – телеграфон – создал Вальдемар Паульсен (Дания) в 1878 году, причем запись велась на стальную проволоку (струну от фортепьяно). В 20-х годах 20 века появились магнитофоны, использовавшие магнитную ленту. Массовое производство магнитофонов началось в 40-х. Сначала появились магнитные ленты на целлюлозной, а затем на лавсановой основе. Запись аудиосигналов производится на продольные дорожки с помощью пишущей (или универсальной) головки с магнитным зазором. Лента протягивается вплотную к зазору головки, и на ней образуется дорожка остаточного намагничивания. Нелинейная часть характеристики «размывается» с помощью высокочастотного тока подмагничивания (обычно порядка 100 кГц), на который накладывается полезный сигнал. Студийные аналоговые магнитофоны наряду с цифровыми до сих пор применяются для первичной записи фонограмм. Бытовые бывают двух- и трехголовочными (отдельно записывающая, воспроизводящая и стирающая головки либо стирающая и универсальная). Иногда присутствуют две воспроизводящие головки, если предусмотрен реверс.

Даже при очень бережном отношении магнитная лента со временем начинает осыпаться

Магнитная лента обладает шумами, которые уменьшаются (частично выводятся за пределы слышимого диапазона) с ростом скорости протяжки. Поэтому студийные магнитофоны имеют скорость 38, в то время как бытовые катушечные – 19 и 9,5 см/с. Для бытовых кассетных магнитофонов была принята скорость 4,76 см/с. Шумы ленты эффективно подавляются с помощью компандерной системы Dolby B: при записи уровень высокочастотной части для слабых сигналов поднимается на 10 дБ, а при воспроизведении на столько же опускается.

Профессиональная аналоговая магнитная запись на высокой скорости обеспечивает очень высокое качество. Именно на магнитных мастер-лентах долгое время архивировались музыкальные записи, и с них фонограмма переносилась на виниловые пластинки с некоторой потерей качества. Однако даже при очень бережном отношении магнитная лента со временем начинает осыпаться, ей свойственно постепенное размагничивание, деформация, копир-эффект (соседние слои в рулоне взаимно намагничиваются), она подвержена влиянию внешних магнитных полей. Затруднен также быстрый поиск нужного фрагмента (хотя это неудобство относится скорее к бытовой сфере). Поэтому с появлением цифровых форматов компания Sony, владелец огромного архива записей CBS/Columbia, озаботившись проблемой сохранности бесценных оригиналов записей второй половины 20 века, разработала метод записи в формате дискретной широтно-импульсной модуляции (поток DSD – Direct Stream Digital, который в дальнейшем дал начало пользовательскому формату Super Audio CD). Если аналоговая магнитная запись обеспечивает сохранность фонограммы в несколько десятилетий при постепенно увеличивающихся потерях, то цифровые архивы вечны и выдерживают неограниченное количество копирований без какой-либо деградации. По этой, как и по многим другим причинам (сервисные преимущества, универсальность, огромные возможности обработки) все большее распространение нынче получают цифровые форматы аудио.

ПОЛУЧЕНИЕ ЦИФРОВОГО АУДИОСИГНАЛА

По теореме Котельникова-Шенона дискретный сигнал может быть впоследствии полностью восстановлен при условии, что частота дискретизации как минимум вдвое превосходит верхнюю частоту спектра сигнала

Цифровой сигнал получают из аналогового или синтезируют непосредственно в цифре (в электромузыкальных инструментах). Аналого-цифровое преобразование предполагает две основные операции: дискретизацию и квантование. Дискретизация – замена непрерывного сигнала на ряд отсчетов его мгновенных значений, взятых через равные промежутки времени. По теореме Котельникова-Шенона дискретный сигнал может быть впоследствии полностью восстановлен при условии, что частота дискретизации как минимум вдвое превосходит верхнюю частоту спектра сигнала. Затем отсчеты квантуются по уровню: каждому из них присваивается дискретное значение, ближайшее к реальному. Точность квантования определяется разрядностью двоичного представления. Чем выше разрядность, тем больше уровней квантования (2N, где N – число разрядов) и ниже шумы квантования – погрешности из-за округления до ближайшего дискретного уровня.


Рис. 16. Оцифровка аналогового сигнала и получение цифровых отсчетов

Формат CD предполагает частоту дискретизации 44,1 кГц и разрядность 16 бит. То есть получается 44 тысячи отсчетов в секунду, каждый из которых может принимать один из 216 = 65536 уровней (для каждого из стереоканалов).

Наиболее совершенными пользовательскими форматами аудио являются DVD Audio и Super Audio CD (SACD)

Помимо формата 44,1 кГц / 16 бит в цифровой записи применяются и другие. Студийная запись обычно производится с разрядностью 20-24 бит. Затем данные переводятся в стандартный CD-формат путем пересчета. Лишние биты затем отбрасываются либо (лучше) округляются, иногда подмешивается псевдослучайный шум для уменьшения шумов квантования (dither).

Наиболее совершенными пользовательскими форматами аудио являются DVD Audio и Super Audio CD (SACD). В DVD Audio принят алгоритм сжатия данных без потерь MLP, разработанный компанией Meridian. А SACD, в отличие от других форматов, использует не импульсно-кодовую модуляцию (ИКМ, или PCM), а однобитовое кодирование DSD-потока (дискретная широтно-импульсная модуляция). Диски SACD бывают однослойными и двухслойными (гибридными), с обычным CD-слоем.

Наиболее популярным аудио носителем на сегодня остается компакт-диск, несмотря на определенные ограничения по качеству звучания, отмечаемые аудиофилами. Причина их – в низкой частоте дискретизации: для точного восстановления сигналов, близких к верхней границе звукового диапазона, необходим фильтр, не реализуемый физически (его импульсная реакция захватывает область отрицательного времени). Это в определенной степени компенсируется с помощью цифровой фильтрации с повышением частоты дискретизации и разрядности. Для обеспечения бесперебойного воспроизведения в реальном времени данные на диске записываются с избыточным кодированием (код Рида-Соломона).

Цифровые носители, чатоты дискретизации и разрядности кодирования

НосительАвторствоРазмерыВремя звучания,мин.Кол. каналовFs, кГцРазрядн., бит
CD-DASony, Philips120, 90 ммдо 90244,116
S-DATкассета, лента 3,81 мм232, 44,1, 4816
R-DATкассета, лента 3,81 мм2, 444,112, 16
DASHлента 6,3, 12,7 мм2…4844,056, 44,1, 4812, 16
DATAlesisкассета S-VHS60844,1, 4816, 20
DССPhilipsкассета2, 432, 44,1, 4816, 18
MiniDiskSony64 мм742, 444,116
DVD Audio120 мм5.119224
SACDSony, Philips120 мм2, 528001

Для передачи цифрового звука нужна широкополосная линия связи, особенно для несжатого многоканального потока высокого разрешения.

ПЕРЕДАЧА ЦИФРОВОГО АУДИО

Линиями связи для передачи цифрового аудио могут служить кабели, оптические линии и радиоэфир.

Для передачи ИКМ-сигналов по проводным линиям разработаны интерфейсы AES/EBU (балансный, коаксиальный), S/PDIF (небалансный коаксиальный), обеспечивающие передачу нескольких сигналов (тактовую частоту, частоту следования цифровых слов, данные каналов) по одному проводу. Внутри аппаратов эти сигналы передаются по отдельности, на выходе транспортного механизма кодируются, а на входе цифро-аналогового преобразователя (в двухблочных системах) вновь разделяются в цифровом приемнике.

Как правило, для передачи цифрового аудио используется высококачественный коаксиальный кабель. Существуют также преобразователи S/PDIF для оптоволоконных линий: AT&T ST и Toslink (последний является стандартным для бытовой аппаратуры). А также – для использования витых пар в составе кабельных сетей Ethernet. Средой распространения сжатого аудио в виде архивированных файлов является и сеть Интернет.


Рис. 17. Оптический кабель с разъемом Toslink

Как любой цифровой сигнал, оцифрованное аудио распределяют и коммутируют с помощью специальных устройств – усилителей-распределителей, обычных и матричных коммутаторов.

Имеется фактор, отрицательно влияющий на цифровые сигналы и часто сводящий на нет практически все преимущества цифрового аудио перед аналоговым, в числе которых возможность многократного копирования, передачи и архивирования программ без потерь качества — речь идет о джиттере. Джиттер представляет собой дрожание фазы, или неопределенность момента перехода из 0 в 1 и наоборот. Происходит это из-за постепенной деформации прямоугольных импульсов с практически идеальными фронтами, которые становятся все более пологими из-за реактивных элементов кабелей, что и приводит к неопределенности момента перепада, хотя крутизна фронтов в каждом последующем цифровом устройстве полностью восстанавливается. С джиттером все современные цифровые устройства успешно борются с помощью блоков перетактирования (reclocking). Подробнее см. брошюру «Коммутация и управление сигналами».

Рис.18. Распределение и коммутация

Для передачи и записи на различные цифровые носители применяются сжатые форматы аудио: Dolby Digital (AC-3) и DTS. Это позволяет разместить на диске DVD Video емкостью 4,7 Гб полнометражный фильм с многоканальным звуковым сопровождением, а также разного рода дополнительные материалы. Формат Dolby Digital предлагает 5 независимых каналов: 2 фронтальных, 2 тыловых и 1 сабвуферный для спец-эффектов. Сжатие производится с помощью адаптивного алгоритма MPEG Audio, основанного на психоакустических особенностях восприятия звука и обеспечивающего минимальную заметность сжатия. Все это позволяет воссоздать полноценную трехмерную звуковую панораму. Однако для качественного воспроизведения музыки Dolby Digital подходит гораздо меньше, чем CD, обладая меньшим разрешением. Скорость потока в режиме Dolby Digital (отсчеты по каждому каналу передаются друг за другом) составляет 384-640 кбит/с, в то время как в обычном двухканальном формате CD – 1411,2 кбит/с. Формат Dolby Digital 5.1 неоднократно совершенствовался, в основном в направлении наращивания количества каналов. Сейчас доступен вариант DD 7.1, предполагающий 2 фронтальных, 2 боковых и 2 тыловых канала, не считая канала спецэффектов (известна также модификация DD 6.1 с одним тыловым каналом).

Формат DTS имеет меньшую степень сжатия и большую скорость потока данных – 1536 кбит/с. Поэтому он используется не только для кодирования многоканальных саундтреков на DVD Video, но для многоканальных аудиод

Джиттер и шум квантования

В АЦП рассматривают еще и такие понятия, как джиттер и шум квантования. Рассмотрим коротко, что они собой представляют.

Итак, джиттер называют фазовым дрожанием цифрового сигнала. В целом это нежелательные (случайные) фазовые и/или частотные отклонения сигнала, что передаются носителем. Может возникнуть по причине нестабильности работы задающего генератора из-за изменения параметров (временных или частотных) линии передачи. Джиттер может проявляться в виде задержек и затухания сигнала, шумов.

В АЦП джиттером называют смещение во временном периоде моментов квантования во время оцифровки аналогового звука. Связано это с несовершенством тактового сигнала, который задает момент семплирования.

Шумом квантования называют ошибки, которые возникают в процессе преобразования аналогового сигнала в цифру. Могут возникать вследствие округления или усечения сигналов. Оба рассмотренные явления влияют на качество итогового звучания. Поэтому, чтобы избежать данных ошибок, во время АЦП передачу сигнала с одного регистра на другой следует осуществлять максимально точно. Кроме того, важно использовать качественную аппаратуру для преобразования сигнала: это касается и звукозаписывающих приборов, и источников питания, и кварцевых генераторов.

2.1. Бинарная система

Подразумевает использование бинарного исчисления для отображения тех или иных значений. В цифровой аудиоиндустрии используется для отображения мгновенных значений напряжения, полученных при замерах мгновенных значений амплитуды аналогового сигнала. Однако, если в аналоговом мире, точность измерения является функцией количества знаков после запятой, то в бинарной системе это количество нулей и единиц в одном цифровом “слове”. Длинна такого слова называется разрядность. Ниже приведена таблица, демонстрирующая систему с 8-ми битной разрядностью.

В такой системе возможно представить максимум 256 различных значений. Внимательный читатель обратит внимание, что отрицательные числа представляются цифровым словом, начинающимся с единицы, тогда как положительные значения начинаются с нуля. Кроме того, положительных значений всегда будет на одно меньше, чем отрицательных, и это потому, что одно из значений “расходуется” на представление нуля, который, как известно, и не положительный и не отрицательный. Колличество возможных значений можно с легкостью вычислить по следующей формуле:

Цифровое слово состоит из ряда нулей и единиц. Первое число в слове называется MSB (Most Significant Bit), тогда как последнее называется LSB (Least Significant Bit). MSB наиболее информативно, а LSB дает наиболее точный координат.

Для иллюстрации можно сравнить MSB с числом перед запятой, тогда как LSB с последним числом после запятой. Например, возьмем число 5.05683097. Первое число (5) является MSB и несет в себе наиболее важную информацию. Без него мы не будем знать, что все число близко к 5. Тогда как последнее число (7) несет в себе наиболее точную информацию о величине числа. Это весьма грубая аналогия, однако может быть вплоне пригодна для иллюстрации.

Данное вычисление демонстрирует способ, посредствам которого получают те или иные значения при помощи нулей и единиц. В данном случае 01111100 равняется 124. Поочередно берется значение (0 или 1) и умножается на 2 (так как может быть либо ноль либо один) в возрастающей степени. Начинают с LSB и степени ноль. Как известно, любое число умноженое на ноль будет равняться нулю. Поэтому, при расчете, считают только единицы и их порядковый номер в цифровом слове, определяющий степень.

Обьем полученного файла будет зависить от часотоы дискретизации, разрядности и, естественно, времени, на протяжении которого производилась оцифровка. Объем легко вычислить по следующей формуле:

Данная формула позволяет вычислить объем для одной минуты моно сигнала. Для получения объема для более длительного времени и многоканального звука, необходимо умножить полученный результат на колличество минут и каналов.

Конечно же, чем большe колличество доступных значений (разрядность), тем более точно можно представить значение амплитуды исходного сигнала в даннный момент времени, однако, в любом случае, количество возможных значений не может быть бесконечным и всегда будет ограниченным. Поэтому, для того, чтобы представить непрерывные значения амплитуды исходного сигнала в дискретной форме, производятся некоторые округления, до значений известных системе.

Цифро аналоговое преобразование

Когда звук был преобразован в цифровой сигнал, чтобы его прослушать, его необходимо снова перевести в аналоговое звучание. Для этого используются цифро-аналоговые преобразователи. На примере аудио интерфейсов рассмотрим, как происходит этот процесс. Аналоговый звук попадает в микшер (аналоговый вход) и направляется в АЦП, где он квантуется и дискретизируется. Полученный цифровой сигнал на выходе проходит такой же процесс, только обратный: данные проходят через цифро-аналоговый преобразователь, который превращает их в аналоговый сигнал. На схеме процесс выглядит так:

Как ЦАП строят волну

ЦАП – это цифро-аналоговый преобразователь, элемент, переводящий цифровой звук в аналоговый. Мы рассмотрим поверхностно основные принципы. Если по комментариям будет виден интерес более подробно рассмотреть ряд моментов, то будет выпущен отдельный материал.

Мультибитные ЦАП

Очень часто волну представляют в виде ступенек, что обусловлено архитектурой первого поколения мультибитных ЦАП R-2R, работающих аналогично переключателю из реле.

На вход ЦАП поступает значение очередной координаты по вертикали и в каждый свой такт он переключает уровень тока (напряжения) на соответствующий уровень до следующего изменения.

Хотя считается, что ухо человека слышит не выше 20 кГц, и по теории Найквиста можно восстановить сигнал до 22 кГц, остается вопрос качества этого сигнала после восстановления. В области высоких частот форма полученной «ступенчатой» волны обычно далека от оригинальной. Самый простой выход из ситуации – это увеличивать частоту дискретизации при записи, но это приводит к существенному и нежелательному росту объема файла.

Альтернативный вариант – искусственно увеличить частоту дискретизации при воспроизведении в ЦАП, добавляя промежуточные значения. Т.е. мы представляем путь непрерывной волны (серая пунктирная линия), плавно соединяющий исходные координаты (красные точки) и добавляем промежуточные точки на этой линии (темно фиолетовые).

При увеличении частоты дискретизации обычно необходимо повышать и разрядность, чтобы координаты были ближе к аппроксимированной волне.

Благодаря промежуточным координатам удается уменьшить «ступеньки» и построить волну ближе к оригиналу.

Когда вы видите функцию повышения частоты с 44.1 до 192 кГц в плеере или внешнем ЦАП, то это функция добавления промежуточных координат, а не восстановления или создание звука в области выше 20 кГц.

Изначально это были отдельные SRC микросхемы до ЦАП, которые потом перекочевали непосредственно в сами микросхемы ЦАП. Сегодня можно встретить решения, где к современным ЦАП добавляется такая микросхема, это сделано для того, чтобы обеспечить альтернативу встроенным алгоритмам в ЦАП и порой получить еще более лучший звук (как например это сделано в Hidizs AP100).

Основной отказ в индустрии от мультибитных ЦАП произошел из-за невозможности дальнейшего технологического развития качественных показателей при текущих технологиях производства и более высокой стоимости против «импульсных» ЦАП-ов с сопоставимыми характеристиками. Тем не менее, в Hi-End продуктах предпочтение отдают зачастую старым мультибитным ЦАП-ам, нежели новым решениям с технически более хорошими характеристиками.

Импульсные ЦАП

В конце 70-тых широкое распространение получил альтернативный вариант ЦАП-ов, основанный на «импульсной» архитектуре – «дельта-сигма». Технология импульсных ЦАП-ов стала возможной появлению сверх-быстрых ключей и позволила использовать высокую несущую частоту.

Амплитуда сигнала является средним значением амплитуд импульсов (зеленым показаны импульсы равной амплитуды, а белым итоговая звуковая волна).

Например последовательность в восемь тактов пяти импульсов даст усредненную амплитуду (1+1+1+0+0+1+1+0)/8=0,625. Чем выше несущая частота, тем больше импульсов попадает под сглаживание и получается более точное значение амплитуды. Это позволило представить звуковой поток в однобитном виде с широким динамическим диапазоном.

Усреднение возможно делать обычным аналоговым фильтром и если такой набор импульсов подать напрямую на динамик, то на выходе мы получим звук, а ультра высокие частоты не будут воспроизведены из-за большой инертности излучателя. По этому принципу работают ШИМ усилители в классе D, где плотность энергии импульсов создается не их количеством, а длительностью каждого импульса (что проще в реализации, но невозможно описать простым двоичным кодом).

Мультибитный ЦАП можно представить как принтер, способный наносить цвет пантоновыми красками. Дельта-Сигма – это струйный принтер с ограниченным набором цветов, но благодаря возможности нанесению очень мелких точек (в сравнении с пантовым принтером), за счет разной плотности точек на единицу поверхности дает больше оттенков.

На изображении мы обычно не видим отдельных точек из-за низкой разрешающей способности глаза, а только средний тон. Аналогично и ухо не слышит импульсов по отдельности.

В конечном итоге при текущих технологиях в импульсных ЦАП можно получить волну, близкую к той, что теоретически должна получится при аппроксимации промежуточных координат.

Надо отметить, что после появления дельта-сигма ЦАП исчезла актуальность рисовать «цифровую волну» ступеньками, т.к. так ступеньками волну современные ЦАП не строят. Правильно дискретный сигнал строить точками соединенной плавной линией.

Являются ли идеальными импульсные ЦАП?

Но на практике не все безоблачно, и существует ряд проблем и ограничений.

Т.к. подавляющее количество записей сохранено в многоразрядном сигнале, то перевод в импульсный сигнал по принципу «бит в бит» требует излишне высокую несущую частоту, которую современные ЦАП не поддерживают.

Основной функцией современных импульсных ЦАП является перевод многоразрядного сигнала в однобитный с относительно невысокой несущей частотой с прореживанием данных. В основном именно эти алгоритмы и определяют конечное качество звучания импульсных ЦАП-ов.

Чтобы уменьшить проблему высокой несущей частоты, звуковой поток разбивается на несколько однобитных потоков, где каждый поток отвечает за свою группу разряда, что эквивалентно кратному увеличению несущей частоты от числа потоков. Такие ЦАП называются мультибитными дельта-сигма.

Сегодня импульсные ЦАП-ы получили второе дыхание в быстродействующих микросхемах общего назначения в продуктах компаний NAD и Chord за счет возможности гибко программировать алгоритмы преобразования.

Громкость в цифровом звуке

Громкость цифровых сигналов не должна превышать 0db. Если не учитывать этот нюанс, на входе или выходе мы получаем перегрузку цифрового сигнала. Это значение является самой высокой точкой, то есть пиковым значением. Она позволяет записывать качественный звук и воспринимать его надлежащим образом. Если превысить это значение, сигнал искажается, а оборудование от перенагрузки может испортиться.

Кроме пиковой точки, понятие громкости включает в себя еще и такой элемент, как значение RMS. Этим понятием определяют уровень актуальной громкости, который отражает плотность записи и выдает информацию о громкости, которую способен воспринять наш слух. RMS обозначают в децибелах, но с минусовым значением: звук тем громче, чем больше числовое значение RMS (максимально громко — -6db, максимально тихо — -20db). Оптимальные значения цифровой громкости — -12db — -10db.

2.3. Резолюция или разрядность

Под данным понятием понимают длинну цифрового слова, а значит колличество доступных значений для отображения амплитуды оригинального сигнала. Отсюда можно сделать вывод: чем выше разрядность, тем более детально можно представить исходный сигнал. А что же с динамическим диапазоном? То есть какой максимальный уровень система может отображать? Это также напрямую связано с разрядностью. Каждый бит расширяет динамический диапазон на 6.02 dB. Динамический диапазон любой системы можно вычислить по следующей формуле:

Так, например, динамический диапазон 16-ти битной системы составляет 96.3 dB, тогда как 24-х битной 144.4 dB. Однако, не стоит путать динамический диапазон с отношением сигнал шум! Как было сказано раньше, ошибки квантования вызывают шум равный 3 dB, который является минимальным шумовым порогом любой цифровой системы!

В цифровых форматах за наивысшее значение сигнала принимается 0 dBFS (Full Scale) и отсчет ведется в отрицательную сторону. Для примера, в 16-ти битной системе с динамическим диапазоном равным 96.3 dB, наивысшее значение будет 0 dBFS,а наименьшее -96.3 dBFS.

Теперь поговорим о сигналах, уровень которых превышает 0 dBFS. Что же будет происходить в этом случае? Если в мире аналаоговых технологий, а особенно ламповых, некоторая степень перегрузки (overdrive) может выгодно окрашивать звук, то в цифрах любое преодоление барьера равного максимальному уровню данной системы будет выражаться в клипинге, то есть приравнивании всех сигналов, превышающих этот уровень к максимально возможному в данной системе. Это выражается в очень неприятных звуках, если уж не говорить о том, что полезный сигнал навсегда утерян. Это означает, что необходимо быть очень осторожным при настройке уровня. Не стоит стремится к самому “потолку”. Это привычка, оставшаяся со времен магнитных лент, динамический диапазон которых был в лучшем случае 60 dB, без учета шипения и других артефактов. Тогда, действительно была необходимость записи сигнала как можно ближе к границе возможного уровня, а иногда даже и за ней, чтобы отдалиться, насколько это возможно, от шумов. Цифровая технология предоставляет нам 96.3 dB (16 bit) и 144.4 dB (24 bit) динамического диапазона и очень глупо его не использовать. Автор не имеет ввиду запись на очень низких уровнях, что ведет к частичному использованию всех возможных в данной системе значений, но грамотному использованию возможностей современной технологии. Помните: цифровые искажения – ПЛОХО! Очень плохо!

Как видно из иллюстрации, невыделенная часть сигнала имеет пиковые значения равные 0 dBFS, в то время как выделенная часть, хотя и имеет уровнь отличающийся от невыделенной всего на 1 dB, заметно искажена. Часть сигнала превышающая максимальный уровень просто напросто навсегда утеряна. Даннное явление называют клиппинг.

Здесь, большое значение играет индикативное оборудование, которое при грамотном и правильном использовании, может помочь избежать перегрузок и, как результат, искажений. Для более полной и подробной информации обратитесь к главе “Громкость и уровень”. Также избежать искажений поможет калибровка уровней всего используемого оборудования под единный стандарт.

Стереофония и панорама

Стереофонией называют запись, передачу или воспроизведение звукового сигнала, при которых сохраняется информация аудиального типа о расположении источника этого сигнала методом раскладки звука парой и более независимыми аудиоканалами. При правильном расположении музыкальных вещателей можно получить объемное пространственное звучание. При этом создается ощущение, что звук с разными фазами исходит из разных источников.

Панорама – это, по сути, установленное направление источника звука по трем пространственным характеристикам – удаленности, высоте и направлению. Благодаря панорамированию мы получаем:

  • равномерное распределение энергии звука;
  • разграничение источников сигнала с одинаковым диапазоном и частотой звучания;
  • специальные эффекты.

Чтобы создать качественную звуковую панораму, необходимо правильно расставить элементы, подающие сигнал. В идеале это выглядит так:

То есть центральный канал звукового источника должен располагаться между левым и правым каналом. Такое размещение стереофонических источников позволит получить максимально полное, чистое и насыщенное звучание звука.

Основные форматы аудио файлов

На самом деле форматов, с помощью которых можно читать аудио файлы, очень много. Но есть те, которые получили всеобщее признание. Все они делятся на три группы:

  • аудиоформаты без сжатия;
  • со сжатием без потерь;
  • со сжатием с потерями.

Рассмотрим основные форматы аудио файлов:

  1. WAV – первый аудио формат, который мог обрабатываться компьютерными программами на высоком профессиональном уровне. Недостаток – запись занимает слишком много места.
  2. CD-диски – расширение .cda не поддается редактированию, однако его можно переформатировать и сохранить любой программой по обработке аудио.
  3. MP3 кодек – универсальный формат, максимально сжимающий аудио файлы.
  4. AIFF-файлы – формат поддерживает монофонические и стереофонические данные размером 8 и 16 бит, изначально разрабатывался для Macintosh, однако после дополнительных разработок может использоваться и на других площадках ОС.
  5. OGG – популярный формат, однако имеет недостатки в виде использования собственных кодеков и декодеров и перегрузки системных ресурсов компьютера.
  6. AMR – низкопробный аудиоформат.
  7. Формат MIDI позволяет производить редактуру записи нажатием клавиш, изменением темпа, тональности, высоты, а также добавлением эффектов.
  8. FLAC – формат, воспроизводящий аудио в высоком качестве.

Формат DSD

После широкого распространения дельта-сигма ЦАП-ов вполне логичным было и появления формата записи двоичного кода напрямую дельта-сигма кодировке. Этот формат получил название DSD (Direct Stream Digital).
Широкого распространения формат не получил по нескольким причинам. Редактирование файлов в этом формате оказалось излишне ограниченным: нельзя микшировать потоки, регулировать громкость и применять эквализацию. А это значит, что без потери качества можно лишь архивировать аналоговые записи и производить двухмикрофонную запись живых выступлений без последующей обработки. Одним словом – денег толком не заработать.

В борьбе с пиратством диски формата SA-CD не поддерживались (и не поддерживаются до сих пор) компьютерами, что не позволяет делать их копии. Нет копий – нет широкой аудитории. Воспроизвести DSD аудиоконтент можно было только с отдельного SA-CD проигрывателя с фирменного диска. Если для PCM формата есть стандарт SPDIF для цифровой передачи данных от источника к отдельному ЦАП, то для DSD формата стандарта нет и первые пиратские копии SA-CD дисков были оцифровками с аналоговых выходов SA-CD проигрывателей (хоть ситуация и кажется глупой, но на деле некоторые записи выходили только на SA-CD, либо та же запись на Audio-CD специально была сделана некачественно для продвижения SA-CD).

Переломный момент произошел с выходом игровых приставок SONY, где SA-CD диск до воспроизведения автоматически копировался на жесткий диск приставки. Этим воспользовались поклонники формата DSD. Появление пиратских записей простимулировало рынок на выпуск отдельных ЦАП для воспроизведения DSD потока. Большинство внешних ЦАП с поддержкой DSD на сегодняшний день поддерживает передачу данных по USB используя формат DoP в виде отдельного кодирования цифрового сигнала через SPDIF.

Несущие частоты для DSD сравнительно небольшие, 2.8 и 5.6 МГц, но этот звуковой поток не требует никаких преобразований с прореживанием данных и вполне конкурентно-способен с форматами высокого разрешения, такими как DVD-Audio.

На вопрос что лучше, DSP или PCM однозначного ответа нет. Все упирается в качество реализации конкретного ЦАП и таланта звукорежиссера при записи конечного файла.

Рейтинг
( 2 оценки, среднее 5 из 5 )
Понравилась статья? Поделиться с друзьями:
Для любых предложений по сайту: [email protected]