Что такое DSD-аудио? Как это работает и где взять файлы?

Сохранить и прочитать потом —

Похоже, формат DSD вновь входит в моду. Большинство новых цифровых устройств обеспечивают его поддержку, а каталог доступных альбомов внушает уважение – особенно у любителей джаза и классики.

Что же это такое и чем отличается от других систем записи цифровых сигналов, применяющихся в компакт-дисках и других форматов Hi-Res-аудио? Давайте узнаем.

Подробнее о PCM

Цифровые потоки записываются в виде комбинации двух состояний, 0 и 1; но для того, чтобы эту информацию можно было использовать, она должна быть организована особым образом. Почти во всех случаях используется система под названием PCM (Pulse Code Modulation, импульсно-кодовая модуляция).

Давайте вначале вспомним, как именно работает PCM.

При использовании PCM исходная форма аналогового аудиосигнала описывается при помощи двух параметров. Первый – это величина. На компакт-диске она представлена 16-разрядными цифровыми данными, что дает возможность задавать 65 536 различных уровней сигнала.

Для адекватного представления исходной формы сигнала ее необходимо измерять с точно отмеренными регулярными интервалами. Эти отсчеты выполняются 44 100 раз в секунду. Число выглядит случайным, однако его выбор был очень продуманным – оно обеспечивает покрытие полного диапазона слышимых человеком частот (от 20 Гц до 20 кГц).

DSD and SACD

Технология DSD (Direct Stream Digital) использует другой подход. Она была разработана в середине 90-х как способ архивирования старых аналоговых записей.

Предполагалось, что это будет более простой и экономичный с точки зрения занимаемой памяти способ хранения цифровых музыкальных данных по сравнению с PCM. Что особенно важно, DSD также изначально разрабатывался с учетом возможности преобразования в файлы формата PCM с частотой дискретизации, кратной 44,1 кГц.

Примерно в то же время компании Sony и Philips работали над заменой CD, который в конечном итоге принял форму SACD. Система DSD представлялась идеальной основой для создания нового формата – в частности, благодаря превосходной защите от копирования.

Основным достоинством DSD была простота и вытекающая из нее дешевизна реализации. Эта технология требовала меньшего уровня обработки, чем PCM, благодаря чему можно было применять более простые и намного менее дорогие ЦАП.

Защита SACD от копирования. Распространение аудио в формате DSD

Все SACD диски обладают специальной защитой (на физическом уровне), которая позволяет считывать SACD слой только лицензированным производителем устройствам, которые оснащены специальным ключом. Тем не менее, в интернете можно найти раздачи SACD рипов. Снятие рипов выполняется с помощью PlayStation 3 (или подходящего проигрывателя со специальной прошивкой) и специальной программы SACD Ripper для ПК. Рип представляет собой так называемый SACD-R образ (как правило в формате ISO). Этот образ можно записать (тем же ImgBurn, например) на DVD диск и далее слушать на стационарном SACD проигрывателе.

Таким образом мы видим, что технология SACD не включает в себя ничего принципиально нового — по сути это поток данных с АЦП, записанный на носитель вроде DVD. Весомое различие между SACD и DVD диском (кроме защиты от копирования) заключается лишь в размере сектора — 2064 вместо 2048 байт. Похоже, что этот трюк был придуман в коммерческих целях, и во многом именно поэтому ни один оптический привод для ПК не читает SACD диски.

Кроме SACD дисков DSD аудио также может распространяться и в виде файлов, в том числе записанных на так называемый DSD disc

. Спецификация была разработана Sony и представляет собой DVD или Blue-ray носитель с файлами формата DSF (DSD Storage Facility), содержащими стерео звук. Многоканальное аудио стандартном не поддерживается, хотя формат DSF открытый и вполне может содержать многоканальное аудио, которое будут читать программные плееры (например, foobar2000). Минусом Sony DSF, как контейнера для хранения DSD, является отсутствие поддержки DST сжатия. Для поддержки DST сжатия следует использовать более сложный контейнер Philips DSDIFF, о котором было сказано ранее.

Как работает DSD?

DSD использует один бит информации, который говорит только о том, больше или меньше предыдущего фрагмента аналогового сигнала оказывается текущий. По сравнению с 65 тысячами разных значений, которые может принимать сигнал PCM, всего лишь два (0 в случае, если уровень сигнала нового отсчета ниже, и 1 – если он выше) у сигнала DSD кажутся категорически недостаточными для передачи нужной информации.

Однако нехватка информации компенсируется очень высокой частотой дискретизации – более 2,8 миллиона раз в секунду, что в 64 раза превышает соответствующий параметр для CD. Из-за этого DSD-формат стандартного разрешения нередко обозначают как DSD64, а его версии с удвоенной и учетверенной частотой дискретизации – как DSD128 и DSD256, соответственно. Существует даже спецификация DSD512, хотя нам не доводилось слышать, чтобы с ее применением был записан какой-то материал.

Записи в стандартном формате DSD по-прежнему достаточно редки по сравнению с альтернативными вариантами в PCM, а с повышенным разрешением встречаются еще намного реже. Однако поклонники DSD утверждают, что этот формат обеспечивает максимальную близость к аналоговому звучанию.

Если бы можно было увидеть цифровой поток формата DSD, нарисовать соответствующий аналоговый сигнал стало бы возможно, просто взглянув на распределение нулей и единиц. Чем больше нулей, тем меньше его величина; чем больше единиц, тем она больше. Если два значения встречаются примерно поровну, уровень сигнала близок к нулевому.

В чем недостатки формата DSD?


Плеер Astell & Kern AK70 mkII перед воспроизведением преобразует файлы формата DSD в PCM

Все это прекрасно, но у формата DSD есть и минусы. В частности, в нем сложно работать с записями.

Для выполнения любых обработок записи – например, эквализации, редактирования, управления динамическим диапазоном и добавления реверберации – обычно приходится преобразовывать DSD в PCM, выполнять необходимые преобразования и затем конвертировать обратно в DSD.

Этот способ сложно назвать простым и прямолинейным, однако он применяется практически для каждой студийной записи, выполненной по технологии DSD. Все дело в отсутствии подходящего оборудования и соответствующего программного обеспечения.

В описании диска может встретиться обозначение DXD. Это означает, что исходный сигнал в DSD был преобразован в PCM с параметрами 24 бит/352 кГц и обрабатывался в этом виде. Несмотря на то, что название, намеренно или нет, звучит похоже на DSD, по сути, это просто PCM с очень высоким разрешением.

Кроме того, аналоговому сигналу, полученному из DSD, присущ высокий по сравнению с PCM уровень шума. Продуманные технологии позволяют инженерам вывести эти шумы за границу слышимого диапазона частот и оптимизировать качество звука и шкалу динамики в пределах слышимого спектра. Высокочастотный шум обычно отфильтровывается.

Как воспроизвести SACD?

Воспроизвести SACD диск на приводе ПК, как я уже сказал, невозможно, поэтому далее я буду рассматривать исключительно воспроизведение образов (SACD-R, DSD-Disc).

3.1 Воспроизведение на устройствах с поддержкой DSD

Если Вы счастливый обладатель звуковой карты / ЦАП с поддержкой DSD, поздравляю — вы сможете успешно воспользоваться преимуществами Super Audio CD. Как настроить правильный вывод DSD — я расскажу ниже.

3.1.1 Native DSD и DoP

Существует два варианта доставки DSD потока на ЦАП: native («родной») DSD и DoP (DSD over PCM). В первом варианте поток поступает на карту именно в том виде, о котором шла речь выше — с очень высокой частотой дискретизации и разрядностью 1 бит. Второй же вариант был разработан для совместимости с существующими PCM-транспортами (чтобы не сочинять новые алгоритмы передачи, а использовать уже имеющиеся для PCM) и представляет собой простое мультиплексирование высокочастотного 1-битного потока в 24-битный PCM с более низкой частотой, в котором старшие 16 бит содержат фрагмент DSD потока, а младшие 8 — специальный DoP-маркер, служебную информацию, говорящую, что данные являются не обычным PCM, а упакованным DSD потоком. Так, для передачи стандартного DSD64 с частотой 2822.4 кГц используется PCM формата 24 бит 176.4 кГц, который легко можно передать по USB, S/P-DIF и другим привычным интерфейсам. С повышением частоты DSD, соответственно, повышается и частота PCM-носителя. Так как поддержка PCM с частотой 705,6 кГц весьма скудная, то проигрывание DSD256 через DoP уже, как правило, не представляется возможным. Также нужно отметить, что процесс мультиплексирования/демультиплексирования самый что ни на есть простой и не предполагает никаких потерь информации/качества. Приведу пример в десятичной системе: представьте, что у вас есть значения 2, 5, 3, 6, 9, 0 и т. д., и вы называете их своему товарищу по-очереди — это обычная передача. Теперь представьте, что Вы условились читать имеющиеся значения «пачками», трехзначными числами — 253, 690 и т. д. — а товарищ будет по-прежнему записывать цифры по отдельности — это и есть мультиплексирование/демультиплексирование. Более чем просто, не правда ли?

3.1.2 Настройка foobar2000

Если по какой-либо причине вы не сможете сами разобраться с настройкой вывода DSD — не проблема — я могу вам в этом помочь. Свяжитесь со мной, чтобы заказать индивидуальную настройку foobar2000/звуковой карты/компьютера.
Итак, приступим к настройке воспроизведения. Наш инструментарий для воспроизведения SACD образов (имеющих формат ISO) включает в себя последние версии foobar2000 с плагинами SACD Decoder, DSD Processor и ASIO-драйвером DSD Transcoder (скачать можно там же, одним архивом с foo_input_sacd), а также ASIO-драйвер ASIO Proxy, который может нам понадобиться вместо DSD Transcoder в некоторых случаях.

Теперь нужно определиться, что мы имеем в плане оборудования. В моём распоряжении на данный момент находится USB-ЦАП iFI nano iDSD. Итак, смотрим в спецификацию и видим, что наше устройство поддерживает PCM вплоть до 384 кГц и DSD вплоть до 12.4 МГц. Таким образом, это означает поддержку всех форматов PCM (в спецификации это не указано, но карта поддерживает разрядность до 32-бит), включая DXD, поддержку DSD64 и DSD128 через DoP или native DSD, а также, дополнительно, поддержку DSD256 — только через native DSD (в последней версии прошивки добавлена поддержка вывода DSD256 также и в режиме DoP).

Вот, как выглядят настройки SACD декодера в нашем случае:


Настройки SACD декодера для DSD вывода

Здесь мы включили декодирование в формате DSD и включили использование DSD Processor. Кстати, если вы хотите, чтоб в плеере работали визуализации, можете установить декодирование в формате DSD+PCM, однако помните, что это негативно отразится на производительности. Остальные настройки:

Editable tags

— включает возможность редактирования тегов. При этом новые теги пишутся не в файл образа, а в XML файлы в папке foobar2000/sacd_metabase.

Store tags with ISO

— если включено, XML файл со значениями тегов сохраняется в той же папке, что и ISO образ.

Linked 2CH/MCH Tags

— создаёт связь между тегами стерео и многоканальной версий трека, так что изменения в одном варианте влекут изменения и для второго.

Edited Master Playback

— включает воспроизведение оригинальной мастер-записи, включая участки, которые не были включены при разметке SACD-диска. При этом фактическое время звучания некоторых треков может быть на несколько секунд больше, что может привести к неверному отображению текущей позиции воспроизведения.


Настройки DSD процессора для iFi nano iDSD
DSD процессор нам нужен для того, чтобы сконвертировать неподдерживаемые форматы DSD в максимальный поддерживаемый. Кстати говоря, с сожалением отмечу, что по данным разработчика для преобразования DSD->DSD используется промежуточное преобразование в PCM (хотя и весьма качественное). Для nano iDSD я включил конвертацию DSD512 в DSD256 с использованием SDM Type D — максимально качественный фильтр 5-го порядка, использующий расчеты в 64-битном формате с плавающей точкой. Для интересующихся различиями между разными типами сигма-дельта модуляторов — SDM Type A/B/C/D — привожу таблицу:

Sample&Hold выключено (эта опция включает упрощение алгоритма за счет использования интерполяции нулевого порядка, что помогает снизить нагрузку на процессор, но негативно отражается на качестве).

Далее поток следует на вывод (обратите внимание: если выбран вывод DSD: …

и на него следует DSD/DoP поток, DSP и регулировка громкости отключаются; для обычных PCM данных они по-прежнему будут работать). Я могу просто использовать вывод
DSD: ASIO: iFi (by AMR) HD USB Audio
, при этом данные будут выводиться в DoP (именно в таком виде поступают данные с SACD декодера). Однако это меня не устраивает, т. к. тогда я потеряю возможность воспроизводить DSD256 (и вообще, я предпочитаю использовать родной DSD формат), и поэтому я предварительно настрою вывод через драйвер DSD Transcoder. Для этого нужно перейти в Playback->Output->ASIO и дважды нажать в списке на DSD Transcoder (DoP/Native).
Настройки DSD Transcoder для iFi nano iDSD
Тут я просто установил вывод всех форматов DSD в режиме native. Параметр Transition отвечает за добавление тишины в начало треков, его можно увеличить, если вы заметите, что треки начинают звучать не сразу. Параметр Sample position override необходим, если в плеере некорректно отображается позиция воспроизведения (прошедшее/оставшееся время).

Далее осталось только выбрать вывод DSD на транскодер:

Кстати говоря, выбранная разрядность здесь роли не играет, т. к. конвертер глубины бит при DSD выводе не используется.

3.1.3 Проверка работоспособности настроек

Для теста я использовал DSD256 семпл Britten: Frank Bridge Variations — Romance, TrondheimSolistene

со страницы 2L High Resolution Music.

Как видите, семпл воспроизводится, а в панели iFi (панель устройства ASIO можно открыть двойным кликом по названию в списке устройств ASIO — см. выше) отображается частота нативного DSD256.

3.1.4 Настройка для нескольких DSD устройств

Это всё хорошо, но только если вы пользуетесь для воспроизведения DSD только одним устройством. А что делать, если устройств несколько, и у них разная поддержка DSD (например, один ЦАП поддерживает DSD256, а другой — нет) — ведь в таком случае нужно будет постоянно менять настройки DSD процессора? В этом случае на помощь приходит ASIO Proxy и Custom channel mappings в foobar2000. Установите драйвер ASIO Proxy и затем добавьте новый пресет для ASIO, перейдя в настройках в Playback->Output->ASIO и нажав Add new в разделе Custom channel mappings. В открывшемся окне выберите драйвер foo_dsd_asio и введите подходящее название:

После этого нажмите Configure — появится окно настройки ASIO Proxy.


Настройки ASIO Proxy для iFi nano iDSD

Как видите, ASIO Proxy совмещает в себе функционал DSD транскодера и DSD процессора, позволяя настроить все параметры индивидуально для каждого устройства. Для своего ЦАП я выбрал настройки аналогичные приведённым ранее.

Обратите внимание: в ASIO Proxy кроме стандартных режимов DSD и DoP есть еще специальные режимы DoP для ЦАП-ов dCS и exD.

После сохранения настроек осталось выбрать устройство вывода DSD: ASIO: iFi nano iDSD custom

и убедиться, что воспроизведение работает. Так и есть, панель iFI по-прежнему отображает частоту 11289.6 кГц.

Теперь можно аналогично создать новые пресеты ASIO с установками для любого другого ЦАП — затем останется лишь переключать при необходимости устройства вывода.

Примечание: у ASIO Proxy есть один минус: он не читает DoP маркеры, и если на него подать PCM 176 кГц или больше, он воспримет его как DSD over PCM и будет конвертировать согласно установкам. Например, в моём случае 352.8 кГц будет конвертироваться в DSD128 (что особого смысла не имеет, ЦАП всё равно сконвертирует PCM в DSD). Поэтому если вы собрались воспроизводить PCM — лучше переключиться на обычный вывод ASIO: <�ваша звуковая карта>

.

3.1.5 Устранение проблем

Если вы настроили всё согласно моей инструкции и спецификации своего устройства, но DSD поток не воспроизводится или воспроизводится с искажениями/щелчками, то попробуйте следующее:

  1. Если плеер (или вся система) тормозит и/или наблюдаются искажения, обратите внимание на загруженность процессора, в частности на то, сколько процессорных ресурсов потребляет foobar2000 (можно посмотреть в Диспетчере задач Windows). Если плеер слишком перегружает систему — попробуйте убрать из него лишние визуализации. Также большую нагрузку на процессор при старте трека может давать Waveform Seekbar, т. к. он дополнительно декодирует и анализирует всю запись (попробуйте временно удалить плагин).
  2. Если воспроизведение идёт с щелчками или искажениями: откройте панель вашего ASIO устройства (для этого поставьте воспроизведение на стоп, зайдите в Preferences->Playback->Output->ASIO и дважды щёлкните по названию ASIO драйвера) и проверьте настройки буфера вывода. Например, драйвер iFi пишет, когда размер буфера вывода не соответствует выбранному режиму и текущей частоте дискретизации:

    Чтобы увидеть это предупреждение, нужно открыть панель устройства во время воспроизведения DSD, но чтобы изменить настройки воспроизведение обязательно нужно остановить.

    Если вы испытываете проблемы с выводом DSD и видите такое предупреждение, увеличьте буфер вывода. Чтобы проверить, действительно ли проблема в буфере — установите максимально безопасный режим (Extra Safe) и увеличивайте размер буфера до тех пор, пока во время проигрывания не перестанет отображаться предупреждение. Даже если у вас другая панель — всё равно попробуйте увеличить буфер, часто это помогает от щелчков и искажений.

  3. Поменяйте режим вывода DSD на DoP (или наоборот) — возможно, с одним из них драйвер работает лучше.
  4. Обновите драйвер и (после обновления драйвера) прошивку (Firmware) вашего ЦАП — это может помочь, если проблемы воспроизведения связаны с каким-то багом в ПО. За последними драйверами/прошивками и инструкциями обращайтесь на сайт производителя устройства.

3.2 Настройка декодирования и вывода в PCM

Если пока Вы не располагаете DSD-совместимым устройством — что ж, не беда, можно просто преобразовать DSD в PCM с высоким разрешением. Также декодирование в PCM понадобится, если вам необходимо выполнять дополнительную обработку потока с помощьюб DSP (как я писал выше, при выводе DSD потока все обработчики отключаются).


Настройки SACD декодера для вывода PCM

В настройках декодера можно задать целевую частоту дискретизации и алгоритм преобразования DSD в PCM. Multistage является SSE-оптимизированным алгоритмом и использует плавающую точку с одинарной (32fp) или двойной (64fp) точностью. Direct метод является более медленным (примерно на 40% медленнее Multistage) и выполняет фильтрацию частот выше 30 кГц. Installable FIR режим позволяет загрузить одну из приложенных к плагину предустановок ФНЧ, давая таким образом возможность выбирать граничную частоту.


Спектр аудио 192 кГц, полученного алгоритмом Multistage (64fp). На графике виден высокий уровень шума в сверхзвуковом диапазоне, обусловленный нойз-шейпингом

Лично я советую выбрать режим Direct (64fp, 30kHz LF), чтобы исключить интермодуляции от ультразвуковых частот, и максимальную частоту дискретизации, а в DSP (обязательно в самое начало цепочки) поставить SoX ресемплер до опорной частоты звуковой карты (её, в свою очередь, установить максимальной). Касаемо настроек — рекомендую почитать мою статью про качественный вывод звука.

Также настройки позволяют установить увеличение уровня громкости. Как правило, SACD имеет пиковый уровень менее -6 dBFS (0.5 от максимума), потому его можно установить в +6 dBFS (при выводе в DSD такое повышение громкости выполняет ЦАП). Есть похожая настройка и для LFE (канала сабвуфера) — полезна для случаев, когда ваш ресивер изменяет уровень канала LFE. После настройки, чтобы убедиться в отсутствии клиппинга можно выполнить анализ результирующего пика с помощью ReplayGain сканера (в контекстном меню foobar2000). Если пик превысит 1.0, усиление следует занизить.


Воспроизведение SACD-R в foobar2000. В плейлист загружены сжатые в DST стерео и 5.1 дорожки (битрейт отображается для декодированного DSD). На ВЧ шум на спектрограмме отсутствует, т. к. использован 30 кГц ФНЧ

Относится ли формат DSD к Hi-Res-аудио?

Насколько высокое разрешение имеют записи в DSD? Точно установить соотношение между PCM и DSD невозможно, но базовый формат примерно соответствует PCM с параметрами дискретизации 24 бит/88,2 кГц.

Заявленный динамический диапазон DSD составляет около 120 дБ в пределах слышимости. Для сравнения, у обычных CD он равен 96 дБ, а теоретический максимум записей в 24/192 достигает 144 дБ.

Большие числа смотрятся впечатляюще, но на деле даже диапазона CD более чем достаточно для любой записи.

Конвертирование SACD

Конвертирование SACD и DSD ничем не отличается от преобразования того же Hi-Res рипа 24/192 или т.п., единственное что предварительно необходимо настроить декодер для вывода PCM (или DSD+PCM), причем достаточно переключить в одни из этих режимов, настроить необходимые параметры, после чего можно вернуть режим вывода DSD — во время конвертирования декодер будет работать в режиме PCM. Всё остальное уже описано в статье Преобразование аудио высокой разрядности в 16 бит/44.1 кГц стерео.

[Обсудить на форуме]

Как воспроизводить DSD-файлы?


Chord Hugo 2 способен воспроизводить файлы вплоть до DSD512

В последние годы цифровые компоненты все чаще поддерживают воспроизведение DSD; это связано с повышением доступности скачиваемых аудиозаписей. Проверьте, поддерживают ли этот формат ваши портативный музыкальный, сетевой плеер и/или ЦАП.

Самые современные цифровые устройства среднего и высшего класса, как правило, обладают такой поддержкой; если ваши компоненты относятся к их числу, обязательно добавьте этот формат к уже привычным FLAC и WAV. Некоторые флагманские смартфоны также совместимы с DSD. И даже пользователи Apple iPhone могут воспроизводить DSD-файлы при помощи дополнительного оборудования.

На сайтах для скачивания музыки время от времени можно встретить обозначения DSF и DFF. Это две разновидности DSD-файлов; все, что реально нужно о них знать – всегда выбирайте версию DSF, если ваш плеер ее поддерживает, поскольку она лучше работает с метаданными (такими как имя исполнителя, название песни, обложка альбома и тому подобные).

Рейтинг
( 1 оценка, среднее 5 из 5 )
Понравилась статья? Поделиться с друзьями:
Для любых предложений по сайту: [email protected]