HerrFelix 25 мая 2020 в 19:30

Цифровое представление аналогового аудиосигнала. Краткий ликбез

7 мин

51K

ФизикаЗвук

Из песочницы

+41

Комментарии 52

nUser123 25 мая 2020 в 21:22

цифровой сигнал это последовательность нулей и единичек, то, что у вас выдается за цифровой сигнал — это называется дискретный сигнал

-6

saboteur_kiev 26 мая 2020 в 01:32

A digital signal is a signal that is being used to represent data as a sequence of discrete values

Отличие дискретного от цифрового — последовательность.
То есть приемник должен уметь определять где закончилась предыдущая цифра и началась новая, даже если это несколько одинаковых цифр подряд. Чаще всего используют временные промежутки, может быть какая-нибудь дополнительная синхронизация частоты передачи.

nUser123 26 мая 2020 в 07:00

Освежил себя из учебника по ЦОС, действительно, дискретный сигнал может принимать любые значения из интервала исходного сигнала при дискретизации, в то время как для цифрового значение каждого из отсчетов «округляется» к значению ближайшего кванта.

saboteur_kiev 26 мая 2020 в 17:56

Ну там суть не в округлении, а в том, что дискретный сигнал — вы можете передавать что-то, и приемний в какой-то момент времени видит конкретное значение. Сейчас это 4, потом это 5. Но это не переданные «45»
А цифровой сигнал он ближе к передаче пакета данных — идет последовательность значений, и вы четко должны получить, что было передано «45» или «444445» или «4555455»

jaiprakash 25 мая 2020 в 21:37

А зачем все картинки под спойлерами?

saege5b 26 мая 2020 в 07:01

На тощих каналах связи, или дохлых устройствах — хорошо, резиновый интервейс с резиновой вёрсткой не скачут как лихорадочные.

jaiprakash 26 мая 2020 в 08:37

Я бы лучше подождал, чем 20 раз жать на спойлеры. Это реально перебор.
*Вздыхает, вспоминая веб с нормальной вёрсткой, с прописанными в html размерами картинок.

kovigor 25 мая 2020 в 22:49

Есть очень хорошая книжка по ЦОС для начинающих. Автор — Юкио Сато:

publ.lib.ru/ARCHIVES/S/SATO_Yukio/_Sato_Yu..html

dlinyj 27 мая 2020 в 12:52

Я начинал с такой книги

Вот тут рассказывал по её примерам habr.com/ru/post/219337

First_Spectr 25 мая 2020 в 23:52

Спасибо, схоронил.

Refridgerator 26 мая 2020 в 07:58

Картинка «Интенсивность шумов при разрядности 6 бит и 8 бит» совершенно точно не соответствует действительности и уровень шумов в ней сильно занижен — даже если рассматривать чистую синусоиду, влияние шумов квантования на которую минимально.

HardWrMan 26 мая 2020 в 08:30

Сэмплы не то чтобы послушать, даже уже скачать не получается:

Хабраэффект в действии?

HerrFelix 26 мая 2020 в 09:15

Здравствуйте. Все аудиофайлы перезалил здесь: cloud.mail.ru/public/HbzU/YEsT34i4c
Надеюсь сработает.

Don_Koton 26 мая 2020 в 08:35

Я извиняюсь за глупый вопрос, но почему не существует «векторного» формата для записи аудио? Чтобы описать звуковую волну математическими формулами, вместо записи конкретных дискретных поинтов где эта волна находится в каждый момент времени

Refridgerator 26 мая 2020 в 08:49

Теорема Котельникова и описывает звуковую волну математическими формулами — через сумму sinc-функций, сдвинутых во времени.

amartology 26 мая 2020 в 11:07

Вы сейчас почти изобрели преобразование Фурье)

dlinyj 27 мая 2020 в 12:53

Преобразование Фурье. Существует.

TheNavi 26 мая 2020 в 15:07

Пардон муа, но вы упустили из виду вариант с 1-битной дельта-сигма модуляцией — которая дает очень неплохие результаты по качеству — SACD собственно так и родился.

rexen 30 мая 2020 в 10:49

SACD — унылый маркетологический формат, существующий лишь на пинковой тяге тёти Сони — обычный DVD-A его превосходит по эффективности. Чисто математически. Как формат хранения. Тут прослеживается ровно та же коммерческая история как в войне VHS и Betamax — желание оторвать кусок рынка недобросовестной рекламой.

Refridgerator 31 мая 2020 в 10:19

Нет. Формат хранения в SACD — это DSD, DVD-A — PCM (в том числе и сжатый). Если в несжатом PCM инвертировать произвольный бит — это приведёт к щелчку, амплитуда которого будет зависеть от порядкового номера этого бита в слове. Если в сжатом PCM инвертировать произвольный бит — это приведёт к потере целого блока данных.

Другая проблема PCM — зависимость уровня шумов квантования от амплитуды:

DSD решает обе этих проблемы. А не стал он повсеместно используемым потому, что у него есть и недостаток — нельзя просто так взять и смикшировать DSD-потоки.

rexen 31 мая 2020 в 13:08

Если в несжатом PCM инвертировать произвольный бит

Вам не кажется, что вы на ходу сочиняете несуществующие проблемы? Вопрос целостности данных идёт параллельно вопросу дискретизации. Я ещё могу понять эти переживания в эпоху оптических дисков, хотя и там с этим боролись в несколько слоёв. А нынче — «bit perfect» и всё такое.

зависимость уровня шумов квантования от амплитуды

И? Ухо всё-равно неспособно расслышать столь малые уровни. Сам экспериментировал. Два-три децибела ниже уровня белого шума ещё как-то звук расслышать можно, но не более того.
Посчитайте, пожалуйста, разрешающую способность DSD на 20кГц. Для многих будет удивительно, насколько «более прогрессивный формат» окажется хуже того же PCM при том же битрейте.

Так что оба аргумента — высосанные из пальцев японских маркетологов. Это продолжение аудиофильской шизофрении на тему ТЛЗ, скин-эффекта, и т.п. Я этот форсинг мертворождённого формата внимательно наблюдал и тоже видел красивые картинки в глянцевых журналах. Там утверждали, что «сам способ записи SACD ближе к грам-записи» — уже от этого аудиофилы должны были испытывать экстаз.

Refridgerator 31 мая 2020 в 13:54

Нет, не кажется, потому что вопрос целостности данных никак не связан с вопросом дискретизации. Аналоговые записи вас никто не заставляет оцифровывать — они вполне и дальше могут храниться на виниле и магнитных лентах.

rexen 31 мая 2020 в 17:44

При чём здесь аналоговые записи? Мы сравниваем DSD и PCM. И, соответственно, под «целостностью» я имел в виду не физическую сохранность аналоговых мастер-лент, а именно ваш гипотетический

в несжатом PCM инвертировать

Это чисто вопрос корректности/правильности/целостности передачи цифровых данных. Если вам считывающее устройство передаёт в ЦАП не то, что записано — это проблема именно передачи, а не формата хранения. То, что SACD якобы более «помехозащищён» — это весьма спорный вопрос. А в наше время флешек вопрос «читабельности» носителя вообще отпал, нивелировав это декларируемое преимущество.

Кстати, ЕМНИП, Sony как один из аргументов за DSD как раз и впаривала то, что нужно аналоговые мастер-записи в него переводить — магнитная лента не вечная, а на виниле мастера вообще не хранят.

Refridgerator 31 мая 2020 в 10:30

Если же говорить о маркетинговом булшите — то это современные хи-рез релизы классических записей, предельно закомпрессированные, убитые шумодавами, с задранными ВЧ и прочими «улучшайзерами».

pvvv 26 мая 2020 в 15:58

раз уж про сигма-дельта модуляцию вспомнили

Ошибки квантования (округления) из-за недостаточного количество уровней не могут быть исправлены.

могут быть разменяны на частоту дискретизации через dithering и oversampling.
добавьте белого шума при оцифровке и задерите частоту дискретизации, ну и соответственно более злой НЧ фильтр при обратном преобразовании цифра->аналог, и вы получите ваш сигнал обратно, даже несмотря на очень грубое квантование.

rexen 31 мая 2020 в 17:50

А, собственно, DSD (и однобитное квантование вообще) и пытается это сделать. Впадая в крайность — уходят от ошибок по уровню, но получают кучу (ИМХО, гораздо бОльшую) других проблем. В этом плане PCM всё-таки более сбалансирован — там выжато всё что можно из обоих пределов точности квантования — что по уровню, что по времени.

pvvv 1 июн 2020 в 01:58

высокоразрядные АЦП — сигма-дельта с оверсэмплингом, так как у любых других АЦП с устройством выборки-хранения и последующей многобитной оцифровкой проблем с линейностью будет заметно больше. Так что это просто взяли и вытащили сразу выход модулятора наружу, кому надо — сам отфильтрует с децимацией и получит PCM с нужной разрядностью, ну или просто пропустит этот цифровой поток через аналоговый ФНЧ и получит аналоговый сигнал.
Места разве что занимает побольше, раза в три, 2.8Мбит/c, для 120дБ в полосе до 20кГц вместо 44кГц*24бита ~ 1МБит/c у PCM.
а кроме этого какие проблемы?
в интегральных микрофонах в качестве интерфейса вполне прижилось.

rexen 1 июн 2020 в 12:59

И места больше занимает и обработку вести проблемно — всё цифровое ПО и железо — что дома, что в студиях — десятки лет затачивалось под ИКМ (PCM).

Линейое ИКМ при 44,1 кГц и 16 битах для восстановления каждой волны самой высокочастотной составляющей сигнала (22,05 кГц) использует 16 бит, что даёт 2^16 = 65536 уровней. Или 6дБ(разница уровней в 2 раза — каждый бит ИКМ)*16бит=известные 96дБ для CD-Audio формата. Для всего диапазона — от НЧ до ВЧ.

В SACD/DSD при 2,8224 МГц и 1-битном кодировании для ВЧ получается 2822,4/44,1кГц = 64 бита. Унарных бита! Там нет старших и младших. А значит динамический диапазон будет между 0 и 64 единицах — это будет 64 уровня вместо 65536 уровней. DSD «грубее» PCM на ВЧ на три порядка!

И DSD здесь «спасает» лишь то, что на реальном музыкальном материале самые ВЧ в принципе не бывают высоких уровней — им этих самых 30дБ (дельта-сигма модулятор первого порядка) и хватает.

Да, конечно, как вы упомянули, при помощи dither можно несколько улучшить картину. По некоторым заявлениям некоторых заинтересованных лиц:

довести его до 60 дб. Плюс noise shaping — до 90дБ.

И это для DSD — потолок. Для «старого» CD — 96дБ. Для конкурента SACD — DVD-Audio динамический диапазон уже 24*6=144дБ! А учитывая 192кГц оцифровки — можно ещё несколько децибел выжать при помощи того же оверсемплинга с фильтрацией!

Почему мы не ~~видим~~ слышим такой драматичной разницы на реальной аппаратуре. Да всё упирается в ограничения по «железу». Один только тепловой шум резисторов перекрывает весь потенциал 192/24. Не говоря уже про другие источники помех и искажений.

А есть ещё такое неприятное явление как джиттер — искажения, вызванные неточностью ЦАП во временнОм домене. Получил бит данных чуть позже или раньше — получи на выходе неверный уровень. Для DSD джиттер страшнее в силу более высокой частоты.

На самом деле ИКМ — вполне себе оптимальный формат. Он использует все достижения/возможности реального железа по точной дискретизации как по уровню, так и по времени. Нет ни одного фатального у него недостатка, чтобы потребовалось «изобретать» DSD. Упоролись в частоту, а потенциал по квантованию уровня просто выкинули.

Чисто маркетинговый ход — вывести на рынок бесполезную хрень, но, вложившись в рекламу, отгрызть кусок рынка, обложив его всякими лицензионными поборами.

pvvv 1 июн 2020 в 14:52

В SACD/DSD при 2,8224 МГц и 1-битном кодировании для ВЧ получается 2822,4/44,1кГц = 64 бита. Унарных бита! Там нет старших и младших. А значит динамический диапазон будет между 0 и 64 единицах — это будет 64 уровня вместо 65536 уровней. DSD «грубее» PCM на ВЧ на три порядка!

это не совсем так, передискретизация в 64 раза не означает 6 бит разрешения, они не просто складываются-усредняются, noise shaping опять же.

то есть заявленные 120дБ у DSD они для всей полосы до 2.8Мгц/64/2 = 22кГц, на НЧ ещё лучше.

Ideal SNR and ENOB of 2nd Order ∆Σ Modulator for Different Decimation Ratios
Decimation Ratio (M) / Ideal SNR (dB) / Ideal ENOB (bits)
4 / 24.99 / 3.9
8 / 40.04 / 6.4
16 / 55.09 / 8.9
32 / 70.14 / 11.4
64 / 85.19 / 13.9
128 / 100.24 / 16.4
256 / 115.30 / 18.9
(не смог одолеть хабровский маркдаун и нормально вставить таблицу)

для модулятора третьего порядка с передескретизацией 64 и будет 122дБ

для преобразования DSD <> PCM в цифре надо лишь несколько сумматоров на sinc фильтр, и те же сумматоры с накоплением (интегратор) для обратного. Оно не лучше и не хуже, просто другое представление абсолютно тех же данных. Аналоговый сигнал удовлетворяющий Найквисту восстановится что из того что из другого абсолютно одинаково.

Никто этот DSD специально особо не изобретал, аудио АЦП — и так всегда были сигма-дельта из-за лучшей линейности, просто выкинули фильтр который выход модулятора из однобитного в PCM превращал, точнее перенесли из внутренностей АЦП в другое место, на сторону "пользователя".

всякие "изолирующие" аналоговые усилители, в которых с одной стороны был модулятор, потом однобитный цифровой поток передавался через опторазвязку и обратно фильтровался в аналоговый сигнал, подозреваю были задолго до "изобретения" SACD.

rexen 1 июн 2020 в 22:06

передискретизация в 64 раза не означает 6 бит разрешения

Почему нет? В Вики так и написано: K=2^N. 64=2^6. Без NS.
Это Нойз-Шейпинг так феерически давит шумы квантования — с -40 до -120дБ? Можете дать ссылку на внятное объяснение? А то мне в основном попадаются либо простые статьи с цифрами, взятыми непонятно откуда, либо трёхэтажный матан.
Либо заслуживающее доверия практическое измерение. Типа вот такой картинки:

Я чего так взъелся-то? Даже если вот те же 120дБ принять на веру, то это всё-равно хуже 144дБ на ДВД. Смысл тогда? Только как «более помехоустойчивый» для хранения на оптическом диске?

pvvv 2 июн 2020 в 01:48

Ну вот ваша же картинка выглядит вполне себе неплохо.
Шумы квантования давит noise shaping, от порядка модулятора зависит довольно сурово.
Не то чтобы прям внятно и без матана:
http://www.ti.com/lit/an/sbaa094/sbaa094.pdf?ts=1591010872307
https://www.ieee.li/pdf/essay/calculating_delta-sigma_snr.pdf

То что на двд пишут 24 бита == 144дБ это здорово конечно, но покажите мне хоть один АЦП который хотя бы 120дБ в полосе хотя бы 20кГц покажет, только честных децибел, а то некоторые умудряются туда ещё некое АЧХ человеческого уха подсунуть в качестве множителя и показывать смотрите как много децибел у нас получилось.
Смысла в любом случае нет, на слух разницу между 16х44, 24х96 или DSD только упоротые аудиофилы в своих фантазиях различить могут ну или совсем мутанты какие-нибудь с абсолютным слухом.

Передавать в некоторых случаях удобнее DSD, потому что не надо греть голову и договариваться приёмнику и передатчику о том сколько же там битов в отсчёте, где старший/младший и когда именно он начинается.

voidnugget 26 мая 2020 в 16:28

Надо было бы о DSD упомянуть...

lolmaus 26 мая 2020 в 16:48

Дискретизация разбивает сигнал по временной составляющей (по вертикали, рис. 5, слева).
Квантование приводит сигнал к заданным значениям, то есть округляет сигнал до ближайших к нему уровней (по горизонтали, рис. 5, справа).

По-моему, у вас горизонталь и вертикаль перепутаны.

robomakerr 26 мая 2020 в 17:51

А почему на первом рисунке синусоиды перекошены?

Armtone 26 мая 2020 в 19:01

Хотелось бы у автора уточнить, есть ли основания считать, что аналоговый сигнал объективно «лучше/приятнее» для слуха, чем тот же Flac 24bit/48kHz? Такую теорию очень часто можно встретить среди меломанов предпочитающих современные виниловые записи.

chelovek-jpeg 26 мая 2020 в 21:24

так виниловые записи просто вносят искажения в запись, которые некоторым нравятся

Grey83 28 мая 2020 в 14:12

среди меломанов предпочитающих современные виниловые записи.

Не путаете ли Вы меломанов с аудиофилами?
Меломаны слушают звук, а аудиофилы на него дрочат.

НЛО прилетело и опубликовало эту надпись здесь

HerrFelix 27 мая 2020 в 13:30

как молодому Шломо Минтцу тогда в семидесятых удалось, исполняя каприччио номер 6 Паганини достичь одному звучания целого оркестра

Такое звучание у Шломо Минца связана в первую очередь с особенностями этого каприса.
Шестой каприс Паганини написан в полифоническом стиле, т.е. имеет многоголосную фактуру. К двухголосному контрапункту добавляется еще и третья линия, но в отличие остальных, она не непрерывная, а написана в орнаментике «тремоло». Всё это создаёт эффект полноты звучания, что и ассоциировался у Вас с звучанием оркестра. Если говорить образно, то фактура шестого каприса похожа на вселенную, где в пространстве-времени (мелодия) быстро «мерцают» звёзды-пульсары (тремоло). Этот каприс довольно трудный и неудобный для исполнения как с музыкальной стороны (интерпретация), так и с технической и физиологической стороны (тремоло сильно нагружает мышцы предплечья). Сам часто его играл (https://youtu.be/H2lyVC1VnaM).

НЛО прилетело и опубликовало эту надпись здесь

HerrFelix 29 мая 2020 в 21:56

В шестом каприсе Паганини используется не трель (trill), а тремоло (tremolo), так как «трель — это быстрое чередование двух соседних нот» (малая/большая секунда),
а тремоло — это «быстрое чередование двух нот, расстояние которых не меньше терции» (но возможно и быстрое повторение одной и той же ноты — это тоже тремоло).
В шестом каприсе чередуются не соседние ноты.
И тремоло, и трель являются орнаментами.

НЛО прилетело и опубликовало эту надпись здесь

Colorbit 29 мая 2020 в 20:26

Аналоговый сигнал преобразуется в цифровой с помощью двух процессов — дискретизация и квантование. Очередь процессов не важна.

Странно, разве можно выполнить квантование перед дискретизацией? Получается квантование аналогового сигнала.

HerrFelix 29 мая 2020 в 21:42

квантование аналогового сигнала...

… можно выполнить и без дискретизации:

Заметим, что квантование по сути тоже является дискретизацией. Только дискретизацией не по времени, а по значению. Т.е. дискретные сигналы бывают:
-дискретными по времени
-дискретными по значению
-дискретными по времени и по значению

rexen 30 мая 2020 в 10:55

квантование по сути тоже является дискретизацией

Об этом и надо было в статье написать. А то получается введение лишней — второй сущности. Когда процесс один, но просто применяемый к двум непрерывно изменяющимся величинам — «уровню звука» и «времени».

HardWrMan 30 мая 2020 в 07:30

Есть АЦП на компараторах. Они, по сути, непрерывны во времени. Это и есть квантование до дискретизации.

amartology 30 мая 2020 в 17:17

Все АЦП — на компараторах. Вопрос в том, тактируемые эти компараторы или нет, и в том, как сохраняется и передается дальше сигнал с них. Но теоретически да, можно собрать флэш-матрицу из нетактируемых комрапаторов и получить АЦП с квантованием, но без фиксированной дискретизации по времени.

HardWrMan 30 мая 2020 в 19:05

Да, все. Но разница в их количестве. Дешевле поставить 1, но качественный (меньше шума, лучше чувствительность и т.д.), но потребуется регистр последовательного приближения. А если разрядов надо мало но нужна скорость — ставят паралельно несколько компараторв и дискретизируют непрерывный сигнал с них. Все быстрые АЦП так построены, например К1107ПВ2 или К1107ПВ3. Только вот разрядов там 8 и 6:

amartology 30 мая 2020 в 19:54

Выходной буферный регистр — тактируемый, так что ваш пример не подходит. А ещё бывают другие архитектуры, кроме флэша и последовательного приближения. И, кстати, там где разрядов мало, но нужна скорость, ставят регистры последовательного приближения ещё как. Например, большинство схем приемников 100G-400G Ethernet ставят регистры последовательного приближения на 9 бит и 1-2 Гигавыборки.

HardWrMan 31 мая 2020 в 08:47

Выходной буферный регистр — тактируемый, так что ваш пример не подходит.

Подходит, если рассматривать этот чип как 2 устройства в 1. Компараторы там непрерывные. Ну а тактировать запись в регистр можно с абсолютно любой частотой от 0 до максимально возможной для конкретного экземпляра микросхемы.

Gryphon88 29 мая 2020 в 21:14

А как обычно рассчитывается ошибка интерполяции? Всё-таки по Котельникову семплов тоже должно быть бесконечное количество.

Refridgerator 29 мая 2020 в 22:11

Нет, конечный набор семплов никак не противоречит теореме Котельникова. Он просто продолжается в бесконечность нулями или зацикливанием в зависимости от того, непрерывный спектр или дискретный.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Цифровое представление аналогового аудиосигнала. Краткий ликбез

Комментарии 52

Публикации

Истории