Pull to refresh

Comments 136

В дополнение мы породим лишние горбы на характеристике, которые станут причиной интермодуляционных искажений.

А разве линейные цепи могут породить нелинейные искажения?
Это не суть важно, поскольку операционный усилитель является ещё тем нелинейным элиментом!
Если «tutorial», то важно. Понятно, что в нашей суровой реальности нелинейность может возникнуть в самых неожиданных местах. Даже просто в паяном соединении в виде окисла. Но просто линейный фильтр с сильно кривыми АЧХ и ФЧХ сам по себе ничего нового (в смысле новых частот) в сигнал не внесёт.
Вот косвенно — да. Если искажения формы сигнала вызовут «clipping», т.е. ограничение сигнала из-за выхода его за допустимые рамки.
Ещё про усилители: пример в статье с фазовыми искажениями хорош тем, что показывает, как один и тот же по громкости по ощущениям на слух сигнал может требовать разных по мощности усилителей. Нижний сигнал потребует более мощного усилителя, ибо его амплитуда выше. А вот мощность та же. А теперь возьмём реальный звуковой сигнал. Его на стадии сведения аккуратно вписали в динамический диапазон 16-битного формата. Воспроизводится он ЦАПом, имеющим вполне определённый максимальный размах. А вот если мы дальше поставим аналоговый фильтр, то из-за фазовых искажений, даже при расчётном коэффициенте пропускания в единицу сигнал может выйти за ожидаемые рамки, что вызовет кране мерзкие искажения в виже ограничения сигнала («clipping»).
А вот это, судя по комментариям, до некоторых вообще не доходит, хотя проблема реальная, и актуальная даже для некоторых цифровых связок…
… из этих соображений в пресетах пиковых лимиттеров для CD, выходной уровень обычно около -0.3dB, хотя для последующего дитеринга даже с нойз шейпом этого запасу овер дофига
Ещё вспомнил, зачем вообще нужен это фильтр на выходе, если «человек усреднённый» выше 20 кГц не слышит:
Проблема в том, что нелинейные искажения в УНЧ растут с с ростом частоты. Достаточно посмотреть на зависимость коэффициента гармоник от частоты для многих УНЧ.
Так вот: берём мы 1 кГц. Оцифровываем, преобразуем обратно. Получаем наш 1 кГц и пары частот с разносом в 2 кГц. А вот тут приходит подлянка в виде интермодуляционных искажений: И мы получим разностную частоту в 2 кГц. А если это реальный сигнал? И вроде бы хороший УНЧ, который хорошо играл «тёплый ламповый» винил, начинает лажать на «нефильтрованной» цифре.
Видимо, поэтому Агеев сделал свой СЛ таким высокочастотным. А так, вообще, в большинстве усилителей стоит простейший RC фильтр (1 кОм и 100 пФ)
Получаем наш 1 кГц и пары частот с разносом в 2 кГц.

Вот эта пара частот с разносом в 2 КГц и есть интермодуляционные искажения! Тот же сумматор в гетеродинных приёмниках ни что иное, как производитель интермодуляционных искажений.
Смеситель. И AFAIK идеальный смеситель должен сигналы перемножать, а не суммировать.
С тёплым, ламповым винилом, тоже не всё так просто, там гораздо более агрессивный мастеринг чем в CD, так что пикфактор фильтры раздувают НО, это ещё цветочки по сравнению с пылинками на пластинке, от которых предусилитель\тон-корректор спроектированный по тупому, захлестнёт водопадом переходных процессов :-)
UFO just landed and posted this here
UFO just landed and posted this here
Да и 1% конденсаторы вообщем тоже;)

Это не так. Разве что керамика с диэлектриком NPO но они имеют малую ёмкость для звуковых ФНЧ, остальные технологически очень сложно сделать высокоточными
UFO just landed and posted this here
Спасибо за ссылку, взял на заметку, а теперь посмотрите на его размеры и цену. А потом на ряд доступных номиналов.
Описанный в статье чип для ресемплинга стоит дешевле одного этого кондёра!
UFO just landed and posted this here
Позвольте не согласиться: керамике, даже с NPO, в звуковом тракте делать нечего. Хорошая плёнка — наше всё.
Согласен.
Но плёнку, особенно хорошую невозможно сделать тонкой просто из-за особенностей технологии изготовления.
Опять замкнутый круг.
Кстати говоря 1% резисторы вполне себе доступны)

Сегодня они вполне доступны, это чистая правда. Но сравнительно просто их можно купить только из стандартного ряда. Теоретически экзотические номиналы можно собрать из двух или даже трёх включенных последовательно. Для фильтров нужны нестандартные. С конденсаторами дело обстоит гораздо хуже. Плюс те же конденсаторы как и резисторы но в меньшей степени не идеальны. Но разбор этих неидеальностей — большая и интересная тема для отдельной статьи.
UFO just landed and posted this here
Можно вообще сделать керамическую подложку и нанести на неё практически какие угодно резисторы и потом ещё и лазером подогнать. И это доступно ещё с 70-х годов прошлого века точно. И керамика там не богопротивный сегнетоэлектрик, как в большинстве керамических конденсаторов, а вполне себе кошерный оксид алюминия например.
Извините, но все эти размышления на пальцах «лучше-хуже» без спектрального анализа и примеров соответсвующих спектров совершенно бесплодны.

Насчёт "Для того, чтобы обрезать все, что лежит за границами звукового диапазона (20 кГц) и получить затухание под 40 дБ на 44 кГц" — могли бы просто поправить товарища — мол, резать-то надо не до частоты оцифровки, а до половины частоты, а разница 20-22 — совсем не то же самое, порядок фильтра запредельный получается.

Наш товарищ очень настойчив, к тому же не у него одного возникают подобные вопросы.
Да, теорема Найквиста верна, но если даже по двум точкам можно восстановить частоту периодического сигнала
Я Найквиста не читал, но у Котельникова речь идёт именно о бесконечном сигнале. На практике, конечно же, в этом необходимости нет, поскольку необходимое количество точек ограничивает сама функция sinc — для 16-битного сигнала это 65536 точек, и даже оно является излишеством. А также шумы/искажения в исходном сигнале, в цапе (+ джиттер), в усилителе, акустике, комнате.
Вы не путаете квантование и дискретизацию?
И тогда каким образом 65536 уровней квантования напряжения (тока) 16-ти битного ЦАП связаны с дискретизацией сигнала (во времени), о которой идёт речь у Котельникова?
Для понимания этого нужно вспомнить о том, как именно происходит восстановление сигнала, и что sinc(x) это sin(x)/x. Поделить на x. После того, как мы поделим квантованную амплитуду на значение, превышающее количество уровней квантования, полезного сигнала не останется. И это легко проверяется на практике.
И ли вы о том, что для 16 бит оверсэмплинг более чем в 2^16 раз смысла не имеет? Но это совсем о другом. Хотя и здесь можно поиграться с дизерингом в духе 1битных ЦАПов ;-).
Бесконечный — это о времени. Вообще все понятия о спектре, преобразовании Фурье итд введены для бесконечных во времени сигналов. И это никак не связано с дискретизацией. Реальность тут вносит ещё один вид искажения: оконную функцию.
Ещё один плюс оверсэмплинга: уменьшается влияние джиттера в выходном ЦАПе: ведь чем меньше изменяется сигнал между отсчётами — тем меньше искажений вносит джиттер.
У Котельникова (да и Найквиста и прочие названия) говориться об оцифровке:
1. Сигнала ограниченного по спектру (может быть вы это имели в виду под «бесконечностью», но тогда надо говорить о бесконечности во времени, т.к. сигнал конечный по спектру бесконечен по времени).
2. Отсчеты снимаются моментально.
3. Для восстановления сигнала нужен генератор дельта-функции и идеальный ФНЧ.

Все три условия физически не реализуемы. Чаще всего вспоминают про ограничение #3 (идеальный ФНЧ), но остальные тоже важны, если что. Но про них, видать, мало помнят после сдачи лаб/зачетов/экзаменов :-)
Хорошо, периодически повторяющийся и бесконечный во времени если вам угодно. реальный звуковой сигнал ни в коей мере не подходит под это определение.
При проектировании аналоговых фильтров — надо ещё учитывать желаемый коэффициет усиления каскадов фильтра (если оно нам нужно) и, при любом усилении, — требования к частотным свойствам ОУ. Что-бы не быть голословным — в недавнем home-made измерителе АЧХ (аналоговый осциллограф + DDS) понадобился фильтр для ШИМа, формирующего горизонтальную развёртку. При частоте среза двухкаскадного фильтра около 7 кГц и общем коэффициенте усиления 2.2 — калькулятор фильтров от Texas Instr. даёт требуемую полосу частот ОУ уже в 1 МГц.

А если применять switchet capacitor filter?

Опять проклятая цифра! ;-)
Опять проклятая цифра! ;-)

Вот тут уже даже я соглашусь без оговорок!
Кстати, а какой был DDS?
Много приходилось с ними работать, но сейчас стоит выбор между DDS и продвинутым ЦАПом. Пока не определился что лучше. DDS аппаратно выдаёт очень ограниченный спектр сигналов, а для ЦАП можно любой файл сформировать без особых проблем.
UFO just landed and posted this here
Кстати, а какой был DDS?

AD9830. Не я его выбрал, а он меня (потому, что он был и был распаян на макетку). Если-бы железо было с нуля — взял-бы SPI-ный и посовременнее.
DDS аппаратно выдаёт очень ограниченный спектр сигналов

Задача была частная, настройка/восстановление нескольких радиоприёмников. Простого DDS'а — более чем достаточно.

P.S.
Впрочем профессиональных спорщиков из этого форума никакой теорией не прошибёшь. Какие формулы не приводи, что не рисуй они просто слушают исключительно сами себя.

Не «этого», а «любого».
progchip666
Только вот увидел 2 часть статьи, спасибо за подробные ответы.

Но к сожалению, судя по резюме, вы видимо не до конца поняли смысл вопросов.

x-------x
Надеюсь, что FreeMind2000 и его сторонники согласятся, что “чистый неискажённый ступенчатый звук с выхода ЦАП” выглядит меньше похожим на оригинал, чем исковерканный цифровыми извращениями?
x-------x

На самом деле в ветке обсуждения https://geektimes.ru/post/284272/#comment_9792346, ставилось 3 вопроса и в принципе, на них удалось ответить благодаря комментариям:Refridgerator и vintage
При этом вывод оказался не утешительным… мировое правительство не дремлет :)

Но давайте все резюмируем в одном месте:
x-------x
1. А действительно ли мы улучшили качество звука, добавив семплы, которые в оригинале (живом звуке) могли отличаться от тех, которые мы придумали(интерполировали)? Ведь, то что мы записали с частотой 44.1 КГц — было реально зафиксировано микрофоном, а то что было между записанными семплами нам не известно.
x-------x
Ответ:
— По теореме Котельникова, если мы записали звук с необходимой минимальной частотой дискретизации, то можем сгенерировать промежуточные точки в любом количестве.

Значит, если запись велась с частотой дискретизации 44.1 КГц (а макс. воспринимаемая частота человеком 20КГц) — то этого вполне достаточно, чтобы в последствии восстановить промежуточные точки с любой точностью которая имеет смысл для человеческого уха. Качество восстановления (близость к оригиналу) определяется качеством фильтра используемого при интерполяции.
Здесь, я думаю все согласны.

x-------x
2. На сколько далеко наша фантазия (прошу прощения, интерполяция :) может нас завести? Т.е. теоретически, мы можем интерполировать и 8битный звук и 4х…
x-------x
Ответ:
— По той же теореме Котельникова, минимальная частота дискретизации при которой, возможно восстановление сигнала без искажений должна быть в 2 раза больше макс. частоты встречающейся в оригинальном сигнале.
Т.е. если берем макс. воспринимаемую частота человеком 20КГц, то минимальная частота для оцифровки = 40КГц
— По битности (т.е. разрядности шкалы амплитуды), можно сказать так: минимальная разрядность оцифрованного сигнала, должна в 2раза превышать разрядность (чувствительность) человеческого уха.

x-------x
3. И о каком таком повышении качества мы говорим?
Для человека средний порог частоты воспринимаемого звука 20 кГц, мы воспроизводим с частотой 44.1 КГц — есть ли смысл в дальнейшем увеличении?.. Повышение точности воспроизведения на 2 разряда — единственное, что имеет отношение к реальному улучшению качества, хорошо, а кто-нибудь знает сколько разрядов может различать человеческое ухо? ;)
x-------x
Ответ:
— Собственно, ответ на этот вопрос и является ключевым, ведь смысл как раз таки в том, зачем снижать погрешность и шумы, если их человек и так уже не чувствует?
Здесь ясность внес комментарий vintage
"
Тут утверждается, что дискретность уха в один момент времени не превышает 5 бит, а 16 с головой покрывает весь динамический диапазон уха: https://geektimes.ru/company/audiomania/blog/246304/
"
Очень интересная статья, всем рекомендую ознакомиться.
Я же в свою очередь из других источников нашел информацию, что повышение громкости (амплитуды) человек способен отличить при изменении исходной громкости на 10%, т.е. 1Дб. Если мы примем максимальным диапазоном амплитуды воспринимаемый человеком без боли 130Дб, то можно самостоятельно грубо посчитать разрядность (чувствительность) человеческого уха. Для этого просто надо взяв за исходную амплитуду 0.1 Дб посчитать сколько дискретных «точек» человек может распознать до 130Дб, с увеличением каждой следующей «точки» на 10%.
В итоге получилось 78 точек, что соответствует 7битам с большим запасом (50 точек). Т.е. вот при таком грубом расчете с запасом, мы приходим к выводу, что для оцифровки и воспроизведения звука без потери качества (с точки зрения человеческого уха) достаточно 7*2=14 бит для шкалы амплитуды.

Отсюда вывод:
"
Надеюсь, что FreeMind2000 и его сторонники согласятся, что “чистый неискажённый ступенчатый звук с выхода ЦАП” выглядит меньше похожим на оригинал, чем исковерканный цифровыми извращениями?
"
— С этим, я не спорил, и честно говоря к цифровым извращениям испытываю большую тягу чем к аналоговым :)

Суть в другом, вот что мы сделали:
1. Поставили более дорогой ЦАП (с повышенной частотой дискретизации и разрядностью)
2. За счет придумывания(интерполирования) отсутствующих семплов на шкале времени CD — увеличили кол-во воспроизводимых семплов.

Но зачем?
Ведь увеличение интерполированных точек, повышение частоты дискретизации и разрядности на ЦАП не влияет на качество звука ВОСПРИНИМАЕМОЕ ЧЕЛОВЕКОМ, ибо ЦАП(16бит, 44.1 КГц) достаточно и даже с большим запасом.

Получается все эти «улучшения качества» с точки зрения человека воспроизводящего звук с CD — не более чем маркетинговый трюк…
Человек написал 2 статьи, объяснил, разжевал — и опять те же вопросы…
Суть увеличения частоты дискретизации — замена дорогого, сложного, крупногабаритного аналогового ФНЧ высоких порядков (да еще с плохой ФЧХ) на связку простого и дешевого цифрового + простого и дешевого аналогового низкого порядка. Вот и все.

И улучшение качества в данном случае — это не улучшение исходного звука, это улучшение приближения звука на выходе системы к исходному.
Я писал о том, что:

1. Замена существующего оборудования имеющего ЦАП(16бит, 44.1 КГц) на оборудование с ЦАП имеющем повышенною частоту дискретизации и разрядности — не имеет смысла, так как разницы человек не услышит.

2. И так же думаю, что
замена РАБОТАЮЩЕГО дорогого, сложного, крупногабаритного аналогового ФНЧ высоких порядков (да еще с плохой ФЧХ) на связку простого и дешевого цифрового + простого и дешевого аналогового низкого порядка — не имеет смысла, если все паразитные шумы лежат за пределами человеческого уха.

Вот и всё :)

«И улучшение качества в данном случае — это не улучшение исходного звука, это улучшение приближения звука на выходе системы к исходному.»
— Поймите, в этом приближении нет смысла, если человек разницы почувствовать не может.

На графиках, всегда рисуют оцифрованный звук большими некрасивыми ступеньками, даже автор данной статьи прибегает к этому приему ;-)
Причем, после добавления промежуточных точек, график якобы становится «красивее» и ближе к оригинальному сигналу. Но, если мы увеличим масштаб раз в 10, то произойдет чудо… через те же самые дополнительные точки, которые красиво приближались к исходному сигналу, опять будут проходить большие некрасивые ступеньки, очень далекие от оригинального сигнала… И такое приближение можно делать до бесконечности опять добавляя промежуточных точек… Но зачем???

Смысл в том, что имея CD-проигрыватель с ЦАП(16бит, 44.1 КГц) человек смотрит на ступеньки с такого далекого расстояния и запасом, что ни одной мало мальски некрасивой ступеньки выступающей от оригинального сигнала увидеть не сможет при всем желании.
Я могу привести аналогию с TV. Сейчас становится модным формат 4K — и это хорошо, отличие от FullHD на глаз мало, но ЗАМЕТНО. Т.е. в 4К человек четко может сказать, что картинка лучше. Это всё почему?, потому, что по оценкам разных специалистов разрешение человеческого зрения около 50К — 100К. Так вот, когда появится телевизор с разрешением 200К, то тогда можно сказать, что это равносильно тому, что сейчас используется при воспроизведении с CD-проигрывателя с ЦАП(16бит, 44.1 КГц).

Те кто считает, что сравнивать разрядность/дискретизацию звука АЦП/ЦАП и чувствительностью человеческого уха нельзя, равно как разрешение для человеческого глаза — в общем смысле ошибаются. Да, напрямую нельзя, т.к. у человеческих органов есть своя специфика и не линейность чувствительности в разных зонах. Но грубо/приблизительно, привести к общему знаменателю и сравнить можно, а когда при сравнении мы видим более чем двух кратное превосходство, то можно уже делать выводы.

Простите, а где автор пишет о замене работающих аналоговых фильтров?
Подозреваю, что аппаратура с такими фильтрами находится либо в чуланах, либо у самых упоротых пользователей.
Сейчас подавляющее большинство (99 и не знаю сколько еще девяток после запятой %) делается именно так, как описано в статье. Хотя бы потому что это проще, лучше, стабильнее и дешевле.
Исторический экскурс так сказать.
Автор не пишет. То, что их нет смысла менять, это как раз мое мнение, подкрепленное после небольшого погружения в суть передискретизации и улучшения качества звука, о которых идет речь в статье.
Их есть смысл менять хотя бы с точки зрения доступности аппаратуры и стабильности ее характеристик.
Параметры цифрового фильтра абсолютно стабильны, он не нуждается в настройке, крайне дешев.
Параметры аналогового фильтра в системе с цифровым некритичны, он прост, и дешев.

В системе с аналоговым фильтром высоких порядков фильтр дорог, его параметры меняются в зависимости от температуры и со временем.

Так что даже если при выходе с производства обе системы будут иметь сравнимое качество звука (что уже объективно невозможно в связи с плохой ФЧХ полностью аналоговой системы), то со временем аналоговая будет звучать только хуже.

Какой смысл сохранять значительно более дорогую, объемную, тяжелую и нестабильную систему кроме «ятакхочу»?
Я уже писал об этом несколько раз.
Смысл в том, что если дорогая старая техника работает и претензий у пользователя к качеству звука нет, то поддаваться на маркетинговые уловки и выкидывать деньги на ветер не надо. На новой технике услышать «лучший» звук не получится.

Поймите, все эти «доступность аппаратуры», «стабильность характеристик», «ФЧХ»… всё это пыль, если итоговое качество звука СЛЫШИМОГО человеком — его устраивает. Если от температуры или от времени, параметры фильтра меняются, но я этого не могу услышать, то для меня они роли не играют. Если же старая аппаратура работает плохо и постоянно приходится ее перенастраивать, чтобы бороться с шумами и помехами, то конечно ее надо менять, с этим никто не спорит.
Да сколько уже можно?
Где, в каком именно предложении автор предлагает хоть кому-то менять свой старый хлам, который его устраивает, на что-то новое??? Если кого-то устраивает патефон, то никаких проблем.

Это не маркетинговые уловки. Это всего лишь описание того как менялась техника. Было так-то, стало так-то. произошло это вот поэтому и вот поэтому. Все. ТОЧКА.
Знаете, у вас происходит либо кратковременное отключение памяти, либо вам просто нравится задавать один и тот же вопрос по 1000 раз… https://geektimes.ru/post/284300/#comment_9795036
Давайте на этом уже закончим.
С памятью у меня все хорошо.
Это у вас некоторые проблемы с пониманием написанного. В частности, с понятием контекста.

Там где я писал «Их есть смысл менять» речь шла о производстве, а не в старых патефонах, устраивающих своих владельцев.
Как собственно и произошло.
Для этого просто надо взяв за исходную амплитуду 0.1 Дб посчитать сколько дискретных «точек» человек может распознать до 130Дб, с увеличением каждой следующей «точки» на 10%.
В итоге получилось 78 точек, что соответствует 7битам с большим запасом (50 точек). Т.е. вот при таком грубом расчете с запасом, мы приходим к выводу, что для оцифровки и воспроизведения звука без потери качества (с точки зрения человеческого уха) достаточно 7*2=14 бит для шкалы амплитуды.

Это всего лишь означает, что для плавной (т.е когда человек не различает ступеньки) регулировки громкости достаточно 14 бит. Какое это имеет отношение к квантованию собственно сигнала?

а кто-нибудь знает сколько разрядов может различать человеческое ухо? ;)

Ухо вообще по другому работает. Там термин «разрядность» неприменим.

«Какое это имеет отношение к квантованию собственно сигнала?»
— Я исходил из того, что возможность услышать звук, зависит от его амплитуды. Самый тихий звук который мы можем услышать, характеризуется минимальной амплитудой (которою может чувствовать ухо), и соответственно самый громкий звук — максимальной амплитудой. Отсюда, мы можем определить мин. и макс. амплитуду которую может воспринимать человек, ну и соответственно, зная шаг изменения громкости, можно определить кол-во разрядов на шкале амплитуды для человека. Конечно, это грубо, и эта так сказать моя собственная оценка, если вы хотите более точного определения, можете обратиться к статье приведенной в комментарии выше.

«Ухо вообще по другому работает. Там термин «разрядность» неприменим.»
— На это я тоже ответил чуть выше.
Ещё: "Наиболее неприятные на слух искажения, вносимые на этапе оцифровки — гранулярный
шум
, возникающий при квантовании сигнала по уровню из-за округления амплитуды до ближайшего дискретного значения. Гранулярный шум сильно связан с
сигналом (зависит от него), и представляет собой гармоники сигнала, искажения от которых наиболее заметны в верхней части спектра. Проявления гранулярного
шума и его связь с сигналом легко заметить, прослушав синусоидальный сигнал с частотой около 0.1..5 Гц — гранулярный шум в этом случае проявляется в виде
изменяющегося по высоте паразитного тона, частота которого зависит от частоты, формы и максимальной амплитуды полезного сигнала.

Мощность гранулярного шума обратно пропорциональна количеству ступеней квантования, однако из-за логарифмической характеристики слуха при линейном квантовании (постоянная величина ступени) на тихие звуки приходится меньше ступеней квантования, чем на громкие, и в результате основная плотность нелинейных искажений
приходится на область тихих звуков. Это приводит к ограничению динамического диапазона, который в идеале (без учета гармонических искажений) был бы равен
соотношению сигнал/шум, однако, необходимость ограничения этих искажений снижает динамический диапазон для 16-разрядного кодирования до 50-60 дБ."


Не все шумы и искажения, равные по амплитудному (процентному) соотношению будут равны по восприятию человеческим ухом. Почитайте статью. Учитывая дешевизну реализации ЦАПов с высокой разрядноситью, проще и дешевле просто свести уровень искажений, связанных с квантованием, до пренебрежимо малых величин и не мучаться. Нет никакого заговора. Это просто самое простое и эффективное решение проблемы с шумом квантования/гранулярным шумом на данный момент.
Вы (автор), как всегда правильно написали фразу «для периодического».
Сложность заключается в том, что музыка — это совсем не всегда периодический процесс.
Посему и любая попытка интерполяции улучшает объективные параметры и ухудшает собственно воспроизведение музыки.
Это уже не лечится.
Специально для людей, с такой точкой зрения написал целую статью где всё уже разжованно с картинками для уровня восприятия дошкольника.
Любая оцифровка коверкает звук.
Оцифрованный звук — это близко не исходный звук и хорошая интепорляция его только улучшает.
Без интеполяции запись с битрейтом CD вообще слушать невозможно.


Посему и любая попытка интерполяции улучшает объективные параметры и ухудшает собственно воспроизведение музыки.

Подобная точка может существовать, но если сказали А, надо говорить уже и B.
Слушать музыку необходимо только вживую, причём музыканты не должны пользоваться усилительной аппаратурой.
Если честно, то на «живых» концертах зачастую качество музыки бывает таким, что лучше с айфона MP3 слушать!
Аналоговая запись тоже не обходится без искажений.
На магнитную ленту пишут с подмагничиванием, что приближает запись к цифре, ну а для записи на винил сигнал предварительно серьёзным образом искажают и компрессируют.
Прослушивание же живых артистов в специальной студии не каждый миллиардер себе позволить может.
Оцифрованный звук — это близко не исходный звук

В данном случае, некорректное утверждение. Дискретизация (этот термин уместнее — видите, переходим на исходный английский и становится проще?) — это всего лишь способ зафиксировать процесс. Как его восстановить из записи — вот вопрос.
хорошая интепорляция его только улучшает.
Еще можно сравнить с кино, 24 кадра в секунду типо достаточно для глаза, хотя на движущихся картинках нечеткость и смазанность очевидна. Когда появились достаточно доступные видеопроекторы бОльшего разрешения, чем 640х480, тоже стало очевидным, что из стандарта DVD бОльшее количество пикселей получить сложно. Точнее, интерполировать-то никаких проблем, картинка выходила гладкая, но, бестолковая — очевидно, деталей на ней не прибавлялось — потому как неоткуда им было взяться.
Сравнить с кино нельзя, вы так и не поняли сути написанного. В данном случае интерполяция не предназначена для увеличения «детальности» звука, она предназначена именно для более достоверного его воспроизведения более простыми средствами.
Это Вы как раз перепутали апсэмплинг с оверсэмплингом.
Тупое добавление нулей ничего не делает сисходником, а вот интерполяция — делает.
Нет, это вы перепутали апскейлинг (в ТВ) с апсэмплингом.
Да, есть интерполяция, которая искажает цифровой исходник с CD. Но нам, вообще говоря, абсолютно безразлично какие именно цифровые преобразования претерпевает сигнал. Нам важно, чтобы окончательный аналоговый сигнал на выходе усилителя как можно точнее повторял сигнал до оцифровки. Апсэмплинг не пытается добавлять никаких аналоговых «деталей» (в отличие от апскейлинга видеосигнала), его цель именно максимально приблизить форму выходного аналогового сигнала (после DAC и фильтров) ко входному (до ADC). Поскольку суммарная АЧХ цифрового и аналогового фильтров такова, что частоты, проходящие через него не превышают 44,1 кГц пополам, то никаких аналоговых «деталей» к звуку добавиться не может. Он делает то же самое, что и аналоговый фильтр без апсэмплинга, но дешевле, компактнее и без лишних фазовых искажений.
Сравнить с кино как раз возможно и это даже забавно:
"24 кадра в секунду типо достаточно" для создания иллюзии непрерывного движения да, но мерцание с частотой 24Hz вы себе представляете? Это-же жесть, заметная даже упоротому транквилизаторами мозгу.
По этому в кино проекционном аппарате есть такая хренька — обтюратор, с двумя или тремя лепестками, которая во время экспозиции кадра, перекрывает световой поток, умножая частоту мерцания на 2 или 3!
В таком виде, кино смотреть в разы приятней, ибо частота мерцания оказывается за гранью восприятия.

PS.А что-бы не было смазывания, в киносъёмочном аппарате так-же был обтюратор, но более хитрый, сменный или настраиваемый, дабы сократить время экспозиции, ибо 1\24 секунды, это как бы дофига.
Сравнивать с кино нельзя. Обтюратор не имеет отношения ни к интерполяции ни к фильтрации. Аналогии должны быть уместными.
Он имеет отношение к умножению частоты! А интерполяцией дискретных значений освещённости занимается зрительный анализатор, в итоге получается фильтр…
Но вы правы, приводить пример из области оперирующей пространственными частотами, там где люди с одномерным рядом разобраться не могут, действительно не уместно…
К увеличению частоты мерцания. При этом информация содержащаяся в каждом кадре не умножается, и вообще никак не изменяется. В отличие от ресэмплинга. Поэтому аналогия неуместная.
обтюратор, с двумя или тремя лепестками, которая во время экспозиции кадра, перекрывает световой поток, умножая частоту мерцания на 2 или 3!
В таком виде, кино смотреть в разы приятней, ибо частота мерцания оказывается за гранью восприятия.

Спасибо, именно эта аналогия ближе всего к процессу добавления нулей.
Без интеполяции запись с битрейтом CD вообще слушать невозможно

Вроде только то рассказали, что выходной фильтр нужен для того, чтоб не мучать усилитель ужосами, а не для того, чтоб уху лучше было.
Без фильтра и передискретизации в первую очередь страдает ВЧ область. Да, мы привыкли к перидискретизированному звуку, к «хрустальному», «воздушному» и т.д. Но это всего лишь звуковые эффекты, ненужные для восприятия музыки. Тот же стандарт LP был не очень-то и богат на ВЧ, а конусные ВЧ-динамики почти не воспроизводили выше 15-16кГц. Да и выходные трансформаторы не очень-то высоко играли. Так что просто мы привыкли за последние 20-30 лет к звону «высоких», а другого ХОРОШЕГО звука в СССР было почти и некому услышать.
Подытоживая — без передискретизации вполне даже слушабельно, если не искать звуковых спецэффектов.
Другое дело, что обычная аппаратура (кремниевый усилитель с ООС) будет работать с выходом ЦАПа без фильтра откровенно плохо.
Наверно да. Если подключить ЦАП к ламповому усилителю, который нагружен на акустику с потолком в 16 кГц — то можно обойтись.

А если аудиотракт типа этого, и слушается всё через мониторные наушники: «Швейцарская компания Nagra выпустила в продажу цифро-аналоговый преобразователь Classic DAC. Новинка представляет собой более доступную версию модели HD DAC и отличается от неё отсутствием регулятора громкости и усилителя для наушников, а также несколько изменённой аналоговой секцией. В последней используется по 9 тщательно подобранных транзисторов на канал, а отношение сигнал/шум (невзвешенное) выходного каскада достигает 145 дБ,» — то придётся и ЦАП ставить соответствующий. Другое дело, что рядовому гражданину для прослушивания русскава рэпа это не нужно.
Это же как прон в 4К. Не каждый найдёт удовольствие в разглядывании прыщиков на теле актрис и качестве бритья ;-). То ли дело VHS и кинескопный телек.
UFO just landed and posted this here
В аудиоплеерах часто есть кнопочка, которая позволяет зациклить любую музыку. И вообще практика говорит, что теорема прекрасно применяется на практике: https://geektimes.ru/post/246728/
С одной оговоркой. Трудно найти компьютер, который не развалится от времени, пока будет обсчитывать восстановление музыкального фрагмента в несколько минут целиком. Если этот процесс вообще завершится до конца существования вселенной.
Ещё в пользу повышения разрядности. Давайте отвлечёмся от нашего синуса на 20 кГц и перейдём к реальной музыке.
Итак:
Звучащий симфонический оркестр обладает динамическим диапазоном свыше 90дБ


Пусть мы используем весь динамический диапазон нашего 16 бит ЦАП. Тогда самый тихий звук оркестра будет -90 дБ от размаха. На него останется 6 дБ динамического диапазона а это...1 бит! Дада. самый тихий (но различимый) звук будет воспроизведён меандром ;-) А учитывая, что в симфонической музыке есть как громкие места так и тихие, то в тихих местах этот меандр будет прекрасно слышен. Ибо его просто нечему будет маскировать.
Вот только придётся задрать громкость усилителя, чтобы искажения не замаскировались окружающим шумом. Но даже для любителей крутить ручки усилителя придумали хитрое подмешивание шума.
хитрое подмешивание шума.
А сейчас, в силу дешевизны, используют лобовое решение: 24бит/192 кГц (или выше). И проблема с дискретизацией/квантованием уходит на дальний план и можно сосредоточиться на качественной аналоговой части типа 9 транзисторов и с/ш 145 дБ ;-)
В случае 24 битного сигнала такой частоты оцифровки скорее всего будет достаточно простейшего фильтра. Но речь в статье идёт о том, как с приемлимым качеством можно слушать обычные CD
Посмотрите на картинки. На выходе ЦАП не меандр сколько же можно это повторять!!!! а прямоугольные ступеньки!
Именно для того чтобы сгладить форму этих ступенек и используется передискретизация!!!
Если исходный цифровой сигнал меняется периодически только в младшем значащем разряде — то меандр ;-). Ну если отцентровать — то да — что-то типа имитации синуса на самом дешёвом бесперебойнике. Лучше от этого не станет.

Речь то идёт о том, что надо воспроизводить не просто синус большой амплитуды. А реальный сигнал с динамическим диапазоном, практически перекрывающим динамический диапазон 16-битного ЦАП.
Как-то так будет выглядеть сумма очень тихих чистых тонов Местами вполне менандр ;-)

image
Хотите увидеть ступенчатые сигналы?
Итак: частота равна 1/10 от частоты дискретизации. Разрешение 16 бит. Идеальных, ибо кирпичик labView
image

А вот те же условия, но частота сигнала 0,5 от частоты дискретизации.
image
Меандр однако. При любой разрядности будет меандр :-)
UFO just landed and posted this here
Я охотно верю, что можно сделать. Только это нужно на данном этапе примерно как троллейбус из буханки хлеба. Разве что маркетологи если раскрутят в узких кругах любителей первых «параллельных» (а скорее всего R-2R) ЦАПов ;-)
Ещё аргумент: берём входной сигнал не 1 кГц а 20кГц. Так вот — без фильтрации при частоте дискретизации 44.1 у него образуется брат-близнец на частоте 24,1 с равной амплитудой. И спокойно пройдет через фильтр Бесселя 10го порядка. Ибо относительная разница в частотах равна 1,2. А фильтры Чебышева и Баттерворта по вполне логичным мотивам автором указанной вами статьи были были забракованы.
UFO just landed and posted this here
Зато при плохом раскладе прекрасно услышите 24,1-20=4,1 кГц. Причём ухо его быстро отловит как чужеродный тон.

А "плохой расклад" в данном случае — наличие хотя бы небольшой нелинейности в тракте?

Да. И на высоких частотах нелинейность тракта обычно растёт.

Ограниченная скорость нарастания выходного напряжения? (Я не настоящий сварщик, так что вопросы, наверное, детские)

Одна из основных причин — уменьшение глубины отрицательной обратной связи.
Далее — просто сама схемотехника (разводка, выбор элементов) может быть не адекватна для нормальной работы с высокими частотами, ибо делалась под ЗЧ.
А если УЗЧ класса D. То там вообще могут повылезти комбинационные частоты частоты дискретизации и частоты ШИМ.
Иллюстрация «биений» при частоте сигнала 0,49 от частоты дискретизации:
image
Можно воспринимать как результат интерференции частоты тона и её «зеркальной» частоты. А можно понять как своего рода «стробоскопический» эффект.
Можно воспроизвести, нарисовав синус и делая дискретизацию руками и карандашём ;-)
В радиотехнике данный результат часто называют «нулевыми биениями»
UFO just landed and posted this here
Я не переживаю. Я накидал в ЛабВью аудиотракт с блэкджеком… с генератором сигнала, ацп, цапом и ресэмплером и теперь радуюсь. Вы просто вопросы задаёте подходящие ;-)
Итак. Маленькое чудо:
Что мы имеем изначально. Сигнал с частотой 0,45 от частоты дискретизации:
загрузить изображение

А теперь делаем ресэмплинг 10х и фильтрацию
хостинг для картинок

Никаких биений! Кстати — если просто соединять точки сплайнами а потом ресемплировать — то биения не уйдут.
Спасибо. Отличный пример! Надеюсь автор не будет против если я добавлю его в мою статью?
и ИМХО стоит добавить физико\математический ликбез, ибо для многих не разу не очевидны преобразования частоты, отсюда и дебильные вопросы.
Скорее уже математический, но это задача скорее для zerg59, пока не закончились праздники он мог бы написать замечательную статью по этому поводу.
Я всё таки больше по области hardware чем математики.
Впрочем профессиональных спорщиков из этого форума никакой теорией не прошибёшь. Какие формулы не приводи, что не рисуй они просто слушают исключительно сами себя.

я не согласен с тем что мастеринг делается на 16х44 щас даже самая нищая домашняя студия мастерит на 24х192. также я не согласен с тем что можно достоверно передать частоту 20кгц дискретизацией 44кгц. можете проверить взять песнь какогонибудь тенора пожать её семпл до 2кгц потом обратно растянуть до 44 и послушать. реально при прослушивании СД все что выше 8кгц давольно лживо звучит, а выше 16 скорее шум. слаа богу есть формат 24х192 к которому у меня нет притензий в плане достоверности ВЧ.

А разве кто нибудь спорит?
Но ещё очень многие слушают СD, и подавляющее количество звуковых карт даже в персональных компьютерах до сих пор 16 битные!
также я не согласен с тем что можно достоверно передать частоту 20кгц дискретизацией 44кгц
Также вы можете не соглашаться с тем, что Земля сферическая и обращается вокруг Солнца. Однако это никак не мешает именно Солнцу быть центром масс Солнечной системы.

взять песнь какогонибудь тенора пожать её семпл до 2кгц потом обратно растянуть до 44 и послушать
Хороший метод, Одобряю.Взять самолет, переехать бульдозером, а потом заявить «аппараты тяжелее воздуха летать не могут».
также я не согласен с тем что можно достоверно передать частоту 20кгц дискретизацией 44кгц.

20/44=0.4545 Пример восстановления с картинкой в сообщении выше.
А я вот взял и проверил, как 44100 жутко корёжит выше 8 кГц: https://geektimes.ru/post/246728/
Вы тоже можете проверить :-)
Так у вас некорректно сравнение сделано.
Взял исходник 192 кГц, удалил фильтром частоты выше 20 кГц, сконвертировал в 44100 и обратно в 192000. Вычел результат с двойным ресемплингом из исходника с фильтром, и получил разницу. Где ошибка?
В исходнике, который по всей видимости ничего выше 20 кГц и не содержал…
Возьмите какую-нибудь библиотечную литавру или сами оцифруйте гитару со стальными струнами, и будет результат.
А скриншот программы со спектром я для кого делал?
Я статью давно писал, но до сих пор никто не привёл пример аудиозаписи, в которой после таких манипуляций что-то портится до 20 кГц.
похоже содержал, но ВЧ был убит примененным фильтром
Ошибка в постановке задачи, что вы делаете, как вы это делаете, и в интерпретации результатов.

Если задача показать, что для 20кГц не нужно 192кГц — так это Котельников/Шеннон/Найквист давно доказали.
Если задача показать, что человек не слышит выше 20 кГц — так это надо фокус-группу собирать и двойное слепое прослушивание устраивать.
Если задача показать, что в HD-записях нет частот выше 20 кГц — так их фильтровать не надо и собрать достаточное количество записей для репрезентативного анализа.
Если задача показать несовершенство алгоритма передискретизации в конкретно взятом аудио-редакторе — так надо его импульсную характеристику анализировать, а не какую-то конкретную аудиозапись.
Котельников/Шеннон/Найквист давно доказали только математикам и людям, доверяющим науке. Для других людей совсем не очевидно, что 44100 достаточно, чтобы не терялась информация о высоких частотах. Цитирую комментарий, на который я изначально отвечал: «я не согласен с тем что можно достоверно передать частоту 20кгц дискретизацией 44кгц».
Люди, не доверяющие Котельникову, даже не пытались почитать его работу. Иначе очень быстро бы выяснилось, что их недоверие вступает в конфликт с объективной реальностью, в которой имеет место быть теле- и радио-вещание.
щас даже самая нищая домашняя студия мастерит на 24х192.

тут такая же история как и с мегапикселями в мылницах и 700 Ваттах звука в аудиоцентре за 10 тыс деревянных.
На китайской коробке могут быть написаны любые цифры, там даже изредка могут стоять приличные микросхемы, но при этом одной только «грамотной» трассировкой можно так испортить звук не говоря уже о питании, дискретных компонентах и звенящих фильтрах, что 16 битный CD будет много более качественный сигнал выдавать.
Пока санитары не смотрят, позволю себе напомить:
1. Задача ЦАП выдать не оригинальный сигнал, а сигнал неотличимый от оригинального на слух.
2. Человеческое ухо — АЦП с частотой дискретизиции в 20 КГц и точностью дискретизации в 5 бит.

Отсыпь травы брат :-)
Если уж сравнивать, что человеческое ухо, это преобразователь импеданса, с АРУ и нелинейностями, и до фига полосный анализатор спектра, причём каждая полоса охвачена АРУ, срабатывание которого порождает импульс в соответствующем канале, далее уже мозг, но там всё ещё веселей…
… и да, мы знаем об этом достаточно много, что бы кодировать звук для кохлеарных имплантатов, или создавать иллюзию баса в наушниках, или чистый-прозрачный звук в мутной трансляционной сети, это всё психоаккустика называется
Человеческое ухо — АЦП с частотой дискретизиции в 20 КГц и точностью дискретизации в 5 бит.


Ознакомьтесь, пожалуйста, с литературой (в гуголе легко находится электронный вариант):
Цвикер Э., Фельдкеллер Р. Ухо как приемник информации
Извините, не не ознакомлюсь. У меня есть дела по интереснее, чем читать 7 мегабайт текста только для того, чтобы возможно понять в чём заключается ваше возражение.
У меня есть дела по интереснее

У меня тоже есть дела по интереснее, чем разжёвывать лентяям основы психоакустики ;-). Идите с миром… ;-)
Имейте ввиду, что позиция «вы не догадаетесь, с чем я несогласен, пока не прочитаете вон тот талмуд» не делает вас умнее в глазах окружающих.
UFO just landed and posted this here
У вас другие данные?
UFO just landed and posted this here
Вот возьмите и проверьте, только имейте ввиду эффект маскировки, не позволяющий нам единовременно воспринимать весь доступный нам динамический диапазон громкостей.
UFO just landed and posted this here
Отлично, значит вам не составит труда выложить результаты проверки.
UFO just landed and posted this here
Вы же уже проверили. Почему скрываете результаты?
При 5 битах, динамический диапазон был бы около 30 дБ. Вы заявляете, что динам. диапазон человеческого слуха 30 дБ?
Нет, я такого не говорил.

Динамический диапазон уха (если не брать в расчёт разные степени болевых ощущений) — порядка 12 Б или 20 бит.

При этом громкость выше 10 Б никто в здравом уме выкручивать не будет. Уровня шумов ниже 3 Б добиться весьма не просто. Так что для записей остаётся лишь 7 Б, что чуть больше 10 бит.

Тем не менее при мастеринге звук всё равно компрессируют максимум в 4 Б, что чуть больше чем 6 бит. Но как правило жмут ещё сильнее, вплоть до 0,4 Б (ага, меньше бита на отсчёт).

Это всё, чтобы понимать масштаб трагедии — 90% населению планеты более чем достаточно 6 бит на отсчёт.

Почему? Да потому, что из-за эффекта маскировки звуки на 3 Б (или в 8 раз) тише от самого громкого в критической полосе уже не слышны. Для примера, можете попробовать, прошептать что-нибудь активно разговаривающим собеседникам находясь в метре от них. Услышат ли они вас?
Простите, а что это за такая единица измерения «Б»?
https://ru.wikipedia.org/wiki/Бел
Ок, хотя я привык к дБ, а вообще речь наверное про дБА, ну да бог с Вами.

2. Человеческое ухо — АЦП с частотой дискретизиции в 20 КГц...


Возможно Вы хотели написать 40 КГц? А иначе люди бы не слышали звуки выше 10 КГц.

… и точностью дискретизации в 5 бит.


Это «работает» только для однотонального сигнала (в отсутствии других звуков или шумов).
Могу объяснить почему.

Теорема котельникова тут не работает, так как ухо фиксирует мгновенное ачх и восстановлением исходного сигнала не занимается.

Оно для любых сигналов работает, на чём и о основано сжатие с потерями. Или у вас другие данные?
и точностью дискретизации в 5 бит.

Откуда у вас такая информация?
Отсюда: https://geektimes.ru/company/audiomania/blog/246304/
За что купил — за то продал. У вас есть более авторитетная информация?
Угу. Неравномерности АЧХ в 4-м знаке после запятой в логарифмической шкале ;-)
Тут где-то товарищ приводил порог различимости разных уровней громкости. Там было ЕМНИП 1 дБ.
Т.е. искажения АЧХ даже в самом пплохом случае на 4 порядка по величине меньше чувствительности человеческого уха.
Искажения АЧХ — линейные искажения. А их человеческое ухо воспринимает очень лояльно.

И пик в 0,0001 дБ,
а это в разах будет 1.00001, т е повышение амплитуды в 0,001%. Аналоговую часть это тоже не перегрузит.

И кстати да — там хорошие картинки насчёт разрядности и шума квантования.
Интересная статья, а еще интереснее коментарии
Хочу завести ЦАП AK4452 в режиме DSD mode. Мне как инженеру чисто интересно.
Direct Stream Digital
Мои друзья аудиофилы говорят яро настаивают, что это не принесет каких либо существенных улучшений. PCM качественнее. Я было не согласился. Но в вики есть один документ к этому артиклю
Why 1-Bit Sigma-Delta Conversion is Unsuitable
for High-Quality Applications

Там много математических выкладк, но заглавие громкое.
Есть и прямо противоположное
Why Direct Stream Digital is the best choice as a digital audio format
Слушал звук в DSD. По ощущениям как в кинотеатре. Шумов нет. Динамический диапазон широкий. На вскидку, без серьезной аппаратуры.
Хотелось услышать мнение по этому поводу. Может напишете еще одны статью? Часть III так сказать

Sign up to leave a comment.

Articles