Как стать автором
Обновить

Комментарии 151

полуофф. Есть забавный тест для проверки аудиотехники. PCM WAV у которого мелодия записана на младших битах. К шоку владельцев аппаратуры — не всякий ЦАП выдал эту мелодию.
А есть ссылка на этот тест?
Уф, еле нашел — 20 февраля 2010 года. Это надо было вспомнить, где это было. (за старание наплюсуйте карму :) )
Тест на качественную систему. Файл в формате 16 бит/44,1 кГц, 25 секунд длиной. Запись сделана с использованием только трёх младших бит.

То есть значения сигнала от -3 до +3, а в основном даже от +2 до -2 минимальных значений-шагов.

Воспроизводя этот фрагмент на качественной системе можно совершенно отчётливо услышать и опознать мелодию и различить слова песни.

Только чур нигде в редакторе не усиливать. Но колонки нужно сделать погромче, примерно выкрутить на половину громкости.

переложил на Google Drive
A что они должны показывать?
Файл в формате 16 бит/44,1 кГц, 25 секунд длиной.
Да, я попутал.
Слышу! Но у меня наушники, и если выверну громкость больше 100%. Это считается?
Ползунок на 50% — это номинальный сигнал, а выше — это усиление. По крайней мере так было в Windows 98-XP
У меня ubuntu, и усиление включается явно — галкой «разрешить громкость выше 100%» в настройках. Тогда после 100% ползунок удлиняется.
Пришлось выкрутить больше половины.
ИМХО, здесь дело не столько в ЦАП'е, сколько в чуствительности колонок/наушников.
если ЦАП «отсекает» младшие биты, то как бы не усиливался сигнал — усиливать нечего.

Поэтому и 24 бит звук в реальности является 18-20 битный. Из-за шумов теряется часть битов. Фактически, чтобы слушать реальные 24-26 бит ЦАП должен быть 32 бит.
Кстати да, ЦАПу какой смысл откидывать младшие биты? Он может быть излишне шумным, как и аналоговый тракт, и шум может быть выше звука, однако его всё равно можно услышать.
это старый холивар, тема со времен сотворения цифрового звука. На форумах HiFi аппаратуры километры страниц поиска цапов поддерживающих «честные» 16, 18, 20 бит.

Скажем пример из хабра:
Берем теорему Котельникова ( в чистом виде штука бесполезная, но для красоты очень даже годная), и из неё видим, что частота дискретизации (те самые 44/96кгц) должна быть в два раза выше максимальной частоты сигнала (оверсемплинг не рассматриваем, он тут ни к чему), в реальности всё будет ещё хуже, и 22.5/48 врядли получится(читаем хорошие книжки по ЦАП/АЦП и понимаем почему). Далее наслаждаемся разрядностью — 16 бит это круто, 24 тоже круто. А на практике в младших разрядах вечный шум, соответственно получаем 12-14 и 18-22 бита(читаем даташыт на ЦАП/АЦП в плеере и смотрим ENOB).


Для примера звуковая карта Creative Audigy-2 24bit — проигрывание этого файла — тишина. На внешних HiFi ЦАП мелодию слышно хорошо.
Я писал к тому, что тут много факторов: начиная с железа и заканчивая шумом в комнате.
Например, я в открытых наушниках практически ничего не слышал, а в закрытых и на колонках услышал.
И на родном ноутбучном 16bit ЦАП-е, и на внешнем 32bit.
тест предназначен для внешнего ЦАП + акустика. Найден в одной из тем о ЦАП на аудиофильском форуме.
На наушниках звука не должно бы быть слышно ( значит очень хорошие наушники) — усиление конечного каскада звуковой карты на низкоомной нагрузке типа наушников низкая.
Мерси за пояснения.
В закрытых мониторных наушниках+цап хорошо слышно, но громкость приходится на максимум выкручивать, в открытых мешает шум от компа
На встроенную звуковую ноутбука ничего не услышал. На внешнюю Creative EMU 0202 USB услышал, хоть наушники-капельки за 200 рублей maxell. Очень тихо, в шумах. В открытых ушах SONY за 1000р — тоже тишина.
В подтверждении вашиз слов — essence ST на относительно низкоомных наушниках (40 ом) при нормальном усилении (которое в драйверах «для наушников до 64 ом») — если что и слышно (как мне кажется) — то на пределе слышимости, какие-то отдельные ноты. Если включить усиление на большие значения — на средних значениях мелодия слышна, но тиховато, если усиление включить на максимум — слышна отчетливо громко, но шумы, увы, ужас.
Примерно понятно.
Для примера звуковая карта Creative Audigy-2 24bit — проигрывание этого файла — тишина.

У меня SoundBlaster Live 24bit external, ей сто лет в обед, на халяву досталась. Юзаю из-за того, что внешняя, удобно наушники включать. Однако слышно.
Realtek ALC892 — на фоне цифрового шума что-то слышно, но тихо. Естественно, в комнате не абсолютная тишина. Например, шумит ноутбук.
MacBook Pro (17-inch, Late 2011) — всё прекрасно слышно. Слушал в VLC, на полной системной громкости, в копеечных мониторных наушниках с перепаянным кабелем.
Блин… Чуть слуха не лишился. Ноут dell inspiron + наушники Razer Orca.
Выкрутил на максимум — мелодию было слышно, но тут пришло сообщение в скайп.
Уши теперь гудят.
Я узнал этот трек — это с "CD-диска с тишиной" (Very Silent Night) или из-за которого какие-то терки были с правообладателем трека.

Не услышал ни в колонках, ни в наушниках ничего.
Хорошая попытка, но нет)
Я так не понял что за музыка, очень тихо. Но то, что в одном канале мелодия, а голос в другом — это слышно.
Сам файл не 16 бит целочисленных, а 32 бит с плавающей запятой.

Хм, нет не так. Это audacity при загрузке его сделал 32 бит с плавающей запятой, странно, раньше такого не замечал за ним, какой есть формат данных, так и открывал
Недавно тоже открыл этот фокус, когда пересохраненный файл неожиданно отказалось воспроизводить устройство.
для себя обнаружил что через ffmpeg приятно звук обрабатывать. В нем и увидел что исходный файл raw s16 — signed 16 bit без сжатия

Тест до сих пор пользуется популярностью и приходят запросы на скачивание. Кроме Google Drive можно скачать без авторизации здесь -
http://www.ant-audio.co.uk/test/2bit_fragment.zip

Что наводит на мысль, что тестировалась способность отличить не 16бит от 24бит, а интерполяцию 16>24, что в общем-то 16-битным звуком на выходе по определению не является.
А на выходе ЦАП вообще аналоговый сигнал, у которого нет никакой разрядности.
Это где же вы увидели интерполяцию?
Ну чисто теоретически, софт-конвертер 16->24 мог проинтерполировать. Надо смотреть конкретные файлы.
Я просто жажду увидеть эту чисто теоретическую формулу интерполяции — из 16 бит в любое кол-во бит больше 16.
Точнее не интерполяция, а сглаживание.
Еще больше жажду увидеть формулу сглаживания при пернводе из 16 бит в любое другое кол-во бит больше 16. В-)
А немного включить мозг?

Демонстрирую просто принцип.
Были сэмплы: 52, 54, 57, 59, 61, 62, 65, 66
Потом понадобилось ужать информацию, для чего округлены младшие разряды.
Стало: 50, 50, 60, 60, 60, 60, 70, 70

Внимание, вопрос! Если мы хотим сделать апконверт, то последовательность 50, 50, 60, 60 (равенство, резкий скачок, равенство) не может нас навести на мысль, что тут было округление и на самом деле были промежуточные значения?
В самом примитивном варианте можно просто усреднять соседей в моментах скачков: 50, 50, 55, 60, 60, 60, 65, 70
А можно придумать более продвинутые методы.

Исходный сигнал не восстановим, но приблизимся к нему.
Не. Если хорошо продумать и всё аккуратно реализовать — в абсолютном большинстве случаев будет приближение.

Насколько оно будет существенно на слух — это вопрос открытый. Но чисто математически будет.
Если так поокруглять — изменится спектр сигнала, предположение класса «пальцем в небо» — съест высокие гармоники (мало ли там меандр, причем и исходно было 51 51 59 59 59 59 71 71, а вы его к чему-то более пологому приводите)

В любом случае фарш невозможно провернуть назад — инфа уже потеряна, чтобы что-то восстановить — нужно что-то знать об исходном материале
Спектр изменится, но на перенебрежимо малую величину, потому что округляем мы младшие разряды.

Насчет меандра (уже не первый раз натыкаюсь на апелляцию к нему в подобных спорах). Причем тут меандр?! Мы говорим не о любом возможном сигнале, а о звуке, который как раз состоит из достаточно пологих волн. Видели когда-нибудь музыку в звуковом редакторе при очень сильном увеличении (так чтобы отдельные волны были различимы)? Никаких меандров там и близко нет, всё полого.
И зная особенности, ограничения и характЕрные особенности именно звукового сигнала — и можно построить алгоритм сглаживания, который будет нетипичные для звука ступеньки приводить к более типичным.

Полностью восстановить исходный сигнал безусловно нельзя, но частично к нему приблизиться — можно. Фотошоп же умеет увеличивать картинки с интерполяцией недостающих пикселов? И делает это относительно неплохо.
Интерполяция недостающих пикселей в фш — в применении ко звуку это увеличение частоты дискретизации, тут да, интерполировать не только можно, но и нужно.
Вы же предлагаете (в терминах изображений) — размыть цвета на контурах областей одного цвета, это не то же самое

Но вообще стоит взять да и посмотреть, что со спектром становится при откидывании младших бит, мб наоборот появляются лишние гармоники — их тогда можно будет и убрать, причем они по идее должны будут зависеть от того, сколько и из какого начального формата бит выкинули
Изображения двумерны, график волны — тоже. Частота дискретизации это одна из «координат», вторая — битовая глубина.
Интерполировать и сглаживать можно обе. Вопрос только в алгоритмах — насколько они хороши и аккуратны.
То есть попортить таким образом звук можно — но это будет косяк конкретной реализации, а не подхода в целом.
Идею понял, имеет смысл для случаев, когда частота сэмплирования существенно больше максимальной частоты сигнала. То есть, явно не для 44/48 KHz. Однако:
1. В примере биты как-то хитро сблокировались в десятичные цифры, но это ладно, в качестве примера покатит.
2. Во всей этой ветке была мысль, что без потерь нельзя переконвертировать из 16 в 24, потому что, мол, 24 не кратно 16. Я думал, что тут имеется ввиду подобное заблуждение.
Да, десятичные цифры это просто пример «на пальцах». Манипулировать битами долго и муторно.
Я вот вашу дискуссию тоже читаю и даже растерялся: подумал может я чего-то отстал: свет поддается этой штуке, на которую вы намекаете (линзы и т.п.), но вот звук…

Вы приводите неверный пример. 16 бит ограничивают звук в потолке, а как потом обратно прыгнуть туда, где и так все было обрезано — вот в чем вопрос и о чем спрашивает dyadyaSerezha т.е. были данные
10 70 50 30 40 75 80 65 40 55 30 55 75 95 85 65 50

его обрезали «сверху» (т.к. граница, например в 65):
10 65 50 30 40 65 65 65 40 55 30 55 65 65 65 65 50

а потом пытаются назад сделать где ограничения в «65» (потолок) нет, то откуда взять недостающую информацию? куда прыгать и насколько высоко?
Теряют информацию не «сверху». Теряют младшую часть.
Лучше смотрите на это так:
было:
0,10 0,70 0,50 0,30 0,40 0,75 0,80 0,65 0,40 0,55 0,30 0,55 0,75 0,95 0,85 0,65 0,50
стало:
0,1 0,7 0,5 0,3 0,4 0,7 0,8 0,6 0,4 0,5 0,3 0,5 0,7 0,9 0,8 0,6 0,5
Поздравляю, вы не понимаете принципов кодирования.
При перекодировании 24->16 бит теряется младшая часть, а не старшая. Потолок не обрезается, теряется точность.
С изображениями, кстати, абсолютно так же.
Эта мелодия может вообще до цапа не доходить из-за дефолтных настроек операционок (или слетания кастомных) — мало кто перед включением каждого трека их проверяет :)
Можно ссылку? Хочу пощекотать себе нервы )))
Думается мне, что большинство случаев заметности разницы между 24 и 16 бит связано с тем, что большинство источников шестнадцатиразрядного звука — это компакт-диск или его копия, то есть 44,1 кГц частоты выборки. А большинство компьютерных звуковых контроллеров осуществляют ресемплинг в 48 кГц. А у файлов на 24 бита частота выборок 48, 96 или 192 кГц.
Плюс сами записи на разных источниках зачастую не идентичны.
Наконец, запись, имеющая широкий динамический диапазон и лишь маленький участок большой громкости (вроде внезапного пушечного выстрела, «торчащего» над всей записью децибел на 20), несомненно, выиграет от 24-битности.
Вы, вероятно, невнимательно прочитали об условиях эксперимента. 16-битные записи вообще не использовались. Бралась 24-битная запись, она конвертировалась в 16 бит, затем обратно в 24. И эта сконвертированная туда и обратно копия предлагалась к сравнению с исходником.
Я-то как раз внимательно читал. И пишу — что часто слышимая (часто и на довольно простой аппаратуре) разница в качестве записей 16 и 24 бит связана с тем, что это разные записи. С разной обработкой (16-битные подвергались более жесткой компрессии, например) и с разной частотой дискретизации. А в описанном в статье случае сравнивали одну запись, так что нет ничего удивительного, что разницу не услышали. Так как слышимая разница была действительно обусловлена целиком разницей в числе уровней квантования. И для данного музыкального материала (и подавляющего большинства других материалов) она оказалась ничтожной.
Все, я понял. Но они же и проверяли как раз влияние исключительно битности.
Частота дискретизации и битность ортогональны, может быть и 192khz 8bit и 22050 32bit.

А вот про железо и 48khz внутри простеньких чипов — верно (собственно ниже уже об близкой проблеме писал — даже если есть хороший цап, операционка все равно не факт что до него сигнал в исходном виде доведет)
Может. Но все же есть определенные стандарты, и ситуации с 24 бит 44,1 кГц или 16 бит 96 кГц встречаются крайне редко. Даже 16-битные записи с частотой дискретизации 48 кГц встречаются гораздо реже, чем 44,1 кГц.
Судя по минусам и возмущенным ответам выше, люди разучились понимать написанное.
А вот на архиполезную ссылку на xiph.org в комменте ниже, никто не обратил внимания. Там в частности обсуждается и вопрос динамического диапазона 16бит.
Имеете в виду то, что 24 бита звучат лучше, потому что там как правило уже 96 или 192КГц? А не столько от битности.
Я пробовал сравнивать 48/96/192 и эквализацию. Замечал только, что высокие частоты на 96 и 192 звучат чище(прозрачнее?), то есть даже как будто высоких добавляется меньше, чем на 48. Ну либо на 48 там уже не синус, а меандр получается и он звучит резче.
Имею в виду, что нет некратных передискретизаций. 44,1 -> 48 и пусть даже 192 -> 48 — это разные вещи.
Единственный адекват в треде. Спасибо за материал. Стоит кинуть сюда еще это видео, где все наглядно демонстрируется xiph.org/video/vid2.shtml
Ребята, кто ещё тут адекватный есть, объявляю предложение неслыханной щедрости!
Я сектант и аудиофил, готов продемонстрировать статистически достоверное определение 16 vs 24 bit, 44.1/48 vs 192 kHz в условиях одной из московских студий. Но так как я человек занятой, и обычно обучаю работе со звуком за деньги, я предлагаю спор на сумму начиная от 200 USD…

… ну что, кто готов довериться репутации xiph.org и заработать\потерять 200USD?
Может быть, еще готовы продемонстрировать и определение проводов за $5000 от проводов за $50?)
Вешалка выиграла
Напротив, году в 2000 отжал у оного умника втиравшего про ценность чудных проводов и тослинка $500.
Чувак включал\выключал в студии свет, надеясь создать хоть какую помеху, но витая и самые дешевые китайские тюльпаны, были ни чем не хуже брэндовых шлангов и тослинка.
В споре я ничем не рисковал, да и сам евангелист святых проводов быстро понял что к чему, когда оказался на студии… Он то надеялся что с мальчиком можно поспорить в аудиофильских категориях, а тут студия, тестовый сигнал из переименованного текстового файла, записывался на ДАТ и обратно в комп…
Предлагается разбить на два ортогональных спора: квантизация уровня и дискретизация по времени.
Может, предложите примеры звуковых файлов, на которых можно эксперементировать?
Согласен, ибо это две большие разницы, но не то не другое не является для меня проблемой.
Однако я предлагаю именно реальный спор, на реальные деньги в условиях реальной студии, где мало того что сам продемонстрирую заявленные «экстросенсорные феномены», что является предметом спора, но и в качестве бонуса проигравшему могу попытаться научить его различать такие вещи как разрядность, дитеринг и тип оного. Способность же различать частоты сэмплирования, без каких-либо косвенных признаков, физически доступна не всем, но кто знает…

Если хотите экспериментов, то ниже я задал вам вполне конкретные вопросы, ответы на которые можно найти в таблицах, вычислить или найти эмпирическим путём, с помощью практически любого аудио редактора со встроенным функциональным генератором и конечно же ума… (Я рекомендую WaveLab тк там есть простенький индикатор разрядности «для тупых» и всё очень показательно.)

Ниже вы обозвали людей сектантами, но заметьте только сектанты распространяют свои учения бесплатно.
«Моё учение» продаётся, даже в формате институтских лекций, студенты за это платят и было бы не очень этично с моей стороны публично раскрывать «секреты мастерства» когда цифровая звукозапись сегодня доступна всем, именно глубокое понимание происходящих процессов является преимуществом профессионалов.
Сложно материал подобрать. Очевидно, что кодирование 24-16-24 — туфта. Ну и динамический диапазон у произведения должен быть широким.
О поверьте, материал на студии найдётся, именно тот самый, между сведением и мастерингом.
Симфоническая музыка конечно-же идеальный, хрестоматийный вариант, но имея некоторые знания и навыки, можно прекрасно различать разрядность поп\рок и даже электроники.
>О поверьте, материал на студии найдётся, именно тот самый, между сведением и мастерингом.
Хотелось бы сначала его «пощупать».
Покупай\производи и «щупай» в чём проблема-то…
Можно с собой принести материал, я к нему совершенно не критичен, единственное моё условие что бы цикл производства этого материала был с точностью 24 разряда, а склонность к симфонической музыке исключительно в силу её заведомо акустической природы. Нужно понимать что если источник сигнала китайская говорящая игрушка, то как её не записывай, это один хрен однобитная дельта модуляция.

Можно гитару-нейлон прописать в 24 разряда и воспроизводя эту запись в 16 бит заметить разницу. А ещё её можно… Короче, у профессионалов с этим проблем вообще никаких нет.
>Покупай\производи и «щупай» в чём проблема-то…
Я не занимаюсь производством музыки и необходимым оборудованием не обладаю. Где купить такой материал — тоже не знаю. Более того, чего мне покупать кота в мешке? Лучше покажите такой, где вы слышите разницу, а я уж гляну на «осцилограммку».
На лайфхакере недавно была статья про сервис Tidal, у них там есть забавный тест «слышишь разницу или нет»: test.tidalhifi.com/
Самое забавное, что мне, при слегка пониженном слухе и Bluetooth гарнитуре со стандартным кодеком, «удалось» правильно выбрать 5 из 5.
Разницы не слышал, тыкал от балды, и 5 из 5ти. Что-то тут не так.
НЛО прилетело и опубликовало эту надпись здесь
Я потом несколько раз пробовал — вроде работает, результат разный…
Эх, жаль это было не 5 из 36 да на другом сайте :)
В описании говорится, что там один flac, а другой aac 320 kbps.
У меня тоже 5 из 5.
НЛО прилетело и опубликовало эту надпись здесь
Хм, наверное транскод. Для простоты реализации теста.
Тоже 5 из 5. Разница крайне сложно уловима, и если не вслушиваться, не разделять мелодию на отдельные партии, вообще ни как не различить. Музыка во флаке не много ярче, яснее, можно услышать чёткие отголоски эха, особенно в звуках перкуссии, тарелочек, либо, как в случае с Hotel California, по приглушению гитары во время боя. Вторую композицию почти наугад отметил, там и вовсе сложно что либо отличить.
Если есть время, попробуйте его пройти еще пару раз. Интересно, какие будут результаты :)
Тест «для аудиофилов» в браузере, где нет возможности со стороны скрипта указать какие-либо настройки аудиовыхода, да еще и с системным микшером и ресемплером.
Это просто пушка! Я, честно говоря, ожидал, что кто-то такое сделает, но все равно, очень смешно!
В конце наверно хотели написать: «Конечно, есть приложения, в которых нужно работать с 24-битным звуком»?
По сути 24-битный 96кГц и выше звук используют при создании звукового материала, для уменьшения искажений при наложении разных эффектов.
Релиз обычно делается в классических 16-бит 44 кГц.
Ещё и задержка меньше при живом прослушивании во время редактирования, правда и нагрузка на процессор выше.
Сравнение не корректно, тк не нормирован уровень громкости прослушивания, отсюда и некорректный вывод о неразличимости 24 разрядов против 16…

Дело в том, что шумы квантизации и дитеринг, запросто могут оказаться погребены по собственными шумами тракта, и порогом слышимости, а могут напротив, быть вытянуты от туда регулятором громкости.

Люди в быту слушают музыку как правило на не большой громкости, и не удивительно то что они не слышат разницы, однако в мастеринге обычно ставится задача получение оптимального звучания фонограммы в различных контекстах и с этой точки зрения 24 бита самое оно, ибо слишком многим приходится жертвовать, особенно в инструментальной, акустической музыке…
И тут надо оговориться, что большинство слушателей, оригиналов записей никогда и не слышало, и редко с ходу врубаются в разницу, оно и не удивительно… Уместно упомянуть старый-добрый винил, который аудиофилы до последнего любили, а возможно что и некоторая популярность к нему опять вернётся… Но правда в том, что большая «детальность» винила, отнюдь не следствие превосходства технологии, а всего-лишь результат агрессивного мастеринга, который для винила и не может быть иным в силу технического регламента.
Меня больше смущает преобразование 24-16-24. Понимаю, они хотели устранить влияние железа и воспроизвести все на одном ЦАПе, но тут вопрос в том, как происходит преобразование. Если каждый сэмпл преобразуется независимо, то должно получиться похоже на правду, за исключением привнесения искажений некратным преобразованием. Но если на преобразование влияют соседние сэмплы, то полученный результат может оказаться лучше 16-битного. Если бывают 48-битные ЦАП, то лучше было бы использовать такой, сделав преобразование 24-48 и 48-16-48. Это устранило бы устранило по крайней мере некратность.
Если не менялась частота дискретизации, то не будет никакого влияния соседних семплов. Так же, если между преобразованиями не делалось никаких нормализаций, не было никаких «искажений некратным преобразованием» и все должно быть эквивалентно простому отбрасыванию 8 младших бит, возможно, с введением дизеринга.
Если просто отбросить биты, это ж будет клиппинг. Надо нормализовать. И тут вылезает проблема некратности. Нельзя без потери сконвертировать одно в другое. А тут целых два преобразования, каждое из которых принесет потери.
Нет, вы неправы. Отбрасывая младший бит, мы просто увеличиваем ступеньку квантования вдвое, потому что пропадает информация о самых мелких ступеньках. Здесь все строго кратно: фактически это преобразование можно рассматривать, как целочисленное деление каждого отсчета на 256 и последующее умножение на те же 256 — то есть все строго кратно.
Именно так.
Про ложную некратность уже написали. А насчет «надо нормализовать», так это будет уже совсем другой сэмпл. Так что уверен, что никаких преобразований, кроме битовых сдвигов вправо-влево, не было.

Но понравился обший итог статьи: «дорогие аудиофилы, если вы ходите расстаться с большими бабками, мы с удовольствием вам в этом поможем!» (с) лозунг фирм, производящих аудиофильскую аппаратуру.
Нет упоминания, что авторы просили людей проверить, что хотя бы частота дискретизации по пути не портится на всем пути от микрофона до ушей.
В макоси по умолчанию, не зависимо от того, какого качества играется исходник — на железо уходит 16бит 44.1, чтобы это было не так — надо специально лезть и переключать (причем если выставить «с запасом» — то будет апконверт, тоже фигово ибо погрешности в любом случае)
Винды вне виртуалки нету, но есть подозрение, что там похожая петрушка.

Это объясняет ошибку музыкантов: маков у них в среднем больше, слух тренированный — они могли услышать что преобразование, которое делали авторы в профессиональном софте (с дитерингом и тп) по качеству оказалось лучше, чем то, что делает сама операционка и дрова
В макоси по умолчанию, не зависимо от того, какого качества играется исходник — на железо уходит 16бит 44.1
Зависит от плеера.
>могли услышать
Не могли. Никто не отличит 44100/16 от 192000/24. Выше товарищ a553 кидал ссылку на статью на xiph.org, и там есть ссылки на исследования, где никто ничего не смог отличить на слух.
Почему тогда среди них результат 30% вместо ожидаемого 50%, который должен был быть, если бы ничего не слышали и соотвественно выбирали случайно?
Предположительно причина где-то в районе bandpass-фильтра и дитеринга, которые в случае 192@24 -> ?@16 -> 192@24 -> 44.1/48@16 были точно применены на первом шаге и уже были в записи, и неясно как применены в случае тупого преобразования 192@24-> 44.1/48@16 в дровах
Второе возможное объяснение — из-за адаптации слуха первый трек из прослушиваемых может казаться чуть громче, а громче всегда подсознательно воспринимается как более качественное -> опять косяк в проведении теста, надо было выдавать участникам в рандомном порядке, чтобы этот эффект тоже статистически нивелировать (а респонденты похоже качали один и тот же пак)

В обоих случаях исследование некорректно и максимум говорит о том, что на современном среднем уровне техники у людей — нет смысла доставлять контент в более высоком качестве, чем пожатое без потерь cdaudio
16 интерполируется в 24, есть смягчение. У всех своё оборудование, свои настройки. Да тут хоть миллион людей протестировать, результата правильного не добиться в принципе. Ибо остается слишком много неучтённых факторов. Да и имея 24 и 24>16>24 и не зная оригинала сказать однозначно нельзя. Если разница и будет заметно, то сказать однозначно где неправильно без оригинала нельзя.
Можно, как минимум если прибавить громкости и обращать внимание на фэйдауты, отчётливо будет слышна ботва квантизации и\или дитеринг.
Спасибо, добрый дядя Alizar.
Дома сложно услышать. Знаете в каких условиях мало кто ошибется? Большая качественная концертная акустика на высокой громкости и участки низкой громкости в тестовой записи. Слышна будет и ступенчатость при изменении амплитуды, и дрожание дизеринга. А больше артефактов у таких преобразований (как в статье, только битность) нет :)
Эм…

Мне одному кажется, что 47.8 > 47.1?
Странно, что увертюры 1812 год не было в тесте.

Если для музыки не нужен широкий динамический диапазон, то она так и так будет звучать нормально. И, на мой взгляд, проблема в том, что не создается музыкальных произведений, которые требуют широкий динамический диапазон. Затем люди не слышат разницы в тестах. Производители оборудование и программ никак не могут перейти на стандарты с 24 бит. Производители музыки продолжают клепать музыку под 16 бит. Большинство жанров этого и не требуют, но вот хардкор мог бы быть куда более злой.
И правильно клепают. Потому что адекваты. А 24 бита для прослушивания хотят «религиозные фанатики».
Дело вовсе не в религиозном фанатизме. Для Вас может быть окажется сюрпризом, но в кино давно используют 24 бит. И сделано это вовсе не для того чтобы потешить слух среднестатистического посетителя кинотеатра. А сделано это для того чтобы диалоги звучали на нормальной громкости, а выстрелы были выстрелами, а взрывы были взрывами. И чтобы шепот был шепотом, но его было отлично слышно. Часто, именно за этим ощущением люди идут в кинотеатр. Таким образом, режиссеры фильмов с успехом используют различные художественные приемы, связанные в резкими переходами от тихого звука к громкому и наоборот. Производители музыки, стремящиеся ужать своё произведение в 16 бит лишены этой возможности.

В упомянутой выше увертюре «1812 год» в качестве музыкального инструмента задействованы пушки. Чисто теоретически, записать её в 16 бит НЕ-ВОЗ-МОЖ-НО! Либо оркестр звучит слишком тихо, либо пушки в результате компрессии. Конечно, в большинстве жанров музыки такие резкие переходы не нужны, но есть немало жанров в которых такие переходы необходимы. Так уж случилось, что я поклонник именно этих жанров. У меня просто сердце кровью обливается, когда слышу как иные замечательные произведения подверглись жестокой компрессии, когда я представляю, как они могли бы круто звучать, будь в индустрии стандартом 24 бит.
Вы ведь гуманитарий, да? Вы вообще не можете посчитать, что ДД 16-битной записи достаточно для всего этого?
Я, опять таки, приведу ссылку xiph.org/~xiphmont/demo/neil-young.html, где все это подытожено:
>16 bits is enough to store all we can hear, and will be enough forever.
Вы ведь теоретик, да?

Статья, конечно супер, но… Чувак записал 1 кГц с громкостью -105дБ. Я долго втыкал. Наконец, понял. Короче да, чувак прав, можно записать монотонный звук с частотой 1кГц и громкостью -120дБ. С частотой 10Гц и того тише. Но вот уже с частотами больше 10кГц при частоте дискретизации 44.1кГц такой фокус не прокатит. Можно, конечно, частоту дискретизации увеличить, но это Вам тоже вряд ли понравится. Что же касается более сложных звуков, то здесь всё может быть ещё интересней. Точность воспроизведения такого звука будет сильно зависеть от ЦАПа и ОУ.

Что же касается практики, то 16 бит дают динамический диапазон 50-60дБ.
>Что же касается практики, то 16 бит дают динамический диапазон 50-60дБ.
Простой подсчет дает мне 96,3 дБ. Куда вы там деваете остальное — не понятно. Может объясните?
Правильно, только вот сколько разрядов передают сигнал с уровнем — 96,3dB?
Ну правильно, это теоретический предел. Ну для 22кГц, как выяснилось. Даже этого, заметьте недостаточно. 140дБ болевой порог.

Куда девается? Очевидно, тембр. Да-да, музыка — это не синусоиды. Очевидно, несовершенство записи. Очевидно, несовершенство воспроизведения. Плюс, масса вещей, которые не очевидны.
>Да-да, музыка — это не синусоиды
А вот наука говорит, что синусоиды.

>Очевидно, несовершенство записи.
>Очевидно, несовершенство воспроизведения.
Ну так если «запись»/«воспроизведение» (что под этим подразумевается?) на столько плохая, на на кой ляд там 24 бита?
24 бита как раз и позволят нам все эти несовершенства нивелировать.

Т.е. если я записал что-то говёным микрофоном, но записал в 24 бита, то запись будет отличной? 24 бита нивелируют говёность?
Нет.
Тогда я не понял, что имеется в виду под «несовершенство записи» и «несовершенство воспроизведения»?
Ошибку при выставлении чувствительности микрофона запросто нивелирует.
Поэтом и пишут всегда в 24 бит, а то и больше.
Так про запись не говорим. Про запись я не спорю. Про обработку тоже не спорю. А вот для готового скомпилированного продукта 24 бита — это излишество.
16 бит — это приблизительно 96dB динамического диапазона (один бит — это в два раза, это примерно 6dB. 20*log(2)=6.02 так что 16*6=96.3).

Но проблема тут IMHO в том, что нет «запаса». Потеря всего трех бит дает 3*6=18dB, а это уже может быть заметно, плюс жульничество производителя, шумные аналоговые части, плохие наушники, крайне неприятный (не белый) шум от цифровой части и т.д.

А вообще есть такой троллинг любителей ТЛЗ: «Надо слушать МУЗЫКУ, а не ЗВУК». Типа в СССР слушали передачу «Севооборот» Сева, Сева Новгородцев, город Лондон, BBC, через шум глушилок и ничего.
Вот-вот. Вот полностью согласен.
Ну а если уж слушать музыку, то музыкальный сигнал с уровнем -60, пляшет в семи разрядах, для симфонической музыки это не редкость и этого мало!
Готовы подтвердить на практике свою способность различить 16 и 24 бита на симфонической музыке? Хотя бы знаете таких?
Про смогу ли я, см выше… (симфоническая музыка это вообще идеальные условия, но она должна быть изначально записана с такой разрядностью)
Про знаю ли таких, да естественно, и боле того, см ниже… я свою «ересь» преподавал в государственном вузе, если что.
16 бит звук это 15 бит диапазона, у звука это как в плюс так и в минус, соответственно от нуля до максимума всего 15 бит
Ну ну, и чему же численно равен этот ДД, чему равен ДД симфонического оркестра без обработки?
А график зависимости КНИ синусоидаьного сигнала от числа разрядов квантизации не пробовали построить?
Это право не сложно для человека технически образованного, и не надо ссылаться на гуманитарщину, когда есть конкретные математические обоснования.
>Ну ну, и чему же численно равен этот ДД, чему равен ДД симфонического оркестра без обработки?
Явно меньше 96 дБ

>КНИ
Вы их слышите? Вы можете отличить 24 бита от 16? А если добавить dithering?
Вот не надо гуманитарщины, когда есть табличные данные как по ДД различного материала, так и по уровням различимости КНИ. Более того, необходимый математический аппарат появился за долго до цифровой техники…

И да, я слышу, и этим в своё время зарабатывал, и не только из расчётов знаю о чём пишу.
Более того, иногда удаётся даже различить тип дитеринга если он применён не корректно.
У меня даже студенты всё это различают, причём в условиях обычно аудитории, а не студии.
>если он применён не корректно.
давайте не будем такие случаи рассматривать.
ДД оркестра считается 70-80дБ, только это уровень между самыми громкими и тихими звуками, а не тишиной.

В пиках оркестр может выдать до 115дБ spl — собственно это и есть 95дБ над считающим тишиной 20дБ фоновым шумом, в аккурат 16-бит должно хватать, но стоит самую малость ошибиться с уровнем сигнала — и кранты, клиппинг

Хотя стоит отметить, что в большинстве городских квартир фоновый шум 35+ дБ, и такой ДД в записи не нужен (собственно его оттуда и убирают компрессией при мастеринге ровно по этой причине)
В узлах погрешность будет на уровне -96 Дб. Разве искажения восстановленной синусоиды могут быть громче, чем погрешность её квантования в узлах?
Вот это-то и зависит от количества узлов ибо децибел, относительная единица измерения.
И если для 24 разрядов, оно ещё куда не шло, учитывая что это дело всё таки весьма тихо.
То для 16 разрядов -96Дб, это уже пушной, таёжный зверь!
Совсем неверный эксперимент, как мне кажется. Для его чистоты необходимо было, чтобы звук и записывался и проигрывался на одном оборудовании. Вот тогда бы и можно было задавать вопрос «различается ли человек 16бит от 24х»
Каждому давали пару файлов, и на одном и том же оборудовании прослушивалось оба файла — и 16 и 24 бита. Так что все честно, никакого bias'а.
Мне кажется, что товарищ хочет донести простую мысль: в эксперименте манипулировали цифровым файлом, то есть преобразование было математическим, «идеальным». Выше уже писали, что при 16 битах и 96dB диапазона практически нет «запаса» и потеря или шум на нескольких битах дает довольно большую ошибку. Так что сквозное преобразование аналог -> микрофоны -> АЦП -> цифра носителя -> ЦАП -> акустика на 16-ти битах дает намного больше шансов испортить звук чем на 24, где потеря нескольких бит не так критична.

Из текста не понятно был это один и тот же пак для всех или все-таки разные, в первом случае bias все равно может быть из-за фиксированного порядка файлов (уставание/адаптация слуха)
Плюс нет гарантии, что весь тракт респондентов это дело нормально воспроизводит (включая достаточно тихое помещение)
Слух вообще вещь относительная.
Вот например тест, насколько вы хорошо можете различать частоты, с каким шагом.

Перед вами три кнопки. Down, Play, Up.
Услышав два звука, вы определяете выше или ниже первого был второй звук. Если ниже — жмете левую кнопку, выше — правую. Интервал между нотами постоянно уменьшается. И в конце теста уловить разницу уже не так-то просто.
В результате программа выдаст вам объективный цифровой показатель. Хорошим считается менее 3х герц. Хотя для гитариста, имхо, нужно до 1-го.
Успехов!!!


Интересно будет узнать результаты людей, которые в комментариях скептично относились к результатам теста.
Первый проход 1.5, второй 0.6, больше не стал заморачиваться, это тест точности восприятия частоты, он не относится к теме.

Но есть два интересных момента:
  1. Попробуйте после сигнала подождать пару секунд и прослушать его повторно нажав пробел, ваш результат заметно улучшиться.
  2. Попробуйте исказить сигнал, например перегрузив наушники, результат станет ещё лучше!


Я эти фокусы не использовал, потому и ошибался(по первому пункту в основном, надо было ждать), а вот второй пункт ИМХО способен выдать феноменальные результаты!
Во втором случае это читерство, т.к. в звук добавляется куча гармоник, которые собственно и проще услышать

Btw, сайт похоже лег :)
Не то что проще, а скажем так, разрешающая способность слуха по частоте не линейна по чисто конструктивным причинам. Это было исследовано физиологами ещё в мохнатых годах.
На низких частотах мы способны замечать минимальные отклонения частоты, а слуховые ощущения за 20 килогерц, это просто ощущения на грани присутствует\отсутствует, а многие так вообще там ничего не воспринимают.
Напрямую конечно не относиться, я имел ввиду что слух у всех разных, и по восприятию динамического диапазона и отдельных частот в частности.

Я после 0.75 Гц начинаю ошибаться.
Звуковая карта 16-bit ведь все равно проиграет звук 24-bit как 16-bit? Для теста получается нужны звуковые карты не ниже 24-bit?
Да, именно так.
Плохо разбираюсь в цифровом звуке, но — разве нельзя просто подать 16-битный и 24-битный треки на Line-in, записать и сравнить получившиеся звуковые диаграммы, посмотреть «дельту», попробовать ее как то выделить и воспроизвести? Если слышно — значит разница есть.
+100500 Вот это я называю инженерный подход!
Там право есть масса тонкостей влияющих на результат сравнения, но всё это можно проделать и в цифре, и получить таки конкретный результат!
Но спор то не о том, нас пытаются убедить в том что человеку на эту разницу болт с резьбою положить.
Для более-менее оживленных бесед\споров\холиваров не обязательно даже топик заполнять, достаточно темы со словами, содержащими: «сравнение», «аудио», «звука».

Катализатором экстрабурной реакции является наличие слов, начинающихся на лам- и заканчивающихся на -повый. К счастью, в данном топике их нет.

По теме: давно доказано, что Audio-CD — формат полностью удовлетворяющий возможности человеческого слуха, остальное — маркетинг. Но если всякие маркетинговые изыски будут способствовать прогрессу — не вижу в них ничего плохого. В том числе и в 24х битах, и в 100500 кГц.
Есть мнение, что если какая-то фраза начинается со слов «давно доказано» — доверять ей можно с бо-ольшой осторожностью.
(Исключая случай, когда речь идет о чем-то, что действительно доказано в строгом научном смысле — например, теорема).
Из 1800 альбомов я могу только на паре треков показать разницу.
Самый качественный исходник из встречаемых: Trentemøller — Chronicles [24-bit], лежал на рутрекере. Запускаю через PC > Оптический шнур за $100 > B&W Zeppelin.

Коротко: Музыкант так заморачивается с высокими частотами в треке Coincidance (Trentemøller Remix), что в MP3 их просто нет, на 16-bit надо вслушиваться, на 24 слышно на обычной громкости. НО, это единственный трек с 1800 lossless альбомов, Карл!
Зарегистрируйтесь на Хабре , чтобы оставить комментарий

Публикации

Истории