NightRadio 20 апр 2014 в 11:26

Печать и воспроизведение звука на бумаге

3 мин

102K

Звук

+201

124

Комментарии 124

Albert_73 20 апр 2014 в 11:41

Удивительно.

+13

tratotui 20 апр 2014 в 11:50

А если еще поместить бумагу в рулон и придать общий корпус, то получится неплохая кассета)

+19

NightRadio 20 апр 2014 в 11:53

Вполне. Это, кстати, тоже один из вариантов использования PhonoPaper — когда движется не телефон с камерой, а бумага. Это может быть бумажная лента или круглая пластинка, на которой звуковой код расположен радиально

Mulin 20 апр 2014 в 17:22

Не поймите меня не правильно, но это один из вариантов баловства. Я хочу сказать, что это представляет отличный академический интерес, но практическкий смысл в чтении при помощи телефона звука записанного на бумаге в виде волн, можно сказать отсутствует. Автор приводит примеры практического использования, но в том то и дело, что эти примеры либо баловство, либо притянуты за уши. Во всяком случае я пока не вижу истинно важных отраслей, где бы это имело смысл
PS Ничуть не умаляя заслуг автора, и креативности исполнения оригинальной идеи ;)

+12

SirD 20 апр 2014 в 19:06

А теперь представьте, что вы работаете в разведке, вскрыли тайник агента вражеской разведки, а там — конверт с одним единственным листом бумаги.

Если в алгоритм кодирования добавить пару ключей, да еще настроить систему так, чтобы считывающее устройство могло считать послание только в определенное время, да в определенный день (эту инфу должен знать только тот, кому письмо предназначается)…

Mulin 20 апр 2014 в 19:12

Не знаю как вам ответить, ибо пока не понял вы серьезно или шутите :)

dtestyk 20 апр 2014 в 21:29

тогда вам возможно поможет это

brutalko 7 мая 2014 в 13:45

Девушке так в люви можно признаться на рулоне бумаги — любая оценит, 100%! :)

Lockal 20 апр 2014 в 12:41

Это же вариофон!

+16

NightRadio 20 апр 2014 в 12:44

ну скорее некий его гибрид с АНСом :)

mad_DOG 21 апр 2014 в 09:19

мне заголовок тоже напомнил пост о рисованном звуке

SVolkov 20 апр 2014 в 16:40

И разматывать рулоны станет куда увлекательнее :)

Z0nd0R 20 апр 2014 в 18:38

Хм, туалетная бумага с музыкальным сопровождением. Разматываешь рулон, а тебе голосом воспроизводятся анекдоты. Или на каждом куске какая-нибудь полезная/бесполезная информация.

klirichek 20 апр 2014 в 22:07

Можно в дамских магазинах так продавать записи Стаса Михайлова. В рулонах по 52 метра!

+10

Saladin 7 мая 2014 в 13:49

Кстати, меня долго интересовал вопрос, почему в рулоне туалетной бумаги 52 метра? Не 50 и не 55, а именно 52. Возможно кто-нибудь знает ответ?

5ap 7 мая 2014 в 13:55

был такой опрос
habrahabr.ru/post/37675/

Torvald3d 20 апр 2014 в 11:55

Здорово! Не думали добавить что-то вроде насечек в маркеры, чтобы потом восстанавливать скорость воспроизведения? Или qr код рядом, чтобы считывать не только скорость, но и, к примеру, название звука?

NightRadio 20 апр 2014 в 11:57

Думал, но пока от этой идеи отказался, дабы не усложнять формат. Длина кода по умолчанию — 10 секунд. Если сфоткать его и воспроизвести через авто-режим, то он будет играть ровно 10 секунд. Хотя при желании скорость можно увеличить или уменьшить, перемещая соответствующий слайдер.
Что касается названия звука — то его ведь можно просто написать обычным текстом рядом :)

urfo 20 апр 2014 в 11:58

Отлично! Только я бы добавил отметки для ориентации по времени, чтобы стабилизировать скорость воспроизведения.

NightRadio 20 апр 2014 в 12:00

Выше уже ответил по этому поводу :)

НЛО прилетело и опубликовало эту надпись здесь

ksenobayt 20 апр 2014 в 12:21

Вы имели в виду, разумеется, фонограф, а не виниловый проигрыватель.

SoulAge 20 апр 2014 в 12:22

Очень круто. Чем-то похоже на QR-коды, но лично мне они неинтересны, а такой штучкой я бы пользовался. Реквестирую, автор с такой технологией станет миллионером.

Кстати, голос распознается крайне хорошо, в отличия от музыки, удивительно. Запишите что-нибудь в 8bit музыке, если есть возможность ;)

-6

NightRadio 20 апр 2014 в 12:28

Такой код конечно теряет много полезной звуковой информации, поэтому лучше всего кодируются звуки с ярко выраженными гармониками и без резких переходов. Например: голос, хор, скрипка. 8bit еще не пробовал — займусь на досуге :)

SoulAge 20 апр 2014 в 12:32

Ммм, буду (или будем) ждать!;)

SoulAge 20 апр 2014 в 17:58

Спасибо за минусы ;D
Это связано с моим мнением, почему такой формат приживется чуть лучше, чем QR-коды? =)

barkalov 20 апр 2014 в 18:35

1. Сравнение QR-кода (у которого тысяча применений) с сабжем и утверждение что QR-код не интересен, а сабж ок.
2. Апелляция к своему личному мнению без аргументов.
3. Неуместное использование слова «реквестую».
4. Утверждение, что технология принесет автору миллионы.
5. Орфография.
6. Смайлы.

+15

SoulAge 20 апр 2014 в 18:45

1. «лично мне они неинтересны, а такой штучкой я бы пользовался».
Первое слово «лично». Мне QR-коды в принципе не нравятся, но сабжевый формат записи шифрованных данных *на бумаге* импонирует.
2. 0_о Чтобы выражать свое мнение, нужно иметь какие-то аргументы? Вам апельсины или бананы нравятся? ОТВЕТ АРГУМЕНТИРУЙТЕ. (где-то тут сарказм есть)
3. Перед написанием комментария тщетно пытался найти точное значение этого слова, чтобы убедиться в правоте ваших слов, но у меня не получилось. Подскажите, пожалуйста, почему я его использовал неверно?
4. Позволю себе порассуждать: если у человека есть крутая технология, не факт, что он станет миллионером. Но с плохой технологией он точно оным не станет. Я считаю, что подобная технология достаточно амбициозна, чтобы сделать автора миллионером. Но не факт, что он к этому стремится или у него вообще это получится.
5. Я обнаружил только одну орфографическую ошибку, в окончании слова «отличие». Знал бы что за такую ошибку меня поимеют на минусах, я бы не торопился с написанием комментария, а прогнал бы его через все известные мне системы проверки правописания.
6. Позволю вас поправить — не «смайлы», а «смайл», так как он у меня был один. Это уже перебор?

-2

zodiac 20 апр 2014 в 19:33

3) «Реквестирую» от слова «реквест», которое является английским «request». Не нужно использовать слова, значение которых Вы не знаете.

SoulAge 20 апр 2014 в 19:38

Точно. Я почему-то был твердо уверен, что оно еще используется в смысле «предсказываю».
Например, «реквестирую появление Ктулху». Каюсь, не углубился в этимологию слова, бейте меня ;D

DexizeR 21 апр 2014 в 10:33

Появление Ктулху вангуют ,)

barkalov 20 апр 2014 в 19:38

1, 2. Раз вы выражаете необоснованное личное мнение, будьте готовы к таким-же необоснованным минусам, показывающим что с вашим мнением не согласны. Были бы аргументы — было бы что обсуждать. А вы просто пишете: «лично мне кажется что бананы круглее апельсинов». Если с вами согласны — получите плюсы, нет — минусы. Тут нет пространства для диалога, вы сами так позиционируете свой комментарий.
3. Реквестую = прошу, требую. Реквестовать можно доказательства, исходники. А вы предполагаете.
4. Вот так и надо было написать. И вам бы, вероятно без минусов, ответили, что да, здорово, но не совершенно непонятно как это монетизировать. Ведь это главная и принципиальная проблема, раз уж вы утверждаете о миллионах.
5. Это хабр, тут бывает.
6. Это хабр, тут бывает. ;)

SoulAge 20 апр 2014 в 19:44

1, 2.
Я вас предельно понял, но прежде чем однополярно минусовать, можно бы и спросить, почему у человека именно такое мнение сложилось, а не просто жать красную стрелочку.

Лично я минусы ставлю если человек грубо ошибается или нагло лжет в комментарии, несет политическую пургу или делает еще какие-то вопиющие вещи. Но если я с ним не согласен, садануть ему минус? И все же, на все воля хабра.

3.4
И вообще, я запрашивал автору миллионы за подобное :D (шутка)

monah_tuk 21 апр 2014 в 11:15

В пункте 3 нужно было написать «вангую», правда минусы всё равно отхватил бы, но за другое.

fanex 21 апр 2014 в 01:42

Ввалили вам по совокупности причин, любой пары из которых достаточно, причем всего пару минусиков. Для чего кому-то что-то аргументировать, если минусик — это обычное «мне не нравится комментарий, но объяснять лень».
А обсуждения этих двух минусиков на десяток килобайт.

Triang3l 20 апр 2014 в 12:32

"...in witness whereof, hear my voice, Alexander Zolotov."

Meklon 20 апр 2014 в 12:45

Восхитительно. Идея выглядит очень свежей и необычной. Удачи в монетизации)

NightRadio 20 апр 2014 в 12:49

Спасибо!

ValdikSS 20 апр 2014 в 16:27

Эх.
ollydbg.de/Paperbak/ может записать минуту-полторы на обычный лист формата A4.

NightRadio 20 апр 2014 в 18:49

Ага. Но в цифровом виде. А последующее воспроизведение — желательно при помощи сканера с высоким DPI

merlin-vrn 21 апр 2014 в 08:37

Свежей? Сто лет в обед. Подобным способом звук на киноплёнку записывается.

NightRadio 21 апр 2014 в 08:42

habrahabr.ru/post/220061/#comment_7512177

merlin-vrn 21 апр 2014 в 08:59

Я видел, видел. Это не «принципиально новая» идея, а вариация давно известной. Мне очень странно и обидно, что в тексте статьи про это у вас ни слова, только про АНС.

Кстати, сам этот синтезатор в свою очередь основан на кинематографическом методе.

NightRadio 21 апр 2014 в 09:34

Согласен с вами. Исправлюсь

evocatus 20 апр 2014 в 12:53

Только верх и низ надо по-разному обозначать (я про полоски)Ю а сейчас, когда они симметричные, можно перепутать и начать играть наоборот.

NightRadio 20 апр 2014 в 12:59

Дык это же прекрасно! :) Формат стимулирует творчество. Всегда интересно, что будет, если проиграть задом наперед или вверх тормашками

DjPhoeniX 20 апр 2014 в 16:45

А можно пример какой-нибудь известной мелодии «вверх ногами»?
И ждём версию для iOS!

isden 20 апр 2014 в 18:21

Классика.

DjPhoeniX 20 апр 2014 в 19:42

Это просто «задом наперёд». В ситуации с этим приложением будут перевёрнуты и частоты, и направление.
А ещё можно просканировать перевёрнутую запись в обратном направлении…

NightRadio 24 апр 2014 в 11:29

iOS версию дождались! :)

DjPhoeniX 24 апр 2014 в 23:58

При запуске телефон повис наглухо… iPhone 4 8Gb, iOS 7.1

NightRadio 25 апр 2014 в 08:36

Непруха :) На 4s работает отлично, а на 4 никак… Будем разбираться

5ap 25 апр 2014 в 10:17

мне кажется проблема в скорости. Греется 4s хорошо, как и садит батарею. А вот ипод 3й по типу зависает н если подождать то он просто очень тупит, по кадрам показывает и тп

NightRadio 25 апр 2014 в 10:46

Очень похоже на то. 4s спасает два ядра. Я поправил бару багов и включил принудительный переход в режим 640x480 для камеры на iPhone4. Залил на проверку. Надеюсь, это поможет.
И, кстати, немножко помогает уменьшение параметра Quality в меню программы.

monah_tuk 21 апр 2014 в 11:21

Хоть убейте, но не вспомню откуда, вроде в книжках про Муми-троллей, были ребусы: как бы закрашенная картинка, а если посмотреть на плоскость листа под достаточно острым углом, то можно было увидеть текст. Причём, текст разный если картинку повернуть на 90 градусов. Было бы забавно увидеть код, в котором будет реализовано нечто подобное (в смысле ориентации).

Meklon 21 апр 2014 в 11:56

Это довольно легко делается. Вы пишете текст, удлинив шрифты и все. Потом накладываете их под углом 90 градусов.
Например:

monah_tuk 21 апр 2014 в 12:31

Как это делается, я понимаю, сам ручкой на бумаге рисовал. Я про автоматически считываемый код в двух плоскостях.

Meklon 21 апр 2014 в 12:36

А смысл? Уплотнение записи? Проще на цифровое кодирование перейти тогда.

monah_tuk 21 апр 2014 в 14:07

Возможно это будет баловством, но когда я первый комментарий писал, в голове был QR код (уже цифровой), который в разных ориентациях считывается по разному. Just for fun.

perevedko 20 апр 2014 в 12:53

Автор, вы — гений!

Gnuava 20 апр 2014 в 12:54

Все уже изобретено до нас. Гуглите тему «аппарат Скворцова „Говорящая бумага“ и „тонфильм“, если смотреть на кинопленку.

NightRadio 20 апр 2014 в 13:01

«Говорящая бумага» не работала со спектром звука. Там использовалась ширина линии (как на кинопленке). В итоге — нужна очень длинная лента. 10 секунд на визитку в таком формате не упихать

+10

Meklon 20 апр 2014 в 13:22

Вдруг вспомнил Uplink. «My voice is my passport. Verify me»

1eqinfinity 20 апр 2014 в 13:30

Забавно, только сегодня вышел на ваш youtube через блог musicofsound.co.nz :)
Отличная штука.

arkady 20 апр 2014 в 13:33

Все ждал когда при воспроизведении вы перевернете листок вверх ногами (отразите зеркально по вертикали). Еще не хватает для музыкальных записей каких-то маркеров повторений: чтоб сканер запоминал повторяющиеся блоки и воспроизводил их в указанных местах.

Logonoff 20 апр 2014 в 14:01

Не пробовали рисовать почеркушки в рабочем поле и проигрывать то что получается?

NightRadio 20 апр 2014 в 18:52

Пробовал :) Получается интересно. Ролик не успел еще такой снять, но надо будет обязательно

barkalov 20 апр 2014 в 19:43

www.youtube.com/watch?v=S7P_G6e7YTo

Cupper 20 апр 2014 в 15:18

Отличная техника для маньяков. На жертве вырезать звук ее крика, можно прям фильм снимать про маньяка с музыкальным слухом.

+13

Conung_ViC 20 апр 2014 в 16:34

ну у вас и фантазия! в жизни бы до такого не додумался.
А кино — да, получилось бы довольно жесткое =)

dtestyk 20 апр 2014 в 21:44

не совсем то, но...

ksenobayt 20 апр 2014 в 15:23

На 4.42 не просто проблемы — приложение крашится, не выдав вообще никакого выхлопа, кроме черного экрана.
На всякий случай отправил крашрепорт.

NightRadio 20 апр 2014 в 18:54

Да, спасибо. Под проблемами я как раз это подразумевал — либо черный экран, либо падение.
Уверен, в ближайшее время появится решение.

ksenobayt 20 апр 2014 в 19:03

Aw. Ну тогда написали бы, что под 4.42 не работает atm, чего уж тут углы скруглять.

NightRadio 20 апр 2014 в 19:23

У некоторых пользователей работает

Dark_Purple 20 апр 2014 в 16:11

Токката хороша. Предложения от Гугла с Мелкософтом уже приходили?

NightRadio 20 апр 2014 в 18:54

:) Не приходили

k0ldbl00d 20 апр 2014 в 16:11

Не думал что звучание голоса сохраняется так качественно. Эдисон бы позавидовал )

НЛО прилетело и опубликовало эту надпись здесь

Triang3l 20 апр 2014 в 17:11

С таким качеством это антиреклама :)

НЛО прилетело и опубликовало эту надпись здесь

kenoma 20 апр 2014 в 20:37

Есть подходящие жанры вроде Death или Black метала.

fanex 21 апр 2014 в 01:43

Для стандартного попсового «умц-умц»? Вы драматизируете :)

Siper 20 апр 2014 в 17:50

ИМХО, стоит добавить защиту от перекоса, из-за которой ВЧ играют вперед НЧ (либо наоборот, в зависимости от наклона). Например в виде дополнительных полосок с кодом Грея.
А вот от шептающе-жужжащего оттенка избавиться будет не просто — для этого нужно как-то фазы кодировать, а места они потребуют столько же сколько амплитуды.

P.S. Все же с практической точки зрения эффективнее юзать QR-код, скажем версии 40 + какойнить low-bitrate кодек (типа iLBC, если для голоса). :)

NightRadio 20 апр 2014 в 18:57

Спасибо, пожелания учту!
На счет QR-кода — соглашусь, но лишь отчасти :) Мне конечно в первую очередь нравится процесс живого взаимодействия с таким кодом — для всяких творческих экспериментов самое то

6opoDuJIo 20 апр 2014 в 18:25

Идеальная вещица для шифрующих свой голос шантажистов.

merlin-vrn 21 апр 2014 в 08:40

Очень сомнительно, что голос действительно скрывается. Искажается — да.

SirD 20 апр 2014 в 19:11

Вкупе с шифрованием — отличный физический способ передачи секретной информации.

engine9 21 апр 2014 в 15:36

Ничего в нём отличного, когда уже давным давно придумали paperback с избыточностью, шифрованием и т.п.

Maccimo 20 апр 2014 в 19:12

IMHO, подобные орнаменты гармонично смотрелись бы в приключенческом фильме про исчезнувшую цивилизацию а-ля приключения Индианы Джонса.

SpiritOfVox 20 апр 2014 в 19:58

Забавно сделать подобную штуку для midi

barkalov 20 апр 2014 в 20:06

OCR для нотного стана? Гениально!
upd: Оказывается всё уже придумано до нас.

Killy 20 апр 2014 в 20:51

Стянул одну из картинок c маркерами и открыл Paint.NET;
Открыл ocenaudio в режиме Spectral View (палитра Inverted Linear Greyscale) и начал скриншотить фрагменты в Paint.NET.
Тут же возникли претензии к «спецификации»:
— 8 октав от 65.4 Гц — это получается до 15804 Гц?
— частотная шкала линейная или логарифмическая? А амплитудная? (Про первое легко догадаться, но раз назвали спецификацией...)
— «небольшая пустая область» — это сколько?

Пример спецификации

Про перекос уже заметили. В целом получается, что кроме голоса и классической музыки ничего толком и не озвучить.

Хотел что-нибудь в духе «Угадай мелодию» сюда запостить, но пока даже сам угадать не могу то, что получается.
Остаётся только «реверс-инжинирингом» подбирать параметры — записать с микрофона фрагмент и смотреть как обработать спектр того же фрагмента для получения такой-же картинки. Но на сегодня я уже наигрался.

P.S. ocenaudio в качестве логарифмической использует Mel scale. [60 Гц — 16 кГц] — это примерно [100 mel — 3500 mel].
P.P.S. Somehow related. Оттуда можно будет попробовать картинки вставлять.

NightRadio 20 апр 2014 в 21:10

8 октав: от 65.4 до 16742.4 Гц.
Частотная шкала — логарифмическая.
Амплитудная шкала — линейная. То есть, в идеале пиксель с цветом #808080 даст синусоиду в половину от максимальной амплитуды.
Небольшая пустая область — настолько небольшая, насколько может заметить ее камера. Точный размер не определяю. Тут важно отметить, что сонограмма в этой области как бы уже начинается. То есть, на практике мы теряем немного верхов и низов из спектра.
За замечания спасибо. Буду править.

Indexator 25 июл 2014 в 03:46

Indexator 25 июл 2014 в 03:51

Простите, Хабр слетел с катушек.
Я хотел написать: А не подскажите под какой лицензией распространяется ocenaudio?

Indexator 25 июл 2014 в 04:07

Да, и за одно SPEAR, если в курсе…

TiGR 20 апр 2014 в 21:53

А не думали, что если рисовать, например, двойную линию посередине, то это поможет решить проблему уплывающего фокуса?

NightRadio 20 апр 2014 в 22:57

Не очень понял, что вы имеете в виду под уплывающим фокусом.
В любом случае не хотелось бы конечно чем-то дополнительно спектр разбивать

TiGR 20 апр 2014 в 23:03

Я имею в виду то, что камера часто теряла фокусировку.

NightRadio 20 апр 2014 в 23:05

А, понял, спасибо. Да, вы правы, это проблема. Но я надеюсь, что ее удастся решить как-то иначе. Например, смещением точки автофокуса на маркер.

Killy 20 апр 2014 в 23:12

Кстати да, с фокусом беда.

Можно сделать верх от «двойной сплошной» амплитуду, и вниз — фазу (см. коммент),
или, что то же самое, положительную и отрицательную часть спектра FFT.
Отняли половину разрешения по частоте для амплитудного сигнала, но выигрыш, возможно, превысит потери. С перекосом, правда ещё проблема остаётся, из-за которой может не взлететь.
Или стерео — левый и правый каналы.

А можно ли камеру андроида программно перевести в режим фиксированного фокуса? Возможно, это будет более интуитивно, чем подстраиваться под автоматику.

NightRadio 20 апр 2014 в 23:19

На счет фазы надо конечно проверить. Но мне почему-то кажется, что ничего не получится, потому что в этом случае обретает большую важность совпадение фазы и амплитуды для конкретной синусоиды, что мы обеспечить не можем в силу чрезмерного искажения картинки.
С камерой такая ситуация. На некоторых устройствах, вроде моего LG Optimus Hub, вообще нет возможности включения постоянного автофокуса. Он срабатывает только тогда, когда, я нажимаю на экран. На других устройствах постоянный автофокус имеется, но теоретически его можно отключать. Наверное, это хорошая мысль, я поработаю над этим.

spc 20 апр 2014 в 23:49

Обычно даже в автоматах есть режимы фокусировки на бесконечность. Сейчас проверил на своем телефоне с Android 4.0.3. Если выбрать режим Landscape (Пейзаж, или как он там в русских прошивках), то рамка фокусировки пропадает и субъективно аппарат не пытается фокусироваться.

Возможно, этот режим можно как-то вызывать программно.

spc 20 апр 2014 в 23:44

Возможно, еще будет интересно для детей. Понятно, что у всех уже давно планшеты (родитель вместо погремушки дал — и спокоен на весь вечер), но так можно еще и книжки к процессу привлечь. Посмотрел ребенок на картинку в книжке, навел планшетик на спектрограмму — послушал очередной фрагмент сказки.

Тоже, по сути, спорно, но это что-то из разряда «чтобы не забывали теплые ламповые книжки».

ps. главное, чтобы злые дяди в книжке не вписали во все спектрограмы дружок, хочешь расскажу тебе сказку?

NormIridium 21 апр 2014 в 00:02

Автор вы гений! Вы не представляете, что вы можете сделать для слепых людей! Метка начала в шрифте Брайля и вот человек слышит такую нужную ему информацию.

NightRadio 21 апр 2014 в 06:59

Кстати, если переключить PhonoPaper в Free Mode (в меню программы), то он начнет озвучивать все, что попадает в кадр, не обращая внимания на маркеры. Теоретически, это могло бы помочь слепым ориентироваться в пространстве.

NormIridium 21 апр 2014 в 10:16

Попросил жену поделиться новостью в министерстве образования. Посмотрим что ответят на инициативу. Но программа адаптации инвалидов большой нацпроект который недавно поднимался.

selenite 21 апр 2014 в 03:35

Автор — очередной горе-изобретатель, комментаторы — «нубасы» )))

ru.wikipedia.org/wiki/%D0%9A%D0%B8%D0%BD%D0%BE%D0%BF%D0%BB%D1%91%D0%BD%D0%BA%D0%B0#35-.D0.BC.D0.B8.D0.BB.D0.BB.D0.B8.D0.BC.D0.B5.D1.82.D1.80.D0.BE.D0.B2.D0.B0.D1.8F_.D0.BA.D0.B8.D0.BD.D0.BE.D0.BF.D0.BB.D1.91.D0.BD.D0.BA.D0.B0

Аналогичная технология использовалась в production'е enterprise-ного уровня (ээ… в кинотеатрах) — почти что в начале века.

-3

barkalov 21 апр 2014 в 04:05

Зачем читать каменты нубасов, да?

Calvrack 21 апр 2014 в 10:37

Вы состоянии различить spacial domain и frequency domain?

wtigga 21 апр 2014 в 10:52

Читал-читал ссылку, и не нашёл там про софт любому желающему, который мог бы на карманном устройстве кодировать и декодировать звук в оптическую дорожку. Так что автор всё-равно молодец.

monah_tuk 21 апр 2014 в 11:35

По внешнему виду: обычный спектр. Я такие картинки впервые увидел, когда для Дальприбора немного работал: сигнал от гидроакустического буя после FFT и вывода на экран (я тогда понятия не имел что это всё такое, просто по «спекам» ваял код и структуру).

Т.е. прочитал файл при помощи любой библиотеки, применил FFT, сохранил в битмап. Мне кажется, что автор для этих целей сделал всё же утилиту, но причёсывать для массового использования не захотел. Оно и понятно — обратное преобразование куда более интересный процесс.

NightRadio 22 апр 2014 в 15:55

Не совсем так. PhonoPaper использует FFT для очень быстрого преобразования, чтобы не напрягать пользователей. Но если хочется лучшего качества, то программа Virtual ANS может вместо FFT использовать метод банка фильтров, что в некоторых случаях дает гораздо более качественную картинку. Если речь, например, о рекламной кампании с использованием PhonoPaper-кодов, то конечно разумнее всего коды генерировать при помощи Virtual ANS, играя с обработкой и перебирая разные варианты.

victor1234 21 апр 2014 в 04:15

Нужно заборы вдоль дорог расписать: едешь и читаешь послание или экскурсионный текст. Причем со строго разрешенной скоростью)

5ap 21 апр 2014 в 11:38

я представляю новый вид хулиганства

engine9 21 апр 2014 в 16:26

Есть «поющие дороги» www.youtube.com/watch?v=0OmmtlORtfQ

unnanego 21 апр 2014 в 12:29

А если татуировка на внутренней части предплечья?

vladimirovich 23 мая 2014 в 13:39

Привет,

написал на форуме, продублирую тут. Конечно, желающих что-то предложить море, желающих что-то сделать нет, но мне кажется, что предложение логичные.

я бы сделал стандарт 2.0 phonopaper, в который внёс:

— Логарифмическую шкалу для громкости
— Пре АЧХ фильтр и пост АЧХ фильтр. У большинства сигналов есть явное преоблажание в области низких частот, поэтому имеет смысл увеличивать яркость высоких частот при печати.
— Маркеры времени, например, прерывистыми граничными линиями.
— Кодирование цветом громкости

6opoDuJIo 24 июл 2014 в 23:40

Какая крутейшая опечатка: преоблажание.
Возьму на вооружение, спасибо!

Indexator 24 июл 2014 в 21:26

Как-то пропустил топик и релиз.
Это гениально! Крутотень! :)
Сам люблю такие штуки и все что связано со звуком и музыкой…
Я все программки автора в маркете скупил, благо очень демократичные цены и софт того стоит) Радует, что имеется и бесплатный софт, насчет открытого не в курсе. Нравится стиль, теплота и любовь автора к своим проектам.
Рад, что не забрасываете развитие и периодически выходят вкусные обновления. Продолжайте в том же духе и успехов! ;)

zhogar 12 сен 2020 в 17:56

Здравствуйте.
Скажите пожалуйста: а как создавать такие коды?
Есть ли приложение?
Спасибо.

impfromliga 5 ноя 2020 в 08:06

Пишут нет применения. Что аж как вызов звучит. Утро надо размять мозг перед работой. Попробую обозреть системно векторно:
Аналогично QR смысл сохранять информацию оффлайн. Причем оффлайн строго. Не url'ами а саму информацию, отличающийся тем, что тут 10с звука против ~10К текста.

— До решения задачи о популяризации декодера данный код может быть прочитан только ожидающем его появление пользователем. Остальных исключаем.
+ Однако малая популярность данного вида кодов может быть и плюсом на узком таргете.
— Смысловой информации в 10К текста бесспорно можно уложить гораздо больше, следовательно нужно исключить области где колличество информации важнее ее формы.
+ Плюсом однако является то, что в данный код против QR звук вобще можно сохранить.
— Звуковые образцы низкого качества, потому кейсы где качество образца важно надо исключить.
+ Аналоговый сигнал более стоек к ошибкам, он читается даже когда качество сниженно.

Из не приколюшных вариантов остаются следующие, которые я не смог строго исключить:
1. В общем случае системы оповещения о персонифицированном приближении кода внутри доверенной группы
«Майкл подходит к вам сзади»

2. Городские звуковые метки для слепых:
Да их можно реализовать на QR + TextToSpeech потому плюс за аудио не строгий.
Но доминантный признак за стойкость к ошибкам и аппаратной легкости парсинга остается.
Кастомный префикс в QR мог бы обеспечить узкий таргет, но с этим более вероятны ошибки или абьюз.

3. Персонификация метки как основная характеристика:
Сравните ситуайию когда TTS зачитывает в ухо машинным голосом «Привет, это Майкл», против аналогового «Привет» считанного с персонифицированного образца лично записанного приветствия. Вы знаете что слепые очень одиноки в социуме еще и потому, что они не видят друг-друга в толпе…
Как думаете сколько это может стоить?

Вариант реализации:
Кепки с камерой на кикстартер (+raspberryPi +наушники) которые могут воспроизводить звуковой идентификатор друг-друга только увидев, как вместо лица.

Говоря о конкретном продукте уже не нужно полагать его выполняющим только главную функцию, можно уже поразмыслить над улучшением сопутствующего функционала:
Так подобные устройства смогут воспроизводить те самые метки в городе из п.2. А сканер кодов можно сместить в невидимый глазу диапазон, если выяситься что слепым есть дело до того как они выглядят со «штрихкодами на голове»

alex_dow 12 окт 2023 в 14:52

было бы круто сделать что-то вроде секвенсора, например картинка с камеры разбивается на 8х8 квадратов или 16х8 квадратов, и от яркости/затенённости областей образуется ударная секвенция, ну и запоминать удачные

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Печать и воспроизведение звука на бумаге

Комментарии 124

Публикации

Истории