alizar Dec 20 2006 at 17:35

Криптосканер Attributor найдет в Сети цифровой контрафакт

2 min

909

Comments 34

entze Dec 20 2006 at 17:54

Интересно как они решат проблему видоизменения нельгального контента. С чего делать хэш для MP3 композиции? А если она с другим или переменным битрейтом?
Изображения то вроде проще "сворачивать", а что сделать с роликами, особенно несколько раз пережатыми и засунутыми к примеру во флеш.
Кроме того - чтобы удостовериться в нелегальности контента его надо как минимум скачать к себе желательно целиком. Слабо себе представляю "паука" ползающего по YouTube или сидящего в торрентах.

Coogle Dec 20 2006 at 18:04

Типа юный следопыт по поиску пиратов 21-го века :-)

У них там может быть как-то и проканает, а у нас полный голяк.

entze Dec 20 2006 at 18:32

А у нас какой-то совсем другой интернет? Заметьте - речь не идет о "прижать пирата", речь пока о том чтобы найти что-то и доказать что это контрафакт.

Coogle Dec 20 2006 at 18:37

А Вы, что разве не в России живёте ???

Наивная душа...

-1

entze Dec 20 2006 at 19:13

Речь идет о математических методах исследования данных на предмет поиска совпадений с имеющимися данными в сети интернет. Или у нас и математика тоже другая?
Что они будут потом делать с найденным и доказанным контрафактом - другая история. Но сейчас всеже пока математика и программирование.

UFO just landed and posted this here

Miker Dec 20 2006 at 22:56

В каждой шутке есть доля шутки. Подобные "алгоритмы", в общем, реализованы некоторыми конторами. Но если всерьез лопатить Сеть, и держать соответствующий штат, то сильно растут сопутствующие расходы.

А если держать их "на удаленке", то сложнее контролировать работу и управлять данной системой.

UFO just landed and posted this here

Miker Dec 20 2006 at 18:33

Ну а как отслеживать файл, который не то, чтобы переназван, а "стырен" с чужого ресурса? Его владелец всегда может сделать круглые глаза и сказать: а на ем не написано, что краденое! Я его вообще по почте получил! Это правовой аспект. То есть, доказать вину третьего лица будет невозможно.

Отсюда схема: краденый файл "пилится" на несколько томов в разных местах, а оригинал удаляется сразу же. Тома раскидываются случайно по некоторым серверам, принадлежность которых к базовому пирату недокказуема. При закачке менеджеру закачек передаются несколько линков. Потом файл собирается на машине пользователя.

То есть, осложнить жизнь пиратам - да, есть немного. А ликвидировать пиратство - не выйдет.

entze Dec 20 2006 at 19:08

Это вы p2p придумали фактически :) А с ними вполне успешно борятся. Даже если сайт содержит только хэши контрафакта (см. наезды на p2p сети).
Да и незнание не освобождает от ответственности.

Всеже задача интересная. Скорее всего они постараются ее решить в неком виде, а не просто освоить 10 млн.

Miker Dec 20 2006 at 21:55

С ними борются потому, что есть точки глобального входа, где надо регистрироваться. А если, например, подобные сети организовать на базе почтовых ящиков (только объем нужен огого!) - то вообще неопределяемо. Ибо то, что лежит у меня в почте и кому я это высылаю - мое личное дело. Частная собственность и privacy, ептыть.

Насчет "незнания" и "неосвобождения" - практически во всех правовых системах существует норма, гласящая: "Имущество, полученное добросовестным приобретателем (ДП), не может быть отчуждено". ДП - это лицо, которое не знало и не могло знать о том, что передаваемое ему имущество было получено тем, кто его передает, незаконно.

Так что опаньки.

entze Dec 21 2006 at 01:02

уже работает. фильмы, ПО раскидываются по почтовым аккам и инфа для спец. собирателя-даунлоадера передается по цепочке. До первого стеревшего.

UFO just landed and posted this here

Miker Dec 20 2006 at 21:59

А вот это интересная мысль, кстати.

Miker Dec 20 2006 at 21:58

Да выкладывается она не в виде мпега Рамштайна. Она выкладывается в виде десятка кусков, к которым ведут ссылки из разных мест. А у меня в блоге появляется запись: во, я тут интересную запись послушал!
Народ сразу - ага, выложено новое. И полез качать. Откуда они знают, что я ее покрал? А если я ее не покрал, то бесплатно я могу ее раздавать направо и налево, и в этом отношении концепция DRM меня ужасно раздражает.

UFO just landed and posted this here

Miker Dec 20 2006 at 22:45

Хм. Насчет блогов и авторских текстов - это, собственно, да. С ними бороться правильно. Не совсем "по лицензии", но хотя бы копирайт ставить.

А сайты, где сотнями лежат мп3... Ну да, таких позакроют. А что с локалками делать, где это добро валяется тысячами?

UFO just landed and posted this here

Miker Dec 20 2006 at 22:52

То есть в кампусах Оксфорда нет локалок, закрытых со стороны web?
А если есть - то там это добро не валяется?
Что-то я как-то думаю немного иначе.

И профессура, я так думаю, фильмы из локалки качает, не особо заботясь авторскими правами...

UFO just landed and posted this here

Miker Dec 20 2006 at 23:08

Согласен. Именно против них и идет борьба: откусить у этих деятелей кусочек денежного потока...

А потому предлагаю всяких мелких Васей, делящихся между собой купленным "на одного" контентом, просто не рассматривать.

Интересно было бы подумать, как подобный крупняк может отреагировать...

UFO just landed and posted this here

Miker Dec 21 2006 at 00:00

Не , я в контент-провайдере работаю. Имею, разумеется, отношение к медийному контенту - но ни BMG, ни Sony Records не являемси... хотя и работаем с ними :) как с правообладателями.

Но интерес мой сугубо частный.
Кстати, насчет поработать "у вас" - пишите в личку. У нас есть несколько интересных вакансий.

altmind Dec 20 2006 at 20:26

не понял. хеширование при чем тут? и если оно тут участвует - почему архивирование не поможет?(они будут с собой таскать все возможные архиваторы?)

ох эти стартапы и венчурные инвестиции...

altmind Dec 20 2006 at 20:27

и главное - зачем для простого паука считающего хеши потребовалось 10млн$?

UFO just landed and posted this here

korzhkov Dec 21 2006 at 13:16

да совсем иначе работает система, просто афтар на хабре не парился с разбирательствами. Вот тут http://webreprints.djreprints.com/161170… есть немного больше подробностей...

alizar Dec 21 2006 at 13:26

Именно там и написано про хеширование: "Attributor analyzes the content, using a technique known as "digital fingerprinting", which determines unique and identifying characteristics of content."

как работает система - никому не известно, и "афтар" тут ни при чем. :)

korzhkov Dec 21 2006 at 13:43

Ну и где тут про хэширование? Вообщето digital fingerprinting не равно hash. Если не сильны в терминах и в иностранных языках, то не надо умничать. Там написано, что система сравнивает ключевые части контента и по ним определяет похожие. Для картинок это может быть например гистограмма, для mp3, как сказали выше, повторяющиеся перепады частот. Для текстов уникальные словосочетания итд...

alizar Dec 21 2006 at 15:33

Цифровые отпечатки (digital fingerprints) - это и есть хеш-код, то есть результат выполнения хеш-функции. По крайней мере, так принято говорить в тех источниках, которые мне доступны. Вот и Википедия так же думает: по запросу "цифровые отпечатки" перенаправляет на "хеширование".

Возможно, как вы говорите, в данном тексте имеется в виду более широкое понятие "цифровых отпечатков", как то гистограммы, перепады частот и т.д. Но конкретного указания на такую трактовуку термина я не вижу, так что рассматриваю ваши предположения просто как безосновательные домыслы. Сорри, если обидел.

korzhkov Dec 21 2006 at 16:45

Извините alizar, мне некогда сейчас спорить, поэтому буду краток, надеюсь, уловите главную мысль. Если взять фотку захэшить - получаем значение. Далее берем и уменьшаем эту фотку на 5% получаем хэш - он совсем другой, естественно. Ок, делаем хитрее, фотку не уменьшаем, а ставим серую точку 1x1px в уголке - хэш другой. Немножко меняем яркость/контрастность - хэш другой. А гистограмма в каждом случае, хотя и немного изменится, но останется более-менее похожей на исходную. Поэтому даже если фотку правили остается шанс ее определить. А при тупом сравнении полученных в результате хэширования значений вы найдете только те фотки, которые были скопированы без изменений. Такой куцый сервис будет никому не нужен.

Именно это, кстати, нарисовано на украденной с википедии диаграмме - при любом изменении данных hash sum меняется.

Это было про фотки, а с видео еще хуже - каждый сервис типа youtube/metacafe/panjea (а именно они рассматриваются как главные нарушители копирайта) перекодирует залитое видео в flv и ресайзит его. Даже представить не могу где тут хэширование применить, разве, что сервисы обяжут открыть доступ к залитым пользователями оригиналам видео.

alizar Dec 21 2006 at 17:16

украденной с википедии диаграмме
Посмотрите лицензию, прежде чем бросаться идиотскими обвинениями.

По сути. Все, что вы рассказали - это совершенно очевидные вещи. У нас же речь идет о другом. Я вам говорил про цифровые отпечатки, они же хеши, которые и упомянуты в статье.

Ваши фантазии по поводу гистограмм и прочего к статье не имеют никакого отношения. Тот факт, что у вас богатая фантазия и широкая эрудиция, не дают вам право вольной интерпретации терминов. :)

Если же поговорить о ваших фантазиях, то хеши, кстати, вполне могут использоваться для поиска модифицированных файлов. Нужно указать такой файл вручную - а система уже найдет все его копии в интернете. Какие проблемы? Думаете, в Сети много модифицированных версий? Несколько версий, не больше. Никто не ставит пикселы 1х1 в уголке фотографии, которую нашел в интернете.

Я думаю Attributor - это будет обычный поисковик с настройками на поиск одинаковых файлов, вот и все. Неужели вы верите, что туда встроят серезные системы распознавания образов? Нет, конечно. Даже $10 млн для этого мало.

korzhkov Dec 21 2006 at 18:49

$10m большие деньги, но т.к. мы явно на разных волнах, думаю не имеет смысла продолжать эти споры - все равно истина будет у каждого своя...

спасибо

Show the best of all time