Comments 119
интересная статистика, особенно надо отметить 8% фильмов на испанском и 12% игр на японском.
Ну игры-то понятно, в Японии огромный внутренний рынок игр по всякой манге.
Лично я ожидал более высоких показателей по порно. :)
Думаю, статистика была бы иной и более точной, если бы материалы выбирались не случайным образом, а по какой-то системе.
Уверен, что если выбирать по системе «только порно», то результаты бы качественно подтвердили бы мнение российского Президента об интернете;)
Но, думаю, задача стояла не такая ;)
Э-э-э… Вообще-то есть даже такое понятие — хорошо рандомизированная выборка. А если исходные данные для выборки подготавливать «по какой-то системе», то можно добиться любых желаемых результатов.
А ещё есть такая наука статистика, так вот статистические исследования предполагают грамотную выборку, а не случайный набор данных.

«Любые желаемые результаты» — это технология выборов президента, а никак не исследований :)

К слову, о «хорошо рандомизированной выборке» в статье не было ни слова.
Ну не думаю, что результат в 1% кого-то удивит на самом деле, вряд ли кто-то ждал другого :-}

Что удивило:
Фильмы:
1. 7% фильмов на русском это понятно откуда. Не так много стран делают дубляж (с полной подменой голоса). Но 5% польского это много. Или они тоже дублируют прокат?
2. В первый раз вижу формат RMVB. Возможно это какие-то правда что шоу в Америке гонят в таком формате.

Игры и софт:
Снова много поляков. Ну то есть это известный факт, что Восточная Европа, как это расплывчато называется, дает чуть ли не 70% всего европейского p2p-траффика, вот теперь понятно откуда оно.

Ну и сильнее всего, разумеется, удивило порно, в особенности 3% дас ист фантастиша :)
Немецкая порноиндустрия практически умерла.
«6%» знающих что происходит на «рынке» не удивят совершенно :-/
1% хинди поразил сильнее 3% немецкого. Оно вообще есть? Или это «переводы»? 8)
И, да, «большинство порновидео в торрентах представлено в виде полного файла, сэмпла 1-5 минут, и постера в JPG» — удивило. Никогда не видел. Прям культурно как ;) Какие-то трейдерские или контентные раздачи? Вряд ли бы они тогда в DHT шли.

Музыка:
6% руской музыки и второе место в мировом трафике это… неожиданно.
RMVB — формат популярный в Азии, в частности, в Китае.
Хорошим качеством он, как правило, не отличается.
Может они среди 46% кинофильмов не смогли распознать порно? Мало ли, бывалые ребята.
UFO landed and left these words here
Интересное исследование,
которое показывает нам результаты, из-за которых бесятся riaa и подобные.
Но также оно показывает, что видеоинформация сейчас наиболее влиятельна.
конечно, забавной показалась строка об исследовании 145 фильмов с выявлением одного любительского..)
Влиятельна на, что?
На генерирование трафика? Да.
1 символ переданный в формате видео генерирует трафика несопоставимо больше, чем в в формате аудио или текстовом.
Всего 1021 торрент? А учитывая 14% «неизвестных», всего 878 торрентов? Он делал это руками или просто поленился оставить компьютер на ночь? Да, и найти RMVB еще нужно было суметь…

Хотя наверное он посчитал, сколько там нужно по теории вероятности, исходя из примерного количества типов данных.
Да, не слишкм большая. Но, может быть, кто-то попробует повторить в расширенном варианте, методика понятная и несложная.
Имеет смысл делать выборку каждый час в течение суток, в зависимости от времени суток, качаемый контингент и контент разнится чуть менее чем полностью.
Конечно, маленькая, но ведь все отсматривали в ручную, судя по этой фразе:
«В категории «порно» один из 145 фильмов выглядел как любительская видеосъемка»

Тяжелая работа!
Мы нашли, что 53% порнофильмов были на английском, 16% на китайском, 15% на японском, 6% на русском, 3% на немецком, 2% на французском, 2% классифицировать не удалось, остальные языки, такие как итальянский, хинди, испанский не более 1% каждый.

При просмотре порно зрителю так важен язык… :)
UFO landed and left these words here
Если не считать «хоум порн» то оно всегда таким было. Только не «лицензионным» а защищенным авторскими правами. Или вы считаете, что порноактеры снимаются в таких фильмах из любви к искуству? ;)
UFO landed and left these words here
Да кто ж качает, когда есть всем известные прекрасные сайты? :)
И кстати, это стыдно при наличии более свободных форматов (того же 7-Zip, например).
Да это вообще стыдно, какой смысл бить фильм раром на куски, чтоб его потом после скачивания собирать?
Уже триста раз эту тему затрагивали здесь. Таковы правила сцены.
Можно посмотреть на эти правила? Я бы плюнул в того, кто их написал.
А можно тогда ещё раз? А то я как-то совсем не могу найти смысла жать фильм раром и рубить на кусочки.
UFO landed and left these words here
их вынуждают ресурсы типа рапидшары, им это не удобно ни разу
а чем пользоваться для выкладывания файлов в интернет? яндекс-диском? у него нет такого ограничения на размер но зато скорость на уровне народ-ру
UFO landed and left these words here
Не блещите модными словами, когда не понимаете из смысла, пожалуйста.
Какое юзабилити может быть у двух командлайновых утилит архивации?
UFO landed and left these words here
между прочим консоль не ест мозг, а развивает, а такое вот юзабилити да, съедает мозг на корню, так что человек не в состоянии использовать за частую более удобную и продуманную программу/систему после использования прошлой. это я не только про винрар, а про все вобще.
UFO landed and left these words here
если ты чего-то не понимаешь это только твоя проблема, я не говорю что нужно все делать в консоле, я говорю, что есть вещи, которые в консоле сделать в 100 раз быстрее и проще чем в гуе. нужно только включить мозг, не надолго, на пару секунд и потом наслаждаться быстрым и красивым результатом, а не ковырять 100500 файлов мышкой, чтобы сотворить с ними простейшую херню. Люди, которые не любят пользоваться мозгом превращаются в имбецилов. Когда вы это поймете?
UFO landed and left these words here
не надо передергивать, масса профессиональных пользователей photoshop используют в ежедневной работе imagemagick. не нужно знать все возможные команды, нужно просто знать возможности. у того же фотошопа миллион возможностей о которых можно узнать только из мануалов и не при чем тут интерфейс. и вобще при чем тут художник, вот веб-дизайнер будет писать скрипты для того же imagemagick и научится работать в командной строке если он не имбицил, потому что это удобно и экономит массу времени при рутинной работе. и женщину свою я научил ресайзить любое кол-во фоток для вконтакта используя Ctrl-V и Enter в командной строке. если ты не знаешь как это твои трудности, командный интерфейс удобен, просто для каждой задачи нужен свой инструмент
UFO landed and left these words here
Что не надо-то? Каким пользователям не надо? Черные экранчики это для динозавров… детский сад. Просто привыкли все к винде, в которой некоторые вещи через жопу сделаны и все теперь только через жопу, потому что подумать и сделать подругому это нужно мозг напрячь, что-то новое попробовать. Терминал это зло потому, что там ничего не понятно, просто верх аргументации.
Не понимаю, в этой ветке -тся и -ться вообще не разу не были использованы. Извините, не удержался :)
варезники будут заморачиваться на свободность формата? мицгол, ты?
Грустно, что раздаётся в основном свежак.

В том числе поэтому лично я больше люблю ed2k и Kad.
Скорее, не раздаётся, а скачивается. Вполне естественно, что свежак людям интереснее.
Раздается. Об этом написано в тексте. В DHT можно определить только активность раздачи, а не популярность ее. С этой точки зрения авторская раздача бит-панк-гараж-группы «Дотком и Пузыри» из одного сидера и двух личеров, и раздача Avatar.FULL.BD-RiP.UnCuT.blah-blah будут представлены одинково, и от того и от другого будут лежать инфохэши.
1021 торрент? У меня суммарно скачано больше.

Что наука статистика говорит про такое маленькое число?
что при «правильно» сделанной маленкой выборке — можно получить любые желаемые результаты. irony
В целом подобные выборки репрезентативны
Беглая выборка при огромном кол-ве — 0,5к — 30к объектов.
Достаточная — 1-5% от общего числа.
>>В категории «порно» один из 145 фильмов выглядел как любительская видеосъемка, и мы отнесли его к ненарушающим авторские права.
Интересно, неужели они просмотрели все?)
Вы невниматльно читаете. Там написано.
Скачивался фрагмент.
Это не погрешность, это действительно так. Легендарная немецкая порноиндустрия практически перестала существовать, все переехало в Венгрию/Чехию/Россию.
Думаю, что эти 3% это всякие «исторические» ;) фильмы.
Ну дык, все идет по спирали. Вон, в 45-м проиграли и теперь что-то тут не так. :)
В категории «порно» один из 145 фильмов

Нормально ребята отсмотрели «материала» для проведения исследования :-)
сделан вывод что 99% торрентов пиратские?

ну прям Христофор Колумб!
Интересно, как они в DHT сеть подключились и как смогли получить .torrent файлы.
> В категории «порно» один из 145 фильмов выглядел как любительская видеосъемка, и мы отнесли его к ненарушающим авторские права.

То есть, все 145 фильмов таки были внимательно просмотрены…
Подводят базу под нападки на сам протокол обмена. Трекера душить задолбаются, так потребуют от провайдеров душить протокол.
согласен. очевидно только для этого и было сделано исследование. ну и конечно же выпендриться самой студентке перед держателями авторских прав. бороться против зла с красивым флагом все горазды…
Удивительно и необычно для Хабра, что никто еще не упомянул «пиар Принстона» и «рекламу битторрента» :-}
Нет. Как сказано в самом начале — это просто факты, ничего больше.
Как категорично…
Сейчас — это факты, а через неделю — доказательная база уголовного (совсем не обязательно, конечно, что уголовного) дела.
могли бы уже и округлить до 1024, а вобще это настолько ничтожная часть всего что качают… что данное исследование нельзя признавать объективным (даже если это и отображает действительность)…
Ну пока нет других результатов, эти — лучшие.

Принимается вариант критики: «Вот я тут провел свое исследование (методика описана тут, результаты опубликованы там), и у меня получилось иначе»
Не принимается вариант: «А мне кажется что все на самом деле совсем не так, потому что я так щитаю»
Странно, что он не смог определить процент новых фильмов в категории порно. Раз указал, что постеры почти у всех есть. На постерах, я думаю, год стоит.
«Из чего состоит мировой торрент-трафик?»
Как раз-таки траффик, думаю, распределен по-другому (еще больше в сторону игр и фильмов, а у книг нет шанса и на 0,1%...). В статье то упор на то, что смотрят на доступные файлы, а не на сгенерированный ими траффик.
Спасибо за замечание, это действительно так.
Но менять уже не буду заголовок, пусть уж так будет :)
Причём на статистику влияет и объём файла. Средний размер фильма на порядок больше среднего размера книги, вот фрагментов фильмов и намного больше.
> Все 98 торрентов с музыкой являлись раздачей нарушающей авторские права.
Там точно не было бесплатной музыки? Последнее время многие исполнители начали сами раздавать свои произведения.
Ну непопулярные же ребята, на ласт.фм у них почти нет слушателей. Когда мы считаем таких, нужно понимать, что их тысячи и десятки тысяч.
Если же смотреть на известных артистов, то у них вполне себе дофига скачиваний. Правда на торентс-ру они не очень-то представлены. Nine Inch Nails -The Slip и Ghosts I–IV, Radiohead — In Rainbows, Tequilajazzz — Журнал Живого (на торентах есть флаковая версия, которая почему-то довольно популярна: torrents.ru/forum/viewtopic.php?t=1947578 ).

Я к тому, что не стоит писать, что 100% пиратки. Написали бы 99%, было бы похоже на правду.
А не надо «похоже на правду», надо «правду». Правда состоит в том, что они скачали N фрагментов, и все N принадлежали копирайтной музыке.
Вот доказательства.
Возможно вы скачаете и вам попадется другая, и тогда вы проведете собственное исследование, и в нем приведете свои данные. А вариант «мне кажется тут должно быть что-то, ты не видишь суслика, а он — есть» — это не исследование, это разговор на лавочке. И именно от этого хотелось бы уйти к реальным данным.
Ну порнофильмы бывают даже и с сюжетом. Приходит, например водопроводчик… или, скажем, телемастер… ;)
>> Мы нашли, что 53% порнофильмов были на английском, 16% на китайском, 15% на японском, 6% на русском, 3% на немецком, 2% на французском, 2% классифицировать не удалось, остальные языки, такие как итальянский, хинди, испанский не более 1% каждый.

Бедные :( Представляете столько порнухи посмотреть! Вероятно их вторые половинки не в восторге от таких исследований :-)
Почему вы априори полагаете, что «вторые половинки не в восторге»? ;)
Потому что их первые половинки выдохлись еще на работе.
От хорошего порно ничуть не выдохнешься, я уж не говорю о том, что правильные половинки и сами ничуть не прочь присоединиться. ;)
UFO landed and left these words here
Не стоит делать далеко идущих выводов из такой маленькой выборки.
(Тут есть изучающие/знающие матстатистику, чтобы оценить погрешность?)
Это примерно как просмотреть 1021 случайную фотографию из минилаба и сделать вывод о всех фотографиях человечества.

Но тема интересная :-)
мне одному кажется что выборка по 1000 торрентам не может являться основой для такого исследования? 1к торрентов это даже не капля, это 0,001 капли ежедневно скаченных торрентов, а то и меньше на пару порядков. 10к я бы еще может и понял, 100к уже адекватно было бы, 1m реальная тема, но 1к это просто ниачем.
меня удивил столь низкий процент по порно. И вот почему. Когда фишишь инет с тарелки — все подряд, то процентов 90 — оказывается порнухой…
В разных местах — по разному. Вот, например, в eDonkey/Kad нынче почти исключительно порнуха, а раньше, году в 2004-2005 я оттуда ведь музыку всякую умную качал, например.
Так что от места — зависит. Видимо в торрентах порно действительн меньше.
Only those users with full accounts are able to leave comments. Log in, please.