Pull to refresh

Comments 118

UFO just landed and posted this here
Кстати да. До этого я писал о роликах, которые неправильно определяются как видео, а вот в обратную сторону — среди ненайденного порно лидирует как раз bdsm.
UFO just landed and posted this here
Ну, зависит от того, насколько чернокожие.
UFO just landed and posted this here
И черно-белое тоже не фильтруется?
Честно говоря, сколько качали с видеохостингов порно, ни разу еще не попалось черно-белое.
UFO just landed and posted this here
Мы как раз эпизоды и ищем. То есть, какие-то cock-party находим (где довольно характерные эпизоды), какие-то пропускаем.
Есть «синее» — когда у камеры включается night vision.

Вы не подумайте чего — я в википедии читал! :)
А я в порно видел :)
Вы смотрите черно-белое, стилизованное под ретро? Вы эстет :)
Есть такой эстет в мире порно — Andrew Blake. У него хватает чёрно-белого.
Это ужас что будет в результатах поиска фкантакте, если такой фильтр там внедрят =))) Будет сплошная латексная bdsm выдача контента =)))))

Будет разрыв мозга :-)
А ещё Аватар ХХХ. Там, если верить старым новостям, все должны быть синие как в оригинале.
Не, там половина фильма — они нормальные, а вот половина фильма — да, синие.
Кстати да. До этого я писал о роликах, которые неправильно определяются как видео, а вот в обратную сторону — среди ненайденного порно лидирует как раз bdsm.
Отличная работа! Только график для HSV не показали :)
Детектор кожи есть и в примерах OpenCV — только там он работает на значениях H и V
Я походил по ссылкам, посмотрел. Все-таки детектить кожу на фото и видео — разные вещи. В видео часто не очень хорошее освещение, неправильная цветовая температура, всякие артефакты от пережатости кодеками.

Графиков для HSV нет, потому что цветовую модель мы выбирали в самом начале работы, уже давно. И графиков с тех пор не осталось.

На ОpenCV мы смотрели в процессе работы постоянно, на ни в одном нашем детекторе так и не использовали. Потому что нам важен доступ к коду на самом низком уровне, а не просто использование API. А ковырять такой космический корабль, как OpenCV не очень хочется.
Спасибо за столь развёрнутый ответ :)

>детектить кожу на фото и видео — разные вещи.
Абсолютно согласен — и не только относительно кожи, но и любых других объектов :)

а вот про отказ от OpenCV — это всё-таки слишком :) библиотека хороша и очень удобна :)
Для своего проекта, вам, так или иначе, пришлось продублировать часть кода библиотеки ;)
Впрочем, это спор в продолжение темы — что лучше — свой велосипед или готовая библиотека и в нём правы обе стороны :)
Вы это про синие и красные столбики?

А вообще да, мы решили выкладывать по пятницам, чтобы народ отвлекался от грустных мыслей о дедлайнах и завалах на работе.
Вспоминается Американский пирог, когда ГГ пытался смотреть порно на закрытом канале :3
Не понимаю, и что с ней бороться, полезная штука…
Если не держать под контролем там быстро оказываются дети и насилие.
Вижу, любитель екзотики…
UFO just landed and posted this here
может он сам Экзотик? ))
Да что же всем дались эти негритянки? ;)
— Негритянки, конечно детектятся немного хуже,
— это «немного» не настолько большое, чтобы сильно влиять на точность итоговой классификации ролика,
— кроме того, видео с негритянками на видеохостингах встречается не так часто (ну это субъективно, точных исследований мы не проводили), то есть, даже если бы они детектились еще хуже, это не так сильно влияло бы статистику классификации некоторой средней выборки роликов.
кстати, а как с хентаем обстоят у вас дела?
Детектор тентаклей думаю еще не реализован :-)
Хентай ловится. Но здесь обратная проблема — иногда неправильно классифицируется как порно и некоторое другое аниме. Например, сцены, где крупным планом показывается ритмично дрожащее лицо главного героя. И это лицо
ну а помимо детекта цвета кожи, можно ж реализовать детект водяных знаков(лого) на самом изображении. к примеру тотже bangbros ). или заставки от private
Да, у нас в лицензеро есть такая функциональность — поиск логотипа в ролике. Думаю, прокручивание этой функциональности к поиску порнографии будет одной из следующих задач.
кстати, а парсинг тэгов в видеофайлах у вас реализован?
Пока стояла задача классифицировать именно видео. В реальной работе конечно к этому нужно добавлять и текстовый поиск.
Кстати была какая-то американская контора (может и сейчас есть) которая с правообладателями адалт-контента сотрудничала и искала в том числе по логотипам неправомерно расшаренные ролики )
UFO just landed and posted this here
Не повезло роликам с пляжа, где полуголые люди и песок.
Ага. Но к счастью, такой порнографии немного.
Так я не о порнографии и говорил. Ваш фильтр, в теории, с вероятностью близкой к 100% отнесет все ролики типа «Я и мои дети на пляже в Турции» к порно.
Во-первых, поэтому мы и не используем в классификации только поиск по цвету. Во-вторых, я думаю, роликов типа «Я и мои дети на пляже в Турции» не будет больше 0.1% на видеохостингах.
Различные методы классификации у вас применяются совместно? Т.е. в итоге получается сумма по всем критериям на основе которой принимается решение. Или же, к примеру, в начале применяется «кожный детектор» и если он выдает результат менее некоторого значения, то ролик считается «нормальным» и публикуется, а если нет, то в ход идут следующие фильтры?
Сейчас совместно. Так получается лучше точность классификации. Но над порогами мы тоже думали, но еще не реализовывали.
тут все намного проще.
Забанили ваш ролик (ну нет там порнухи) значит вы напишете гневное письмо как автор ролика и после вашего письма ролик просмотрит человек, откроет ролик снова для просмотра и отправит экспертам для улучшения сервиса.
тот кто гарантированно разместил порно никуда отписывать не будет, ну или опять же процент отписавшихся будет минимальным и это опять сможет обработать человек (с банхаммером).
Мне тут подсказывают знатоки, что там половые органы не синие, задетектим.
О, у вас там и знатоки есть? :)
На такой работе без знатоков не обойтись :)
осталось только сделать поиск гениталий в видео :)
Про это еще будет статья (ну, не совсем про это). Но в двух словах, это не такая простая задача, как может показаться. Например, член трудно отличить от, скажем, руки или пальца.
UFO just landed and posted this here
это вы ещё оптимистично сказали :))))
Да-да, «не путай член с трамвайной ручкой» и прочие выражения именно об этом :)
Ну да, ну да. Сравнил хуй с пальцем, как говорится.
Интересная у вас, парни, работа :)
я как-то был на заводе где диски печатают, так там целый день порно крутиться :)
интересно, а каким дома этим работникам завода? )
при виде девушки мысль — «что опять?»
У них мысль — «Наконец то, живая, настоящая»
аааа. она со мной говорит )
мне кажется оно по началу интересно, а когда с утра до вечера на работе заставляют смотреть разного рода кхмнуху — уже наверное не так весело =)
Многие школьники мечтают о такой работе. Через неделю они жестоко разочаровываются (:
Это как с шоколадной фабрикой. В детстве всегда мечтал работать на шоколадной фабрике, и как-то попал туда на экскурсию. Сначала как увидел весь процесс — была одна мысль: «счастливые люди, столько шоколада, ешь не хочу прям с конвейера». Спустя 4 часа блужданий по фабрике меня тошнило от запаха шоколада, мне было плохо, и я мечтал только о том, чтобы выйти оттуда и больше никогда не есть шоколад. Собственно, проблема была именно в запахе — сам процесс производства нормальный.
Так, в принципе и вышло. Шоколад я напрочь разлюбил.
Может на пивзавод съездить…
C пивзаводом такая тема не прокатывает почему-то :)
Я сахар так разлюбил, когда целый вагон разгрузили. Никогда бы не подумал, что сахар может вонять :)
Еще как. Особенно в замкнутом пространстве.
Я с двумя товарищами в сумме тонн 20 ламината отгрузил за 4-й курс. Теперь в стоительных магазинах обхожу этот отдел, чую его по запаху за 3 ряда :)
а я сижу как в Матрице — 0x19fa02aa, 0x03bba92f — о… блондинка! :)
«Фрагмент является попорнографическим» — речь об анальном сексе? :)
Опечатка, так сказать, по Фрейду. Исправил.
значит теперь искать порно стало еще проще? .)) а где ссылка на сервис? .))
Да куда уже проще :D
DexizeR, если вам для научного интереса, то мы, в принципе, можем выдать вам тренировочный и тестовый наборы для этого. В них будет много роликов, классифицированных по типу акта (действия), направления движений, их ритмичности, и т.д. Это чтобы было легко искать — например, будут ролики типа 'двое, 80% кожи, он сзади, 5 Hz, в помещении', и т.д. Для этого придется поговорить с менеджерами, и скорее всего подписать договор о нераспространении наших данных и т.д.

Или вам в личных целях хочется?
Боязно, что под раздачу попадут все пляжные фото, соревнования бодибилдеров, и другой правильный контент.
UFO just landed and posted this here
Под какую раздачу? Все эти фильтры — не более чем инструмент, выдающий результат. Как его применить — зависит от человека.
Если взять сферический видеохостинг, то для старых пользователей с высоким рейтингом порог срабатывания поставить в 95%, а после n жалоб — снижать до 70. Например. Можно добавить ручную модерацию для роликов, отмеченных как 65-процентное порно.
таким образом, под критерий порно-контента попадает все, где есть кожа: реклама крема для загара или лосьона для тела, фотографии с пляжа и прочее.
поэтому авторы и используют несколько разных детекторов ;)
И вот еще. Если порно-контент будет распространяться с инвертированными цветами? Как тогда? Ведь для его просмотре достаточно не самого навороченного плеера, умеющего накладывать фильтры на видео.
Кстати, и 3D-порно будет детектиться хуже, там цвета размыты.
ну если такое будет очень популярно, то мы добавим проверку на инвертированный цвет — просто заинвертируе ми ролик еще раз пропустим… но такого не будет. Вот вы, например, будете в самый ответственный момент накладывать там какой-то фильтр на видео? Или заядя на страничку, сможете ли вы одним взглядом понять, какая сцена вам более всего интересна, и выбрать ее? Я бы не смог. Скорее всего, такого не произойдет.
Фантомас разбушевался!
Пативэн уже выехал.
Руки на клешни стали похожи. Краб :)
Как вы радикально подошли к смене иконок из KDE 3.
Классный сайт, сразу на серьёзных людей похожи.
«Затем стала выбора...»
Наверное, «проблема»?
Спасибо за ваши пятничные рассказы.
История из нашей практики: у группы пользователей регулярно включались блокировки доступа к ресурсам с ключевым словом «порно». Они утверждали, что это нужные сайты и доступ к ним остро необходим. Оказалось, что данные ресурсы посвящены продажам «заПОРНО-регулирующей арматуры» :)
Ага, еще по слову «анал» режется вся аналитика :-(
У нас фильтр не давал разместить объявление производителю опорно-двигательных протезов.
Я не знаю. Для скачивания писали скрипт, и «тщательнейшим образом» не пересматривали потом.
Читал оба поста по Вашему фильтру. Не хотел бы выступать с жесткой критикой, поскольку сам не занимался распознаванием порно-контента на практике, но у меня не малый опыт в распознавании изображений, и было время, я начинал заниматься проблемой распознавания порно-контента, но до практики тогда так и не дошло, однако у меня есть некоторые наработки в теории.
Мне кажется, Вы, при разработке своего фильтра, не верно подошли к решению задачи в комплексе. Вначале необходимо было сесть и набросать формальные признаки наличия порно-контента на видео/изображении, определить приоритет каждого признака, а после этого садиться за разработку.

1) Как уже многие прокомментировали, детектор наличия кожи — весьма ненадежный фильтр:
а) существует множество различных вариаций цветов кожи;
б) существует множество различных вещей похожих по цвету на кожу;
в) обнаженное тело считается неприличным (порно), а обнаженное тело в купальнике — это приемлемо;
г) обнаженное тело в купальнике — это приемлемо, но если купальник «немного съехал».
Детектор кожи может служить только вспомогательным фильтром, при этом в очень низким приоритетом.

2) Детектор ритмических движений — это, на мой взгляд, хороший фильтр, но не для всех возможных вариантов роликов.
а) не во всем порно-контенте присутствуют ритмические движения;
б) как Вы сами показали в предыдущем посте, не все ролики с ритмическими движениями относятся к порно-контенту.
в) детектор работает только для видео;
Я бы отнес такой детектор к среднему приоритету.

3) Наивысший приоритет я бы отдал поиску изображения гениталий. Такие изображения обладают рядом особых признаков, а реализовать алгоритм поиска не сложнее, чем алгоритм поиска лица.
а) вы пишете, что гениталии легко с чем-то спутать — возможно, но все зависит от количества признаков, заложенных в алгоритм распознавания;
б) лицо также можно много с чем спутать, но тем не менее, качественные алгоритмы поиска лиц существуют;
в) у вас нет необходимости работать в реальном времени, поэтому можно сделать ставку на точность и перепроверку данных;

Немного из той исследовательской практики, которой я занимался.
Я пытался найти лица, на изображении, если лица были найдены, то в зависимости от положения лиц я пытался определить область, где необходимо искать изображения неприкрытых половых признаков (гениталии, грудь женщины), поскольку обнаженную женскую грудь определить на порядок сложнее чем гениталии.
Если же лиц на изображении не было, тогда поиск изображений первичных половых признаков выполнялся по всему исходному изображению.

P.S. Возможно, мои представления о порно-контенте отличаются от Ваших, и тот же стриптиз необходимо относить к эротике, а не к порно-контенту.
> 3) Наивысший приоритет я бы отдал поиску изображения гениталий. Такие изображения обладают рядом особых признаков, а реализовать алгоритм поиска не сложнее, чем алгоритм поиска лица.
> а) вы пишете, что гениталии легко с чем-то спутать — возможно, но все зависит от количества признаков, заложенных в алгоритм распознавания;
> б) лицо также можно много с чем спутать, но тем не менее, качественные алгоритмы поиска лиц существуют;

Нет, все совсем не так. Лицо очень хорошо детектится, есть много алгоритмов, мы и сами писали свою реализацию, пока правда не пригодилось. Так вот, лицо (если картинку размыть, убрав шум) у всех одинаковое — темные глаза, светлый лоб и нос. Гениталии же детектить на видео довольно тяжело, особенно если качество видео плохое, мы пробовали.

Опять же, не надо путать поиск в видео и на фото — все сильно различается.
jerax, а давайте мы с вами подружимся и обсудим — какие же такие признаки есть на изображении гениталий? конечно, если вы считаете, что это признаки будет прилично написать на таком публичном форуме, как Хабр, то опишите здесь. Думаю, всем будет интересно. А если нет — то можно просто подружиться и обсудить в оффлайне.

p.s. — я тоже вместе с borges работаю над этим детектором, и как borges и сказал, мы тестировали и с лицами и без, на достаточно большой базе роликов, и получалось, что удаление лиц и прочие усложнения только мешают.

А так… да… ни один детектор, в том числе и кожа, не дают достаточно хороших результатов в одиночку, но вместе взятые — работают очень даже неплохо!
Не стоит забывать и о том, что детектор должен быть очень высокопроизводительным, ведь предназначается для видеохостингов. А алгоритмы поиска лиц (Виола-Джонсо-подобные) всё-таки тяжелые. Я, например, тестировал софт www.yangsky.com/products/porndetect/index.htm, основанный на десятках таких детекторов, так вот сканирование одного ролика заняло более часа! это же абсолютно неприемлемо для более-менее массового использования.
Я буду читать все комментарии, прежде чем писать свой. Я буду читать все комментарии, прежде чем писать свой.
да ладно, такого пруф шота ещё не было :)
Хм, а пляжный волейбол фильтр примет за груповуху?
считаем количество пикселей кожи во всех кадрах фрагмента;
делим на общее число пикселей кожи во всех кадрах фрагмента — получаем долю пикселей кожи;

В выделенном фрагменте должно быть просто «пикселей» или я не так понял мысль в этом абзаце?
В случае массового применения приведёт к наложению цветовых фильтров на видео и картинки. Сказать что будет весело — всё равно что ничего не сказать: девушки бывают разные — чёрные, белые красные (а будут так же всех других сочетаний RGB).

По поводу видео. Как насчёт анализа цикличности движений? Если разложить на те же цвета и сравнивать изменения между кадрами, то цикличность выявить не должно быть сложно. В этом случае даже цветовые фильтры вряд ли помогут скрыть порно, поскольку можно анализировать цикличность для любой цветовой гаммы.

К какому «усовершенствованию» порнухи это приведёт уже даже представить сложно, но то что станет совсем весело — сомневаться не приходится. :)
Я всегда думал, что в программировании самое классное — это делать игры. Черт возьми! Как я ошибался.

Как у вас там с вакансиями?)
А для чего это все нужно? Чтоб запретить все порно? Тогда запретный плод окажется еще слаще, и народ только и будет что целыми днями думать где достать порно; появятся новые поводы преследовать людей, появятся новые поводы давать взятки. В общем, путь запретов — он тупиковый. Легалайз как-то поцивильнее.
А если ролики будут выкладываться со смещенным оттенком? Ролик скачали, подкрутили оттенок в видео-проигрывателе и профит.
Тяжелые условия работы! Молоко выдавали бы что ли…
А как обстоят дела с производительностью?
с производительностью дела обстоят *приблизительно* вот так www.nvidia.ru/object/nvidia-licenzero-ru.html, а на конкретном проекте про порнографию даже гораздо (в разы или десятки раз лучше), но точных цифр называть не можем по разным причинам.
А что это за фильм/ролик в примере работе детектера? :)
Sign up to leave a comment.

Articles

Change theme settings