Открыть список
Как стать автором
Обновить
  • по релевантности
  • по времени
  • по рейтингу

Борьба с комментариями-дубликатами

Habr
Привет.

Нужно либо ввести flood-control (второй и последующие комментарии с одинаковым текстом от одного пользователя к одному посту/комментарию в базу не записывать), либо дизаблить кнопку добавления комментария после нажатия на неё.

А то невозможно, у меня все время комментарии дублируются — кликну по кнопке, реакции нет. Ну, думаю, тачпад подвел, кликаю снова — оп и два камента запостилось.
Всего голосов 4: ↑3 и ↓1 +2
Просмотры737
Комментарии 4

Послать поисковик на permalink

Чулан
Довольно долго мучает этот вопрос, ответ на который, казалось бы, должен быть элементарным: дублирующееся содержимое.

Допустим, есть сайт, например, со статьями. Полная версия статьи отображается её личной ссылке example.com/article/hello-world, а уменьшенная версия только с текстом до ката — во всех остальных местах. Причём этих остальных мест может быть очень много: на страницах профилей пользователей (example.com/user/vasya), на страницах категорий, тегов, топов, различных параметров сортировки, в общем, есть множество вариантов показать краткую версию статьи (а иногда и полную, если ката нет).

На всякий случай уточню: меня не волнует, как это повлияет на рейтинг сайта, мне нужно, чтобы гугл не давал ссылок на все эти страницы, а только на одну: личную страницу статьи. Ведь если он даст, например, ссылку на категорию, в которой есть эта статья, то к моменту, когда пользователь туда придёт, статья может оказаться уже на следующей странице или же вообще быть убрана из этой категории. И если параметры сортировки я могу отсечь, вынеся их в HTTP GET параметры и потом запретив в robots.txt всё, что после знака вопроса (так советуют в справке для вебмастеров от Google), то закрыть в robots.txt страницу, например, example.com/user/vasya я не могу, так как он тогда вообще не посетит эту страницу. Как хабралюди борятся с этой проблемой, и делают ли они это вообще?
Всего голосов 3: ↑3 и ↓0 +3
Просмотры162
Комментарии 10

Кластеризация дубликатов в Яндекс.Картинках

Обработка изображений
Сегодня в клубе Яндекс.Субботник появилось интересное видео о том, как Яндекс обрабатывает изображения для исключения дубликатов. Рассказывает Александр Крайнов: он с 2000 года занимается проектами, связанными с обработкой медиаданных. В Яндексе отвечает за проекты, в которых задействовано компьютерное «зрение».

О докладе
Легко найти дубликаты среди тысяч картинок. Сложнее – среди миллионов. И совсем трудно – среди миллиардов. Чем выше полнота работы алгоритма, тем больше проблем. Но в то же время полнота кластеризации дубликатов – это основа качества поиска изображений.

Думаю, многие не следят за этим клубом и мне кажется, что после этого видео есть над чем поразмыслить.
Всем кому интересно — прошу под кат.
Читать дальше →
Всего голосов 40: ↑39 и ↓1 +38
Просмотры6.6K
Комментарии 8

Боремся с дубликатами

PostgreSQL
Tutorial
Продолжая тему использования динамического SQL, я хочу рассказать об одном полезном инструменте, реализованном мной в рамках одного из текущих проектов. Речь пойдет о дубликатах в справочниках. Под дубликатами, в этой статье, я понимаю записи, внесенные в справочники повторно, например в результате орфографической ошибки при вводе наименования.
Читать дальше →
Всего голосов 22: ↑22 и ↓0 +22
Просмотры9K
Комментарии 2

Слияние дубликатов в Oracle

Oracle
Tutorial
Всего несколько дней назад я описывал набор процедур, помогающих бороться с дубликатами в БД PostgreSQL. Напомню, что под дубликатами я понимаю записи внесенные в справочники повторно, например по ошибке. Как выяснилось, для Oracle аналогичный инструмент также может быть полезен.
Читать дальше →
Всего голосов 8: ↑7 и ↓1 +6
Просмотры6.4K
Комментарии 0

DaData.ru находит и уничтожает одинаковых людей

HFLabsРазработка веб-сайтовАнализ и проектирование системSaaS / S+S


DaData.ru — сервис автоматической проверки, исправления и дедупликации контактных данных (ФИО, адресов, телефонов, email, паспортов).

У меня в телефоне 453 контакта. Среди них встречаются дубли: один и тот же человек записан то как «Леха», то как «Алексей Мегафон», а то и как «Зиновьев, Алексей Иванович». У Лехи указан скайп и день рождения, у «Алексея Николаевича» — емейл и основной мобильный номер, а у «Мегафона» — запасной номер от понятнокакого оператора.

В телефонных контактах дубли неприятны, но не особо напрягают. Хуже, когда такая чехарда начинается с клиентской базой компании.
Дубликаты приходят ночами и мучают маркетологов
Всего голосов 31: ↑24 и ↓7 +17
Просмотры20.2K
Комментарии 40

Подсказываем реквизиты компаний по данным ФНС РФ и бесплатно ищем дубли

HFLabsРазработка веб-сайтовAPIРазработка под e-commerce
DaData.ru автоматически исправляет ошибки в адресах, ФИО и телефонах. Находит и объединяет одинаковых клиентов в базе. Помогает быстро ввести адрес и ФИО покупателя, а также и реквизиты компании на форме заказа. Есть API и javascript-виджет.

В предыдущем выпуске Дадата помогала бороться с дублями. А сейчас мы снова причинили добро:
  • бесплатно находим дубликаты в файлах до 100 записей;
  • снизили стоимость сервиса дедупликации до 5-10 копеек за запись;
  • подключили актуальные справочники налоговой службы в подсказках по компаниям.


Читать дальше →
Всего голосов 11: ↑9 и ↓2 +7
Просмотры9K
Комментарии 13