Как стать автором
Обновить

Комментарии 55

Отличная новость! Жаль только не все сайты с тегами внедряют подобные фичи =)
На самом деле теги вообще очень мало кто использует по-назначению. А, тем не менее, с ними можно делать кучу интересных вещей: возможность тежирования постов пользователями, как это реализовано на Last.FM, генерация списка схожих статей в блоке типа «читайте так же...» и т.д.
А у Вас — это где, если не секрет?
НЛО прилетело и опубликовало эту надпись здесь
А у Вас — это где, если не секрет
НЛО прилетело и опубликовало эту надпись здесь
Расскажите как организован механизм у вас?
Сами в ручную расставляете, расставляют пользователи или автоматически?
Просто отлично! Казалось бы элементарная вещь, а как удобно!
«схлопывать» можно названия компаний, которые написаны как на русском, так и на английском языке
Спасибо. Действительно, полезно!
Спасибо. Действительно, полезно!
а по какому алгоритму делали? или планируете делать?
сначала ручками, это ладно. но потом то на автомат удобнее посадить, да чтобы ложных срабатываний почти небыло.
интересен алгоритм=)
Пока без алгоритма. Я даже не уверен что это возможно полностью автоматизировать.
Сейчас изучаю статью blogs.sun.com/plamere/entry/determining_synonyms_from_tags
Самое простое — перевести название всех фирм в транслит и обратно.
Ниже я подсказал парочку алгоритмов ;)
Замечательно! Стремимся к совершенству, товарищи ;)

побольше бы таких нововведений в сети.
спасибо
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
А без нормативной лексики нельзя? О_О Вы сначала подумайте «почему» вас заминусовали, а уж потом что-то говорите… и будет вам счастье :)
ненормативной
Наконец-то :)

Фактически, полезное применение семантический алгоритма.
НЛО прилетело и опубликовало эту надпись здесь
Элементарно, для всех похожих тегов указывается один родительский.
НЛО прилетело и опубликовало эту надпись здесь
Модератор, очень вдумчиво и аккуратно ;)
Я думаю, что решениие о том, какой тэг будет родительским стоит принимать исходя из частоты его появления в поиске хабра / тэгах хабра / частоте слова в поисковиках. Взять самое часто употребляемое например.
Очень эффектиным был бы нечеткий поиск строк (тот же Bitap algorithm) и фонетический (к последнему была хорошая хабрастатья).

Выявить «кандидатов» этими алгоритмами и связать нужные вручную или силами НЛО.
Спасибо!
Предлагаю объеденить «Хабрахабр» с «Google»! ))
Вот бы тогда дело получилось! ;))

А если серьёзно, то надо бы «SEO» и «поиск» под один таг помоему.
Вот до такого объединение тегов никогда не должно доходить! И в этом-то основная проблема — слишком широки смыслы и области применения тегов-терминов-названий…
Sphinx — «поиск», но ни в коем случае не «SEO»!
Конечно, ведь SEO — это поисковая оптимизация.
Кстати помимо связывания синонимов можно связывать включающие понятия. Например пост с тегом Яндекс или Гугл можно находить по запросу поисковик, а по запросу Яндекс выводить посты про Гугл не следует
У ЭВМ, как правило, экстрасенсорных способностей нет, и что имелось под Google, к примеру, можно понять только из текста. А вот карта тегов…

Интересней будет, если у хабраграждан появится новая возможность ставить пользовательские теги при наличии, ну, там >100 кармы, маленький внутренний голос такой. :)
Если 2 пользователя поставили один тег его можно отобразить
Где-то я это уже видел…
Разве что только «поисковая оптимизация» и «SEO»
>>P.S. Предлагаю пофлеймить на тему что с чем следует, а с чем не следует объединять :)
Размышления Дмитрия Смирнова на эту тему: spectator.ru/technology/web-building/tags2null
Замечательно. Мы такую штуку тоже сейчас тестируем на своем проекте.
как же у меня облегчилась бы жизнь, если бы еще теги присутстовали в rss, и нормально кушались rss-ридерами… эх… мечты :)
пользуясь случаем хочу выразить отдельное спасибо за внедрение поддержки тегов с точкой, таких как «.net», раньше приходилось писать dotNet

кстати, вот вам кандидат на слияние: dotNet == .net
logo = лого = логотип
А еще хорошо бы клеить слова единственном и множественном числе «стартапы» = «стартап».
:) А я сделал наоборот
(про стартапы)
Действительно, можно помочь разработчикам Хабра, предлагая свои варианты тегов для склеивания. Алгоритм — это хорошо, а реальные варианты от сформированного сообщества — еще лучше.
Начнем с меня (с):startup=стартап; хтмл=html; линукс=linux; фотошоп=photoshop; опенсорс=опенсоурс=оупенсорс=opensource; юзабилити=usability=ui.
Возможно, некоторое из этого уже учтено.
Спасибо. Склеил. :)
Только opensource = open source, usability=юзабилити, а ui я оставил.
НЛО прилетело и опубликовало эту надпись здесь
а это разве не полезное?
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
надо проверить bobuk = порно %)
Можно попробовать подстроить какой нибудь словарь. Автоматом найдёт кучу необходимых групп тэгов «на объединение», а вы их вручную отсортируете.
________________________________________________________________________
Не являюсь программистом (паскаль\маркапы не в счёт), так что объяснил так, как смог.
Еще бы при выборке по тегу можно было бы сразу несколько тегов выбрать. Например «WinXP» «Файловая система»
Да, поиск по нескольким тегам мы планируем сделать
Один из способов чуть-чуть автоматизировать процесс объединения — транслитерировать русские теги и прогонять их через soundex()/metaphone(), при совпадении результатов с латинскими тегами объединять.

На мой взгляд, отношение родитель-ребёнок здесь не совсем уместно. Теги должны быть равноправны, они же синонимы, а отношение родитель-ребёнок возможно в паре, скажем, «поисковик > google». Т.е. это на самом деле должно быть два разных вида связывания, которые должны работать в паре :)

Вот как-то так.
А ещё жаль, что метки продолжают называть тегами.
А возможность объединения меток правильная.
Зарегистрируйтесь на Хабре , чтобы оставить комментарий

Публикации

Истории