Как стать автором
Обновить

Комментарии 14

Повторяюсь, но: «Какл» для русского уха крайне неблагозвучное название. Его стоит поменять на что-то менее ушеоскорбительное.
Каждая статья сопровождается таким комментарием. Название у продукта нормальное, кому не нравится тот не использует.
Что то я не виду у народа особого рвения переименовывать наш геологический институт: ВСЕГЕИ
И что же теперь в хороший институт не идти если у него своеобразное сокращение?
Мы же IT-шники для нас главное качество продукта или на деле это не так?
А что мне делать, если в ленте постоянно появляется упоминание каклов? У «всегеи» название забавное, но не неблагозвучное. А тут чистой воды какофония, в буквальном и переносном смыслах.

Я всё жду, когда до руководства «какла» дойдёт, что быть «каклом» как-то неприлично и они-таки переименуются.
Забавно, на сайте полное название значится «ВСЕРОССИЙСКИЙ НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ГЕОЛОГИЧЕСКИЙ ИНСТИТУТ им. А.П. КАРПИНСКОГО», что по логике вещей должно сокращаться как ВСЕНИГЕИ.
Т.е. вы во так просто без тюнинга используете Sphinx? Никаких словарей, стоп слов и т.д. не подключаете?
А какое ранжирование используете?
Рассматривали ли альтернативы Apache Solr или Elasticsearch при выборе?
Solr да, так как у него уже готовый Java API, но начав разбираться, поняли, что там все как-то сложно (имхо).
С каких ресурсов система извлекает отзывы? Как система определяет, является ли текст отзывом?
Сбор отзывов происходит — от юзеров, с follow-up рассылки и Яндекс.Маркета. Про «Как система определяет» не совсем понимаю, мы просто индексируем весь текст отзыва — достоинства, недостатки и комментарий, хотели ещё и имя юзера индексировать, но потом поняли, что там могу быть проблемы.
Вы можете извлечь достоинства и недостатки из отзыва, если они явно не размечены?
А при использовании Postgres можно обойтись встроенными функциями, что упрощает инфраструктуру.
А почему не рантайм индекс?
Зарегистрируйтесь на Хабре , чтобы оставить комментарий