Pull to refresh

Comments 60

Класс идея. Попробую.
Не сразу заметил дисклеймер про гуся.
Здорово, мотивирует! Будут комментарии — обязательно пишите.
Правильно я понимаю, что если для прочтения страницы требуется аутентификация, то полнотекстовый поиск по ней работать не будет?
Полнотекстовый поиск будет, но по контенту, доступному публично по данному URL. Страница обрабатывается на сервере, которому аутентификация не доступна. Кроме того, не забывайте — страница может быть показана как рекомендация и мы не можем собирать персонализированные данные на клиенте и потом показывать их всем.
Полез экспортировать закладки из Хрома, а они, оказывается, сделали тот же ГрабДак у себя:

Закладки в Хроме



:-D

У вас названия роликов как будто настоящие, и ссылки как будто тоже, но они не соответствуют друг другу. Это какой-то хитрый план? :-)

До чего я дошел, проверяю правильность ссылок на прон...
Ничего, скоро Хром будет знать, что показать вам в закладках, даже если закладки не делались. «В это время дня вы хотите читать про Go», а в это — про «Yoga Teen...» (и, да, я открою вам эту страницу в анонимном режиме, как будто ничего не запоминаю!) )
Google — это страшная сила. Чего нет в Google, но что можем дополнительно предложить мы, это кроссбраузерность и рекомендации других материалов, которые фактически проверены другими пользователями на качество и подходят под то, что вы ищете.
До эпохи поисковых машин очень были популярны каталоги ссылок. Похоже, история по спирали возвращается на круги своя: мы снова ищем избранные ссылки. Разве что — свои, а не отобранные редактором.
Наверное можно и так сказать, но мне больше видится, что мы плавно движемся от больших поисковых универсальных машин к какому-то более персонифицированному поиску. Много проектов появляется, которые ищут по закладкам, по лайкам, по сообщениям, тот же Slack вспомните.
Сервис гуд. Но мои 4.5Мб закладок импортнуть не смог :)
Артем, можете поподробней что получается? Где был затык? Закладки грузятся как один json файл на сервер. Получилось загрузить?
Пользователи, уже зарегистрированные и использующие сервис на момент завершения тестирования, >>>получать<<< преференции и дополнительные предложения от сервиса.

grabduck.com/auth/register
По моему опечатки тут принято отправлять в личке, но все равно спасибо — поправим. :-)
Пардоньте. Я все еще новичок-с

;)
Конечно будет — в планах сделать для firefox, opera и safari. Сейчас мы на стадии MVP, руки пока просто не дошли.
>Так и родилась идея GrabDuck. А почему я не могу искать в своих закладках также, как мы это регулярно делаем в поисковых системах — задавая поисковые запросы.

Ну эта проблема решается уже существующими сервисами, например, полнотекстовый поиск по сохраненным статьям есть в pinboard.in. Или вот еще — fetching.io, bookmarks.io, historio.us. Можно немало таких сервисов накопать по соотвествующему запросу в гугле.
UFO just landed and posted this here
У нас другая концепция и доменная область. По тем документам, которые сейчас в системе, уже можно сказать, что у нас большой крен в ИТ. Это означает, что нам придется разбираться с тонкостями именно этого мира, чтобы показать качественные рекомендации. Как небольшой пример: необходимо понимать, какие синонимы мы можем использовать при выполнении поискового запроса. Например, если пользователь ищет что-то по javascript, то все что удовлетворяет слову js, тоже подходит. Или для показа рекомендаций необходимо возвращать не только документы, которые удовлетворяют запросу, но ограничивать их только теми технологиями, которые интересны пользователю. Тема обширна и одного комментария для того, чтобы дать полный ответ, тут недостаточно. Мы планировали освещать какие-то такие детали в следующих статьях. А так, да — все на что-то так или иначе похоже.
Вот это да, уже целая армия желающих поконкурировать diigo.
Позвольте пару замечаний:
Зачем сделана регистрация через ФБ (и другие сервисы), если потом все равно надо вводить пароль?
Ну и реквестирую плагин для Огнелиса, конечно.
Потому что, может сложиться ситуация, когда данный сервис (FB,VK,G+) не работает и вы не сможете воспользоваться им для захода на GD. В этом случае у вас всегда есть email / пароль, которые вы завели.


Да, мы поняли, что плагин нужен скорее. Правда, посмотрим когда сможем сделать.
Вам конечно виднее. Но регистрируясь через ФБ, я рассчитываю не использовать пароль вообще. Не знаю, насколько это распространенный шаблон поведения среди пользователей, но может сделать таки регистрацию с паролем опциональной?
Думаю, что нет. Diigo — это social bookmarking, как и Delicious. Их специализация на социальности, подписках на что-то, фоловерах и прочем. Мы делаем копилку личного материала, который собирается для себя. Рекомендации, которые мы даем, они сугубо по тому запросу, который пользователь ищет и могут быть именно сейчас ему полезны для решения какой-то конкретной проблемы.

Grabduck не поддерживает функцию: «Дай-ка почитаю, что там запостили сегодня по тегу javascript”, как Delicious.
Было бы круто такую штуку к избранным статьям хабра прикрутить.
Ваша мысль опережает наши действия :-D
У нас планах стоит синхронизация с избранным хабра и SO
Ага, такой большой, что провайдер целиком завалился .
Приносим свои извинения, говорят скоро должны починить. Провайдер contabo.de если кому интересно.
Нет возможности проверить снова из-за хабраэффекта, но заметил вот что:
— в поиске не ищет по имени домена, например, пытался найти «habrahabr», но никаких результатов не выдало,
— нет возможности поменять пароль
+ по-моему, было бы удобней, если в поиске по умолчанию было выбрано «User only articles», а не «All articles»
По имени домена действительно не ищет. Изначально думали нужно нам это или нет. Остановились на том, что вроде самим не надо и решили «огородов не городить». Наверное все таки реализуем, но как фильтр.

Прямой функции «поменять пароль» сейчас действительно нет. Пока можно пользоваться функцией «Забыл пароль», она позволяет сменить теккущий пароль, если есть доступ к email.

Мы видим это наоборот — когда ищу что-то свое, всегда интересно посмотреть, что еще у кого-то есть на данную тему. Тем более, что если ничего путнего нет, то смотреть вроде как никто не заставляет. Как вариант, который понравиться всем, можем рассмотреть пользовательскую настройку — по умолчанию искать или нет по другим закладкам.

Кстати, если пользуетесь Trello, то посмотрите здесь — мы стараемся аккумулировать весь «feedback» от пользователей.
Извините конечно, но чем ваш проект от допустим instapaper отличается? Ну и вопрос — как вы собираетесь монетизировать? Еще из пожеланий хочется апп для iOS/android
А Instapaper где хранит кеш? На сервере, или локально? Отсутствие бессплатного полнотекстового поиска опечалило. :(
А чем он похож? Конкурент Instapaper, это getpocket или на худой конец evernote. Это все сервисы отложенного чтения. Мы не показываем контент, а только выполняем поиск и рекомендуем то, что нашли другие пользователи по этому запросу.

Так вам для iOS или Android? ;-)

Про ценовую политику. Ждали этот вопрос :-)
Пока для нас несколько преждевременно. Монетизация будет — хотим чтобы сервис развивался и совершенствовался — поступление средств для этого самый лучший мотиватор. Будет абонентка. Какая именно, сейчас сложно сказать — будем равняться на то, что работает на рынке для подобных сервисов. Предложим на выбор несколько тарифных планов.
Хотелось бы и iOS и Андроид, т.к. у меня как и у многих iPad и андроид телефон. Может конечно ето не было идеей, но мне например хочется оффлайн чтения самой статьи после того как я ее нашел допустим чтобы в метро почитат или если плохое соединение
Извините, но мы этого не видим. Мы знаем про этот проект — ничего общего.
Он больше конкурент стандартному поиску от Google — альтернативный универсальный поисковик, как и DDG — для любителей уйти от всезнающего и наблюдающего за всем Google.
Ребята молодцы, придумали интересное решение. Из минусов я бы назвал необходимость разворачивать свою локальную ноду — далеко не каждый будет это делать. Ну и с релевантностью поиска самого не до конца понятно.
YaCy же можно настроить по разному. Можно сделать личный поисковик по всем посещённым страницам и/или только по закладкам.

> Поэтому GrabDuck, это прежде всего поиск. Хороший полноценный полнотекстовый поиск по всем материалам которые я сохранил (не только по заголовку, но и по всей статье).

Грубо говоря в YaCy полнотекстовый поиск по закладкам, у вас полнотекстовый поиск по закладкам (плюс рекомендации от других пользователей. этого от YaCy в такой конфигурации не получить).
А чем данный сервис СУЩЕСТВЕННО отличается от знаменитого delicious?
Delicious не сохраняет страницы в свой собственный кеш? Если сайт закрылся, ваша закладка испортится.
Не знаю как у других людей, но у меня в делишесе сохранено около 2900 закладок и на компе, все руки не доходят загнать в делишес еще около 300 закладок. Так вот у меня там хранится то, что может пригодиться, а в эверноут я сохраняю всегда то, что нужно сохранить (мануал по настройке чего либо). За все время пользования делишесом было несколько раз, что сохраненная страница с сайта удалена, но тут кеш гугла не кто не отменял, да и в случае чего, по словам можно чтото похожее найти в нете
GrabDuck — сервис хранения закладок, где во главу угла поставлено: найди мне нужную ссылку/статью, даже если я помню о ней достаточно приблизительно или не помню вообще.

Delicious это social bookmarking. Где основное — это смотреть что в тренде по каким-то интересующим меня областям и набивать свою коллекцию ссылок. Еще по-моему Delicious не позволяет искать по самим документам.
За 4 года пользования делишесом, я не разу не пользовался его социальной основой. Если память не изменяет, то года 2-3 назад, когда случился редизайн и сайт переехал на другой домен, была возможность искать по самим документам, как сейчас — не могу сказать (нет возможности проверить)
У вас описание как импортировать закладки из Chrome слегка устарело
Да, уже вчера поняли это. Спасибо, поправим.
Сравните себя с DIIGO.COM?
Я пользуюсь несколько лет платной учеткой, причем недавно расценки значительно поднялись (не для старых пользователей, к счастью).

Какая у вас будет ценовая политика?
Про Diigo я написал развернутый ответ выше в комментариях. Смысл делать еще один такой же Diigo, но заведомо хуже, не видим.

У Grabduck другой путь и тот финальный продукт, который держим в голове, абсолютно не похож на сегодняшний Diigo.com, также как и на Delicious.

По ценовой политике — уже тоже говорили. Если кратко, будет абонентка, т.к. приток средств за работу мотивирует больше всего. Сколько — будем исходить из того, что есть/принято на рынке.
Какие у вас на текущий момент отличия от diigo? Что есть у вас, чего нет у них?

Первое отличие, которое я, к сожалению, обнаружил, это невозможность импорта моих 827 закладок. Такое ощущение, что сервис пытается их кешировать во время импорта.
Давайте еще раз. Я не вижу как мы похожи на Diigo, поэтому мне трудно сравнить его с GrabDuck. Из того, что я вижу навскидку, что есть на сервисе и что является его основной чертой — это обмен какой-то полезной инфой между пользователями. Наша концепция это быстро помочь пользователю найти решение его вопроса и порекомендовать какие-то другие материалы. У нас нет и не планируется отмечать что-то для других пользователей. Мы не планируем делать какие-то персонализированные (социальные) рекомендации по типу “Вася считает это вам поможет”. Diigo наверное хороший и удобный сервис, но к сожалению больше ничего о нем сказать не могу.

По импорту, Михаил, что именно не получилось. Можно подробней? У других пользователей все работает нормально. Где произошел затык? На сервер получилось сохранить?
Зависал на этапе загрузки файла на сервер. Сейчас попробовал еще раз, все отлично отработало.

Чем вы похожи на diigo?

Оба сервиса:
1. Сохраняют закладки
2. Кешируют сохраненные страницы
3. Обеспечивают полнотекстовый поиск по кешу
4. На страницы можно назначить теги (а в diigo и «категорию») и искать по тегам

Но diigo не позволяет искать по чужому кешу. Потому что в кеше запросто может оказаться
— корпоративная информация
— пароли
— adult контент
(готовы с этим побороться?)

Вот и вся функциональность на этот момент, верно?
Хотел бы добавить про поиск. Честно говоря, он практически не работает. Я сравниваю результаты поиска diigo и grabduck, последний не находит и половины статей.
Не знаю, что на это сказать. Как-то вам не повезло. Мы сравнили оба сервиса — для нас GrabDuck возвращает более релевантные результаты.
Мы на GrabDuck концентрируем свои усилия на поиске. Давайте еще один раз пройдемся по тому, чем должен обладать хороший поиск и что уже сделано у нас или планируется в ближайшее время.

1. Поиск должен возвращать не много результатов, а релевантные результаты. Поищите в поисковике по «spring security -tutorial», получите более 100 миллионов ответов. Будет кто-то проверять их все? Нет. Обычно дальше второй — третьей страницы редко кто заглядывает. Поэтому проблема — не найти все, проблема, это показать то что нужно. На GD мы старались найти грань между «много» и «вменяемые результаты». Получилось? Узнаем, когда соберем feedback от пользователей через какое-то время. Будут нарекания — расширим поиск в сторону «много», алгоритмы от этого не меняются, только параметры.

2. Учет языка. Должно быть возможно искать, принимая во внимание синтаксис языка. Например, под запрос «красный стол» также дополнительно попадают все красные и красненькие столики и столешницы. Мы сейчас поддерживаем русский и английский. На очереди немецкий. Это не означает, что на французском искать нельзя, это означает только, что для французского поиск будет не такой гибкий. Большинство систем, в таком ключе, поддерживают только один язык — «американский».

3. Должен выполняться поиск по всей фразе, а не по словам поискового запроса. Приведу пример с тем же красным столом. Если я ищу красный стол, то хочу видеть информацию именно про красный стол, а не про зеленый, который мне будет выдан только потому, что в документе дополнительно присутствует информация о красном одеяле. Опять, говоря про большинство систем, не специализирующихся на поиске, результат — это документы, где просто присутствуют все или хотя бы одно из слов запроса. Поверьте нам на слово, мы проводили анализ нескольких систем из доступных в opensourse, там именно так.

4. Система должна поправлять очепятки, а не искать бездумно что попросили. Особо говорить здесь не о чем. Понятно и так, кажется, что система должна это делать так или иначе. Самый известный пример, это Google с его «Did you mean?» функциональностью.

5. Система должна учитывать при поиске синонимы. Уже проходил этот пример в комментариях — если я ищу «javascript», я буду очень удивлен если документы только с «js» не будут мне показаны. Это происходит потому, что для меня javascript и js две взаимозаменяемые сущности. Но это не так с т.з. компьютерной системы. Чтобы быть в состоянии это делать, сервис должен быть либо большим, таким как google, тогда в компании просто есть ресурсы для того, чтобы качественно прорабатывать «все все, про все про все» или покрывать только небольшое количество доменных областей, о которых у команды есть знания. Построить здесь универсальный алгоритм, обрабатывающий «все и без усилия» невозможно.

6. Было бы очень хорошо, если бы сервис сам мог классифицировать документы (проставлять теги, категории, помещать документ в нужную папочку). Прежде всего, есть какая-то общая классификация, например, если статья о javascript, то наверняка тег с таким же название подойдет. Как понять то, что статья именно о javascript, это другой большой вопрос. Кроме того, как дополнение, всегда можно посмотреть: «а что же там пользователь сам набивает для подобного материала», — и добавить классификацию в новые документы автоматически. Сейчас из того, что я знаю, это делает только google и evernote. Скоро будем и мы. :-)

Все из вышеперечисленного возможно на diigo? Я в этом как-то очень сомневаюсь. И не потому что они плохие, просто, это не их конек.

Про борьбу с корпоративной информацией.
Не видим проблемы с показом чужой корпоративной информации и паролей. Все рекомендации, это публичный контент доступный каждому по публичному url. Парсинг осуществляется не на клиенте, а на сервере у которого нет и быть не может доступа к чему-то секретному или корпоративному.

С Adult контентом готовы и будем бороться. Даже знаем, как это делается — в рекомендациях показывать не будем.

Надеюсь, что ответил вам на все ваши вопросы и считаю дискуссию по данному вопросу с нашей стороны закрытой.
Спасибо за ваше мнение.
Спасибо, будем наблюдать за развитием вашего сервиса
Особой надобности именно в таком решении если честно не вижу. Проблему решаю расширением для хрома. Там поиск конечно не супер-пупер, но как правило все находится.

Но все равно удачи вам!
Спасибо за комментарий и за то что посмотрели наш материал.
Мы понимаем, что GrabDuck не панацея от всех бед, которая поможет каждому. Кому-то сервис подойдет, кому-то нет.
Sign up to leave a comment.