Как стать автором
Обновить
  • по релевантности
  • по времени
  • по рейтингу

Newsle — отслеживаем своих друзей в сети

Чулан
image

Думаю хотябы раз в жизни вы искали информацию о той или иной личности через поисковик. Недостаток лишь в том, что ручной поиск занимает время. Из известных средств автоматизации припомню такие сервисы как «Подписка на запрос» от Яндекса, проект ktotam.ru — к сожалению, оба уже не работают.

Итак, в режиме бета стартовал сервис Newsle для сбора информации о любой персоне которая вам интересна.
Читать дальше →
Всего голосов 10: ↑7 и ↓3+4
Просмотры122
Комментарии 4

Простой метод для извлечения соотношений и фактов из текста

Блог компании MeanoTekРазработка веб-сайтовСемантикаМашинное обучение
Ранее мы писали об анализе отзывов о ресторанах, с целью извлечения упоминаний разных аспектов (еды, обстановки, и подобного). Недавно в комментариях возник вопрос о извлечении из текста фактической информации, т.е. можно ли, например, из отзывов об автомобилях извлечь факты, например «быстро ломается коробка передач» => ломается(коробка передач, быстро), чтобы с этими фактами можно было потом работать. В этой статье мы опишем один из подходов к решению такой проблемы.



Метод, о котором мы расскажем, опирается на ряд упрощений, он не самый точный, но зато легок в реализации и позволяет быстро создать прототип приложения, в котором он должен использоваться. В ряде случаев его будет и вполне достаточно, а для других можно ввести усовершенствования, не отступая от основного принципа.
Читать дальше →
Всего голосов 17: ↑14 и ↓3+11
Просмотры15K
Комментарии 7

Алгоритм извлечения информации в ABBYY Compreno. Часть 1

Блог компании ABBYYПоисковые технологииСемантика
Привет, Хабр!

Меня зовут Илья Булгаков, я программист отдела извлечения информации в ABBYY. В серии из двух постов я расскажу вам наш главный секрет – как работает технология Извлечения Информации в ABBYY Compreno.

Ранее мой коллега Даня Скоринкин DSkorinkin успел рассказать про взгляд на систему со стороны онтоинженера, затронув следующие темы:

В этот раз мы опустимся глубже в недра технологии ABBYY Compreno, поговорим про архитектуру системы в целом, основные принципы ее работы и алгоритм извлечения информации!



Читать дальше →
Всего голосов 44: ↑40 и ↓4+36
Просмотры27K
Комментарии 15

Алгоритм извлечения информации в ABBYY Compreno. Часть 2

Блог компании ABBYYПоисковые технологииСемантика
И снова здравствуйте!

Надеюсь, вас заинтересовал наш вчерашний пост про систему извлечения информации ABBYY Compreno, в котором мы рассказали про архитектуру системы, семантико-синтаксический парсер и его роль и, самое главное, про информационные объекты.

Теперь настало время поговорить о самом интересном – как устроен сам движок извлечения информации.


Читать дальше →
Всего голосов 34: ↑33 и ↓1+32
Просмотры11K
Комментарии 13

Реализация семантического новостного агрегатора с широкими поисковыми возможностями

Поисковые технологииСемантика
Из песочницы
Цель этой статьи — поделиться опытом и идеями реализации проекта, основанного на полном преобразовании текстов в семантическое представление и организации семантического (смыслового) поиска по полученной базе знаний. Речь пойдет об основных принципах функционирования этой системы, используемых технологиях, и проблемах, возникающих при ее реализации.

Зачем это нужно?


В идеале, семантическая система «понимает» содержание обрабатываемых статей в виде системы смысловых понятий и выделяет из них главные («о чем» текст). Это дает огромные возможности по более точной кластеризации, автоматическому реферированию и семантическому поиску, когда система ищет не по словам запроса, а по смыслу, который стоит за этими словами.

Семантический поиск – это не только ответ по смыслу на набранную в поисковой строке фразу, а в целом способ взаимодействия пользователя с системой. Семантическим запросом может быть не только простое понятие или фраза, но и документ — система при этом выдает семантически связанные документы. Профиль интересов пользователя – это тоже семантический запрос и может действовать в «фоновом режиме» параллельно с другими запросами.
Читать дальше →
Всего голосов 14: ↑13 и ↓1+12
Просмотры9.2K
Комментарии 14