Статьи / Закладки / Профиль rabchevsky / Хабр

Как стать автором

Рабчевский Евгений @rabchevsky

Пользователь

Профиль Публикации 1Комментарии 2Закладки 48

yagla 12 авг 2015 в 10:45

Новый аукцион в Яндекс Директ: 3 изменения и как их использовать

7 мин

12K

Блог компании YaglaВеб-аналитика*Интернет-маркетинг*Контекстная реклама*

В конце августа Яндекс Директ переходит на новый тип аукциона VCG. Действующая схема «второй цены» останется в прошлом. Для кого-то это апокалипсис, а для кого-то светлое будущее. В чем суть изменений, что принесут новые правила и как их использовать с максимальной выгодой — читайте в этой статье.

Читать дальше →

+7

frii_fond 9 авг 2015 в 12:07

Идеальная презентация для стартапа: 3 минуты 44 секунды на убеждение инвесторов

7 мин

121K

Блог компании Фонд развития интернет-инициативУчебный процесс в ITФинансы в IT

Перевод

Создание компании — это крайне нелегкий процесс. Привлечение капитала является важным шагом для многих ИТ-стартапов, который, однако, связан с трудностями для тех, кто делает это в первый раз. Учитывая это, мы хотели бы пролить свет на то, что из себя представляет процесс успешного привлечения посевного финансирования.

Читать дальше →

+14

Tsybdenova 27 июл 2015 в 13:12

Насколько ваша команда соответствует принципам agile? Пять вопросов для проверки

5 мин

19K

Блог компании ScrumTrekУправление проектами*Agile*Управление e-commerce*Управление персоналом*

Перевод

Такие гибкие методологии, как Lean Startup и Scrum, помогут вам понять, чего хотят клиенты, и как им поскорее это дать. Сильнейшие Agile-команды следуют пяти основным паттернам. Чтобы понять, соответствуют ли ваши рабочие процессы принципам Agile, проверьте, насколько вы следуете этим паттернам. Чтобы оставаться гибкими, следуйте этим паттернам постоянно.

Читать дальше →

+12

yanemal 24 июл 2015 в 12:23

Как стартапу получить поддержку большой компании — наш путь к дружбе с Mail.Ru Group

5 мин

3K

Блог компании ВирусдайGrowth Hacking*Интернет-маркетинг*

Случается, что вы выводите стартап на рынок, которого еще нет. Люди пока не знают о проблеме, которую вы решаете или не считают её серьезной. Рекламировать продукт в такой обстановке — зря тратить время. Маловероятно, что все вдруг осознают важность проблемы, с которой ваш стартап справляется, наверняка, лучше всех и побегут к вам покупать решение.

Процесс будет постепенным. Со временем образуется понятный рынок, появятся основные игроки, устоятся цены. Но нельзя ждать, пока все сложится само собой. Ведь если даже имея лучшее на сегодня решение сидеть неподвижно — чуда не случится и вы останетесь у обочины нового рынка.

Наступает время занимать стратегическую позицию на будущем рынке. Задача, которую вам придется для этого решить крайне сложна, но предельно понятна. Нужно донести до людей осознание серьезности проблемы, с которой работает ваш стартап. Для этого есть всего два пути: либо потратить миллионы на работу со СМИ, либо попробовать найти поддержку ваших идей в лице известной и авторитетной компании. Давайте смотреть правде в глаза. Маловероятно, что вы сможете привлечь сотни миллионов инвестиций в ваш стартап для глобальной PR-кампании и создания нового рынка. Остается только надежда на партнера, который сможет донести серьезность и значимость решаемой вами проблемы до людей.

Я расскажу, что вы сами можете сделать уже сейчас, чтобы занять выгодную стратегическую позицию на будущем рынке. И покажу это на примере того, как у нас, еще молодого стартапа, получилось создать совместный с Mail.Ru Group сервис по проверке сайтов на вирусы, который сейчас работает с более чем 1 миллионом сайтов. Итак, пора действовать.

Читать дальше

+1

nzhiltsov 22 июл 2015 в 13:24

Text Analytics as Commodity: обзор приложений текстовой аналитики

11 мин

17K

Поисковые технологии*Семантика*Data Mining*Разработка под e-commerce*Блог компании Textocat

text analytics landscape

Если бы мне дали миллиард долларов на научные исследования, я бы создал большую программу в масштабе NASA по обработке естественного языка (NLP).[из Reddit AMA Майкла Джордана, 2015]. Из данной публикации вы узнаете, есть ли рынок для приложений текстовой аналитики. И не слишком ли оптимистичен заслуженный профессор М. Джордан по поводу потенциала NLP, а лучше потратить миллиард долларов на что-то другое.

Введение

Вначале определимся с терминами. Интеллектуальный анализ текста (англ., text mining) — это технологии получения структурированной информации из коллекций текстовых документов. Обычно в это понятие включают такие крупные задачи, как

категоризация текста
извлечение информации
информационный поиск.

Часто, когда говорят о применении интеллектуального анализа текста в бизнесе — текстовой аналитики (англ., text analytics) — имеют в виду не просто структурированную информацию, а т.н. углубленное понимание предмета анализа (insights), которое помогает в принятии бизнес-решений. Известный эксперт Сэт Граймс определяет текстовую аналитику как технологические и бизнес процессы применения алгоритмических подходов к обработке и извлечению информации из текста и получению глубокого понимания.

Принято считать, что формируется новый рынок когнитивно-вычислительных (cognitive computing) продуктов. По оценкам MarketsandMarkets глобальный рынок продуктов на основе обработки естественного языка должен составить $13.4 млрд. к 2020 году при росте в 18.4% по CAGR. Таким образом, сейчас этот рынок оценивается примерно в $5.8 млрд. В последние годы этот растущий рынок ознаменовался целым рядом громких сделок, вроде покупки Alchemy API компанией IBM. По другим оценкам, аналогичный рынок в Европе уже сейчас превосходит пол-миллиарда долларов и удвоится к 2019 году. Рынок Северной Америки составляет почти 40% глобального рынка текстовой аналитики и имеет оптимистичные оценки роста.

Читать дальше →

+6

MagisterLudi 16 июл 2015 в 20:27

Palantir, мафия PayPal, спецслужбы, мировое правительство

8 мин

71K

Информационная безопасность*Big Data*Профессиональная литература*

«Лучший способ избавиться от дракона — это иметь своего собственного»

На Хабре нет ни одного упоминания о Palantir`е, в русской Википедии об этом проекте нет статьи, Mithgol молчит — что-то идет не так. Или так.

А между тем Palantir стала второй крупнейшей частной компанией Кремниевой Долины с оценкой в 20 000 000 000$ (уступив Uber). Среди прочих заслуг Palantir`а — раскрытие крупных китайских разведывательных операций Ghostnet и Shadow Network.

Журналист: — В «Википедии» говорится, что вы входите в управляющий комитет Бильдербергского клуба. Правда ли это, и если да, чем вы там занимаетесь? Организуете тайное мировое господство?

Питер Тиль: — Это правда, хотя все не до такой степени тайно или секретно, чтобы я не мог вам рассказать. Суть в том, что ведется хороший диалог между разными политическими, финансовыми, медиа- и бизнес-лидерами Америки и Западной Европы. Никакого заговора нет. И это проблема нашего общества. Нет секретного плана. У наших лидеров нет секретного плана, как решить все наши проблемы. Возможно, секретные планы – это и плохо, но гораздо возмутительнее, по-моему, отсутствие плана в принципе.

Приходится собирать информацию о Palantir`е по крохам. И такая жирная кроха прячется в книге Питера Тиля «От нуля к единице» (хотя в этой книге множество намеков и информации между строк, так же как в легендарном курсе и его переводе на Хабре, спасибо zag2art).

Питер Тиль: Цель, которую я ставил перед собой, читая стэнфордский курс о стартапах и предпринимательстве, заключалась в том, чтобы донести все те знания о бизнесе, которые я приобрел за последние 15 лет в Кремниевой долине как инвестор и предприниматель, собрать их воедино. С книгой то же самое.

Надеюсь, благодаря этой статье и комментам хабрачитателей, положение дел относительно Palantir`а станет чуточку яснее.
(Есть многомиллиардный рынок, связанный с аналитикой и ИБ, а мы ничего про него не знаем.)

Читать дальше →

+32

alizar 16 июл 2015 в 11:50

Молодому учёному из Краснодара грозит 11 лет строгого режима

2 мин

177K

Энергия и элементы питанияХимия

Фото: Владимир Аносов/РГ

По-настоящему трагическая история произошла с 26-летним кубанским учёным Дмитрием Лопатиным. Он изобрёл гибкие солнечные фотоэлементы новой конструкции с использованием перовскита вместо кремния, которые эффективно работают даже на закате, в облачную погоду и в туман. При этом они в пять раз дешевле в производстве, чем обычные фотоэлементы.

Но в процессе разработки Дмитрий заказал по почте один литр растворителя гамма-бутиролактон, который, как позже выяснилось, является ещё и психотропным веществом.

Читать дальше →

+170

DKey 10 июл 2015 в 16:20

Анализ тональности в социальных медиа на русском языке при помощи RussianSentimentAnalyzer API

2 мин

11K

Семантика*Java*API*

В этом посте я покажу, как воспользоваться API анализа тональности в социальных медиа на русском языке. Одной из отличительных фич системы является возможность определять тональность по отношению к заданному объекту мониторинга. Проиллюстрирую на примере:

Мне нравится телефон X, но телефон Y ужасен.

Читать дальше →

+9

ser0t0nin 2 июл 2015 в 18:09

Иерархическая классификация сайтов на Python

8 мин

27K

Python*Big Data*Машинное обучение*Блог компании DCA (Data-Centric Alliance)

Привет, Хабр! Как упоминалось в прошлой статье, немаловажной частью нашей работы является сегментация пользователей. Как же мы это делаем? Наша система видит пользователей как уникальные идентификаторы cookies, которые им присваиваем мы или наши поставщики данных. Выглядит этот id, например, так:

42bcfae8-2ecc-438f-9e0b-841575de7479

Эти номера выступают ключами в различных таблицах, но первоначальным value является, в первую очередь, URL страниц, на которых данная кука была загружена, поисковые запросы, а также иногда некоторая дополнительная информация, которую даёт поставщик – IP-адрес, timestamp, информация о клиенте и прочее. Эти данные довольно неоднородные, поэтому наибольшую ценность для сегментации представляет именно URL. Создавая новый сегмент, аналитик указывает некоторый список адресов, и если какая-то кука засветится на одной из этих страничек, то она попадает в соответствующий сегмент. Получается, что чуть ли не 90% рабочего времени таких аналитиков уходит на то, чтобы подобрать подходящий набор урлов – в результате кропотливой работы с поисковиками, Yandex.Wordstat и другими инструментами.

Получив таким образом более тысячи сегментов, мы поняли, что этот процесс нужно максимально автоматизировать и упростить, при этом иметь возможность мониторинга качества алгоритмов и предоставить аналитикам удобный интерфейс для работы с новым инструментом. Под катом я расскажу, как мы решаем эти задачи.

Читать дальше →

+36

asash 22 июн 2015 в 15:41

Потоковая обработка данных при помощи Akka

5 мин

39K

Scala*Big Data*Блог компании DCA (Data-Centric Alliance)Hadoop*

Привет, Хабр! Все привыкли ассоциировать обработку больших данных с Hadoop (или Spark), которые реализуют парадигму MapReduce (или его расширения). В этой статье я расскажу о недостатках MapReduce, о том, почему мы приняли решение отказываться от MapReduce, и как мы приспособили Akka + Akka Cluster на замену MapReduce.

Читать дальше →

+41

Tsybdenova 1 июл 2015 в 11:31

Команды и их типология. Как построить самоорганизующуюся команду?

7 мин

23K

Блог компании ScrumTrekAgile*Управление персоналом*

Бизнес, в котором все идет по плану, а сотрудники решают поставленные перед ними задачи и успешно обходят все проблемы без вовлечения руководства – идеал, к которому стремятся многие компании. Сегодня мы поговорим о том, как всего этого можно добиться.

Читать дальше →

+13

dmitry_iv 26 июн 2015 в 14:33

Кейс: Как организовать работу над интернет-проектом в Trello

4 мин

18K

Блог компании Carrot questУправление проектами*Agile*Управление персоналом*

Привет, меня зовут Дима. Хочу поделиться с вами опытом работы над сервисом Carrot Quest (ссылка на описание проекта на Мегамозге). Это сервис для общения и управления пользователями на основе их поведения, другими словами marketing automation.

Долго мы искали для себя удобную форму работы и сколько перепробовали различных инструментов: использовали сервис Asana, работали со Scrum-досками, даже в Google Docs умудрялись записывать задачи. Мы постоянно искали удобную для всей команды методологию.

Читать дальше →

+9

CvetKomm 9 июн 2015 в 14:01

Социальные сети в России, весна 2015. Цифры, тренды, прогнозы

8 мин

7.8K

Блог компании Brand AnalyticsИсследования и прогнозы в IT*

Представляем новые данные исследования цикла «Социальные сети в России сегодня: цифры, тренды, прогнозы», за первое полугодие 2015 г. Шестая регулярная публикация содержит актуальные данные о проникновении социальных медиа по регионам России, демографический анализ аудитории, а также динамику публикационной активности в социальных сетях.

Читать дальше →

+11

ivansychev 2 июн 2015 в 12:01

Минкомсвязи против ответственности за «лайки» и репосты

2 мин

7.9K

Социальные сети и сообщества

Представитель Минкомсвязи РФ в эфире радиостанции «Эхо Москвы» рассказал, что министерство выступает против ответственности за лайки и репосты в социальных сетях. Замминистра отметил, что понятия «репост» и «перепост» прописаны нечётко, и что в некоторых случаях пользователь может дать ссылку на контент, который после этого будет заменен противоправным.

Читать дальше →

+21

frii_fond 28 мая 2015 в 19:00

Психология ценообразования: 10 стратегий и 29 тактик

30 мин

63K

Блог компании Фонд развития интернет-инициативGrowth Hacking*Интернет-маркетинг*

Перевод

Добро пожаловать! Это длинный список стратегий ценообразования, учитывающих психологические факторы.

Неважно, запускаете ли вы новый продукт, продаете что-либо на eBay или же заключаете сделку о продаже дома – вы научитесь устанавливать цены, которые максимизируют вашу прибыль.

Читать дальше →

+26

OzzyTech 23 мая 2015 в 18:05

Сериал: Big Data — как мечта. 9-я серия: Почему IBM был вынужден купить «Алхимиков» за $100млн

4 мин

3.9K

Семантика*Анализ и проектирование систем*Data Mining*Big Data*Блог компании PalitrumLab

В предыдущих сериях: Big Data — это не просто много данных. Big Data — процесс с положительной обратной связью. «Кнопка Обамы» как воплощение rtBD&A. Философия развития Big Data. В этой серии поговорим о лингво-аналитике высокоскоростных потоков неструктурированных текстов и сообщений соцмедиа и представим «Эврику» — наш ответ «Алхимикам».

Интернет, в своем нынешнем восприятии обществом, это связанный набор сообщений: личной переписки в мессенджерах, ссылки между статьями в СМИ, обсуждений в блогах, игровые чаты, тематические сериалы на Хабре, или, как преобразилось в мировоззрении новых поколений — ссылки на ответы поисковика после набора запроса «Чем сегодня заняться?»

Если приглядеться, то основа основ: Связи и Тематики. Про аналитику «связей» говорить не будем (это к АНБ, на чьи возможности по электронной слежке сегодня отказался покушаться даже «всемогущий Сенат США»). А вот Тематическая аналитика (что недавно получило свое название — Brand Analytics — в пресс-релизе между Facebook и DataSift, а в России существует уже 3 года в виде названия проекта) и связанные с ней разнообразные вкусности — прекрасная тема (! :-) ) для новой серии.

Читать дальше →

+1

ivansychev 7 мая 2015 в 11:24

Россия и Китай подпишут соглашение о сотрудничестве в области информационной безопасности

2 мин

4.4K

Законодательство в IT

В ходе визита в Москву председателя КНР Си Цзиньпина 8 мая может быть подписан проект межправительственного соглашения между двумя странами о совместном противодействии киберугрозам. В рамках проекта Россия и Китай не будут атаковать друг друга и будут сотрудничать для противодействия использованию технологий для «вмешательства во внутренние дела государств» и «дестабилизации внутриполитической и социально-экономической обстановки», пишет Коммерсант.

Читать дальше →

+12

marks 8 мая 2015 в 14:15

Соцсеть LinkedIn помогла «засветить» 27000 работников разведслужб США

1 мин

19K

Социальные сети и сообщества

Социальные сети — зло, особенно для людей, которые заняты в разного рода службах разведки. На днях в Сети появился сервис Transparency Toolkit, который, по словам разработчиков, содержит информацию о 27 тысячах работников разведслужб США. При этом базу набирали не благодаря каким-то утечкам информации из этих организаций. Разработчики сервиса просто детально проанализировали базу данных LinkedIn, стараясь выявлять работников разведслужб по разного рода секретным кодовым словам (правда, некоторые из них известны определенным кругам специалистов) и некоторым другим параметрам. Некоторые пользователи LinkedIn открыто публикуют название конторы, на которую они работают.

Читать дальше →

+22

en1gma 2 мая 2015 в 19:56

Компьютеры на базе процессоров Эльбрус-4С стали доступны для покупки юридическими лицами

2 мин

49K

Компьютерное железоПроцессоры

Свершилось, господа: 23 апреля 2015 года ЗАО «МЦСТ» и ПАО «ИНЭУМ им. И.С.Брука» сообщили, что пополняют ассортимент продукции новыми моделями вычислительных комплексов: персональным компьютером АРМ Эльбрус-401 и сервером Эльбрус-4.4, и что на опытные образцы этих систем открыт приём заказов по электронной почте и телефону. Контакты можно узнать на официальном сайте ЗАО «МЦСТ», но заказы принимаются только от юридических лиц.

Читать дальше →

+51

nzhiltsov 5 мая 2015 в 13:46

Извлечение упоминаний сущностей и поиск в Textocat API

9 мин

17K

Поисковые технологии*Семантика*Data Mining*API*Блог компании Textocat

Textocat API — это облачный SaaS анализа текстов. Качественное извлечение полезной информации из текстов — сложная задача и требует серьезной экспертизы. Миссия команды Textocat — сделать процесс обработки текстов настолько легким для использования, чтобы его мог включить в свой арсенал любой современный разработчик. Используя Textocat API, вы можете быстро прототипировать приложения на основе текстовой аналитики и превращать их в свой бизнес. В данной публикации мы покажем, насколько легко интегрировать в любое приложение возможности Textocat API по распознаванию упоминаний сущностей (объектов) и поиску документов на русском языке.

Возможности Textocat API Beta

В начале апреля мы запустили бета-тестирование Textocat API. В этой версии мы предлагаем разработчикам бесплатно использовать часть функционала сервиса со следующими возможностями:

распознавание упоминаний сущностей (entity recognition) в коллекциях документов на русском языке;
хранение обработанных коллекций;
полнотекстовый поиск с учетом выделенных типов сущностей.

пример распознавания упоминаний сущностей

Читать дальше →

+22

1