Как стать автором
Обновить
2
0
Рабчевский Евгений @rabchevsky

Пользователь

Отправить сообщение

Новый аукцион в Яндекс Директ: 3 изменения и как их использовать

Время на прочтение7 мин
Количество просмотров12K


В конце августа Яндекс Директ переходит на новый тип аукциона VCG. Действующая схема «второй цены» останется в прошлом. Для кого-то это апокалипсис, а для кого-то светлое будущее. В чем суть изменений, что принесут новые правила и как их использовать с максимальной выгодой — читайте в этой статье.
Читать дальше →
Всего голосов 9: ↑8 и ↓1+7
Комментарии5

Идеальная презентация для стартапа: 3 минуты 44 секунды на убеждение инвесторов

Время на прочтение7 мин
Количество просмотров121K
Создание компании — это крайне нелегкий процесс. Привлечение капитала является важным шагом для многих ИТ-стартапов, который, однако, связан с трудностями для тех, кто делает это в первый раз. Учитывая это, мы хотели бы пролить свет на то, что из себя представляет процесс успешного привлечения посевного финансирования.

Читать дальше →
Всего голосов 16: ↑15 и ↓1+14
Комментарии1

Насколько ваша команда соответствует принципам agile? Пять вопросов для проверки

Время на прочтение5 мин
Количество просмотров19K


Такие гибкие методологии, как Lean Startup и Scrum, помогут вам понять, чего хотят клиенты, и как им поскорее это дать. Сильнейшие Agile-команды следуют пяти основным паттернам. Чтобы понять, соответствуют ли ваши рабочие процессы принципам Agile, проверьте, насколько вы следуете этим паттернам. Чтобы оставаться гибкими, следуйте этим паттернам постоянно.
Читать дальше →
Всего голосов 12: ↑12 и ↓0+12
Комментарии5

Как стартапу получить поддержку большой компании — наш путь к дружбе с Mail.Ru Group

Время на прочтение5 мин
Количество просмотров3K


Случается, что вы выводите стартап на рынок, которого еще нет. Люди пока не знают о проблеме, которую вы решаете или не считают её серьезной. Рекламировать продукт в такой обстановке — зря тратить время. Маловероятно, что все вдруг осознают важность проблемы, с которой ваш стартап справляется, наверняка, лучше всех и побегут к вам покупать решение.

Процесс будет постепенным. Со временем образуется понятный рынок, появятся основные игроки, устоятся цены. Но нельзя ждать, пока все сложится само собой. Ведь если даже имея лучшее на сегодня решение сидеть неподвижно — чуда не случится и вы останетесь у обочины нового рынка.

Наступает время занимать стратегическую позицию на будущем рынке. Задача, которую вам придется для этого решить крайне сложна, но предельно понятна. Нужно донести до людей осознание серьезности проблемы, с которой работает ваш стартап. Для этого есть всего два пути: либо потратить миллионы на работу со СМИ, либо попробовать найти поддержку ваших идей в лице известной и авторитетной компании. Давайте смотреть правде в глаза. Маловероятно, что вы сможете привлечь сотни миллионов инвестиций в ваш стартап для глобальной PR-кампании и создания нового рынка. Остается только надежда на партнера, который сможет донести серьезность и значимость решаемой вами проблемы до людей.

Я расскажу, что вы сами можете сделать уже сейчас, чтобы занять выгодную стратегическую позицию на будущем рынке. И покажу это на примере того, как у нас, еще молодого стартапа, получилось создать совместный с Mail.Ru Group сервис по проверке сайтов на вирусы, который сейчас работает с более чем 1 миллионом сайтов. Итак, пора действовать.

Читать дальше
Всего голосов 13: ↑7 и ↓6+1
Комментарии2

Text Analytics as Commodity: обзор приложений текстовой аналитики

Время на прочтение11 мин
Количество просмотров17K
text analytics landscapeЕсли бы мне дали миллиард долларов на научные исследования, я бы создал большую программу в масштабе NASA по обработке естественного языка (NLP).[из Reddit AMA Майкла Джордана, 2015]. Из данной публикации вы узнаете, есть ли рынок для приложений текстовой аналитики. И не слишком ли оптимистичен заслуженный профессор М. Джордан по поводу потенциала NLP, а лучше потратить миллиард долларов на что-то другое.

Введение


Вначале определимся с терминами. Интеллектуальный анализ текста (англ., text mining) — это технологии получения структурированной информации из коллекций текстовых документов. Обычно в это понятие включают такие крупные задачи, как
  • категоризация текста
  • извлечение информации
  • информационный поиск.

Часто, когда говорят о применении интеллектуального анализа текста в бизнесе — текстовой аналитики (англ., text analytics) — имеют в виду не просто структурированную информацию, а т.н. углубленное понимание предмета анализа (insights), которое помогает в принятии бизнес-решений. Известный эксперт Сэт Граймс определяет текстовую аналитику как технологические и бизнес процессы применения алгоритмических подходов к обработке и извлечению информации из текста и получению глубокого понимания.

Принято считать, что формируется новый рынок когнитивно-вычислительных (cognitive computing) продуктов. По оценкам MarketsandMarkets глобальный рынок продуктов на основе обработки естественного языка должен составить $13.4 млрд. к 2020 году при росте в 18.4% по CAGR. Таким образом, сейчас этот рынок оценивается примерно в $5.8 млрд. В последние годы этот растущий рынок ознаменовался целым рядом громких сделок, вроде покупки Alchemy API компанией IBM. По другим оценкам, аналогичный рынок в Европе уже сейчас превосходит пол-миллиарда долларов и удвоится к 2019 году. Рынок Северной Америки составляет почти 40% глобального рынка текстовой аналитики и имеет оптимистичные оценки роста.
Читать дальше →
Всего голосов 6: ↑6 и ↓0+6
Комментарии2

Palantir, мафия PayPal, спецслужбы, мировое правительство

Время на прочтение8 мин
Количество просмотров71K
«Лучший способ избавиться от дракона — это иметь своего собственного»



На Хабре нет ни одного упоминания о Palantir`е, в русской Википедии об этом проекте нет статьи, Mithgol молчит — что-то идет не так. Или так.

А между тем Palantir стала второй крупнейшей частной компанией Кремниевой Долины с оценкой в 20 000 000 000$ (уступив Uber). Среди прочих заслуг Palantir`а — раскрытие крупных китайских разведывательных операций Ghostnet и Shadow Network.
Журналист: — В «Википедии» говорится, что вы входите в управляющий комитет Бильдербергского клуба. Правда ли это, и если да, чем вы там занимаетесь? Организуете тайное мировое господство?

Питер Тиль: — Это правда, хотя все не до такой степени тайно или секретно, чтобы я не мог вам рассказать. Суть в том, что ведется хороший диалог между разными политическими, финансовыми, медиа- и бизнес-лидерами Америки и Западной Европы. Никакого заговора нет. И это проблема нашего общества. Нет секретного плана. У наших лидеров нет секретного плана, как решить все наши проблемы. Возможно, секретные планы – это и плохо, но гораздо возмутительнее, по-моему, отсутствие плана в принципе.

Приходится собирать информацию о Palantir`е по крохам. И такая жирная кроха прячется в книге Питера Тиля «От нуля к единице» (хотя в этой книге множество намеков и информации между строк, так же как в легендарном курсе и его переводе на Хабре, спасибо zag2art).

Питер Тиль: Цель, которую я ставил перед собой, читая стэнфордский курс о стартапах и предпринимательстве, заключалась в том, чтобы донести все те знания о бизнесе, которые я приобрел за последние 15 лет в Кремниевой долине как инвестор и предприниматель, собрать их воедино. С книгой то же самое.

Надеюсь, благодаря этой статье и комментам хабрачитателей, положение дел относительно Palantir`а станет чуточку яснее.
(Есть многомиллиардный рынок, связанный с аналитикой и ИБ, а мы ничего про него не знаем.)
Читать дальше →
Всего голосов 56: ↑44 и ↓12+32
Комментарии22

Молодому учёному из Краснодара грозит 11 лет строгого режима

Время на прочтение2 мин
Количество просмотров177K

Фото: Владимир Аносов/РГ

По-настоящему трагическая история произошла с 26-летним кубанским учёным Дмитрием Лопатиным. Он изобрёл гибкие солнечные фотоэлементы новой конструкции с использованием перовскита вместо кремния, которые эффективно работают даже на закате, в облачную погоду и в туман. При этом они в пять раз дешевле в производстве, чем обычные фотоэлементы.

Но в процессе разработки Дмитрий заказал по почте один литр растворителя гамма-бутиролактон, который, как позже выяснилось, является ещё и психотропным веществом.
Читать дальше →
Всего голосов 190: ↑180 и ↓10+170
Комментарии593

Анализ тональности в социальных медиа на русском языке при помощи RussianSentimentAnalyzer API

Время на прочтение2 мин
Количество просмотров11K
В этом посте я покажу, как воспользоваться API анализа тональности в социальных медиа на русском языке. Одной из отличительных фич системы является возможность определять тональность по отношению к заданному объекту мониторинга. Проиллюстрирую на примере:

Мне нравится телефон X, но телефон Y ужасен.

Читать дальше →
Всего голосов 17: ↑13 и ↓4+9
Комментарии18

Иерархическая классификация сайтов на Python

Время на прочтение8 мин
Количество просмотров27K
Привет, Хабр! Как упоминалось в прошлой статье, немаловажной частью нашей работы является сегментация пользователей. Как же мы это делаем? Наша система видит пользователей как уникальные идентификаторы cookies, которые им присваиваем мы или наши поставщики данных. Выглядит этот id, например, так:

42bcfae8-2ecc-438f-9e0b-841575de7479

Эти номера выступают ключами в различных таблицах, но первоначальным value является, в первую очередь, URL страниц, на которых данная кука была загружена, поисковые запросы, а также иногда некоторая дополнительная информация, которую даёт поставщик – IP-адрес, timestamp, информация о клиенте и прочее. Эти данные довольно неоднородные, поэтому наибольшую ценность для сегментации представляет именно URL. Создавая новый сегмент, аналитик указывает некоторый список адресов, и если какая-то кука засветится на одной из этих страничек, то она попадает в соответствующий сегмент. Получается, что чуть ли не 90% рабочего времени таких аналитиков уходит на то, чтобы подобрать подходящий набор урлов – в результате кропотливой работы с поисковиками, Yandex.Wordstat и другими инструментами.
logo
Получив таким образом более тысячи сегментов, мы поняли, что этот процесс нужно максимально автоматизировать и упростить, при этом иметь возможность мониторинга качества алгоритмов и предоставить аналитикам удобный интерфейс для работы с новым инструментом. Под катом я расскажу, как мы решаем эти задачи.
Читать дальше →
Всего голосов 36: ↑36 и ↓0+36
Комментарии18

Потоковая обработка данных при помощи Akka

Время на прочтение5 мин
Количество просмотров39K
Привет, Хабр! Все привыкли ассоциировать обработку больших данных с Hadoop (или Spark), которые реализуют парадигму MapReduce (или его расширения). В этой статье я расскажу о недостатках MapReduce, о том, почему мы приняли решение отказываться от MapReduce, и как мы приспособили Akka + Akka Cluster на замену MapReduce.


Читать дальше →
Всего голосов 47: ↑44 и ↓3+41
Комментарии50

Команды и их типология. Как построить самоорганизующуюся команду?

Время на прочтение7 мин
Количество просмотров23K


Бизнес, в котором все идет по плану, а сотрудники решают поставленные перед ними задачи и успешно обходят все проблемы без вовлечения руководства – идеал, к которому стремятся многие компании. Сегодня мы поговорим о том, как всего этого можно добиться.
Читать дальше →
Всего голосов 15: ↑14 и ↓1+13
Комментарии0

Кейс: Как организовать работу над интернет-проектом в Trello

Время на прочтение4 мин
Количество просмотров18K
image

Привет, меня зовут Дима. Хочу поделиться с вами опытом работы над сервисом Carrot Quest (ссылка на описание проекта на Мегамозге). Это сервис для общения и управления пользователями на основе их поведения, другими словами marketing automation.

Долго мы искали для себя удобную форму работы и сколько перепробовали различных инструментов: использовали сервис Asana, работали со Scrum-досками, даже в Google Docs умудрялись записывать задачи. Мы постоянно искали удобную для всей команды методологию.
Читать дальше →
Всего голосов 19: ↑14 и ↓5+9
Комментарии2

Социальные сети в России, весна 2015. Цифры, тренды, прогнозы

Время на прочтение8 мин
Количество просмотров7.8K
Представляем новые данные исследования цикла «Социальные сети в России сегодня: цифры, тренды, прогнозы», за первое полугодие 2015 г. Шестая регулярная публикация содержит актуальные данные о проникновении социальных медиа по регионам России, демографический анализ аудитории, а также динамику публикационной активности в социальных сетях.
Читать дальше →
Всего голосов 11: ↑11 и ↓0+11
Комментарии1

Минкомсвязи против ответственности за «лайки» и репосты

Время на прочтение2 мин
Количество просмотров7.9K
Представитель Минкомсвязи РФ в эфире радиостанции «Эхо Москвы» рассказал, что министерство выступает против ответственности за лайки и репосты в социальных сетях. Замминистра отметил, что понятия «репост» и «перепост» прописаны нечётко, и что в некоторых случаях пользователь может дать ссылку на контент, который после этого будет заменен противоправным.
Читать дальше →
Всего голосов 23: ↑22 и ↓1+21
Комментарии3

Психология ценообразования: 10 стратегий и 29 тактик

Время на прочтение30 мин
Количество просмотров63K


Добро пожаловать! Это длинный список стратегий ценообразования, учитывающих психологические факторы.

Неважно, запускаете ли вы новый продукт, продаете что-либо на eBay или же заключаете сделку о продаже дома – вы научитесь устанавливать цены, которые максимизируют вашу прибыль.
Читать дальше →
Всего голосов 30: ↑28 и ↓2+26
Комментарии5

Сериал: Big Data — как мечта. 9-я серия: Почему IBM был вынужден купить «Алхимиков» за $100млн

Время на прочтение4 мин
Количество просмотров3.9K
В предыдущих сериях: Big Data — это не просто много данных. Big Data — процесс с положительной обратной связью. «Кнопка Обамы» как воплощение rtBD&A. Философия развития Big Data. В этой серии поговорим о лингво-аналитике высокоскоростных потоков неструктурированных текстов и сообщений соцмедиа и представим «Эврику» — наш ответ «Алхимикам».

Интернет, в своем нынешнем восприятии обществом, это связанный набор сообщений: личной переписки в мессенджерах, ссылки между статьями в СМИ, обсуждений в блогах, игровые чаты, тематические сериалы на Хабре, или, как преобразилось в мировоззрении новых поколений — ссылки на ответы поисковика после набора запроса «Чем сегодня заняться?»

Если приглядеться, то основа основ: Связи и Тематики. Про аналитику «связей» говорить не будем (это к АНБ, на чьи возможности по электронной слежке сегодня отказался покушаться даже «всемогущий Сенат США»). А вот Тематическая аналитика (что недавно получило свое название — Brand Analytics — в пресс-релизе между Facebook и DataSift, а в России существует уже 3 года в виде названия проекта) и связанные с ней разнообразные вкусности — прекрасная тема (! :-) ) для новой серии.
Читать дальше →
Всего голосов 11: ↑6 и ↓5+1
Комментарии0

Россия и Китай подпишут соглашение о сотрудничестве в области информационной безопасности

Время на прочтение2 мин
Количество просмотров4.4K
В ходе визита в Москву председателя КНР Си Цзиньпина 8 мая может быть подписан проект межправительственного соглашения между двумя странами о совместном противодействии киберугрозам. В рамках проекта Россия и Китай не будут атаковать друг друга и будут сотрудничать для противодействия использованию технологий для «вмешательства во внутренние дела государств» и «дестабилизации внутриполитической и социально-экономической обстановки», пишет Коммерсант.
Читать дальше →
Всего голосов 14: ↑13 и ↓1+12
Комментарии5

Соцсеть LinkedIn помогла «засветить» 27000 работников разведслужб США

Время на прочтение1 мин
Количество просмотров19K


Социальные сети — зло, особенно для людей, которые заняты в разного рода службах разведки. На днях в Сети появился сервис Transparency Toolkit, который, по словам разработчиков, содержит информацию о 27 тысячах работников разведслужб США. При этом базу набирали не благодаря каким-то утечкам информации из этих организаций. Разработчики сервиса просто детально проанализировали базу данных LinkedIn, стараясь выявлять работников разведслужб по разного рода секретным кодовым словам (правда, некоторые из них известны определенным кругам специалистов) и некоторым другим параметрам. Некоторые пользователи LinkedIn открыто публикуют название конторы, на которую они работают.
Читать дальше →
Всего голосов 28: ↑25 и ↓3+22
Комментарии8

Компьютеры на базе процессоров Эльбрус-4С стали доступны для покупки юридическими лицами

Время на прочтение2 мин
Количество просмотров49K
image
Свершилось, господа: 23 апреля 2015 года ЗАО «МЦСТ» и ПАО «ИНЭУМ им. И.С.Брука» сообщили, что пополняют ассортимент продукции новыми моделями вычислительных комплексов: персональным компьютером АРМ Эльбрус-401 и сервером Эльбрус-4.4, и что на опытные образцы этих систем открыт приём заказов по электронной почте и телефону. Контакты можно узнать на официальном сайте ЗАО «МЦСТ», но заказы принимаются только от юридических лиц.
Читать дальше →
Всего голосов 65: ↑58 и ↓7+51
Комментарии273

Извлечение упоминаний сущностей и поиск в Textocat API

Время на прочтение9 мин
Количество просмотров17K
Textocat API — это облачный SaaS анализа текстов. Качественное извлечение полезной информации из текстов — сложная задача и требует серьезной экспертизы. Миссия команды Textocat — сделать процесс обработки текстов настолько легким для использования, чтобы его мог включить в свой арсенал любой современный разработчик. Используя Textocat API, вы можете быстро прототипировать приложения на основе текстовой аналитики и превращать их в свой бизнес. В данной публикации мы покажем, насколько легко интегрировать в любое приложение возможности Textocat API по распознаванию упоминаний сущностей (объектов) и поиску документов на русском языке.

Возможности Textocat API Beta


В начале апреля мы запустили бета-тестирование Textocat API. В этой версии мы предлагаем разработчикам бесплатно использовать часть функционала сервиса со следующими возможностями:
  • распознавание упоминаний сущностей (entity recognition) в коллекциях документов на русском языке;
  • хранение обработанных коллекций;
  • полнотекстовый поиск с учетом выделенных типов сущностей.


пример распознавания упоминаний сущностей

Читать дальше →
Всего голосов 24: ↑23 и ↓1+22
Комментарии66

Информация

В рейтинге
Не участвует
Откуда
Пермь, Пермский край, Россия
Дата рождения
Зарегистрирован
Активность