Pull to refresh

Comments 11

Не таким уж и господствующим в поиске работы стал LinkedIn, скорее у него своя ниша, у классических сервисов поиска работы своя.
Автор оригинального материала, конечно, имел в виду ситуацию на Западе. Там LinkedIn стал очень серьезным инструментом, это факт
Всё это романтизм, который разбивается о реальность — которая заключается в том что для анализа данных из разных источников нужна инфраструктура. Разработка этой инфраструктуры очень дорогая. Позволить её себе могут только очень богатые компании. Говорю, как человек, работающий в фирме которая решают эту задачу для одного клиента. Это очень дорого для рядового среднего бизнеса.
Не знаю кто заминусовал, я поддержу Вас. Разработка и поддержка Big Data решений действительно недешевая. С другой стороны, какие-то типовые алгоритмы уже есть, реализовать их толковый программист может за пару дней. Ну а дальше — Amazon EMR и что-нибудь типа MRJob, выходит не так уж дорого, если данных конечно сотня терабайт, а не петабайт.

Самое главное — это экономический эффект, если потратить $2000 но сэкономить $4000, то решение оправданно.
Позволю себе не согласиться. Насколько мне известно, со слов участника (Виктора Булгакова), в Билайне, обработка LBS для терминалов начиналось без финансирования. Чтобы собрать hadoop прошлись по офису и взяли старые компьютеры. Когда показали результаты, тогда и начались инвестиции.

Современные технологии позволяют обрабатывать сотни миллионов записей в памяти без мучительного построения OLAP, количество и тип источников не ограничены. (При этом однопользовательская лицензия на сию технологию бесплатна:).
Речь не про мощности вычислений и не про обьёмы данных, а про количество кода который нужно написать и поддерживать.
И речь не про гиганты типа Билайн с айти-бюджетами и штатом программистов.

Поймите, что упомянутые в статье Авиакомпании — нищие, медецинские компании- маленькие и нищие.
Банки, телеком, компании с большим айти бюджетом и персоналом — да, увеличат свои продажи. А революции которая изменит повседневную жизнь людей мелкий и средний бизнес — не произойдет.
За авиакомпании сказать не могу,
но мелкие фармкомпании (Фармстандарт, российский Новартис, Кьези и т.п.) позволяют себе использовать системы анализа данных при минимальных (если не сказать нулевых) бюджетах. Аналоговые люди (люди с медицинским или гуманитарным образованием) получают результаты обрабатывая цифровые данные, практически не привлекая программистов. Да, с математической точки зрения, результаты могут быть не бесспорны, но это работает, и в конечном счете спасает чью-то жизнь.

Желающий — ищет возможность, равнодушный — причины (С) С.П.Королев.
Анализировать действительно не так уж и дорого. Дорого интегрировать данные из разных источников.
Хотели бы поинтересоваться у хабрапользователей, приходилось ли вам использовать Hadoop или другие технологии

Помогаю Жене в автоматизации заказов товаров в Аптеке на основании статистики продаж и анализе объединенного прайс листа.
Назвать данные в двести-триста МБайт – BigData, язык не поворачивается. Да и откуда могут появится кластерные решения, если в качестве единственного сервера используется desktop компьютер с 4Гб памяти? :)
Используя технологии лингвистики, математической статистики, программа, анализируя внутренние (статистика продаж) и внешние (объединенный прайс лист от нескольких поставщиков) данные, успешно делает прогноз и заказ товаров.

Для прогноза товаров, для которых статистика превышает больше года (аптеке только-только исполнился год) нужно учитывать сезонные компоненты. Для определения периода сезонного колебания начал изучение спектрального анализа. К сожалению, в этом направлении пока не достиг желаемого успеха (или данные слишком зашумлены, или не хватает данных – нужно минимум два года). Полученная коррелограмма с помощью БПФ содержит какие-то не корректные данные. Буду очень признателен, если поможете разобраться.
Спасибо за вопрос,
к сожалению ответить на него у нас не получится. Т.к. мы скорее специализируемся на способе предоставления необходимой инфраструктуры, чем на анализе полученных данных. Мы задавали свой вопрос с целью узнать, какая инфраструктура (например, серверы с предустановленным hadoop) может быть востребована для решения подобных задач
Sign up to leave a comment.