Pull to refresh
2
0
Send message

Логисторная логика

Reading time4 min
Views6.8K

Логисторная логика это набор концепций, применение которых может позволить ускорить вычисления, сократить затраты энергии на вычисления и увеличить плотность транзисторов на кристалле без существенного изменения техпроцесса. Она находится в разработке и статья ниже является лишь первичным результатом. Мы надеемся что она вызовет интерес в научных кругах и среди энтузиастов и разработка будет продолжена.

Читать далее
Total votes 35: ↑34 and ↓1+33
Comments17

Сократить время вычислений от нескольких лет до минут. Разбираемся с квантовым машинным обучением

Reading time9 min
Views10K
Я давно интересуюсь квантовыми вычислениями и пишу программы для 5- и 14-кубитных квантовых компьютеров IBM Q Experience. Сегодня я расскажу о технологиях, которые можно будет применять в машинном обучении после того, как квантовые вычисления завоюют мир. Спойлер для дата сайентистов: в будущем у вас не получится запустить модель и уйти пить кофе на полдня. Квантовый компьютер щелкает задачи машинного обучения на раз, и отговорки вроде “модель обучается” уже не пройдут. Придется запускать не одну модель, а по меньшей мере миллион.

image
Читать дальше →
Total votes 34: ↑24 and ↓10+14
Comments48

Обнаружение пересекающихся сообществ в Instagram для определения интересов пользователей

Reading time8 min
Views17K
Сколько может рассказать о человеке профиль в соцсети? Фотографии, посты, комментарии, подписки – непаханное поле для анализа. Сегодня поговорим о том, как мы определяем интересы пользователей на основе их подписок в сети Instagram.

image
Источник
Читать дальше →
Total votes 19: ↑19 and ↓0+19
Comments11

Как мы собирали данные по рекламным кампаниям с интернет-площадок (тернистый путь к продукту)

Reading time12 min
Views5.6K
Кажется, что сфера интернет-рекламы должна быть максимально технологичной и автоматизированной. Ещё бы, ведь там работают такие гиганты и эксперты в своём деле, как Яндекс, Mail.Ru, Google и Facebook. Но, как оказалось, нет предела совершенству и всегда есть что автоматизировать.

image
Источник

Коммуникационная группа Dentsu Aegis Network Russia — крупнейший игрок на рекламном digital рынке и активно инвестирует в технологии, пытаясь в оптимизировать и автоматизировать свои бизнес-процессы. Одной из нерешенных задач рынка интернет-рекламы стала задача сбора статистики по рекламным кампаниям с разных интернет-площадок. Решение этой задачи в итоге вылилось в создание продукта D1.Digital (читать как ДиВан), о разработке которого мы и хотим рассказать.
Читать дальше →
Total votes 15: ↑15 and ↓0+15
Comments3

Большие данные — большая ответственность, большой стресс и большие деньги

Reading time7 min
Views17K
image

Термин Big Data подпорчен современным фантастическим преувеличением новых вещей. Как ИИ поработит людей, а блокчейн построит идеальную экономику — так и большие данные позволят знать абсолютно все про всех и видеть будущее.

Но реальность, как всегда, скучнее и прагматичнее. В больших данных нет никакой магии — как нет ее нигде — просто информации и связей между разными данными становится так много, что обрабатывать и анализировать все старыми способами становится слишком долго.

Появляются новые методы. Вместе с ними — новые профессии. Декан факультета аналитики Big Data в GeekBrains Сергей Ширкин рассказал, что это за профессии, где они нужны, чем там надо заниматься и что надо уметь. Какие используются инструменты и сколько обычно платят специалистам.
Читать дальше →
Total votes 35: ↑29 and ↓6+23
Comments5

Фриланс или офис? Ответ фрилансера

Reading time11 min
Views29K
Привет, я фрилансер по жизни. Меня часто спрашивают, почему я не реализовываю себя в офисе компании. Говорят, что удаленная работа в фирме — это некая золотая середина.



Сейчас я постараюсь ответить на все вопросы разом в виде некоего сравнения труда в офисе или как фрилансер. Ну что, вперед!
Total votes 36: ↑29 and ↓7+22
Comments117

Семинары IBM: весна-лето 2019 — искусственный интеллект, разработка в облаке, чат-боты, блокчейн и прочие технологии

Reading time4 min
Views3K


Привет, Хабр! В апреле-июне этого года в нашем клиентском центре (Москва, Пресненская набережная, 10) мы проводим очередную серию семинаров по облачным сервисам IBM. Приглашаем всех заинтересованных разработчиков! Участие в семинарах абсолютно бесплатное, а кофе-чай-пирожные — за наш счет. ) По окончании семинара каждый его участник получит сертификат от IBM. Количество мест ограничено.

Для тех, кто посетил наши семинары в прошлом году, мы подготовили обновленную программу, скорректированную в соответствии с вашими пожеланиями. Темы семинаров: разработка в облаке, чат-боты, блокчейн, частные облака, машинное обучение и анализ данных в облаке. Посетив наши семинары, вы сможете быстро реализовать свои инновационные идеи в виде сервисов и/или приложений из облака IBM, используя современные технологии, сократить time-to-market, создавать PoC для ваших заказчиков, или вывести вашу идею на международный рынок!

Тем, кто заинтересовался — смотрим далее.
Читать дальше →
Total votes 20: ↑20 and ↓0+20
Comments3

Бинарные модули для Python

Reading time17 min
Views15K
Python — классный. Мы говорим «pip install» и скорее всего нужная библиотека поставится. Но иногда ответ будет: «compilation failed», потому что есть бинарные модули. Они практически у всех современных языков страдают какой-нибудь болью, потому что архитектур много, что-то нужно собирать под конкретную машину, что-то нужно линковать с другими библиотеками. В целом интересный, но малоизученные вопрос: а как же их делать и какие там проблемы? На этот вопрос постарался ответить Дмитрий Жильцов (zaabjuda) на MoscowPython Conf в прошлом году.


Под катом текстовая версия доклада Дмитрия. Ненадолго остановимся на том, когда бинарные модули нужны, а когда от них лучше отказаться. Обсудим правила, которые стоит соблюдать при их написании. Рассмотрим пять возможных вариантов реализации:

  • Native C/C++ Extension
  • SWIG
  • Cython
  • Ctypes
  • Rust

О спикере: Дмитрий Жильцов занимается разработкой больше 10 лет. Работает в компании ЦИАН системным архитектором, то есть несет ответственность за технические решения и контроль сроков. В своей жизни успел попробовать и ассемблер, Haskell, C, а последние 5 лет активно программирует на Python.
Total votes 51: ↑48 and ↓3+45
Comments15

Оптимистичный взгляд на автоматизацию и будущее рабочих мест

Reading time4 min
Views16K
imageЗахватывают ли мир роботы и технологии, переводя людей в низший класс? Прежде чем напрягаться по этому поводу, вспомните, что обычно это происходит в результате автоматизации. Автоматизация действительно устраняет некоторые рабочие места, но может быть, это не так уж и плохо. Пока мы думаем, что мы будем делать с большей свободой, предоставляемой нам цифровыми вмешательствами в жизнь, рассмотрим уроки истории ранней автоматизации.

Если верить Илону Маску и его товарищам, то скорее рано, чем поздно, роботы заменят вас. Маск и другие считают, что скоро нас ждёт универсальный базовый доход (УБД). Правительство будет снабжать неработающих людей средствами, достаточными, чтобы не работать. Почему? Согласно высказыванию Винни Мирчандани [Vinnie Mirchandani] в статье «Медленная автоматизация»:
На выставке Gartner Symposium/ITxpo 2014 года Гартнер предсказал, что к 2025 году каждое третье рабочее место будет отдано ПО, роботам и умным машинам.

Читать дальше →
Total votes 16: ↑13 and ↓3+10
Comments65

Методические заметки об отборе информативных признаков (feature selection)

Reading time39 min
Views22K
Всем привет!

Меня зовут Алексей Бурнаков. Я Data Scientist в компании Align Technology. В этом материале я расскажу вам о подходах к feature selection, которые мы практикуем в ходе экспериментов по анализу данных.

В нашей компании статистики и инженеры machine learning анализируют большие объемы клинической информации, связанные с лечением пациентов. В двух словах смысл этой статьи можно свести к извлечению ценных крупиц знания, содержащихся в небольшой доле доступных нам зашумленных и избыточных гигабайтов данных.

Данная статья предназначена для статистиков, инженеров машинного обучения и специалистов, которые интересуются вопросами обнаружения зависимостей в наборах данных. Также материал, изложенный в статье, может быть интересен широкому кругу читателей, неравнодушных к data mining. В материале не будут затронуты вопросы feature engineering и, в частности, применения таких методов как анализ главных компонент.

image
Источник.

Читать дальше →
Total votes 20: ↑19 and ↓1+18
Comments6

AI 101: введение в автоматизацию и искусственный интеллект в аутсорсинге

Reading time6 min
Views7K
image

Традиционное понимание аутсорсинга стремится к восприятию снижения себестоимости как одного из основных факторов для любого клиента. Мысль о том, что «общая стоимость владения» каким-либо бизнесом на протяжении всего срока договора аутсорсинга должна снижаться, очень часто выступает в качестве экономического обоснования. Аналогичным образом, восприятие аутсорсинга как способа преобразования активов на балансе в абонентскую плату за услуги и снижение (или, по крайней мере, кажущееся снижение) капитальных затрат является еще одним распространенным сдерживающим фактором в начале сделки. В то время как сделки с технологической трансформацией / изменениями в бизнесе совершаются, когда цель заключается в обновлении сервисов с увеличением общей стоимости, они не так распространены, как сделки, учитывающие стоимость.
Читать дальше →
Total votes 13: ↑12 and ↓1+11
Comments1

Титаник на Kaggle: вы не дочитаете этот пост до конца

Reading time31 min
Views81K
Привет, хабр!

#{Data Science для новичков}

Меня зовут Глеб Морозов, мы с Вами уже знакомы по предыдущим статьям. По многочисленным просьбам продолжаю описывать опыт своего участия в образовательных проектах MLClass.ru (кстати, кто еще не успел — до конца еще можно получить материалы прошедших курсов — это, наверное, самый краткий и максимально практичный курс по анализу данных, который можно себе представить).

Данная работа описывает мою попытку создать модель для предсказания выживших пассажиров «Титаника». Основная задача — тренировка в использовании инструментов применяемых в Data Science для анализа данных и презентации результатов исследования, поэтому данная статья будет очень и очень длинной. Основное внимание уделено исследовательскому анализу (exploratory research) и работе по созданию и выбору предикторов (feature engineering). Модель создаётся в рамках соревнования Titanic: Machine Learning from Disaster проходящего на сайте Kaggle. В своей работе я буду использовать язык «R».
Читать дальше →
Total votes 42: ↑35 and ↓7+28
Comments5

Пример сегментации изображений средствами PHP

Reading time4 min
Views11K
Добрый день,
довольно редко, но все же встает вопрос о необходимости в автоматическом режиме делить изображение на логические фрагменты. Если вы ограничены только средствами PHP, то задача становится немного трудней, но все же решаема.
В данной статье я рассмотрю частный случай распознавания образов, ориентированный на не слишком изощренную публику.
В статье используются примеры с одного из сайтов с явным указанием ссылки, сайт не мой, изначально не было мыслей писать статью.
Читать дальше →
Total votes 41: ↑38 and ↓3+35
Comments3

Пример векторной реализации нейронной сети с помощью Python

Reading time14 min
Views49K
В статье речь пойдет о построение нейронных сетей (с регуляризацией) с вычислениями преимущественно векторным способом на Python. Статья приближена к материалам курса Machine learning by Andrew Ng для более быстрого восприятия, но если вы курс не проходили ничего страшного, ничего специфичного не предвидится. Если вы всегда хотели построить свою нейронную сеть с преферансом и барышням векторами и регуляризацией, но что то вас удерживало, то сейчас самое время.

Данная статья нацелена на практическую реализацию нейронных сетей, и предполагается что читатель знаком с теорией (поэтому она будет опущена).
Читать дальше →
Total votes 46: ↑43 and ↓3+40
Comments4

Активные пользователи ВКонтакте и Twitter: рейтинг российских регионов

Reading time4 min
Views14K
Как и обещали, публикуем данные по региональной активности пользователей Twitter и Вконтакте. В отличие от опросов общественного мнения, данное исследование позволяет проследить не декларативное поведение пользователей социальных сетей, а выделить ядро активных пользователей, формирующих информационный поток в сети. Больше всего пользователей, публикующих записи в социальных сетях ВКонтакте и Twitter, в Санкт-Петербурге и Москве.
Читать дальше →
Total votes 16: ↑10 and ↓6+4
Comments30

Очередное «Все пропало» или «Эпоха аналитики соцмедиа закончилась». Реально?

Reading time5 min
Views4.6K
Когда человечество приближается к очередной ступеньке роста, сразу появляются люди, предвещающие очередной Апокалипсис и «Все пропало!». Индустрия социальных медиа, составные части которой — аналитика, лингвистика и неструктурированные BigData — также уже несколько раз упиралась в стены, но снова и снова разбивала кокон ограниченного восприятия и перелетала бабочкой к новым высотам.

Из наглядных проблем-решений можно вспомнить:
— «Сбор таких мощных потоков невозможен» — появились новые команды с новыми походами и реализовали Topsy, gnip, SDS;
— «Аналитика неструктурированных объемных разноязычных данных на лету невозможна» — Autonomy, Radian6, Brand Analytics отпровергли невозможность;
— «Лингвистика никогда не справится с такими скоростями» — на смену старым медленным алгоритмам пришли AlchemyApi, EurekaEngine

Высота очередной новой стены поднялась на новый, уже нетехнологический (здесь, фактически, объем человечества «закончился» раньше), а на социумный уровень - «Данных станет мало и все пропадет!» — этому посылу как раз и посвящена статья.

У нас есть (свой) ответ на очередную пугалку, но перед его публикацией возможно кто-то из коллег выскажет свое мнение? — welcome!


Читать дальше →
Total votes 6: ↑6 and ↓0+6
Comments0

Я не знаю ООП

Reading time12 min
Views547K
Я не умею программировать на объектно-ориентированных языках. Не научился. После 5 лет промышленного программирования на Java я всё ещё не знаю, как создать хорошую систему в объектно-ориентированном стиле. Просто не понимаю.

Я пытался научиться, честно. Я изучал паттерны, читал код open source проектов, пытался строить в голове стройные концепции, но так и не понял принципы создания качественных объектно-ориентированных программ. Возможно кто-то другой их понял, но не я.

И вот несколько вещей, которые вызывают у меня непонимание.
Читать дальше →
Total votes 412: ↑309 and ↓103+206
Comments870

Поиск похожих групп и пабликов Вконтакте

Reading time5 min
Views56K
На днях удалось провернуть интересную штуку. Для всех групп Вконтакте с числом подписчиков от 5000 до 10 000 (~100 000 групп) был построен полный граф, в котором веса рёбер равнялись пересечению аудиторий групп.


Читать дальше →
Total votes 32: ↑29 and ↓3+26
Comments34

Анализ звонков в колл-центры

Reading time3 min
Views7K
Для проверки технологии я записал несколько обращений в разные колл-центры. Дальше они будут фигурировать под кодовыми названиями: water, mosenergo, rigla, transaero и worldclass.


Первым делом нужно разбить запись на реплики...
Total votes 7: ↑4 and ↓3+1
Comments2

Анализ резюме с HeadHunter. Кто сколько зарабатывает и в каких отраслях работает

Reading time11 min
Views98K
Недавно, на хакатоне от Petamelon нам в руки попал датасет с ~6 000 000 резюме с НН. Там, естественно, не было никаких персональных данных и контактов, но было много других интересных вещей: ожидаемая зарплата, возраст, пол, примерный адрес, образование и индустрии, в которых человек ищет работу. Было решено попробовать использовать эти данные в нашем проекте про выбор школ. Идея заключалась в том, чтобы определить в каких индустриях работают выпускники школ и сколько примерно зарабатывают. Но я, конечно, не удержался и построил кучу других бесполезных, но прикольных таблиц и графиков.

Распределение резюме по возрасту имеет интересную форму и как будто разделено на две части: до окончания института и после:


В Москве с возрастом ожидаемая зарплата выходит на плато в ~50 000 рублей:

Читать дальше →
Total votes 119: ↑106 and ↓13+93
Comments66
1
23 ...

Information

Rating
Does not participate
Registered
Activity