Как стать автором
Обновить
99.11

Data Mining *

Глубинный анализ данных

Сначала показывать
Порог рейтинга

Хакеры слили базу сторонников Алексея Навального, выразивших согласие выйти на митинг

Время на прочтение2 мин
Количество просмотров62K

Хакерам удалось получить доступ к базе данных сторонников Алексея Навального, зарегистрировавшихся на сайте free.navalny.com. Соответствующая новость была опубликована в одном из Telegram-каналов.

В общий доступ выложена база с почтами почти 530 тысяч пользователей, зарегистрировавшихся с 23 марта по 1 апреля. Также в базе указано время регистрации и время подтверждения соответствующей почты.

Читать далее
Всего голосов 139: ↑131 и ↓8+123
Комментарии0

Скоро ещё и рестораны на нас стучать начнут

Время на прочтение2 мин
Количество просмотров1
Ну что, гос­по­да па­ра­но­и­ки, у ме­ня для вас пло­хие но­вос­ти.

Раз­ра­бо­та­на сис­те­ма, ана­ли­зи­ру­ю­щая, как че­ло­век жу­ёт. Ока­зы­ва­ет­ся, на ос­но­ве ви­део чав­ка­ния мож­но ди­аг­нос­ти­ро­вать про­бле­мы со здо­ровь­ем, при­чём не толь­ко зуб­ную боль, но и сер­деч­но-со­су­ди­с­тые за­бо­ле­ва­ния, по­тен­ци­аль­ное ожи­ре­ние, при­чём ещё в дет­ском воз­рас­те, бо­лез­ни глаз, нев­ро­ло­ги­чес­кие про­бле­мы и за­бо­ле­ва­ния ды­ха­тель­ных пу­тей. Не спра­ши­вай­те, как, я не знаю, я все­го лишь бе­се­до­вал с раз­ра­бот­чи­ком (не­кто Аль-Шбуль, иор­дан­ский уни­вер­си­тет на­уки и тех­но­ло­гии).

Рейтинг0
Комментарии0

Data-driven митап

Время на прочтение1 мин
Количество просмотров1.2K

X5 выходит на тропу митапов. 2 апреля приходите на онлайн #meetupХ5 по data-driven подходу в наших проектах. Обещаем – все только самое интересное и эксклюзивное от самых главных спецов Big Data X5. С соблюдением дистанции, но с широким виртуальным охватом спикеры Х5 не только поговорят о последних разработках Х5, но и ответят на ваши вопросы.

Читать далее
Всего голосов 4: ↑3 и ↓1+2
Комментарии0

«Большие данные: не хайп, а индустрия». Митап 1 марта

Время на прочтение1 мин
Количество просмотров1.2K


Приглашаем на митап «Большие данные: не хайп, а индустрия» в понедельник 1 марта. Спикеры из ITSumma и Слёрма представят доклады о Big Data, ответят на вопросы участников. Будем говорить о том, как получать и обрабатывать большие данные, какие выгоды и инсайты сможет получить бизнес при правильной работе с данными и какая обработка данных принесёт вред компании.

Читать дальше →
Всего голосов 8: ↑8 и ↓0+8
Комментарии0

Истории

Telegram объявил два новых конкурса для разработчиков

Время на прочтение2 мин
Количество просмотров11K
Telegram объявил два новых конкурса: Data Clustering Contest 2021 с призовым фондом $50 тыс. и Android Contest 2021 с призовым фондом $60 тыс.

В рамках конкурса на кластеризацию данных участникам предлагается создать библиотеку на C/C++ для определения языка и тематики каналов.
Читать дальше →
Всего голосов 20: ↑19 и ↓1+18
Комментарии24

Во время пандемии COVID-19 в онлайн-магазинах снизились оценки ароматических свечей

Время на прочтение2 мин
Количество просмотров3.7K

Сравнение средней оценки ароматических свечей (выделено цветом) и свечей без запаха на Amazon.com. Пунктирная вертикальная линия показывает первый выявленный случай COVID-19 на территории США. График Washington Post.

Основной нейрологический симптом новой коронавирусной инфекции — это аносмия. Исследования показывают, что потеря обоняния предсказывает заболевание лучше, чем другие известные симптомы, к примеру, кашель или повышенная температура тела. Как и всё связанное с заболеванием, механизм, который заставляет терять способность различать запахи, исследован лишь частично. Но уже известно, что коронавирусная инфекция в большинстве случаев затрагивает не нейроны обоняния, а вспомогательные клетки, поэтому поражение не долгосрочное. Это могут подтвердить и сами переболевшие, которые постепенно вновь начинают чувствовать запахи.
Читать дальше →
Всего голосов 4: ↑4 и ↓0+4
Комментарии3

«Вымпелком» выполнит дата-майнинг своих абонентов по заказу любого клиента

Время на прочтение2 мин
Количество просмотров7.8K
«Вымпелком» запустил новый сервис, который позволяет компаниям получить демографические данные своих клиентов: возраст, доходы, интересы и многое другое. Это возможно путём дата-майнинга по базам, которые собирает «Вымпелком».

Соответствующую услугу предоставляет компания «Билайн бизнес», подразделение «Вымплекома». Сейчас сервис экспресс-аналитики Big Data в демонстрационных целях открыт бесплатно.
Читать дальше →
Всего голосов 15: ↑15 и ↓0+15
Комментарии51

Принят закон об электронных досье на жителей России

Время на прочтение7 мин
Количество просмотров22K

Центр обработки данных № 1 ФНС (Городец)

Госдума приняла в третьем чтении законопроект № 759897-7 «О едином федеральном информационном регистре, содержащем сведения о населении Российской Федерации». Каждому гражданину присвоят уникальный неизменяемый номер, а всю информацию сконцентрируют в одной базе: так удобнее, считает правительство.

Федеральный закон «устанавливает правовые основы формирования и ведения единого Регистра, в том числе сбора, обработки, хранения, получения, использования и защиты указанных сведений, а также гармонизации государственных и муниципальных информационных ресурсов, содержащих сведения о населении Российской Федерации».

В связи с постоянными и массовыми утечками персональных данных из разных государственных БД создание единого реестра позволяет уверенно предположить, что количество таких утечек уменьшится — ведь информация теперь будет сконцентрирована в одном месте и достаточно будет одной утечки. В общую базу сведут примерно 30 показателей из 12 ведомств (среди них ЗАГСы, МВД, Пенсионный фонд и другие).
Читать дальше →
Всего голосов 28: ↑25 и ↓3+22
Комментарии113

Поисковик Google по датасетам вышел из беты

Время на прочтение3 мин
Количество просмотров12K


Для машинного обучения и научных исследований требуется много данных. В помощь разработчикам и исследователям, Наташа Ной с коллегами из исследовательского подразделения Google Research в сентябре 2018 года выпустили специализированную поисковую систему Dataset Search. 23 января 2020 года поисковик вышел из беты, с новыми инструментами для лучшей фильтрации поиска и доступом почти к 25 миллионам наборов данных.

Датасеты публикуют в открытом доступе многие учреждения: университеты, государственные организации и лаборатории. Но зачастую их трудно найти с помощью традиционного поиска. Поисковик Dataset Search обрабатывает теги метаданных в формате Schema, тут наборы данных самой разной тематики: от лыжных травм до популяции пингвинов.
Читать дальше →
Всего голосов 30: ↑29 и ↓1+28
Комментарии1

Российский квантовый центр и Nissan планируют исследовать химические соединения для аккумуляторов нового поколения

Время на прочтение1 мин
Количество просмотров881
Проект по квантовому машинному обучению Российского квантового центра (РКЦ) совместно с Nissan начал изучение вопроса о применении квантовых вычислений для моделирования химических соединений. Об этом пишут «Ведомости».

Условия партнёрства коммерческие, сумма сделки не раскрывается. В сотрудничестве с РКЦ Nissan планирует создать методы поиска материалов, которых могут быть использованы в новых аккумуляторах электромобилей.
Читать дальше →
Всего голосов 9: ↑2 и ↓7-5
Комментарии0

В России резко вырос спрос на специалистов по данным и машинному обучению

Время на прочтение6 мин
Количество просмотров15K


Академия больших данных MADE и HeadHunter опубликовали совместное исследование «Портрет российского Data Scientist» со статистикой вакансий для специалистов этой профессии в 2015−2019 годы.

Судя по цифрам, рынок переживает настоящий бум. В 2018 году количество вакансий с упоминанием специальности data scientist выросло в семь раз по сравнению с 2015 годом, а вакансий с ключевыми словами machine learning — в пять раз. В интернет-компаниях и IT дата-сайентистам предлагают медианную зарплату 145 000 руб., а в в сфере услуг для бизнеса — 170 000 руб. В последнем случае речь идёт об анализе больших массивов данных, в том числе алгоритмами машинного обучения, чтобы выявить полезные для бизнеса закономерности, которые не очевидны для человеческого мозга.
Читать дальше →
Всего голосов 21: ↑17 и ↓4+13
Комментарии21

Опубликована база учёных, которые активно цитируют сами себя. Украина и Россия в лидерах

Время на прочтение5 мин
Количество просмотров24K


Российские и украинские лидеры в рейтинге самоцитирования

Авторитет в научном сообществе определяется количеством ссылок в научных статьях (индекс цитирования). Самые цитируемые в мире — небольшая группа учёных, в которую входят нобелевские лауреаты и выдающиеся исследователи. Однако к ним примыкает ряд менее известных персонажей. Например, Сундарапандиан Вайдьянатан из Индии.

Этот исследователь в области теории хаоса, декан R&D частного технологического института Vel Tech в Ченнае — соавтор сотен научных работ и абсолютный мировой рекордсмен по саморекламе: 94% (!) ссылок на его научные статьи поставлены им самим или соавторами, пишет Nature.
Читать дальше →
Всего голосов 38: ↑34 и ↓4+30
Комментарии77

Управление делами президента разместило тендер на услуги по мониторингу СМИ в сети Интернет

Время на прочтение2 мин
Количество просмотров5.4K
Управление делами президента РФ разместило на сайте госзакупок тендер на Оказание услуг по мониторингу СМИ, социальных сетей и блогосферы информационно-телекоммуникационной сети «Интернет».

Крайний срок подачи заявок – 16.05.2019. Начальная (максимальная) цена контракта – 1 100 000 руб.
Читать дальше →
Всего голосов 19: ↑18 и ↓1+17
Комментарии12

Ближайшие события

One day offer от ВСК
Дата16 – 17 мая
Время09:00 – 18:00
Место
Онлайн
Конференция «Я.Железо»
Дата18 мая
Время14:00 – 23:59
Место
МоскваОнлайн
Антиконференция X5 Future Night
Дата30 мая
Время11:00 – 23:00
Место
Онлайн
Конференция «IT IS CONF 2024»
Дата20 июня
Время09:00 – 19:00
Место
Екатеринбург
Summer Merge
Дата28 – 30 июня
Время11:00
Место
Ульяновская область
2

Вклад авторов

Работа

Data Scientist
55 вакансий