Pull to refresh

MakeMeLaughNow — анализ червя нового поколения в Facebook (перевод)

Reading time5 min
Views1K
В недавнем топике высказали пожелание, что было бы хорошо, если бы кто-то перевел. Я посмотрел текст — вроде не так много. Поэтому, кому интересно, смотрим…
Читать дальше →
Total votes 67: ↑62 and ↓5+57
Comments15

Analyst Days: Ирина Сурова — Использование трассировок на практике

Reading time19 min
Views9.8K
Публикуем статью, написанную на основании предыдущего доклада Ирины Суровой с прошлой конференции Analyst Days. В этом году Ирина выступает не только в роли докладчика, но и члена программного комитета будущей московской конференции.


Читать дальше →
Total votes 21: ↑10 and ↓11-1
Comments8

Impact анализ на примере инфраструктуры корпоративного хранилища данных

Reading time8 min
Views14K
В этой статье я хочу рассказать, как можно решать задачу impact анализа или анализа влияния в сложной, многоуровневой инфраструктуре корпоративного хранилища данных на примере нашего DWH в Тинькофф Банке.



Работая с DWH все наверняка задавались хоть раз вопросами:
  • «Что будет, если поменять поле в таблице?»
  • «На каких ETL процессах это скажется?»
  • «Какие отчеты будут затронуты?»
  • «Какие бизнес процессы могут пострадать?»

Ответить на этот вопрос как правило непросто, т.к. нужно просмотреть дюжину ETL процессов, потом залезть в BI инструмент, найти нужные отчеты, что-то держать в голове, помнить о том, что что-то там строится ручным кодом и всё это выливается в большую головную боль.
Даже самое порой безобидное изменение может сказаться, например, на отчете, который каждое утро приходит на почту к председателю правления банка. Немного утрирую, конечно:)

Далее в статье я расскажу, как и с помощью чего можно уменьшить головную боль и быстро проводить impact-анализ в инфраструктуре DWH.

Читать дальше →
Total votes 14: ↑13 and ↓1+12
Comments16

В чем разница между наукой о данных, анализом данных, большими данными, аналитикой, дата майнингом и машинным обучением

Reading time4 min
Views41K
В последнее время слово big data звучит отовсюду и в некотором роде это понятие стало мейнстримом. С большими данными тесно связаны такие термины как наука о данных (data science), анализ данных (data analysis), аналитика данных (data analytics), сбор данных (data mining) и машинное обучение (machine learning).

Почему все стали так помешаны на больших данных и что значат все эти слова?

image
Читать дальше →
Total votes 29: ↑20 and ↓9+11
Comments8

Борьба с утечками памяти в Android. Часть 1

Reading time6 min
Views49K
Этой статьей мы открываем цикл статей на Хабре о нашей разработке под Android.
Согласно докладу компании Crittercism от 2012 года, OutOfMemoryError — вторая по распространенности причина «крашей» мобильных приложений.
Честно говоря, и в Badoo эта ошибка была в топе всех крашей (что неудивительно при том объеме фотографий, которые просматривают наши пользователи). Борьба с OutOfMemory — занятие кропотливое. Мы взяли в руки Allocation Tracker и начали играться с приложением. Наблюдая за данными зарезервированной памяти, мы выявили несколько сценариев, при которых выделение памяти росло с подозрительной стремительностью, забывая при этом уменьшаться. Вооружившись несколькими дампами памяти после этих сценариев, мы проанализировали их в MAT (http://www.eclipse.org/mat/).
Результат был занимательный и позволил нам в течение нескольких недель снизить количество крашей в разы. Что-то было специфично для нашего кода, но также выявились типичные проблемы, присущие большинству Android приложений.
Сегодня поговорим о конкретном случае утечки памяти. О нем многие знают, но часто закрывают на это глаза (а зря).
Читать дальше →
Total votes 59: ↑55 and ↓4+51
Comments18

Вышел GitLab 9.5: Верификация коммитов GPG и шаблоны проектов

Reading time10 min
Views5.6K

image


В GitLab 9.5 мы представляем верификацию коммитов GPG, шаблоны проектов, автоповтор неудавшихся работ CI, навигацию по дифф-файлу мерж реквестов, существенные улучшения производительности и многое другое.


Читать дальше →
Total votes 13: ↑12 and ↓1+11
Comments0

Ваш выход, граф: как мы не нашли хороший сетевой граф и создали свой

Reading time13 min
Views5.5K


Расследуя дела, связанные с фишингом, бот-сетями, мошенническими транзакциями и преступными хакерскими группами, эксперты Group-IB уже много лет используют графовый анализ для выявления разного рода связей. В разных кейсах существуют свои массивы данных, свои алгоритмы выявления связей и интерфейсы, заточенные под конкретные задачи. Все эти инструменты являлись внутренней разработкой Group-IB и были доступны только нашим сотрудникам.

Графовый анализ сетевой инфраструктуры (сетевой граф) стал первым внутренним инструментом, который мы встроили во все публичные продукты компании. Прежде чем создавать свой сетевой граф, мы проанализировали многие подобные разработки на рынке и не нашли ни одного продукта, который бы удовлетворял нашим собственным потребностям. В этой статье мы расскажем о том, как мы создавали сетевой граф, как его используем и с какими трудностями столкнулись.

Дмитрий Волков, CTO Group-IB и глава направления киберразведки
Читать дальше →
Total votes 16: ↑14 and ↓2+12
Comments2

Анализ Буткита FinFisher

Reading time8 min
Views3K
Добрый вечер! Ровно через неделю у нас стартует курс «Реверс-инжиниринг», и сегодня мы хотим поделиться с вами переводом материала, который имеет прямое отношение к этому курсу. Поехали.

Недавно мы исследовали вредоносный буткит FinFisher, опубликованный WikiLeaks. Большинство компонентов версии для Windows были достаточно простыми, так что перейдём сразу к драйверу режима ядра и загрузочному коду.



Драйвер режима ядра напрямую считывает сырые данные с жесткого диска, либо записывает их на него. С упрощенной версией метода, используемого драйвером, можно ознакомиться в этой статье.
Читать дальше →
Total votes 20: ↑19 and ↓1+18
Comments3

System Analysis MeetUp UPD2 Трансляция и презентации

Reading time2 min
Views2.2K
13 июня System Analysis Community Райффайзенбанка приглашает на свой первый открытый Meetup, который пройдет в офисе в Нагатино. Мы ждём системных и бизнес аналитиков, а также всех тех, кто связан с анализом или только планирует связать свою профессиональную деятельность с ним.


Total votes 13: ↑12 and ↓1+11
Comments2

Хайповые строительные сектора и стоимость работ в Большом городе. Инфляция и рост чека в Сан-Франциско

Reading time11 min
Views2.3K
Сан-Франциско — технологическая «Москва» нашего мира, на примере которого (при помощи открытых данных) можно наблюдать за развитием строительной отрасли в больших городах и столицах. В этом технологичном городе очень выраженно проходили экономические циклы, которые в разные временные промежутки, давали взрывной рост спроса разным секторам недвижимости.

Данные о более чем миллионе разрешений на строительство (записей в двух датасетах) от департамента по строительству Сан-Франциско — позволяют проанализировать не только строительную активность в городе, но и критически рассмотреть последние тенденции и историю развития строительных секторов и спроса на недвижимость за последние 30 лет.

В прошлой статье была рассмотрена общая годовая сумма строительных объемов (инвестиций) в Сан-Франциско в период с 1980 по 2018 год. По разнице между ожидаемой (сметной) и фактической (пересмотренной) стоимостью строительства отслеживались движения настроений инвесторов в периоды экономических бумов и кризисов в регионе.

Взлёты и падения строительной отрасли Сан-Франциско. Тенденции и история развития строительной активности



В данной статье рассмотрим подробнее отдельные отрасли строительства: ремонт крыш, кухонь, лестниц и ванных комнат. После этого сравним инфляцию по отдельным типам работ с данными по официальной инфляции и другими экономическими показателями.
Читать дальше →
Total votes 4: ↑4 and ↓0+4
Comments4

Крошка Енот: как операторы JS-сниффера FakeSecurity распространяли стилер Raccoon

Reading time20 min
Views3.4K


Летом 2020 года специалисты Group-IB обратили внимание на необычную кампанию по распространению стилера Raccoon. Сам стилер хорошо известен: он умеет собирать системную информацию, данные учетных записей в браузерах, данные банковских карт, а также ищет информацию о крипто-кошельках.

Сюрприз оказался в другом. Никита Ростовцев, аналитик Group-IB Threat Intelligence & Attribution, рассказывает, как в ходе исследования удалось восстановить хронологию вредоносной кампании, установить связи с другими элементами инфраструктуры злоумышленников. Забегая вперед, отметим, что «енот» оказался прикормленным уже известной нам группой.
Читать дальше →
Total votes 3: ↑3 and ↓0+3
Comments1

Chipmunk: обновления

Reading time2 min
Views2K

Короткий обзор очередных обновлений смотрелки логов chipmunk. Много исправлений, много корректировок и немного фишек, в том числе запрашиваемых сообществом.

Читать далее
Total votes 3: ↑3 and ↓0+3
Comments3

CatBoost и ML-конкурсы

Reading time8 min
Views4.6K

Эта статья основана на данных конкурса, который компания Driven Data опубликовала для решения проблем с источниками воды в Танзании. Краткий анализ данных, подготовка данных и бэйзлайн модель с использованием CatBoost. Целевая аудитория - те, кто хотят начать свой путь в ML-соревнованиях.

Читать далее
Rating0
Comments2

Дорогая редакция… Или какие новости в Феврале?

Reading time3 min
Views2.9K

Немного об Agile и офисе


Недавно прошел тренинг Agile Development with Scrum и 2-х дневный workshop (тренингом не совсем это назовешь — 50% времени этого тренинга работа с живими документами и генерацией артефактов для получения информации о проекте) по сбору требований в Agile — REQ-Agile Requirements Analysis.

Было достаточно интересно. Первый тренинг проходил почти в виде круглого стола. В течении 4 часов мы обсуждали Agile — что это такое, почему подход рекомендует те или иные практики. Пришли к тому, что магии особой в этом нет и это здравый смысл в организации работы проектов.

Один из участников приятно отозвался об этом тренинге
Читать дальше →
Total votes 30: ↑21 and ↓9+12
Comments0

Дело на триллион. В 2015-ом капитализация рынка SaaS достигнет $1 трлн

Reading time7 min
Views5.6K
Сейчас много проектов по созданию новых сервисов совместной работы. Несмотря на то что инвесторы уже начали понимать перспективность SaaS-рынка, еще остается определенный скепсис, и если такой стартап приходит к инвестору, то может услышать: «Зачем еще один тысяча первый сервис совместной работы?». Нужно наглядно показать, что рынок растет и готов вместить еще одного игрока. Мы делаем именно такой сервис, и нам пришлось подготовить разумные объяснения.

Инвестор вкладывает в бизнес, рассчитывая на рост капитализации, поэтому нужно быть готовым рассказать про капитализацию рынка. Выяснилось, что инвесторы тоже люди и, как все люди, больше интереса проявляют к интересным историям о том, как развитие продукта и рынка изменят мир.

Если кратко, рынок очень большой, быстро растет и можно без страха на него заходить. Выручка в целом по рынку за 2003 год составила $3b, за 2011 год — $12b. На 2015 год Gartner прогнозирует $21b. Облачные сервисы стоят в 40 раз дороже прибыли, отсюда капитализация рынка получается $840b.


Читать дальше →
Total votes 16: ↑11 and ↓5+6
Comments24

God object. Анализ сложных проектов

Reading time5 min
Views8.1K

Введение


Ни для кого не секрет, что такой архитектурный антипаттерн как God object препятствует эффективному поддерживанию кода проекта. Однако его все равно можно встретить в Legacy-системах корпоративного сектора. Со временем код становится настолько сложным, что изменить его функциональность, даже при наличии Unit-тестирования, становится большой проблемой. Такие системы никто не хочет поддерживать, все боятся что-либо улучшать, количество проблем в трекере держится постоянным числом, но может и расти. Как правило, у команды упавшее настроение, которое со временем становится чемоданным: все хотят свалить.
Иллюстрация проблемы
Читать дальше →
Total votes 35: ↑30 and ↓5+25
Comments18

Kibana Tips & Tricks: How to view events in Discover mode

Reading time3 min
Views6K
image

Hi Habrausers!

As you may know Kibana is a visualization instrument, part of ELK (Elastic, Logstash, Kibana) stack. With the help of Kibana you may analyze and visualize your data, build different charts and combine them on the dashboard to present data in the most beautiful way.
People who use Kibana in our company have different background — some of them are technical who process data, some are managers who simply want to monitor some KPIs. And all have various questions. In spite of Kibana is rather popular in IT companies, there are not many articles or courses about it. To fill the gap I have created Kibana Tips & Tricks — weekly letters with frequently asked questions or themes. Such letters help our users to become more familiar with Kibana. There are no secrets — just detailed description of how you may work with your data.
I would like to share the first part of 'Kibana Tips & Tricks' with you — series of simple how-to articles for people who would like to know more about data analysis and visualization in Kibana. Today we will see how to view events in Kibana.
Read more →
Total votes 7: ↑7 and ↓0+7
Comments0

How the PVS-Studio analyzer began to find even more errors in Unity projects

Reading time7 min
Views658
image1.png

When developing the PVS-Studio static analyzer, we try to develop it in various directions. Thus, our team is working on plugins for the IDE (Visual Studio, Rider), improving integration with CI, and so on. Increasing the efficiency of project analysis under Unity is also one of our priority goals. We believe that static analysis will allow programmers using this game engine to improve the quality of their source code and simplify work on any projects. Therefore, we would like to increase the popularity of PVS-Studio among companies that develop under Unity. One of the first steps in implementing this idea was to write annotations for the methods defined in the engine. This allows a developer to control the correctness of the code related to calls of annotated methods.
Read more →
Total votes 3: ↑3 and ↓0+3
Comments0

Взлёты и падения строительной отрасли Сан-Франциско. Тенденции и история развития строительной активности

Reading time13 min
Views2.3K
Это серия статей посвящена исследованию строительной активности главного города Кремниевой Долины — Сан-Франциско. Сан-Франциско — технологическая «Москва» нашего мира, на примере которого (при помощи открытых данных) можно наблюдать за развитием строительной отрасли в больших городах и столицах.

Построение графиков и расчётов проводилось в Jupyter Notebook (на платформе Kaggle.com).

Данные о более чем миллионе разрешений на строительство (записей в двух датасетах) от департамента по строительству Сан-Франциско — позволяют проанализировать не только строительную активность в городе, но и критически рассмотреть последнии тенденции и историю развития строительной отрасли за последние 40 лет, в период с 1980 по 2019 год.

Открытые данные дают возможность исследовать основные факторы, которые влияли и будут влиять на развитие строительной отрасли в городе, разделив их на “внешние” (экономические бумы и кризисы) и “внутренние” (влияние праздников и сезонно-годовых циклов).
Читать дальше →
Total votes 4: ↑4 and ↓0+4
Comments14

Impact Analysis: 6 шагов, которые облегчат тестирование изменений

Reading time5 min
Views17K

Impact Analysis (импакт анализ, анализ последствий) - это исследование, которое позволяет указать затронутые места (affected areas) в проекте при разработке новой или изменении старой функциональности, а также определить, насколько значительно они были затронуты.

Проведение исследования изменений могут помочь QA:

- сфокусироваться на тестировании функциональности, где изменения были представлены;

- принять во внимание части проекта, которые были затронуты изменениями и, возможно, пострадали;

- не тратить время на тестирование тех частей проекта, которые не были затронуты изменениями.

Читать далее
Total votes 2: ↑1 and ↓10
Comments1