Визуализация данных *

Облекаем данные в красивую оболочку

sqshq 19 авг 2019 в 07:11

Sampler. Консольная утилита для визуализации результата любых shell команд

5 мин

84K

Open source*Программирование*Go*Визуализация данных*DevOps*

В общем случае с помощью shell команды можно получить любую метрику, без написания кода и интеграций. А значит в консоли должен быть простой и удобный инструмент для визуализации.

Наблюдение за изменением состояния в базе данных, мониторинг размера очередей, телеметрия с удаленных серверов, запуск деплой скриптов и получение нотификации по завершению — конфигурируется за минуту простым YAML файлом.

Код доступен на гитхабе. Инструкции по установке — для Linux, macOS и (экспериментально) Windows.

Читать дальше →

+296

IMnEpaTOP 16 авг 2019 в 11:24

Умер нобелевский лауреат Кэри Муллис — изобретатель полимеразной цепной реакции ДНК

6 мин

14K

Блог компании Издательский дом «Питер»Визуализация данных*Читальный залНаучно-популярноеБиотехнологии

В Калифорнии в возрасте 74 лет умер американский нобелевский лауреат по химии Кэри Муллис. По словам его супруги, смерть наступила 7 августа. Причина — сердечная и дыхательная недостаточность из-за пневмонии.

О том, какой вклад он внес в биохимию и за что получил Нобелевскую премию, нам расскажет сам Джеймс Уотсон — первооткрыватель молекулы ДНК.

Отрывок из книги Джеймса Уотсона, Эндрю Берри, Кевина Дэвиса

ДНК. История генетической революции

Глава 7. Геном человека. Сценарий жизни

Читать дальше →

+16

TheyMakeDesign 13 авг 2019 в 15:46

Портфолио UX-дизайнеров: лучшие практики

6 мин

34K

Визуализация данных*Карьера в IT-индустрииДизайн

Туториал

Перевод

Сегодня мы хотим поделиться мыслями о том, что необходимо для создания хорошего портфолио UX-дизайнера.

Представим, что Вам необходимо портфолио, чтобы получить заказ на UI/UX работу. Если Вы лишь начинаете работать в этой сфере или взяли достаточно большой перерыв в своей работе, то это может стать настоящим шоком. Даже если у Вас есть портфолио, может быть интересно, сделает ли оно всё возможное от того, что может. На этот счёт, у нас есть некоторые мысли на тему портфолио дизайна – как сделать его целостным и извлечь из него максимальную пользу и выгоду.

Читать дальше →

selesnow 12 авг 2019 в 09:48

Построение поведенческих воронок на языке R, на основе данных полученных из Logs API Яндекс.Метрики

19 мин

Data Mining*Яндекс API*R*Визуализация данных*Интернет-маркетинг*

Туториал

Анализ воронки продаж — типичная задача для интернет маркетинга, и в частности электронной коммерции. С её помощью вы можете:

Выяснить на каком из шагов к покупке вы теряете потенциальных клиентов.
Моделировать объём дополнительного притока выручки, в случае расширения каждого шага на пути к покупке.
Оценить качество трафика закупаемого на различных рекламных платформах.
Оценить качество обработки входящих заявок по каждому из менеджеров.

В этой статье я расскажу о том, как на языке R запрашивать данные из Logs API Яндекс Метрики, строить и визуализировать на их основе воронку.

Одно из основных преимуществ языка R заключается в наличии огромного количества пакетов, расширяющих его базовый функционал. В данной статье мы рассмотрим пакеты rym, funneljoin и ggplot2.

С помощью rym мы загрузим данные из Logs API, funneljoin используем для построения поведенческой воронки, а с помощью ggplot2 визуализируем полученный результат.

Читать дальше →

+10

postmachines 10 авг 2019 в 14:28

Визуализация зависимостей и наследований между моделями машинного обучения

3 мин

6.6K

Визуализация данных*Машинное обучение*Искусственный интеллект

Из песочницы

Несколько месяцев назад я столкнулся с проблемой, моя модель построенная на алгоритмах машинного обучения просто на просто не работала. Я долго думал над тем, как решить эту проблему и в какой-то момент осознал что мои знания очень ограничены, а идеи скудны. Я знаю пару десятков моделей, и это очень малая часть тех работ которые могут быть очень полезны.

Первая мысль которая пришла в голову это то что, если я буду знать и пойму больше моделей, мои качества как исследователя и инженера в целом, возрастут. Эта идея подтолкнула меня к изучению статей с последних конференций по машинному обучению. Структурировать такую информацию довольно сложно, и необходимо записывать зависимости и связи между методами. Я не хотел представлять зависимости в виде таблицы или списка, а хотелось что-то более естественное. В итоге, я понял что иметь для себя трехмерный граф с ребрами между моделями и их компонентами, выглядит довольно интересно.

Например, архитектурно GAN [1] состоит из генератора (GEN) и дискриминатора (DIS), Состязательный Автокодировщик (AAE) [2] состоит из Автокодировщика (AE) [3] и DIS,. Каждый компонент является отдельной вершиной в данном графе, поэтому для AAE у нас будет ребро с AE и DIS.

Шаг за шагом, я анализировал статьи, выписывал из каких методов они состоят, в какой предметной области они применяются, на каких данных они тестировались, и так далее. В процессе работы я понял сколько очень интересных решений остаются неизвестными, и не находят своего применения.

Читать дальше →

+19

Gers1972 8 авг 2019 в 12:41

Web scraping с помощью R. Сравнение оценок фильмов на сайтах Кинопоиск и IMDB

6 мин

9.6K

Data Mining*R*Визуализация данных*

Всемирная паутина — это океан данных. Здесь можно посмотреть практически любую интересующую Вас информацию. Однако, "вытащить" эту информацию из интернета уже сложнее. Есть несколько способов получить данные и web-scraping один из них.

Читать дальше →

+16

Fly_Cam 4 авг 2019 в 19:06

Сравнительный обзор портативных СВЧ приборов Arinst vs Anritsu

19 мин

25K

Беспроводные технологии*Визуализация данных*ГаджетыНосимая электроникаМультикоптеры

Из песочницы

На независимый тест-обзор поступила пара приборов российского разработчика «Kroks». Это довольно миниатюрные радиочастотные измерители, а именно: анализатор спектра со встроенным генератором сигналов, и векторный анализатор цепей (рефлектометр). Оба устройства по верхней частоте имеют диапазон до 6,2 ГГц.

Появился интерес понять, это очередные карманные «показометры» (игрушки), или действительно достойные внимания приборы, потому как производитель их позиционирует: -«Прибор предназначен для радиолюбительского применения, так как не является профессиональным средством измерения.»

Вниманию читателей! Данные тесты проводились любительские, ни в коей мере не претендующие на метрологические исследования средств измерений, на основании стандартов государственного реестра и всего прочего с этим связанного. Радиолюбителям интересно посмотреть на сравнительные измерения часто применяемых на практике устройств (антенны, фильтры, аттенюаторы), а не теоретические «абстракции», как это принято в метрологии, например: рассогласованные нагрузки, неоднородные линии передачи, или отрезки короткозамкнутых линий, в данном тесте не применялись.

Читать дальше →

+54

Dmytro_Kikot 2 авг 2019 в 10:00

Увидеть почти невидимое, еще и в цвете: методика визуализации объектов через рассеиватель

9 мин

7.1K

Блог компании ua-hosting.companyВизуализация данных*Читальный залНаучно-популярноеФизика

Одной из самых знаменитых способностей Супермена является суперзрение, которое позволяло ему рассматривать атомы, видеть в темноте и на огромное расстояние, а еще видеть сквозь предметы. Эту способность крайне редко демонстрируют на экранах, но она есть. В нашей же реальности видеть сквозь практически полностью непрозрачные объекты также можно, применив некоторые научные трюки. Однако, полученные снимки всегда были черно-белые, до недавнего времени. Сегодня мы познакомимся с исследованием, в котором ученые из университета Дьюка (США) смогли сделать цветной снимок объектов, спрятанных за непрозрачной стеной, применив однократное световое воздействие. Что это за супер-технология, как она работает и в каких областях может применяться? Об этом нам расскажет доклад исследовательской группы. Поехали.

+19

denis-19 27 июл 2019 в 09:23

Визуализация сна первого года ребенка на узорах одеяла

3 мин

26K

JavaScript*Визуализация данных*Научно-популярноеDIY или Сделай самЗдоровье

Отец-айтишник визуализировал данные о сне и бодрствовании первого года жизни своего сына. Сделал это своими руками — программно обработал данные и связал одеялко, которое показывает активность его малыша за год.

Читать дальше →

+48

hse_spb 26 июл 2019 в 17:49

Отладка алгоритмов на графах — теперь с картинками

11 мин

11K

Блог компании Питерская ВышкаПрограммирование*Visual Studio*Отладка*Визуализация данных*

Представим типичную ситуацию на первом курсе: вы прочитали про алгоритм Диница, реализовали, а он не заработал, и вы не знаете, почему. Стандартное решение — это начать отлаживать по шагам, каждый раз рисуя текущее состояние графа на листочке, но это жутко неудобно. Я попробовала исправить положение в рамках семестрового проекта по Software Engineering, а в посте расскажу, как у меня в итоге получился плагин для Visual Studio. Скачать можно тут, исходный код и документацию можно посмотреть тут. Вот скриншот графа, который получился для алгоритма Диница.

Читать дальше →

+29

lahmatiy 24 июл 2019 в 16:01

JsonDiscovery: Меняем опыт просмотра JSON в браузере

3 мин

34K

Визуализация данных*Расширения для браузеров

Перевод

Сегодня я хочу рассказать о JsonDiscovery, браузерном расширении для просмотра JSON. Возможно вы скажете: «у нас и так полно подобных расширений!». Да, полно, но фичи JsonDiscovery отличают его от других и делают его действительно мощным.

Давайте же взглянем поближе...

+73

bashnick 22 июл 2019 в 14:56

Семь раз отмерь, один раз внедри BI инструмент

11 мин

29K

Блог компании Open Data ScienceData Mining*Big Data*Визуализация данных*Софт

Не так давно я столкнулся с задачей по переходу на новую BI-систему для нашей компании. Поскольку мне пришлось погрузиться довольно глубоко и основательно в данный вопрос, я решил поделиться с уважаемым сообществом своими мыслями на этот счет.

На просторах интернета есть немало статей на эту тему, но, к моему большому удивлению, они не ответили на многие мои вопросы по выбору нужного инструмента и были несколько поверхностны. В рамках 3 недель тестирования мы опробовали 4 инструмента: Tableau, Looker, Periscope/Sisense, Mode analytics. Про эти инструменты в основном и пойдет речь в данной статье. Сразу оговорюсь, что предложенная статья — это личное мнение автора, отражающее потребности небольшой, но очень быстро растущей IT-компании :)

Несколько слов о рынке

Сейчас на рынке BI происходят довольно интересные изменения, идёт консолидация, крупные игроки облачных технологий пытаются укрепить свои позиции путем вертикальной интеграции всех аспектов работы с данными (хранение данных, обработка, визуализация). За последние несколько месяцев произошло 5 крупных поглощений: Google купил Looker, Salesforce купил Tableau, Sisense купил Periscope Data, Logi Analytics' купил Zoomdata, Alteryx купил ClearStory Data. Не будем дальше погружаться в корпоративный мир слияний и поглощений, стоит лишь отметить, что можно ожидать дальнейших изменений как в ценовой, так и в протекционистской политике новых обладателей BI-инструментов (как недавно нас обрадовал инструмент Alooma, вскоре после покупки их компанией Google, они перестают поддерживать все источники данных, кроме Google BigQuery :) ).

Читать дальше →

+40

GerasimGerasimov 17 июл 2019 в 14:34

SVG индикатор загрузки на Vue.js

12 мин

12K

JavaScript*Визуализация данных*VueJS*

Туториал

Из песочницы

Привет! Учусь на front-end, и параллельно, в учебном проекте, разрабатываю SPA на Vue.js для back-end, который собирает данные от поискового бота. Бот нарабатывает от 0 до 500 записей, и я должен их: загрузить, отсортировать по заданным критериям, показать в таблице.

Ни back-end ни бот, сортировать данные не умеют, поэтому мне приходятся загружать все данные и обрабатывать их на стороне браузера. Сортировка происходит очень быстро, а вот скорость загрузки, зависит о коннекта, и указанные 500 записей могут загружаться от 10 до 40 секунд.

Поначалу, при загрузке, я показывал спинер, недостаток которого — пользователь не знает когда закончится загрузка. В моём случае заранее известно количество записей которые отыскал бот, поэтому можно показать сколько % записей загружено.

Чтобы скрасить пользователю ожидание, я решил показать ему процесс загрузки:

цифрами — сколько % записей уже загружено
графиком — время загрузки каждой записи
заполнением — % загрузки. Так как график по мере загрузки заполняет прямоугольный блок, видно, какую часть блока осталось заполнить

Вот анимация результата, к которому я стремился и получил:

… по-моему, получилось забавно.

В статье я покажу как продвигался к результату шаг за шагом. Графики функций в браузере я до селе не рисовал, поэтому разработка индикатора принесла мне простые, но новые знания о применении SVG и Vue.

+17

PatientZero 17 июл 2019 в 10:44

Есть ли что-то общее у разных песен-хитов?

5 мин

15K

Python*Big Data*Визуализация данных*Социальные сети и сообществаЗвук

Перевод

Если выполнить вход на Spotify.me, то можно получить персонализированную сводку того, как Spotify понимает вас через музыку, которую вы слушаете на этом сайте Spotify. Это круто!

Я слушаю много музыки и люблю работать с данными, поэтому это вдохновило меня на попытку анализа моей коллекции музыки.

Мне было очень любопытно, существуют ли какие-то конкретные ингредиенты, из которых составлены хитовые песни. Что делает их крутыми? Почему нам нравятся хиты, и есть ли у них определённая «ДНК»?

Задача

Это привело меня к попытке ответить при помощи данных Spotify на два вопроса:

На что похож мой музыкальный плейлист?
Существуют ли конкретные атрибуты аудио, общие для всех хитовых композиций?

Инструменты

К счастью, есть очень простые инструменты, позволяющие подключиться к Spotify, получить данные, а затем визуализировать их.

Мы будем работать с языком программирования Python 3, библиотекой Python Spotipy, позволяющую подключаться к Spotify Web API, а визуализировать данные будем с помощью plot.ly и Seaborn.

Массив данных

В конце каждого кода Spotify компилирует плейлист из 100 самых часто воспроизводимых песен. Использованный мной массив данных уже выложен на Kaggle: Top Spotify Tracks of 2018. Список 100 самых популярных песен со Spotify кажется вполне разумным массивом данных для изучения хитов, не правда ли?

Читать дальше →

+15

vlstrochkov 16 июл 2019 в 18:23

Представьте себе ваши данные перед тем, как вы их соберете

4 мин

Блог компании OTUSR*Визуализация данных*

Перевод

Перевод подготовлен для студентов курса «Прикладная аналитика на R».

Нам, как исследователям данных (data scientist), часто дают набор данных и просят использовать его для получения информации. Мы используем R для обработки, визуализации, моделирования, подготовки таблиц и графиков, чтобы поделиться результатами или опубликовать их. Если мы смотрим на данные таким образом, то нам не важно откуда эти данные пришли. Размер выборки, набор признаков и их шкалы фиксированы. Тем не менее, процедуры, используемые для сбора или генерирования данных, чрезвычайно важны для будущего анализа, а также для качества информации, которую мы, в конечном итоге, можем получить. Процесс сбора данных влияет на то, как следует анализировать полученные данные. Для исследований, которые измеряют причинно-следственные связи, важно какие данные следует брать во внимание, а какие нет.

Читать дальше →

+15

CarpeDiem 16 июл 2019 в 11:56

Как купить авиабилет максимально дешево или ударим мониторингом по динамическому ценообразованию

3 мин

38K

Data Mining*API*Визуализация данных*Реверс-инжиниринг*Исследования и прогнозы в IT*

Как максимально выгодно купить авиабилет?

Любой более-менее продвинутый пользователь Сети знает такие варианты как

покупать заранее
искать маршруты с пересадкой
hidden-city ticketing
мониторить чартерные рейсы
искать в режиме инкогнито браузера
использовать мильные карты авиакомпаний, всяческие бонусы и промо-коды

Полный список лайфхаков как-то делал Тинькофф-Журнал, не буду повторяться

А теперь ответьте на вопрос — как часто вы попадали в ситуации когда покупали авиабилет, а потом он стал стоить дешевле?

Читать дальше →

+25

ubongo 16 июл 2019 в 07:17

Метод мониторинга актуального состояния российских автодорог смартфонами пользователей

4 мин

8.9K

Открытые данные*Визуализация данных*Патентование*СмартфоныТранспорт

Целью одной из федеральных программ, направленных на реализацию Указа Президента «О национальных целях и стратегических задачах развития Российской Федерации на период до 2024 года» № 204 от 7 мая 2018 года (ссылка) является улучшение качества автомобильных дорог за счет увеличения процентного соотношения, соответствующего нормативным требованиям.

Тем же указом предусмотрено внедрение общедоступной информационной системы контроля за формированием и использованием средств дорожных фондов всех уровней.

Однако объективный контроль качества проведения мероприятий по строительству или ремонту дорог бывает затруднителен в силу ряда причин, начиная от небезызвестных проблем а-ля коррупция в строительстве (ссылка), и заканчивая естественными причинами трудоемкости организации такого процесса с использованием существующих методов — с помощью рейки и клин-промерника, дорожного профилометра или толчкомера, методом амплитуд и т.д. (затраты на проведение измерений качества автомобильных дорог, необходимость выезда на место, ограниченные человеческие и технические ресурсы).

Специалистами принимаются меры для упрощения процесса диагностики ровности дорог (ссылка), однако все равно возможности масштабного исследования их качества крайне ограничены.

Существующие проекты типа «Автострада» (autostrada.info), «Дорожная инспекция ОНФ» (dorogi-onf.ru) ведут наполнение своей базы качества автодорог в основном за счет обратной связи от пользователей, присылающих фотографии или отзывы только об отдельных участках автодорог.

Впрочем, одним из выходов контроля качества дорожного покрытия, равно как и отслеживания его изменения как в лучшую, так и в худшую сторону, является агрегация уже существующих аналитических инструментов.

Читать дальше →

+12

Gers1972 15 июл 2019 в 15:41

Построение анимационного линейного графика скользящего среднего в R. Получение данных через NBA API

10 мин

2.1K

Data Mining*API*R*Визуализация данных*

Продолжим анализировать баскетбольные данные с помощью R.

В отличие от прошлой статьи, носившей исключительно развлекательный характер, графики, которые будут построены в данной заметке, могут быть интересны с точки зрения анализа игры команды походу сезона.

А строить мы будем графики скользящего среднего для трёх видов рейтинга команд НБА: атакующего, оборонительного и net-рейтинга (т.е. разницы между первыми двумя). В двух словах о них. Атакующий и оборонительный рейтинги — это количество очков, набранных/пропущенных командой за 100 владений. NET рейтинг — это их разница также на сто владений. Кому интересно узнать о них более подробно, могут прочитать глоссарий на сайте basketball-reference. Там есть формула расчёта, которую я тоже реализовал с помощью R, но так пока и не опубликовал статью об этом.

Читать дальше →

+11

Yermack 15 июл 2019 в 09:07

Luxor

13 мин

7.5K

Программирование*Работа с векторной графикой*Визуализация данных*Julia*Графический дизайн*

Туториал

Сегодня мы рассмотрим графический пакет для языка Julia, который называется Luxor. Это один из тех инструментов, которые превращают процесс создания векторных изображений в решение логических задачек с сопутствующей бурей эмоций.

Осторожно! Под катом 8.5 Мб легковесных картинок и гифок изображающих психоделические яйца и четырехмерные объекты, просмотр которых может вызвать лёгкое помутнение рассудка!

Читать дальше →

+17

VisualMethod 10 июл 2019 в 15:09

5 слайдов, которые игнорируют опытные презентующие

8 мин

Визуализация данных*Читальный залКонференцииИнфографикаПрезентации

Громкий бренд или имя спикера с высокой должностью помогают заполнить конференц-залы. Люди тянутся к “звездам”, чтобы быть в тренде и узнать об их ошибках и победах. Только вот в конце выступлений участники ставят таким спикерам далеко не самые высокие оценки.
В студии создания презентаций и инфографики VisualMethod выяснили у предпринимателей и корпоративных сотрудников, что больше всего их разочаровало в докладах на конференциях. Оказалось, когда опытные спикеры игнорируют организационные слайды и переходят сразу к описанию процесса или кейса, теряется доверие. Некоторые опрошенные даже назвали такое поведение спикеров высокомерным (“не представился вообще”) и невнимательным (“в теме одно, а на словах другое”). Подробно рассказываем о том, о каких слайдах важно помнить.

Читать дальше →

+11

1 2 ...

45 46

48 49 ...

75 76

Визуализация данных *

Sampler. Консольная утилита для визуализации результата любых shell команд

Умер нобелевский лауреат Кэри Муллис — изобретатель полимеразной цепной реакции ДНК

ДНК. История генетической революции

Глава 7. Геном человека. Сценарий жизни

Портфолио UX-дизайнеров: лучшие практики

Построение поведенческих воронок на языке R, на основе данных полученных из Logs API Яндекс.Метрики

Истории

Визуализация зависимостей и наследований между моделями машинного обучения

Web scraping с помощью R. Сравнение оценок фильмов на сайтах Кинопоиск и IMDB

Сравнительный обзор портативных СВЧ приборов Arinst vs Anritsu

Увидеть почти невидимое, еще и в цвете: методика визуализации объектов через рассеиватель

Визуализация сна первого года ребенка на узорах одеяла

Отладка алгоритмов на графах — теперь с картинками

JsonDiscovery: Меняем опыт просмотра JSON в браузере

Семь раз отмерь, один раз внедри BI инструмент

Несколько слов о рынке

SVG индикатор загрузки на Vue.js

Ближайшие события

Есть ли что-то общее у разных песен-хитов?

Задача

Инструменты

Массив данных

Представьте себе ваши данные перед тем, как вы их соберете

Как купить авиабилет максимально дешево или ударим мониторингом по динамическому ценообразованию

Метод мониторинга актуального состояния российских автодорог смартфонами пользователей

Построение анимационного линейного графика скользящего среднего в R. Получение данных через NBA API

Luxor

5 слайдов, которые игнорируют опытные презентующие

Вклад авторов