4 March 2009

Визуализация информации и статистики

Data visualization
Так уж получилось, что время от времени мне приходится работать со статистикой, а следовательно задаваться вопросом «В каком виде ее лучше представить другим людям?» Поэтому, сегодня я расскажу вам о некоторых весьма оригинальных способах визуализации разного рода статистических данных.

Для начала приведу пример одной визуализации, сделанной с помощью Processing.
В ее основу входит ежегодная статистика наиболее освещаемых газетой New York Times людей и организаций, а связи между ними показаны линиями.
image
По ссылке можно посмотреть визуализации за каждый год с 1984.


Способ второй, пожалуй, самый неоригинальный, тем не менее, он тоже заслуживает внимания. Для примера возьмем сервис Lovely Charts, который, подобно своим конкурентам, позволяет строить схемы, карты сайтов и диаграммы онлайн. Подобных сервисов бесконечное множество, но я остановился на этом, потому что недавно встеритил упоминание о нем на одном ресурсе, и он мне понравился. Построение схем не представляет особо труда, в чем вы можете сами убедиться, зарегистрировавшись на сайте. Вот пример того, что получилось у меня за пару минут:
image

Программа UUrold визуализирует статистику и привязывает ее к различным политически единицам. Реализуется это путем «надстройки» трехмерной диаграммы над политической картой мира. В программу встроен специальный плеер, и, если, скажем, статистика собиралась несколько лет подряд, по изменению высоты диаграммы, можно в реальном времени пронаблюдать, как она варьировалась год от года. На словах описать это трудно, поэтому выкладываю авторское видео.

В некомерческую поставку программы входит огромная статистическая база (более 10 000) из различных областей, от медицины до экономики. Конечно же существует возможность добавления своей собственной.

Тримапинг. Тримапинг возник еще в начале 90, но широкого распространения не получил и в наши дни. Изначально тримапинг использовался для визуализации данных о дисковом пространстве, но впоследствии и для других целей. Суть этого способа визуализации заключается в представлении иерархической (древесной) системы в виде гнезд-прямоугольников. Каждый прямоугольник, при подобной визуализации, имеет пропорциональную статистическим данным площадь. Зачастую это помогает по-новому взглянуть на структуру данных. Самая известная утилита для изготовления тримапов — одноименная Treemap 4.0
А вот пример удачного тримапинга на основе Google News:
image

Интерактивный вариант здесь.

Вот пожалуй и все. Если статья будет интересна читателям и у них будут какие-то вопросы по созданию подобных визуализаций, это, возможно, станет темой для следующей статьи. Спасибо, жду ваших комментариев.
Tags:visualizationstatistics
Hubs: Data visualization
+57
551 78
Comments 33