Подборки работ по визуализации данных

Примеры, которые мне понравились или показались важными
основной блог | канал в телеграмме

Вдохновляющие видео

Недавно меня позвали провести лекцию для студентов-аналитиков из ВШЭ. Я поставил себе цель показать, что визуализация данных — это интересная и важная область для аналитика. Рассказал о том зачем нужна визуализация, какая она бывает, в чем её можно создавать, какие есть отличия в инструментах и показал небольшое демо в Табло. Получилось хорошее видео, если визуализация данных для вас — совсем новая область. трансляции в VK:

Если же вы уже работаете с визуализаций и все эти основы — скучно. Рекомендую вот эти видео. Они невероятно вдохновляют на то, чтобы изучать визуализацию данных.

Ганс Розлинг

Ганс Розлинг с помощью визуализации показывает, что наши убеждения не соответствуют статистике. Это самое крутое видео, которое можно посмотреть про визуализацию, потрясающая подача. Захватывает как хорошее кино.

Тафти и другие специалисты из области

Короткое вдохновляющиевидео от мэтра о том, что такое визуализация данных

Девид МакКендлес

Выступление автора Information is Beautiful на TED.

Fallen

Интерактивная работа про вторую мировую войну. Потрясающее эмоциональная и аккуратная работа, которая не оставляет равнодушным.

Большая подборка за осень

Не успевал собирать подборки регулярно — была насыщенная осень. Решил собрать всё, что запомнилось за последние пару месяцев.

Налоговая квитанция в Австралии

В этом примере нет чего-то потрясающего с точки зрения визуализации, но как же круто, что о таких вещах может подумать государство. Государство присылает квитанцию об оплате очередных налогов, но при этом показывает в виде визуализации на что пойдут именно твои налоги. Сразу понимаешь зачем тебе их платить.

Как меняются поисковые запросы перед выборами

Проект посвящен тому, как меняется активность по социальным и политическим поисковым запросам перед выборами. Эта работа понравилась в первую очередь лаконичными графиками, приятным визуальным оформлением и прикольной картой с анимацией.

Подробное описание как сделан проект — https://observablehq.com/@fil/how-we-made-waves-of-interest

Как звучит карта мира

Очень милый проект, в котором автор рисует карты с помощью нотного редактора. Можно послушать как звучат разные карты — довольно музыкально!

4 работы про цвета

Цвета комиксов автора Jean Giraud. Очень аккуратная и красивая работа.

52 года LEGO по кол-ву цветов в наборах.

Цвета автомобилей по годам в Польше по дате производства

Анализ цвета в живописи с 1800 по 2000 годы по 94 526 картин.

Карта Германии с соц. показателями

Потрясающая интерактивная карта, которая позволяет разрезать Германию и сравнить разные показатели в полученных регионах. По-умолчанию предлагается попробовать отделать восточную Германию и увидеть, что многие показатели до сих пор сильно различаются.

Вспомнилась старая статья из Washington Post. Там тоже делали похожее сравнение, а ещё была прикольная фотка со спутника, где видно насколько разное освещение в Берлине по границе Берлинской стены.

Анализ частоты использования слов

Анализ частоты использования слов в журнале Scientific American. Супер красивая с эстетической стороны работа.

Сколько стоит жилье в России?

Сатья в ТАСС про стоимость недвижимости. Очень хорошее использование простой и понятной графики для донесения идей в журналистике данных. Очень аккуратное оформление и графики классно заточены под мобильные экраны. Такое же оформление подойдет для бизнесовых дашбордов или презентаций.

Частота новых случаев COVID-19

Визуализация в которой при каждом новом случае заражения в стране раздается звонок.

Я делал похожий проект по разным событиям — http://revealthedata.com/examples/frequency/
Вдохновлялся тут — https://xkcd.com/1331/

Новые случаи COVID-19 и запросы про потерю обоняния

В этой работе от Яндекса очень крутая идея — забавно как можно косвенными путями проверять статистику.

3 Простых хитмапа

В этой подборке три простые работы. С точки зрения «инфографики» и визуализаций для широкой аудитории, это мой любимый вид — простые, лаконичные, но очень интересные графики. А в этих примерах, можно сказать, что даже просто таблички. =)

Сложность пароля

В строках — количество символов, в столбцах — сложность пароля, в ячейке — длительность взлома пароля. Сразу становится понятно, почему сайты требуют добавлять буквы и спецсимволы. Вспоминаешь свой пароль → проверяешь по табличке → идешь менять =)

Переплата по кредиту

В строках — ставка по кредиту, в столбцах — количество лет, которое будешь платить кредит, в ячейке — процент переплаты от взятой суммы. Нравится, что этот график не зависит от размера взятой суммы. Смотришь именно на процент переплат. Эту визуализацию сделал мой друг, когда хотел брать кредит. Посмотрел на визуализацию и решил не брать. ))

Ответы на сообщения на сайте знакомств

В строках — возраст того, кто отвечает на сообщение, в столбцах — того, кто прислал. В ячейке — процент ответов на это сообщение. В этот раз цветом показаны не сами значения в ячейке, а превышение относительно процента ответов для всех возрастов (столбец с синими цифрами правее от хитмапа). У мужчин образуется два аномальных кластера: мужчины 25-30 лет часто отвечают дамам за 40, а мужчины старше 30 отвечают двадцатилетним девушкам. А вот девушки чаще всего отвечают именно мужчинам своего возраста.

Вместо вывода

Эти примеры классно показывают, что вовлечь читателя можно, если он может «примерить» на себя те данные, что есть в визуализации. При этом для такого рода визуализаций — чем проще формат, тем лучше.

NYT «You Draw It»

Увидел пример в канале про журналистику данных пример, вспомнил ещё о похожих примерах.

Очень люблю такие визуализации, где тебе предлагают сначала «нарисовать» данные, а потом показывают ответ. У NYT самые классные реализации (если не открывается и показывает paywall, то помогает перейти в режим инкогнито для каждой статьи).

Смерти от наркотиков

Социально-экономические показатели во время президентства Обамы

Как доход семьи влияет на образование детей в институте

П.С. Меня удивило, что каждый раз используются разные визуальные подходы к отображению. Не смог придумать почему.

IronViz 2020

Табло выложили работы, поданные на IronViz — конкурс по визуализации от Табло. В этом году тема конкурса — здравоохранение.

В конкурсе, кстати, разрешено участие только если ты гражданин страны из определенного списка. России в этом списке нет, вот такой толерантный западный мир. =)

Из 371 работы мне приглянулись вот эти три. К сожалению, найти классных работ в жанре «дашборд» не получилось, классные только в виде лонгриодов и журналистики данных.

Про время и день недели рождения детей

  
  

Про проказу в Индии

 
 

Про здравоохранение по странами

Про деньги и масштабы

Визуализация данных — отличный инструмент чтобы сравнивать разные величины. Многие издания пользуются этим и часто делают эмоциональные истории, построенные на сравнении больших величин с небольшими. В этой подборке три работы, где этим пользуются для сравнения денежного состояния разных людей.

Как одним графиком рассказать историю

Эта работа на одном графике сравнивает состояние разных людей. Мне она очень понравилась тем, что используя всего лишь один график автору удалось сделать крутой сторителлинг.

Сначала он показывает и подписывает две точки: наш доход и состояние Джеффа Безоса. Наш доход округляет до нуля, в таких масштабах это, наверное, правда. =)

Потом добавляет точки богатых людей, известно же, что футболисты — очень богатые люди:

Потом добавляет Стивена Спилберга, Джоан Роулинг и Дональда Трампа. Оказывается их состояние также сильно ближе к нашему, чем к состоянию Безоса:

И последним добавляет состояние Илона Маска и других владельцев IT гигантов. И даже их состояние оказывается ближе к нашему, чем к Безосу:

Прям огонь! За одним графиком целый рассказ и интересный конечный факт. Ещё у работы в целом нейтральный посыл и он скорее просто показывает занимательный факт, в отличие от двух следующих работ, где посыл скорее негативный и обвинительный.

Шиииииирокий лонгрид

Эта работа как лонгрид, только в ширину. За счет необычного расположения она привлекает внимание и делает работу интересной. Здесь каждый пиксель — определенное кол-во денег, которыми владеет Джефф Безос.

Сначала автор вводит масштаб:

Потом начинает показывать разные сравнения, чтобы можно было как-то сравнить миллиарды Безоса:

Работа спекулятивна и «очерняет» Безоса сравнивая его состояние с лекарствами для больных и т. п. Кажется, что это манипуляция. Но сам приём сравнения и сторителлинга в этой работе интересный и какие-то идеи можно взять на вооружение.

Видеоинфографика в ТикТоке

Такие же сравнения состояний делают и в ТикТоке с помощью Майнкрафт! А что, это тоже инфографика!

 

Или делают обвинительные видео в сторону Цукербега, сравнивая его пожертвования на борьбу с ковидом и его состояние.

 

Тоже самое, но без манипуляции

Три примера выше получились слегка манипулятивными, но с помощью них хотел показать как можно рассказывать истории сравнивая масштабы данных и задавая разный тон повествования. В противовес этим примерам, вот эта работа с xkcd, где всё вроде тоже самое, но нет манипуляции за счет сторителлинга. Отлично показы масштабы, но выводы читатель может делать сам.

Вместо вывода: с помощью сторителлинга можно создавать нужный тон работе и донести ту мысль которую вы хотите. Нужно это вам или нет для вашей задачи — решать вам. Если сомневаетесь лучше дайте удобный инструмент для анализа, а зритель сам решит как ему трактовать данные.

Интерактивные объяснялки

Кирилл Беляев скинул мне чумовую работу про свет. Я вспомнил, про еще несколько работ в этом жанре с собрал их в этой подборке.

Как работает свет

Это просто чумовой пример как можно делать современные учебники. Я даже не знаю как назвать этот материал, больше всего тянет на главу из учебника. Да и визуализация данных здесь условная, но вот как жанр интерактивной инфографики прям хорошо. Страница явно сделана с любовью, старанием и явно хорошим техническим стеком. Отличный проект!

Больше всего понравилась вот эта часть про отражения света разного порядка:

И про то, как комбинируются цвета:

Как работает машинное обучение

Это потрясающая работа, которая с помощью скролителлинга и графиков объясняет как работает машинное обучение. Проект довольно старый, но у него выходят новые части. Самое классное в нём как частица данных переходит от визуализации к визуализации при скроллинге. Еще мне нравится название команды r2d3, по-моему оригинально )) Остальные работы у этой творческой пары тоже в этом ключе и очень хорошо сделаны. Если ищите вдохновения по этому жанру, то рекомендую.

Как работает парадокс дней рождений

Этот забавный математический факт часто используют преподаватели в ВУЗах. В этой объяснялке от Pudding наглядно показывается как это работает. В целом, этот классный пример направленный именно на неподготовленного слушателя, здесь хорошо подглядеть как объяснять сложные темы обычным читателям. И ещё классно, что в результате читатель видеть как ответили другие и работает ли парадокс дней рождений.

Путешествия и карты

В этой подборке три работы: про компактное отображение маршрутов путешествия; про гибкость Табло и возможность показать в нём мореходные пути; и подборка очень красивых хэнд-мейд карт.

История путешествия беженцев

В этом примере мне многое понравилось, а что-то вызвало вопросы. Разберемся, какие в работе есть классные ходы, а что можно было бы улучшить.

Это работа Federica Fragapane и Alex Piacentini, посвящённая историям шести беженцев, которые, которые бежали из своей страны в Италию в 2016 году в поисках лучшей жизни. Начинается работа с овервью маршрутов каждого из шести беженцев и краткого описания проекта.

 

Мне кажется, что не стоило отрывать маршруты от географии. Я бы показывал это овервью на карте — не так много участников, да ещё два из них пришли «справа» из Пакистана, что совсем теряется когда нет карты.

Грубо, что-то такое:

Следующим этажом в визуализации идёт большая легенда. Она сложная, тут мне не хватило, чтобы читателя провели за руку. Я бы пояснял такую легенду на каком-то одном примере с помощью скролителлинга.

 

Ещё я бы убрал легенду транспорта и просто рядом с маршрутом рисовал бы иконки транспорта. Очень грубо:

 

После легенды идёт история путешествия каждого из беженцев. Можно смотреть путь на карте, а можно выбрать вот такой формат визуализации, как на картинке ниже. Это что-то похожее на «квадратную диаграмму» и этот формат больше всего зацепил меня в работе. Получился очень классный и интересный подход, который позволяет легко сравнивать разные путешествия. Цифры напротив каждой точки — это количество дней, проведенных на остановке, оно же дублируется длинной фиолетовой линии. Высота бирюзового квадрата — количество пройденных километров, ширина — потраченное время. Красные точки — проблемы или важные события на пути беженца.

 

Я бы использовал такой формат, чтобы собрать small multiples со сравнением путешествий. Сразу видно: некоторые путешествия длинные по километрам (высота визуализации), но не такие долгие (ширина визуализации). Одни прошли путь без остановок, другие попадали в тюрьмы и долго оставались на промежуточных остановках (количество и длинна фиолетовых линий). Если не использовать иконки транспорта, то цветом линий можно было бы показать тип транспорта. Докрутив этот формат, было бы классно сравнивать путешествия.

Мореходные пути Английского флота

Это работа Егора Ларина и Саши Варламова. В работе есть, что прокачать по верстке и графически, но для меня она больше про «Табло может как угодно». Классно, что в BI инструменте можно сделать нужную стилистику и «кометы».

Причём «кометы» сделаны гениально и одновременно просто. Это изменение размера линии для последней точки маршрута, решение — огонь.

Хенд-мейд карты

Последний пример про дата-арт. Это подборка безумно красивых карт, которые сшили, связали, вышили или склеили. Тут нечего добавить, просто красота:

Сторителлинг про моральный выбор беспилотника

Сегодня разберу один пример, но довольно подробно. Он зацепил не сложной визуализацией, а продуманным и интересным сторителлингом. Это отличная статья на сайта Канадского радио.

В обычном автомобиле в случае отказа тормозной системы все решения принимает водитель в текущем моменте. А вот в беспилотном автомобиле решения программируются заранее. И появляется этический вопрос: какой выбор должен сделать беспилотник в случае, когда на кону стоят жизни пешеходов и пассажиров. В этой статье читатель отлично проводится по статье с рассуждениями и примерами.

Сторителлинг строится по схеме: гипотетическая ситуация с вовлечением читателя в принятие решения (онбординг, вовлечение и эмпатия) → овервью по всем странам с возможностью выбрать разные страны (изучение и самостоятельное сравнение) → реальная проблематика с примерами и вовлечением читателя (эмпатия) → выводы (подкрепление и интерактив).

Онбординг читателя
В этой части статьи представляется гипотетическая ситуация и просят сделать выбор. Интерактив круто вовлекает читателя, сразу интересно, что же дальше.

Представьте, что вы видите сломанный трамвай. Он мчится навстречу группе из пяти человек. Вы стоите рядом со стрелкой и можете отправить трамвай на другой путь, там находится только один человек. Используете ли вы переключатель, чтобы пожертвовать одной жизнью и спасти пять?

И второй вопрос. Сломанный трамвай также приближается к пяти людям, которые находятся на рельсах. По пути к ним рядом с рельсами стоит крупный мужчина. Толкнули бы вы его под трамвай, если в этом случае транспорт остановится и пять человек останутся живы?

Трамвай, который не спас пятерых

В первом вопросе большинство людей выбирают вмешаться и использовать переключатель. Во втором — наоборот, предпочитают не толкать человека на рельсы.

Эти две дилеммы похожи тем, что предлагают пожертвовать одним человеком, чтобы спасти пятерых, но отличаются тем, насколько активную роль вы должны принять в смерти человека, принесенного в жертву. Интересно, что этого нюанса достаточно, чтобы изменить то, что люди считают правильным этическим выбором. Производители беспилотников должны будут научить свои автомобили, как вести себя в подобных ситуациях.

Овервью и самостоятельное исследование
В этой части статьи читателю дают свободу самому поизучать данные, если хочется. Это вовлекает самых заинтересованных. Тех кому это не нужно просто прочитают вывод.

Должны ли они быть запрограммированы на действия, спасающие большинство жизней, если для этого нужно пожертвовать кем-то, кто изначально не находился в опасности? А что, если придется убить водителя автомобиля, чтобы спасти большее количество людей на дороге? Производителям придется продумать алгоритмы для таких ситуаций. Причем, отказ от выбора сам по себе является выбором.

В 2016 году исследователи Массачусетского технологического института запустили международный опрос через интернет — «машину морали».

Западный, восточный и южный кластер — области, в которых люди принимали похожие решения. Россия находится в западном кластере

Реальная проблематика
В этой части статьи продолжается уже известная для читателя «игра» с выбором, но теперь это реальная проблематика, которую будет нужно решать инженерам. Так как читатель уже знаком с механикой и ему дали объяснение и овервью, большое кол-во таких решений проходит быстро и интересно

Давайте рассмотрим еще несколько ситуаций, только уже с беспилотным автомобилем.

У беспилотника отказали тормоза. Если он продолжит движение, то убьет женщину. На другой полосе стоит мужчина. Должен ли автомобиль продолжать движение прямо или сменить полосу движения? А если так: на полосе движения стоит ребенок, а в соседней полосе — пожилой человек. Что должен сделать беспилотник? Еще одна ситуация: беспилотник собьет двух женщин, если продолжит движение. Если сменит полосу, то вместо них собьет беременную женщину. Или вот: беспилотник собьет двух пешеходов, если останется на своей полосе. Если он сменит полосу, то врежется в одного человека, стоящего на тротуаре.

Попробуйте сами принять решения на сайте статьи.

Выводы
В этой части статьи делается выводы и подводятся итоги, объясняется почему беспилотники не должны вызывать страх и приводится классный интерактивный пример.

Конечно, читая все это, приходишь к мысли, что если беспилотники так этически опасны, зачем они вообще нужны на дороге.

В Канаде подсчитали, что в 2016 году около 94% дорожно-транспортных происшествий были вызваны человеческими ошибками. Помимо устранения человеческой ошибки, беспилотники могут быть в состоянии избежать аварий из-за меньшего времени реакции и более коротких остановочных путей.
Ниже моделирование торможения беспилотника с нулевым временем реакции и автомобиля с водителем, время реакции которого — 1,5 секунды.

Обратите внимание, как возрастает длина остановочного пути с увеличением скорости автомобиля. А значит, возрастает и разница длины этого пути у беспилотника и автомобиля с водителем. В России на автомагистрали автомобиль может ехать со скоростью 110 км/ч. В Италии — 150 км/ч.

Визуализация тормозного пути беспилотника и автомобиля с водителем. Можно менять скорость движения

Тормозные пути рассчитываются для сухого дорожного покрытия. Реальные беспилотники не будут тормозить мгновенно, но могут достичь значительно меньшего времени реакции по сравнению с предполагаемыми 1,5 секундами, которые требуются людям, чтобы начать торможение.

И напоследок: если у вас появилось желание пройти полный тест, это можно сделать на русском языке по ссылке. Он охватывает больше моральных проблем, чем приведено в статье.

Вместо заключения

Мне очень понравился этот пример, много интерактива и легко объясняются сложные вещи. При этом «тяжелая» тематика сглажена пиксельной графикой и оформлением. Отдельно понравилось как были встроены видео экспертов — очень круто и не обычно, хотя просто поменяли соотношение сторон видео, а сразу ощущение, что собеседники разговаривают между собой и «живут» внутри этой статьи.

Отказ от угля, цвета фильмов и кассовые сборы

Использование угля в электроснабжении Англии

Работа Гардиан, посвященная тому, как Англия отказывается от угольного топлива для электроснабжения страны. Очень аккуратная и понятная работа, приемы которой можно легко использовать в бизнес среде. В работе два графика.

Первый график — это bar-code chart. Он показывает процент энергии, которая производится на угле за каждый день с 2012 года. Каждая полоска — один день. Чем темнее полоска, тем больше энергии производится за счет угля. Если процент угля равен нулю, то полоска зеленеет. Это классный пример неравномерный цветовой шкалы, которая ярко подсвечивает нужные значения. Но! С этой шкалой есть и проблемы — создается ощущение, что вся энергия в стране становится «зеленой», а это совсем не так. Это становится понятно только на следующем графике.

Ниже в статье «квадратная» карта Европы, где показан процент энергии, генерируемый разными видами топлива. Мне очень нравится, что этот формат так прижился в датавизе. Я не знаю ни одного другого формата, который был бы придуман за последние 5-10 лет и который настолько проник во все СМИ и визуализации. Это круто и такой формат классно решает свои задачи: показать примерную привязку данных к географии и при этом не иметь искажения из-за размеров гео-объекта.

 https://www.theguardian.com/environment/ng-interactive/2019/may/25/the-power-switch-tracking-britains-record-coal-free-run

Обратите внимание, на мобильном эта карта превращается в «таблицу» и при этом страны упорядочиваются по алфавиту, а не географически.

Цвет фильмов

Это довольно старый вид визуализаций, но мне про него напомнил друг, который скинул одну из вариаций такой визуализации. Плюс напомнила про это предыдущая визуализация bar-code из Гардиан. В таких визуализациях для каждого кадра фильма «усредняется» цвет и показывается в виде полоски. Посмотрите насколько разные палитры получаются для Аладдина, Алисы в Стране чудес и Чужого. Существует несколько проектов, кто делает такие визуализации. Самый известный, пожалуй, The Color of Motion. Можно очень долго залипать, фильтруя разные жанры, года и т. п.

 

Есть и более «продвинутые» версии таких проектов. Они показывают не только цвет, но и количество действий в фильме, его длительность и т. п.

Также используют и другой способ визуализаций — суммируют изображение каждого кадра в одно целое. Вот пример такой визуализации по вестернам. Каждый прямоугольник — отдельный фильм. Он получен путем наложения кадров друг на друга с прозрачностью.

В общем, в эту тему можно погружаться бесконечно, вот огромный лонгрид про цветовые палитры в фильмах.

Мне во всех этих визуализация только не хватает какой-то картинки, где было бы показано много-много фильмов одновременно в разбивке по жанрам/годам и т. п. Что-то такое, как ниже на картинке, но более компактное и по разным фильмам, а не одной серии.

 

Кассовые сборы фильмов

Если уж зашла речь про фильмы, то хочу вспомнить классную работу Нью-Йорк Таймс. В этой работе всё замечательно, её можно рассматривать очень долго. Каждая «река» — один фильм. Очень круто видно, как нарастают его кассовые сборы, как долго кино идёт в прокате и есть ли повторные пики популярности.

 

Саша Варламов сделал ремейк этой работы в Табло Паблик. Это очень классно, так как версия Нью-Йорк Таймс сделана на флеше, а он скоро совсем умрёт.

Ранее Ctrl + ↓