Добра визуализација је кључан начин како да савладамо “нељудскост” података

Визуализација анализе комбинације инструмената и њиховог утицаја на енергичност песама на Spotify платформи, из пројекта What's That Sound Again?

Да ли вам се догодило да се осећате збуњено или незаинтересовано када се нађете испред xls табеле или json документа са дугачким низом слова и бројева? Вама су потребни јасни закључци и параметри који илуструју ситуацију, а отворени подаци долазе у формату занимљивом за машине, али не и за људе. Једна од главних препрека у практичној употреби информација који су нам на располагању у форми отворених података најлакше се решава - визуализацијом података.

  • “Ако податке прикажемо на начин који је разумљив, занимљив, узбудљив или провокативан, отворени подаци добијају димензију која може да промени наше схватање света и појава у њему. “

Јован Лековић је дуго времена провео у центру у којем подаци и њихова обрада утичу на ставове и одлуке читалаца широм света. Радећи у BBC тиму у Лондону бавио се не само визуализацијом података већ и дефинисањем интерних стандарда, које су објавили као BBC Audiences Tableau Style Guide. Јован је често био пред изазовом како да што јасније пренесе резултате обраде података најразличитијим циљним публикама.

Практична обрада и атрактивно представљање података су и наши велики изазови и зато смо разговарали са њим о важности визуализације података, улози отворених података у медијима, о изазовима визуализације и перцепције података у јавности, као и о добрим примерима из праксе.

Зашто је важна визуализација података?

Не би ме изненадило када би историчари (у будућности) садашњи период описивали као тренутак револуције података. Тренутно нам подаци помажу да донесемо одлуке у свакодневном животу, у послу, и у друштвеним односима. У суштини, визуализација је начин да претворимо апстрактност бројки у нешто видљиво, сажето и разумљиво. Рецимо, да преточимо огромну базу података у приказ који свако може да разуме. Можемо да сведемо појаве које трају деценијама у анимацију која траје неколико секунди. Или да дозволимо кориснику да нађе битан детаљ у сложеној хијерархији.

Како визуализација помаже у коришћењу отворених података и закључивању на основу њих?

Пристрасан сам наравно, али по мени приказ података игра велику, ако не и кључну улогу у раду са отвореним подацима. Ако је сврха отворених података да омогуће транспарентније друштво и увид у стање света, визуализација је један од најбитнијих начина комуникације тих увида.

  • Отворени подаци су имали огроман утицај на визуализацију као струку. Пре појаве отворених података, пронаћи податке за визуализације је било веома тешко, скупо и споро. Са једне стране, постојање отворених података омогућава да се бавимо занимљивијим приказом тих података. Али, са друге стране, омогућава да те податке користимо као подлогу и контекст за неке сасвим нове идеје.

WhatsThat Sound-Again Jovan Lekovic

За пројекат What's That Sound Again?, користећи Spotify api обрадио сам 200 хиљада песама, 28 хиљада плејлисти на којима се појављује 57 хиљада различитих уметника.

Која је улога података и отворених података у (онлине) медијима?

Један од мени најзанимљивијих феномена у последње две године у отвореним подацима у Британији јесте извештавање на тему разлике у платама зависно од пола. Раније, ово би можда била тема која би била више везана за академске институције и ограничена на академску публику. Тиме што се читави скупови података објављују сваке године створило је озбиљну дискусију на годишњем нивоу у којој учествују медији, компаније и британска јавност. И то је само један од скоријих примера. Отворени подаци мењају начин на који причамо о здравственим установама, о неједнакости у поседовању некретнина и политичким феноменима. Оно што је посебно интересантно је један мање видљив аспект примене отворених података:

  • Отворени подаци омогућавају пружање информативног контекста. Ако неко представља податке о бескућништву у одређеном региону, са отвореним подацима је веома лако приказати и историјат незапослености који је сигурно битан за ту тему. Добра визуализација података омогућава свеобухватније схватање друштвених прилика.

Како се визуализација података ради у BBC тиму?

Моја улога у BBC-ју је била унутар тима од преко 100 људи (што додатно говори о важности анализе параметара у једној медијској кући) који се бавио разумевањем односа BBC-а и британске јавности. Да бисмо разумели тај однос, тим је користио различите истраживачке методе. Од гледаности ТВ канала, до сложених упитника о квалитету садржаја, фокус група, до вишегодишњих посматрачких студија. Од извештавања о томе како се мења слушаност радија, до темељних анализа о улози друштвених мрежа у животима младих људи. И све те технике на један или други начин производе море података који треба да допринесу бољем схватању гледаоца, слушаоца и читаоца ББЦа. Затим, све те податке треба средити и јасно пренети новинарима, уредницима, режисерима, продуцентима, коментаторима, компјутерским програмерима и менаџменту BBC-а.

Ја сам имао срећу да иницирам стварање радног места специјализованог за визуализацију података. Конкретно, то је подразумевало да обучим тим како да корисити технике визуализације, поставим стандард квалитета визуализације унутар тима, и да развијам визуализације и апликације које су од значаја за BBC. Добар пример пројекта који сам развијао са тимом, јесте апликација која помаже уредницима да схвате какав ефекат има коришћење друштвених мрежа. Ово је подразумевало сарадњу са неколико различитих тимова, скупљање и аутоматизацију података, дефинисање мера које су од значаја, дизајн апликације и обуку корисника.

BBC Audiences Tableau Style Guide

Из пројекта BBC Audiences Tableau Style Guide

Сада када визуализацију радиш у свом студију, како изгледа твој посао?

Као фриленсер имам слободу да користим време на мени три битна начина: истраживање за личне пројекте, предавања, и развој пројеката за клијенте. Главна разлика јесте што овакав рад подразумева много флексибилнији приступ пројектима, јер захтева способност да се сваки пут савлада област којом се клијенти баве, разуме систематизација њихових података и њихова питања, програми и култура података. Што значи да је сваки пројекат другачији и да представља нове занимљиве изазове, теме и методе.

Како си се одлучио да се визуализацијом података бавиш пуно радно време?

Бавим се визуализацијом података на један или други начин преко десет година. Већи део каријере је то била нека врста радног хобија, који су колеге запажали и ценили. У BBC-ју сам добио прилику да тај “радни хоби” озваничим радним местом, које се само тиме бави. Прошле године сам одлучио да отворим The Synthesis Bureau да бих могао скроз да се посветим визуализацији.

  • Не могу да замислим занимљивију струку у занимљивијем периоду за ову струку. Визуализација спаја неколико дисциплина које до сада нисмо сматрали сродним. Статистику и дизајн, програмирање и теорију уметности, журналистику и математику. Што значи да стално имам нешто ново да учим, пружају ми се могућности да користим свакакве технике и да покушам да испробам нове концепте и идеје.

Са којим се проблемима сусрећеш у процесу одабира података и визуализације?

Клише је, али и често истина, да је 80% процеса визуализације припрема података. Подаци су често у компликованим форматима или нису прилагођени машинском читању, што је технички изазов. Мени су занимљиви и концептуални изазови. Како се до тих података дошло? Да ли су то подаци које смо раније видели? Да ли постоји нови начин да се подаци прикажу? Шта недостаје у подацима и како то приказати? Да ли подаци осликавају нешто што не очекујем? Колико имам поверења у извор података? Да ли су подаци везани за тему која је на неки начин актуелна?

Који су проблеми у процесу перцепције и/или недовољно стручне анализе и визуализације која може да наведе на погрешне закључке?

Визуализација података делује као једноставан процес, међутим веома је лако направити грешке. Класичан пример јесте тврдња Едварда Тафта како су НАСА инжењери могли да спрече експлозију свемирског шатла Челенџер бољим приказом података (тема која је доста дискутована унутар заједнице). У свакодневној визуализацији је битно схватити податке, наћи најбољи начин да се ти подаци представе и нарочито - водити рачуна о томе како ће читаоци визуализације да интерпретирају те податке. У сва три корака могуће је направити грешке. У схватању података могуће је да постоје грешке у методу прикупљања које треба разумети и пренети читаоцу. У приказу података може се, на пример, непримерено користити графикон са 3D ефектима који могу да смање читљивост. И коначно, треба разумети кориснике визуализације. На пример, употреба боја у приказу може да буде нејасна корисницима који пате од далтонизма. Има случајева да читаоци не разумеју терминологију, скраћенице и приказане мере, или може нам се десити да се саплетемо о дизајн корисничког искуства - на пример да читаоци не разумеју како да користе интерактивне компоненте.

И вреди рећи да сви ми о визуализацији још увек имамо доста тога да научимо. У часопису Economist, који има дугу традицију иновативног приказа података, објавили су списак примера где сматрају да су погрешили. У последњих десетак година виђамо и фантастичне радове у академској јавности и струци који покушавају да успоставе стандарде, које је релативно лако применити. На пример, вреди пратити Multiple Views који објављују принципе које истражује академска јавност или Data Visualisation Society који је покренуо одличну дискусију о стандардима у струци.

Како популаризовати коришћење отворених података?

Имајте у виду да заједница која се бави визуализацијом података обожава добар изазов. Makeover Monday и Storytelling With Data Challenge су одлични примери иницијатива које користе податке у јавности да прикажу занимљиве приче користећи визуализацију. Лично су ми инспиративни пројекти који повезују стручњаке за податке са добротворним организацијама које покушавају да добију одговор на спечифицно питање или реше конкретан проблем. На овај начин употреба отворених података добија веома прагматичну димензију. Има неколико организација које се баве управо овом темом. DATA4CHANGE и DataKind су одлични примери. Коначно, отворени подаци који су приступачни и лаки за обраду ће увек бити занимљивији кандидати за визуализацију. Имати квалитетне мета-податке, добру структуру података, коментаре стручњака, јасна обележја и стандардизоване табеле су изузетно битни у развоју пројеката.

Како су успешне примене најбољи покретачи, да ли можеш да поделиш са нама неколико примера где је визуализација направила разлику?

Класичан, и мени омиљени пример, јесте графикон који је развила Florence Nightingale током кримских ратова. Да би убедила законодавце да уложе у боље услове у болницама, произвела је графикон који показује узроке смрти у кримским ратовима у три категорије: смрт на бојном пољу, смрт које су могуће спречити и смрт од других узрока. У графикону је јасно да је смрт од узрока које било могуће спречити највећа категорија и нешто што би британске власти могле да промене. Ово је био тренутак који је трансформисао схватање здравства и санитарних услова у здравству.

Nightingale mortality

Савременији пример јесте рад Ханса Рослинга, који је био водећи глас у жељи да преобрази схватања света на макро нивоу. Рослингове методе су генијалне. За визуализацију је користио све што му је при руци да би променио застареле перцепције. Од Лего коцки, преко ролни тоалет папира, анимираних визуализација, до гутања сабљи на сцени. Али кључно, користећи све те технике створио је једну значајно другачију слику о савременом добу, било да је причао о трећем свету, пренасељености планете или изазовима током епидемије еболе.

Да ли визуализација може да промени свет (што може да звучи оптимистично) у областима зелене енергије, екологије, заштите приватности података, превенције ширења лажних вести?

  • Занимљиво је да већина проблема којима се данас бавимо има квантитативну димензију.

Било да причамо о климатским променама, угрожености животињских врста, једнакости полова, или политичкој нестабилиности, постоје подаци помоћу којих можемо боље да разумемо те проблеме. И срећом струка визуализације се већ бави тим проблемима на много начина. Било да говоримо о новинарству које представља податке да скрене пажњу на кључне проблеме, академским институцијама које визуализују како ће свет изгледати, или институцијама који праве dashborad-е који ће помоћи да се разумеју области у које највише треба инвестирати.

Колко год бих хтео, тешко би ми било да кажем да визуализација сама по себи може да промени свет. Али свакако може да нам прикаже свет на један нови начин. И у том процесу приказивања може да нам изоштри слику коју имамо о свету. Може да нам укаже где су проблеми. Може да нам прикаже која решења су најбоља. И дефинитивно може да нам омогући информисанију дискусију о стању света и могућностима промена.

Интервју припремила Катарина Поповић за Национални портал отворених података, мај 2019.