Јесења школа за податке - утисци и поруке
Како ући у свет рада са подацима?

Крајем октобра 2019. организована је Јесења школа за податке чији је отворен позив био упућен представницима организација цивилног друштва и државне управе, новинарима и представницима медија, истраживачима и стартап покретачима. Мултидисциплинарни тимови су кроз петодневни рад прошли кроз обраду, анализу и визуализацију података. Предавања и радионице су обухватили програмски језик R и Python, data mining, технике визуализације података и правни оквир за коришћење отворених података.

Разговарали смо са предавачима Урошем Крчадинцем, програмером, уметником и доцентом на Факултету за медије и комуникације на предметима нових медија, програмирања за уметнике и визуализације података и Татјаном Кецојевић доктором статистике са Универзитету у Манчестеру са искуством сениор предавачице на универзитету у Великој Британији и активне чланице R заједнице. Да бисмо ослушнули какви су ефекти радионица били на полазнике, наш трећи саговорник је Дејан Дојчиновић математичар са мастером из развоја локалних заједница на Балкану.

За почетак, у једном се сви слажу, а то је да овакве радионице представљају неопходан подстрек да се створе мултидисциплинарни тимови које није тако лако направити у току регуларних пословних пројеката или истраживања. Мешовити тимови дизајнера, програмера, истраживача или других учесника који долазе из хуманистичких наука, посматрају друштвене изазове из више углова и имају могућност да кроз комбиновање података дођу до иновативнијих решења. Дејановим речима:

Овакве радионице осим што увећавају знања и вештине самих учесника, посредно оснажују њихове индивидуалне активности у сопственим заједницама.

Други заједнички утисак је важност отварања врата за улазак у практичну употребу отворених података. Уз уклањање заблуда да се програмирање може научити у току једне радионице као и да програмирањем решавамо све проблеме, интегрисање нових практичних знања у малим корацима подиже квалитет пројеката у свим областима. Урош Крчадинац истиче да је највећа снага отворених података њихов допринос објективности информација које доспевају у јавност и спречавају ширења тзв. “паушалних трућања” - произвољних наратива који се не базирају на чињеницама.

Снага писмености за разумевање и коришћење података је у томе што су на вашој страни јачи аргументи у односу на страну која нема податке. Подаци нису цело решење, али су веома важан део решења. Урош даје пример како је популарно мњење о томе како је Панчево загађеније од Београда заправо нетачно. Званични СЕПА подаци показују да је Београд тренутно (почетак децембра 2019.) заправо загађенији од Панчева. На пример, само ПМ10 честице чија се количина мери на 24 сата, на 3 мерна места у Београду показују већу загађеност него у Панчеву! Што и даље не значи да Панчево није загађено, већ да је, заједно са Београдом, високо позиционирано на листи градова са прекомерним загађењем.

Колико је обрада и разумевање података стварно важна за наше животе?

Колико год ово питање звучало драматично, у њему има нешто истине. Голи подаци су попут телефонског именика: доступни су, можемо да их прочитамо, и колико год било важно, то никоме није занимљиво да ради. Да би порука која се тиче људи из података изашла на прави начин и утицала на стварне промене, потребно је да буде релевантна, али и интересантна. Моћ добро усмерене податковне приче долази из једног примера из XIX века када је Џон Сноу (није онај лик из Игре Престола) показао да су смрти од колере везане за локације загађених извора воде у Лондону. Другим речима - његове мапе (визуализације отворених података, рекли бисмо сада) су заправо спасиле велики број живота. Онлајн мапе, могли бисмо аргументовати, спашавају још један веома важан аспект људског живота - време и стрпљење.

Татјана је држала радионицу програмског језика R и тврди да је коришћење података директно повезано са нашим квалитетом живота:

Отворени подаци помажу грађанима да објективно анализирају одлуке институција и да доносе информисане одлуке путем анализе доступних ресурса и на тај начин подижу и свој и општи квалитет живота.

Када се рачунарска мистификација склони, нестаје тај вео недоступности података који одбија све оне који немају искуства са програмирањем. Урош, коме је баш техничко образовање основно, инсистира на томе да обрада података не сме да буде још један ниво фетишизације технологије.

У епохи преплета у којој живимо, мултидисциплинарност је кључ. Данас нема озбиљне анализе друштвених појава без математике, једнако као што нема одговорног програмирања без познавања друштва. Да се ја питам, социологија технологије би била обавезан предмет.

Колико је тешко (или- досадно?) приступити обради података када немате много искуства?

Предавачи Јесење школе се слажу да ниво техничке писмености није највећи проблем, већ стање отворености да научимо нове ствари са којима у току званичног образовања нисмо имали прилике да се сусретнемо. За коришћење напреднијих софтвера, основни ниво познавања програмирања јесте неопходан, али ако сте потпуни почетник, постоје кораци који се могу предузети да се полако и без стреса закорачи у свет обраде података.
Први корак јесте Национални портал отворених података на којем се налазе отворени подаци и примери коришћења у оквиру различитих тема и пројеката. Следећи кораци се односе на тему у оквиру које се подаци користе и на претрагу алата који могу помоћи да се подаци јасније прикажу. Најлакшe је одмах испробати веома једноставне програме за визуализацију, као на пример Tableau који нам за само 15 минута може понудити корисне визуализације наших одабраних сетова, јер је унутар програма понуђен и врло јасан, “корак по корак” водич кроз коришћење. Наредни кораци се односе на нашу одлуку да учимо даље, посећујемо радионице и користимо доступне онлајн курсеве, вебинаре и информације које ће нас даље уводити у свет рада са подацима. Програмски језици R и Python су веома популарни и на блиц претрази на Coursera сајту нашли смо неколико основних курсева које може било ко да похађа. Такође, вреди погледати и ресурсе о разумевању, обради и визуализацији података које нуде потпуно бесплатна Khan академија и Udemy платформа која врло често има велике попусте за курсеве који су им у понуди. Не треба занемарити ни то колико се неко потрудио да вам учење о подацима учини забавним. Урошеве радионице су сада већ постале познате по свом креативном приступу - у оквиру Јесење школе користио је пољану испред Мокрин хоусе-а да корисници направе људски scatter plot и тако боље разумеју његову логику и коришћење. Ричард Фејнман, физичар и добитник Нобелове награде, има једну добру поскочицу која каже да ако вам је наука досадна, вероватно је учите од погрешног професора.

слика са Урошеве радионице

Ако је судити по ефектима радионица на полазнике, били су и инспиративни и практични. Дејан је одмах након Јесење школе, уз нова Р знања, кренуо у разраду свог пројекта који боље приказује изборне податке:

Прототип апликације се може видети на https://deksterica.shinyapps.io/PA2016/ Користећи отворене податке и отворен софтвер, а инсистирајући на могућности ширења на друге заједнице, желим да, мапирајући изборне резултате, омогућим нове увиде у изборне процесе на микро нивоу.

Отворене могућности и комплетније образовање

Чињеницу да постоји доступно, отворено и бесплатно образовање у пољу обраде података треба искористити и направити искорак у властитој каријери, без обзира на област интересовања или ниво стручне спреме. Урош тврди да је то један од ресурса које треба обилато користити и себе усавршавати када год се за то укаже прилика, јер је једини начин да исправимо грешке које нам је донело класично образовање, а које тржишно окружење користи против нас самих.

Пуно “друштвењака” се као по неком правилу плаши математике и технологије, а студије инжењерства се дешавају у суженом либерално-капиталистичком окружењу које нас тера да се фокусирамо на посао и прагматизам, и тако не стижемо да научимо како да будемо људи тј. како да пројекти и производи излазе из разумевања за људе.

Татјана је саставила листу корисних линкова везаних за програмски језик Р и рад са отвореним подацима уз охрабрење у духу отвореног софтвера свима који желе да уђу у свет података, а које можете наћи на ROpenSci:

R заједница није само за напредне кориснике или програмере. Место је за све врсте корисника и све заинтересоване да науче више о програму R.

Запратите #rstats хештег- осећаћете се добродошло у овој интерактивној заједници R корисника
На Твитеру погледајте R-Ladies- са више од 30 локалних заједница ова светска организација промовише инклузивност и родну равноправност у оквиру R заједнице
Локални R сусрети- обична онлине претрага може да вам покаже где се одвијају, а ако их нема у вашем окружењу, размислите да их покренете!
Rweekly- одличан недељни преглед свега занимљивог везаног за програм R
R-bloggers- исцрпан ресурс да пронађете различите постове R блогера
DataCarpentry и Software Carpentry- овде ћете пронаћи свима доступне лекције и курсеве који промовишу истраживачки приступ подацима
Stack Overflow- велика је шанса да је неко већ поставио слично питање вашем везано за R програм, а људи из струке ће овде наћи и понуде послова
RStudio Community овде отворено можете постављати питања и пронаћи одговоре за различите R недоумице

Ми се надовезујемо на утиске предавача и полазника и позивамо вас да се одважите да уђете у свет обраде и визуализације података. Погледајте доступне податке на Националном порталу отворених података и поделите своје пројекте или истраживања у оквиру Примера употребе како бисмо унапредили општу податковну писменост и инспирисали даљу употребу и комбиновање отворених и других података у Србији. Одлична референца и помоћ на вашем путу биће вам једноставан и практичан Водич кроз отворене податке.

Јесења школа за податке је организована у оквиру пројекта „Отворени подаци – отворене могућности“, који спроводе Канцеларија за ИТ и е-Управу и УНДП, уз подршку Фонда за добру управу Уједињеног Краљевства и Светске банке.