Објављено 24. август 2018.
Шта су отворени подаци?
Појам “отворени подаци” се појављује тек пре неколико година. Стога постоји потреба да се он дефинише и ближе објасни. Овај појам је у српски језик ушао преводом речи са енглеског језика - Open Data. Самим преводом није пуно изгубљено јер и у енглеском се овај појам дефинише и објашњава. Постоји више дефиниција , а како не постоји јединствена, без ризика да се неко увреди јер није изабрана управо његова дефиниција, у овом приручнику ћемо дати своју:
Отворени подаци су комплетни, ажурни и изворни подаци којима свако може слободно приступити, поново користити и делити их даље, без обзира на сврху.
Овако кратка дефиниција захтева нешто дуже објашњење.
Комплетност
Да би подаци били комплетни они треба да обухвате целину прикупљених информација, без изузимања делова информација под изговором да се подразумевају или нису битне. Уколико постоје подаци о личности, потребно их је уклонити односно деперсонализовати податке, али не методом агрегације. Уколико је неопходно, податке треба агрегирати минимално могуће.
Уз податке који се дају потребно је обезбедити шифарнике који се односе на дате податке. У случају комплексније структуре веома је корисно и објаснити структуру података.
Додатне информације уз дате скупове података дајемо помоћу метаподатака. Метаподатке још зовемо подацима о подацима. Користимо их како би постигли интероперабилност између различитих портала и за лакше сналажење међу подацима. Уобичајено је да у метаподацима наведемо назив скупа података, надлежну институцију, период на који се подаци односе и сличне информације.
Уколико постоје изведени и рачунати подаци, информација о томе како су извођени треба да буде дата у виду објашњења или линка на методологију која је коришћена. Ове информације треба представити у оквиру описа ресурса или скупа података.
И на крају, да би били комплетни потребно је обезбедити приступ историјским подацима, односно не уклањати претходно објављене отворене податке.
Ажурност
Информација вреди само уколико је правовремена. Након неке природне катастрофе, као што је поплава или земљотрес, свима је јасно да се катастрофа догодила и информација о томе више није актуелна, за разлику од ажурне информације која може да спаси људске животе. Само информације објављене одмах по прикупљању, односно у реалном времену дају пуну функционалност отвореном скупу података. Препоручује се да ће се успоставити електронски аутоматски механизам, који без интервенције човека може да ажурира и објави најновије податке.
Изворни подаци
Тумачење и агрегација су велики непријатељи отворених података. Податке треба дати у изворном облику, управо онако како су прикупљени. Агрегацијом података та целина се нарушава. Детаљи о процесу прикупљања података и извори података такође треба да буду објављени, а добро место за њихово објављивање су метаподаци.
Слободан приступ
Слободан приступ подразумева да су скупови података једноставно доступни. Препреке које се могу јавити могу бити физичке природе, где се на путу до података захтева посета некој институцији, попуњавање формулара, подношење захтева уз позивање на закон о слободном приступу информацијама и сличне обесхрабрујуће и захтевне поступке.
Препреке могу бити и технолошке природе, када се информације дају путем страница и технологије, нпр. flash, silverlight, java apleta - одакле их није могуће лако преузети без активног учешћа човека у том процесу. Често је информација дата на страници која нема перманентни линк већ се генерише преко ЈavaScripta, што опет спречава слободан приступ подацима.
Подаци морају бити доступни свима, стално, без учешћа човека у процесу.
Коришћење отворених података би по правилу требало да буде бесплатно. Показано је да је коришћење података који се не наплаћују више десетина пута веће у односу на податке за које треба платити макар и симболичну надокнаду. Истраживање спроведено од стране Open Data Institute показује да разлика између података за које се плаћа и бесплатних отворених података може да генерише 0,5% бруто домаћег производа.
Коришћење и даље дељење података
Да би подаци могли поново да се користе они морају бити дати у облику који је могуће машински једноставно обрадити, односно у машински читљивом облику. Уколико податке прикажемо у облику скениране слике, како је уобичајено у пракси органа управе (да би се видео печат), рачунар то свакако не може да разуме као податак, већ му је неопходан човек да би растумачио тако дату информацију.
Подаци треба да буду дати у једном или истовремено више актуелних отворених формата, као што су на пример CSV, XML, JSON. Овакве податке машина даље може једноставно обрађивати и евентуално комбиновати са другим изворима података, чиме се остварује додатна вредност отворених података.
Грешка је уколико се подаци дају у формату који није отворен јер то обично подразумева куповину лиценци да би се уопште могли читати такви подаци. Најчешће грешке су објављивање у форматима који припадају Microsoft - у (doc, xls...).
Поред техничког аспекта, да би подаци могли поновно да се користе и даље деле потребно је и да је задовољен правни аспект. Члан 27 Закона о електронској управи уређује дужност органа да објављују своје податке које прикупљају.