Отворени подаци у служби научних истраживања и отворене поделе резултата
Отворени подаци и отворен научни метод: сарадња за бољитак човечанства

Настанак гравитационе астрономије и успешно доказивање Ајнаштајнове теорије релативитета везује се за један величанствен експеримент: снимање гравитационих таласа. Како професор и нобеловац др Бери Бериш у разговору са др Дарком Доневским за часопис Елементи каже, тим пројекта ЛИГО (енг: Laser Interferometer Gravitational-Wave Observatory) је организован као интернационална сарадња научника и различитих стручњака која је по својој структури функционисала као тим који гради мостове!

Све је као и са мостовима – постоје временски рокови, постоје велики таласи који вам некад засметају, али када гледате како тај мост расте, заједно са осталим људима који мост граде, ви постајете свеснији значаја тога што радите.

Метафора мостова чини се идеалном да представи још један научни метод који мало по мало мења свет: отворени научни приступ (енг. open science). Ако замислимо мејнстрим научно тржиште као набујалу реку пројеката, патената, профита и надметања ко ће први нешто открити, онда отворену науку можемо посматрати као мост који се извија изнад мањих циљева, и настаје у колаборацији која више мари за мултидисциплинарне пројекте и сретање резултата негде изнад - у нашем већем интересу. И у том смислу је ЛИГО пројекат занимљив, јер су сви подаци отворени за даље коришћење у оквиру Отвореног научног центра за гравитационе таласе. Интересантно је и то да је сама астрономија доста утицала на развој отвореног научног метода у целини.

Зашто је отворени научни приступ важан и какву улогу играју отворени подаци?

Kao што Маркус Ханвел, један од модератора opensource.com платформе, добро примећује, цитат најстарије националне научне институције, британског Royal Society: “Не верујте никоме на реч” (лат. “Nullius in verba”), приказује да размена резултата истраживања, њихово проверавање и доказивање јесте саставни део научног метода. Када се тај принцип примени на све научне дисциплине и установе широм света, помислили бисмо да се сви подаци, резултати и радови деле отворено и слободно, у име напретка човечанства. Иако се ограђујемо од било каквог коментара везаног за мотиве који се мењају са вековима, сам метод и резултати заправо нису увек отворени и у том пољу, иако има помака, има још доста посла. Научна истраживања захтевају велике буџете и објављивање научних радова као и њихова доступност се у великој мери и даље везује за издаваче који наплаћују озбиљне суме новца за чланарину, што појединцима и мањим научним институцијама чини многа истраживања и резултате недоступним.

Међутим, криза изгледа има моћ да уклања и дубоко укотвљене препреке. За разлику од отворене платформе Arxiv.org на којој је преко 1,687,264 научних радова из физике, математике, економије и многих других области, талас отварања приступа научним радовима сада је захватио и велике издаваче. Jstor је делимично отворио своје базе научних радова за студенте у карантину који не могу да присуствују предавањима, у (партнерским) образовним институцијама, а Elsevier је омогућио бесплатан приступ свим научним истраживањима у вези са вирусом SARS-CoV-2. И то су само неки од примера. Још један занимљив одговор на новонасталу кризну ситуацију је пример платформе која позива научнике да учествују тако што дели специфичне сетове отворених података. Отворени изазов COVID-19 Open Research Challenge у организацији Беле Куће у Вашингтону и водећих научних истраживачких група је тренутно и даље активан. У организацији Европске комисије, три дана последње недеље априла организован је и највећи паневропски хакатон за иновативна решења у борби против коронавируса. Стручњацима су на располагању и решења попут апликације Covid-19 Ekspert - алат који информације сакупљене из заједнице ставља на располагање медицинским радницима који лече пацијенте од коронавируса. Како је најсигурнији начин да се епидемија заустави проналажење вакцине (или ефикасне терапије) истраживачи креирају симулације понашања вируса да би га што пре и што боље упознали. Такве предикције користе пуно меморијског капацитета компјутера, те је покренут пројекат Folding At Home. Волонтери из свих крајева света инсталирају једноставан софтвер на своју кућну машину и тиме повећавају укупан капацитет свих повезаних компјутера у један суперкомпјутер. Тренутно је милион волонтера и моћ суперкомпјутера је већ сада шест пута претекла претходни најјачи суперкомпјутер IBM Summit. Пројекат је почео са радом 2000. године и до сада је тим научника који га води објавио неколико научних радова - од истраживања антибиотика, Алцхајмерове, Паркинсонове болести и рака, до тренутног рада на истраживању понашања протеина новог коронавируса. Последње симулације молекула добијене овом методом можете видети овде, а за истраживање лекова који могу бити примењени на вирус, научници се фокусирају на симулацију активности протеина који се везује за људске ћелије. Важно је истаћи да било ко може бити волонтер и у овом случају се научни пројекат отвара према најширој популацији која може да допринесе свој део отварањем приступа технологији коју већ имају у кући.

Да заронимо дубље у значај отворене науке и отворених података, разговарали смо са три научника: др Иваном Гађански Станић, помоћником директора за науку и вишим научним сарадником на Институту БиоСенс, Универзитета у Новом Саду, др Ирис Жежељ, ванредном професорком на катедри за Социјалну психологију Филозофског факултета у Београду и др Дарком Доневским, астрофизичаром из Центра за космологију Универзитета у Трсту.

Сви саговорници сматрају да су отворени подаци практично неопходни за отворени научни метод и да је њихова вредност вишеслојна. Предуслов су за контролу квалитета (откривање грешака и пропуста), избегавање понављања (и неетичког понављања) експеримената и паралелног изучавања. Отворени подаци и њихова размена омогућавају бољу проверљивост резултата и тзв. репродуцибилност научних студија и њиховом је употребом свако поновно коришћење једноставније (за ре-анализе и нове анализе). Такође, организовани отворени подаци су одличан начин да сви сарадници на научном пројекту своје резултате сачувају на једном, увек доступном месту, што и комуникацију чини бржом и транспарентнијом. Гледано из угла целог друштва, научна истраживања се у већини случајева финансирају из јавних извора и самим тим резултати треба да буду отворени и доступни свима, како би научна сазнања могла да доспеју до најшире популације.

Др Ивана Гађански Станић дефинисала је три начина како се отворени подаци користе у оквиру отвореног научног метода: у отвореним истраживањима (енг. open research data), отвореном приступу научним радовима (engl. open access) и кроз отворени код, дизајн и друге елементе софтвера и хардвера (eng. open source).

Из искуства на два Horizon 2020 пројекта којима тренутно координира: DRAGON и IPANEMA, др Гађански Станић наводи да се на почетку пројекта учесници изјашњавају да ли желе да учествују у Open Data Research (ОДР) пилот студији у оквиру које су дефинисани и типови отворених података на том пројекту:

Студија је иницирана због неопходности успостављања односа између отворених података тј. отвореног приступа свим подацима са једне стране, и омогућавања безбедности, заштите приватности, као и генерисања интелектуалне својине у циљу комерцијализације (нпр. у виду патената), што је и даље (ипак) неопходно. Сваки пројекат који одлучи да учествује у ОДР пилоту, мора да припреми тзв. План о коришћењу података (енг: Data management plan), у који се уносе специфичне одреднице о типовима података који ће бити јавно доступни односно који ће бити заштићени.

Иако се многе велике издавачке куће противе, све је више универзитета који се окрећу отвореном приступу научним радовима, што значи да се приступ комплетном научном раду не наплаћује, наводи др Гађански Станић. Европски пројекти у оквиру Horizon 2020 шеме финансирања су обавезни да своје резултате објављују на овај начин. Визија OpenAire платформе добро дефинише и настојања и значај отворених података и отвореног приступа:

Трансформишемо друштво кроз валидирано научно знање. Омогућавамо грађанима, едукаторима, финансијерима, јавним радницима и индустријама да пронађу начине како да научна сазнања буду корисна у оквиру радних окружења и целог друштва.

Из угла стручног управљања подацима истраживања, Обрад Вучковац, библиотекар Института за нуклеарне науке у Винчи, сматра да је правилна организација и планирање података пре, у току и након истраживања неопходна за успешно вођење отворених научних пројеката. Библиотекари у оквиру научних институција су због тога и усавршили своја знања и често учествују у оквиру научних тимова као менаџери истраживачких података (енг. research data manager, data steward, data custodian, и сл.). Принципи по којима се води управљање подацима се скраћено називају FAIR, што је енглески акроним направљен од четири препоруке које помажу истраживачима да њихови подаци буду:

  • прилагођени за лакше проналажење (Findable), помоћу јасних метаподатака и перзистентних идентификатора (на пример: универзални број DOI (digital object identifier) - врста сталног линка који гарантује да ће страница бити функционална без обзира на ком сајту се сада налази);

  • приступачни (Accessible), помоћу стандардизованих комуникационих протокола;

  • интероперабилни (Interoperable) - да се налазе на платформама које поштују стандарде за размену информација између машина;

  • спремни за поновно коришћење (Reusable), односно да поседују јасне показатеље о условима коришћења.

Да ли криза гура отворену науку напред?

Др Ирис Жежељ истиче да отворен приступ резултатима научних истраживања умањује неједнакости међу истраживачима које су последица разлика међу институцијама на којима раде. У овом тренутку, док нас претња од Covid-19 заразе држи у карантину, на научном пољу се води велика битка да се што пре дође до вакцине или терапије која ће зауставити пандемију и омогућити да се живот врати у нормалне оквире. Иницијативе за отварање података и истраживања постојале су и у блиској прошлости када су вируси Зике и Еболе претили да прерасту у епидемију, па је и 2016. и 2018. био отворен позив научницима да своје радове директно шаљу Светској здравственој организацији. Али, шта се дешава са остатком времена? Да ли нам је заиста увек потребна криза да би се добра пракса отворене размене података задржала?

Потреба за отвореном приступу медицинском хардверу и инструментима је постала веома видљива са акутним недостатком респиратора и друге опреме за лечење корона пацијената. Од респиратора па све до визира и маски, 3Д штампари и моделари непрестано раде на свим странама света. Брзина израде, удруживање инжењера и других стручњака различитих профила као и прилив нових идеја скраћују време израде нових или резервних делова и драстично умањују цену опреме. Иако је одлично то што у овој ситуацији помоћ долази из многих извора, медицинска опрема мора да прође ригорозне провере како би била поуздана за коришћење. Интересантно је да у овом случају отворени подаци и отворена истраживања иду руку под руку. Др Гађански Станић наводи пример из њихове праксе у Биосенс институту:

Кроз иницијативе као што су Open Science Hardware Association (OSHWA) коју води ЦЕРН успостављен је систем тзв. Open source hardware лиценци, тако да опрема која добије ту лиценцу јесте стандардизована и заиста квалитетна. Конкретно у БиоСенсу радимо на изради модификованог open source CO2 инкубатора за ћелијску културу са интегрисаним специфичним сензорима, који нам је потребан за још један занимљив пројекат - REALSENSE2 - амерички пројекат који смо добили на Good Food Institute конкурсу. Већ у оквиру пријаве пројекта захтевано је да наведемо open source hardware лиценце за које намеравамо да аплицирамо са резултатима пројекта. Недавно смо добили и други пројекат на ову тему, REALSENSE2, и ту смо такође у обавези да све резултате публикујемо као радове са отвореним приступом.

Др Доневски скреће пажњу да је у случају отворених метода у науци, потребан, али не и довољан услов да подаци буду отворени. Други, не мање важан услов, јесте да неко процени квалитет података и статистички "bias". То је посебно важно у ситуацијама где отворени подаци морају да се убрзано примењују, као што је сада случај са епидемијом Covid-19. Све државе су отвориле податке (први услов је задовољен), али само пар држава је објавило и на који начин су евалуиране грешке и статистички "bias" података (што је други услов).

Отворен научни метод у различитим дисциплинама и отворена наука уживо?

Живимо у веома узбудљивом тренутку у историји научних истраживања. И ово не кажемо само због микробиологије и истраживања вируса. Један од занимљивијих научника данашњице, физичар Стивен Волфрам (креатор отворене базе знања Волфрам Алфа) је са својим тимом дошао до занимљивих резултата у походу на фундаменталне законе физике. Заправо, толико је и сам понесен могућностима које су се отвориле у поновном дефинисању времена и простора да их је назвао прелепим. Последњи велики пресек резултата који су изашли из ове педесетогодишње посвећености објавио је под насловом "Могуће је да најзад имамо пут до фундаменталне теорије физике и прелепо је". И не само да језик прилагодио најширој публици, већ у духу радикално отвореног приступа, све резултате и сазнања комуницира преносима уживо на Youtube и Twitch платформама и организује и Q&А сесије. Са задршком да у овом тренутку још увек не постоји стручна рецензија овог рада, што део научне заједнице критикује (објављен је више као вест него као научни рад), и даље је фасцинантно да се отвара могућност да y скоро реалном времену пратимо напредак људске мисли и у њега се укључимо као стручњак и као заинтересовани читалац или слушалац.

Астрономија је била међу првим наукама које су развила концепт великих отворених научних података. Још 1980. године, отворене су велике датотеке свих до тада познатих галаксија и небеских објеката. У Европи је та иницијатива потекла од Центра за астрономију у Стразбуру (Француска), док је у Америци реализатор била НАСА. Те две базе су временом толико нарасле, да тренутно садрже физичке параметре о скоро милијарду објеката откривених у свемиру. Међутим, највећи научни пројекти отворених података тек нас очекују. Већ идуће године, америчка и Европска свемирска агенција ће у свемир лансирати највећи телескоп икад послат са Земље. Телескоп James Webb ће заменити легендарни Hubble телескоп и обећава да ће фундаментално променити наше разумевање свемира. Др Доневски тренутно учествује у припреми једног од научних пројеката за Webb телескоп на Дунлап Институту у Канади:

Тренутно, око 3000 научника широм света пише предлоге пројеката за ово чудо технике. То ће бити први уређај који ће одмах по пријему података на Земљи омогућити свим истраживачима, без икаквих ограничења, да учествују у научној трци. Основни циљ овог уређаја ће бити да детектује милионе далеких галаксија и планета у којима потенцијално постоје молекули који улазе у састав читавог живог света.

У оквиру теме о заштити здравља, један од интересантнијих примера је open source malaria пројекат који се води принципима отворене науке и наводи да њихову организацију можемо посматрати као заједницу окупљену око Linux оперативног система, само за сузбијање маларије. Отворен је најразличитијим стручњацима да се придруже и покрива теме од општих информација везаних за писање и финансирање пројеката у овој области до креирања платформи везаних за отворен метод који се може применити у процесу откривања нових лекова.

Др Жежељ нам је дала пример који долази из психологије које је као друштвена наука једна од првих области у којој су истраживачи почели да се залажу за методе отворене науке и мењају праксе при дизајнирању, публиковању, дељењу истраживачких резултата, али и при запошљавању стручног кадра (где се вреднује посвећеност овим вредностима).

Лабораторија за истраживање индивидуалних разлика (ЛИРА) недавно је учинила јавним репозиторијум психолошких инструмената (оригиналних или адаптираних за српску популацију), са намером да се оваквом централизацијом омогући лакша претрага и коришћење, као и да се спречи расипање ресурса (поновно превођење и прилагођавање већ адаптираних инструмената).

У Мексику је покренут пројекат Revitalización, Mantenimiento y Desarrollo Lingüístico y Cultural (PRMLDC) на чијем челу је др Хосе Антонио Флорес Фарфан у оквиру кога лингвисти и други језички стручњаци сакупљају снимке, приче, белешке и друге језичке и културолошке артефакте индијанских језика са подручја Мексика и Латинске Америке. На тај начин креира се дигитална база која је отворена и расположива истраживачима, као и материјали који се дистрибуирају директно како би етничке заједнице очувале своје језичко и културно наслеђе.

У оквиру могућности које се научницима отварају слободном поделом података и резултата, вреди осврнути се и на праксу брзе стручне рецензије радова која се показује посебно важном у случају пандемије. Платформа Outbreak Science Rapid PREreview омогућава и подстиче брзу и отворену стручну рецензију нових научних радова и резултата.

Кумулативни ефекат удруженог знања и поделе резултата који долазе из великог броја различитих истраживачких инстанци на пројектима отворене науке може се добро илустровати и експоненцијалним растом. Узмимо за пример 4 лабораторије које одвојено и у различито време раде на једном истраживању, а насупрот њих посматрајмо друге 4 лабораторије које симултано раде и отворено деле податке до којих долазе. Прве 4 лабораторије могу доћи до 4 резултата на различитим степенима развоја, а у случају друге групе имамо ланчану реакцију где је сваки резултат напредовао корак или неколико корака даље од следећег.

Попут пројекта Грађанског мерења ваздуха који смо недавно подржали,
неки од пројеката које смо навели у овом тексту, као што је Folding At Home, отворени су не само према научницима већ и према грађанима који могу да допринесу научним истраживањима. Први такав пројекат покренут је 1999. године на Берклију од стране СЕТИ (скраћено од енг. Search for ExtraTerrestrial Intelligence) са веома инспиративном темом: трагањем за ванземаљским животом. Ако вас интригира могућност да допринесете отвореној науци, погледајте и занимљив списак грађанских научних пројеката који обухвата теме од посматрања птица до прављења датотека за галаксије!

Отворени научни резултати и подаци, њихово јасно и једноставно комуницирање су моћно оружје у борби против лажних вести, теорија завера и сензационалистичких информација. Феномен је добио и пригодно име - инфодемија која се јавља чак и у науци, у форми псеудонауке. Речима др Гађански Станић:

У Србији се боримо и кроз Фејсбук групу Science in Serbia/Наука у Србији где се под хештегом: #nistapanikasamonauka, окупило неколико администратора и модератора групе (сви смо научници) и стручњака у својим дисциплинама. Избор медијума је направљен због броја људи који је у Србији на тој мрежи - наш циљ је да на разумљив начин широј јавности представимо научне резултате, увек из јасно означених извора, а тренутно првенствено у вези са Covid-19. Од како је почело ванредно стање, број чланова групе се рапидно повећава, тренутно броји 4500+ чланова.

Мостови су изгледа заиста добра метафора за отворени научни метод - не само да се научни пројекти тако граде од отворене сарадње, дељења резултата, чланака и алата, већ се граде брже и са већим дометом, те преко њих на другу обалу могу да пређу готово сви које занимају научне, доказиве чињенице. Интересантно је такође, што отворени метод и отворена подела података протежу идеје сарадње и ван научне заједнице; омогућавају нам да креирамо алате да спречимо извртање научних чињеница и ширење лажних вести, док отварају простор свим заинтересованима да допринесу у истраживањима за боље човечанство.