FAIR принципи дељења података
 Објашњење CC лиценци
 Образац за план трeтмана података
 Образац уговора о дељењу података
 Листа препоручених репозиторијума часописа Nature

Адекватан третман истраживачких података односи се на пажљиво руковање и организацију истраживачких података током читавог циклуса истраживања у циљу ефикасног спровођења истраживачке активности и омогућавања сарадње с другим истраживачима.

У третману истраживачких података често се користи концепт животног циклуса, који помаже истраживачима у разумевању обима и значаја овог аспекта истраживања. Слика испод показује један такав животни циклус података. Потребе за адекватним третманом података спадају у прве три фазе овог животног циклуса: креирање или прикупљање података, обрада података и анализа података, тако да се резултати могу дистрибуирати као нека врста академског излаза, попут чланка у часопису. Међутим, све фазе захтевају адекватан третман, како би се осигурао детаљан и разумљив опис прикупљених података. Ако су подаци разумљиви, други истраживачи могу да их користе како би тестирали валидност првобитних резултата или поново анализирали оригиналне податке на потпуно другачији начин. Прецизније, циљеви третмана примарних истраживачких података су:
1. заштита примарних истраживачких података од могућег губитка;
2. омогућавање размене примарних истраживачких података с другим истраживачима и
3. обезбеђивање отворености, доступности и поновног коришћења примарних истраживачких података.

Заштита примарних истраживачких података од могућег губитка
Заштита примарних истраживачких података има два аспекта:
а) Први аспект је безбедност и односи се на заштиту од губитка података кроз складиштење и архивирање, уз добру организацију и документацију;
б) Други аспект је сигурност и односи се на заштиту података од нежељених промена, што се може постићи контролисањем приступа подацима; давањем одговарајуће лиценце или организацијом података која онемогућује промене.

Размена истраживачких података
Један од основних принципа отворене науке је размена примарних истраживачких података с другим истраживачима. Размена истраживачких података представља ефикасну и одговорну употребу јавног новца који се улаже у истраживања и омогућује истраживачима адекватну размену актуелних научних информација. Могуће добити од дељења примарних истраживачких података података су омогућавање одговора на нова истраживачка питања на основу постојећих података, промовисање сарадње између различитих истраживачких тимова и различитих научних дисциплина, размена знања о најбољим методама за прикупљање података и пратећим анализама, обезбеђивање адекватног третмана прикупљених података, уз њихово јасно спецификовање и описивање, независна провера добијених резултата истраживања и развој и тестирање нових истраживачких метода.

Примарни истраживачки подаци деле се с другим истраживачима најчешће из два разлога:
а) Провера и верификација анализе података (провера репликабилности резултата истраживања)
б) Употреба података у новим истраживањима.

Разменом истраживачких података, која подразумева дељење својих, али и преузимање података других истраживача, могу се остварити велике уштеде у појединим научним областима, јер се омогућујује вишекратно коришћење истих података за различите истраживачке циљеве. На пример, студенти докторксих студија могу преузети податке из постојећих репозиторијума у циљу писања семинарских радова, чиме се постиже уштеда у времену, финансијским средствима и осталим ресурсима, неопходним за реализацију истраживања.

Адекватна припрема истраживачких података за поновну употребу претпоставља да су подаци приступачни, доступни, интероперабилни и вишекратни. Ови захтеви су познати као FAIR принципи за третман истраживачких података.

FAIR принципи
Приступачност (Findable)
Ф1. метаподаци примарних истраживачких података имају глобално јединствени и трајни идентификатор
Ф2. подаци се описују детаљним метаподацима
Ф3. метаподаци примарних истраживачких података јасно и експлицитно укључују идентификатор података које описују
Ф4. метаподаци су регистровани или индексирани у репозиторијуму који се може претраживати

Доступност (Accesible)
А1. метаподаци се могу преузети путем свог идентификатора користећи стандардизовани комуникацијски протокол
А1.1 протокол је отворен, бесплатан и универзално имплементиран
А1.2 протокол дозвољава поступак аутентификације и процедуре ауторизације, где је то потребно
А2. метаподаци су доступни, чак и када подаци нису или нису више доступни

Интероперабилност (Interoperablе)
И1. метаподаци користе формалан, приступачан, дељен и широко примењив језик за представљање информација
И2. метаподаци користе речник који прати ФАИР принципе
И3. метаподаци обухватају квалификоване референце на друге метаподатке

Вишекратност (Reusable)
Р1. метаподаци су детаљно описани тачним и релевантним атрибутима
Р1.1. метаподаци се објављују уз јасну и приступачну лиценцу за кориштење података
Р1.2. метаподаци су повезани са детаљним изворима из којих подаци поричу
Р1.3. метаподаци испуњавају релевантне стандарде у одређеној научној или уметничкој области

Подаци о испитаницима и заштита података о личности
Права и приватност људских субјеката који учествују у истраживањима морају бити заштићени у сваком тренутку. Одговорност сваког истраживача, надлежног етичког одбора, факултета или института у оквиру ког се спроводи истраживање је да заштите права субјеката и обезбеде заштиту података о личности. Прије дељења, податке треба уредити тако да се уклоне све информације о идентитету испитаника и примене ефикасне стратегије како би се смањили ризици од неовлашћеног откривања идентита сипитаника. Избацивање ставки из базе података које се односе на идентитет учесника у истраживању назива се анонимизирање базе података или деидентификација података. Поред уклањања директних података о идентитету, као што су имена, адресе, бројеви телефона или имејл адресе, истраживачи треба да уклоне и све индиректне информације које би могле довести до "дедуктивног откривања" идентитета учесника. Већа вероватноћа за дедуктивно откривање појединачних субјеката постоји код неуобичајених карактеристика или необичних варијабли. На пример, узорци испитани на малим географским подручјима или ретким популацијама могу обухватати посебан ризик у погледу заштите идентитета субјекта.

Истраживачи могу користити различите методе како би смањили ризик од идентификације субјекта. Један од могућих приступа је избацивање дела података. Други приступ је промена података на начин који неће угрозити статистичке анализе, али ће штитити идентитете појединачних субјеката. Један од начина је и ограничавање приступа подацима који могу открити идентитет испитаника. Неки истраживачи могу користити хибридне методе, као што је стављање редигованог скупа података у општу употребу, али омогућавање приступа осетљивијим подацима са строжијим контролама само уз посебну дозволу.

Истраживачи који траже приступ појединачним подацима обично су обавезни да приступе споразуму о размени података. Уговори или споразуми о размени података, који се могу називати "споразум о лиценцирању" или "споразум о дистрибуцији података", обично укључују захтеве за заштиту приватности и поверљивости података учесника. Они могу забранити примаоцу пренос података другим корисницима или захтевати да се подаци користе само за истраживачке сврхе, а могу обухватати и казне за кршења ових правила. За више информација о алтернативним механизмима за размену података погледајте и одељак који се односи на "Методе за дељење података". У већини случајева, дељење и архивирање података је могуће без угрожавања поверљивости и права приватности. Процедуре усвојене за размену података при заштити приватности требало би прилагодити сваком посебном скупу података.

Истраживачи који спроводе клиничка испитивања и имају намеру да деле своје податке треба пажљиво да размишљају о истраживачком дизајну, структури сагласности за учешће у испитивању и структури матрице података пре започињања студије. На пример, многа клиничка испитивања у раној фази користе мале узорке, што отежава заштиту приватности учесника. Такође, лонгитудинална истраживања представљају посебан изазов, због потребе за задржавањем идентификатора како би се повезали појединачни подаци прикупљени у различитим временским интервалима.

Политика отворених података подразумева да размена података из клиничких испитивања мора бити контролисана, што подразумева приступ подацима само оним истраживачима који пристану да чувају приватност субјеката и обезбеде средства за заштиту поверљивости података.

Истраживачи који спроводе испитивања с људима морају да се придржавају Закона о заштити података о личности и кодекса о академском интегритету које поседује већина установа.

У већини случајева, није прикладно да истраживач који је први прикупио податке поставља ограничења у вези с истраживачким питањима или методама које би други истраживачи могли да примене с подацима. Стога је прикладно да сагласност за учешће у истраживању укључује и став да ће подаци бити дељени с осталим истраживачима. Такође, није прикладно да истраживач који је прикупио податке захтева коауторство као услов за размену података. Његов допринос препознаје се кроз адекватно цитирање преузетих података. Међутим, када се истраживач определи за контролисан приступ подацима, неопходно је да прецизно дефинише услове под којима се они могу даље делити или на други начин користити.

Многа истраживања не укључују људске субјекте. Коначни истраживачки скуп података из студија који не укључују људске субјекте генерално не би требало ограничити захтевима који се сматрају потребним и одговарајућим за људе.

Депоновање података
Будући да у Србији нису развијени репозиторијуми за депоновање истраживачких података, препорука је да истраживачи пронађу одговарајући међународни репозиторијум и своје податке депонују у складу с принципима које је тај репозиторијум развио. На пример, исцрпну листу репозиторијума података нуди часопис Nature.

Creative Commons лиценце
Примарни подаци треба да буду заштићени стандардизованом машински читљивом лиценцом (пожељно је да то буду лиценце CC0, CC-BY или CC BY-SA) и повезани са публикацијама у којима су објављени резултати добијени на основу тих података. Одабир лиценце зависи од природе података и/или фазе у којој се налази истраживачки поступак. Потребно је проучити врсте лиценци пре одабира оне која је најприкладнија за специфичне истраживачке податке.

  Копирање и дељење Обавезно цитирање Комецијална употреба Прилагођавање
и мењање
Промена
лиценце
PD
(јавни домен)
BY
BY-SA
BY-ND
BY-NC
BY-NC-SA
BY-NC-ND

Attribution 4.0 International (CC BY 4.0)

Можете слободно:
Делити - копирати и дистрибуирати материјал у било ком медију или формату
Адаптирати - преуређивати, трансформисати и надоградити материјал за било коју сврху, чак и комерцијалну.
Давалац лиценце не може одузети ове слободе све док се следе услови лиценцирања.
Услови који важе за ову лиценцу:
Цитирање - Морате навести одговарајући цитат, омогућити везу с лиценцом и назначити ако су извршене измене материјала. Можете то учинити на било који разуман начин, који не подразумева да давалац лиценце одобрава вашу употребу материјала.
Нема додатних ограничења - не смете да примењујете правне услове или технолошке мере које законски ограничавају друге да раде било шта што дозвољава ова лиценца.

Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)

Можете слободно:
Делити - копирати и дистрибуирати материјал у било ком медију или формату
Адаптирати - преуређивати, трансформисати и надоградити материјал за било коју сврху, чак и комерцијалну.
Давалац лиценце не може одузети ове слободе све док се следе услови лиценцирања.
Услови који важе за ову лиценцу:
Цитирање - Морате навести одговарајући цитат, омогућити везу с лиценцом и назначити ако су извршене измене материјала. Можете то учинити на било који разуман начин, који не подразумева да давалац лиценце одобрава вашу употребу материјала.
Дели слично - Ако преуређујете, трансформишете или надограђујете материјал, морате дистрибуирати своје доприносе под истом лиценцом као и оригинал.
Нема додатних ограничења - не смете да примењујете правне услове или технолошке мере које законски ограничавају друге да раде било шта што дозвољава ова лиценца.

Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)

Можете слободно:
Делити - копирати и дистрибуирати материјал у било ком медију или формату
Адаптирати - преуређивати, трансформисати и надоградити материјал
Давалац лиценце не може одузети ове слободе све док се следе услови лиценцирања.
Услови који важе за ову лиценцу:
Цитирање - Морате навести одговарајући цитат, омогућити везу с лиценцом и назначити ако су извршене измене материјала. Можете то учинити на било који разуман начин, који не подразумева да давалац лиценце одобрава вашу употребу материјала.
Некомерцијално - не можете користити материјал у комерцијалне сврхе.
Нема додатних ограничења - не смете да примењујете правне услове или технолошке мере које законски ограничавају друге да раде било шта што дозвољава ова лиценца.

Attribution-NoDerivatives 4.0 International (CC BY-ND 4.0)

Можете слободно:
Делити - копирати и дистрибуирати материјал у било ком медију или формату за било коју сврху, чак и комерцијалну.
Услови који важе за ову лиценцу:
Цитирање - Морате навести одговарајући цитат, омогућити везу с лиценцом и назначити ако су извршене измене материјала. Можете то учинити на било који разуман начин, који не подразумева да давалац лиценце одобрава вашу употребу материјала.
Без измена - Ако преуређујете, трансформишете или надограђујете материјал, не смете дистрибуирати модификовани материјал.
Нема додатних ограничења - не смете да примењујете правне услове или технолошке мере које законски ограничавају друге да раде било шта што дозвољава ова лиценца.

Attribution-NonCommercial- ShareAlike 4.0 International (CC BY-NC-SA 4.0)

Možete slobodno:
Делити - копирати и дистрибуирати материјал у било ком медију или формату
Адаптирати - преуређивати, трансформисати и надоградити материјал
Давалац лиценце не може одузети ове слободе све док се следе услови лиценцирања.
Услови који важе за ову лиценцу:
Цитирање - Морате навести одговарајући цитат, омогућити везу с лиценцом и назначити ако су извршене измене материјала. Можете то учинити на било који разуман начин, који не подразумева да давалац лиценце одобрава вашу употребу материјала.
Некомерцијално - не можете користити материјал у комерцијалне сврхе.
Дели слично - Ако преуређујете, трансформишете или надограђујете материјал, морате дистрибуирати своје доприносе под истом лиценцом као и оригинал.
Нема додатних ограничења - не смете да примењујете правне услове или технолошке мере које законски ограничавају друге да раде било шта што дозвољава ова лиценца.

Attribution-NonCommercial- NoDerivatives 4.0 International (CC BY-NC-ND 4.0)

Можете слободно:
Делити - копирати и дистрибуирати материјал у било ком медију или формату
Давалац лиценце не може одузети ове слободе све док се следе услови лиценцирања.
Услови који важе за ову лиценцу:
Цитирање - Морате навести одговарајући цитат, омогућити везу с лиценцом и назначити ако су извршене измене материјала. Можете то учинити на било који разуман начин, који не подразумева да давалац лиценце одобрава вашу употребу материјала.
Некомерцијално - не можете користити материјал у комерцијалне сврхе.
Без измена - Ако преуређујете, трансформишете или надограђујете материјал, не смете дистрибуирати модификовани материјал.
Нема додатних ограничења - не смете да примењујете правне услове или технолошке мере које законски ограничавају друге да раде било шта што дозвољава ова лиценца.

Цитирање података
Цитирање података је веома важно зато што омогућује истраживачу одговарајући кредит и признање научном напору у процесу прикупљања података. Такође, одговарајуће цитирање података омогућује кредит репозиторијумима у којима су ти подаци архивирани на дужи рок. Цитирање података је одговорност истраживача који прикупљају и одржавају матрице с подацима и правилним наводјењем свих неопходних информација обезбеђује заштиту од могућих плагијата.

Адекватно цитирање података омогућава другим истраживачима да лакше лоцирају и приступе скупу података у сврху репликације или верификације њихових резултата, што би требало да представља део добре научне праксе. Дакле, једноставно лоцирање и приступ подацима могу олакшати њихову доступност и охрабрити могућност поновне употребе.

Увођењем праксе цитирања података креира се формализован систем препознавања и награђивања истраживача који су прикупљали податке, што представла важан допринос научној заједници. Цитирање података омогућује лако праћење утицаја који одређени скуп података има, кроз публикације у којима су цитирани. Систем формалног цитирања података у научним публикацијама може повећати транспарентност процеса креирања података, али и подстаћи квалитетнији третман истраживачких података.

Стандарди за цитирање података

Пракса цитирања података још увек није уједначена, те постоје различити стандарди. Процес цитирања података је сличан цитирању научних публикација. Неопходно је да цитат садржи следеће податке: Аутор(и), година, наслов, архив (репозиторијум) и датум приступа.

Међутим, цитирање података може бити отежано услед динамичније природе самих података у односу на класичан процес цитирања научних публикација. На пример, скуп података може се састојати од више верзија необрађених података или може бити део већег скупа података. Сам скуп података може временом да се мења, будући да истраживачи могу да модификују или додају више података. Према томе, скупу података је потребан трајни идентификатор или локатор који се може додати у цитат како би се скуп података адекватније пратио.

Трајни идентификатори и локатори података

Свака датотека би требало да има свој идентификатор и локатор. Трајни идентификатор је јединствени веб-компатибилни, алфанумерички код, који указује на одређени скуп података који ће се сачувати на дужи рок. Идентификатор скупова података садржи информације о подацима, као што је наслов, назив датотеке или чак идентификацијски ID објекта. Примери идентификатора су UUID (Универзално јединствени идентификатор), OID (Идентификатор предмета), LSID (Идентификатор науке о животу).

Локатор скупа података помаже при проналажењу места на коме је тај скуп похрањен. Примери локатора су URL адресе, директоријуми или регистрировани локатори. Регистровани локатор је јединствени код који указује на специфичан скуп података који је обично одвојен од метаподатака. Примери локатора података су DOI (Идентификатор дигиталног објекта), APK (Кључ архивског извора), URL адресе, PURL, KSRI.

Примери цитираних података

Истраживач би требало да одабере онај стандард за цитирање података који је важећи у његовој научној области или који препоручује репозиторијум у ком су подаци архивирани. Овде су наведени само неки од примера цитираних података:

Cool, H. E. M. and Bell, M. (2011), Excavations at St Peter’s Church, Barton-upon-Humber [dataset] (York: Archaeology Data Service), doi: 10.5284/1000389

Frederico Girosi; Gary King, 2006, Cause of Death Data, http://hdl.handle.net/1902.1/UOVMCPSWOL UNF:3:9JU+SmVyHgwRhAKclQ85Cg== IQSS Dataverse Network [Distributor] V3 [Version].

Zwally, H.J., R. Schutz, C. Bentley, J. Bufton, T. Herring, J. Minster, J. Spinhirne, and R. Thomas. 2003. GLAS/ICESat L1A Global Altimetry Data V018, 15 October to 18 November 2003. National Snow and Ice Data Center. dataset accessed 2011-07-21 at doi:10.3334/NSIDC/gla01.

Коришћене референце
DataCite Metadata Working Group. (2016). DataCite Metadata Schema Documentation for the Publication and Citation of Research Data. Version 4.0. DataCite e.V. http://doi.org/10.5438/0012. Accessed August 11, 2018

GoFAIR. https://www.go-fair.org/fair-principles/ Accessed August 12, 2018

Wilkinson, M. D. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci. Data, 3:160018, doi: 10.1038/sdata.2016.18 (2016).