Urban Vitality Open Science

FAIR data

Vindbare, toegankelijke, interoperabele en herbruikbare onderzoeksgegevens

In dit hoofdstuk leggen we uit wat de FAIR-principes inhouden en hoe ze in meer of mindere mate kunnen worden toegepast binnen Urban Vitality onderzoek. Dit doen we aan de hand van gepubliceerde FAIR-checklists in UvA/HvA figshare. Daarnaast geven we nuttige links voor meer informatie over FAIR.

Wat is FAIR?

FAIR is een acroniem voor Vindbaar, Toegankelijk, Interoperabel en Herbruikbaar. De FAIR-principes zijn richtlijnen om gegevens vindbaar, toegankelijk, uitwisselbaar en herbruikbaar te maken.

Vindbaarheid is als een etalage: zowel mens als machine (computer) kunnen zien wat er binnen beschikbaar is. Toegankelijkheid betekent niet dat de gegevens open zijn (voor iedereen te zien), maar specificeert wie de gegevens mag "betreden" (toegang krijgen), op welke manier en onder welke voorwaarden. Interoperabiliteit, of (semantische) interoperabiliteit, is als "speed dating voor machines": het is nuttig als gegevens uit verschillende bronnen een "match" hebben en als er een gemeenschappelijke, universele (computer)taal is. Herbruikbaarheid betekent dat er aanvullende informatie aanwezig is die de gegevens interpreteerbaar maakt. Denk bijvoorbeeld aan een onderzoeks- of meetprotocol, een syntaxis van bewerkingen en analyses of een logboek. (Bron: Steeds FAIRder. Verslag van het Urban Vitality zaaigeldproject 'FAIR: geen woorden maar data ').

Gegevens kunnen in meer of mindere mate voldoen aan FAIR-principes. Er zijn 15 FAIR-principes die als uiteindelijk doel hebben het kunnen hergebruiken van data.

FAIR in onderzoek

De Nederlandse Gedragscode Wetenschappelijke Integriteit, diverse subsidieverstrekkers, het Nationaal Platform Open Science, hebben allemaal FAIR-principes opgenomen. Zo ook de HvA-richtlijnen voor research data management (RDM). De FAIR-principes moeten in de hele cyclus van onderzoeksgegevens worden toegepast.

Voordelen voor onderzoek en onderzoekers

  • Grotere impact van onderzoek door vindbaarheid (zichtbaarheid) en herbruikbaarheid van data (citatie van je data)
  • Het mogelijk of makkelijker maken om data uit verschillende onderzoeken te combineren
  • Data worden (meer) geschikt voor AI-toepassingen
  • Mogelijk maken of faciliteren van reproduceerbaarheid, verifieerbaarheid en repliceerbaarheid van onderzoek en resultaten.

FAIR-checklists

Al in de voorbereidingsfase van een onderzoeksproject is het van het grootste belang om een specifiek protocol voor gegevensverzameling op te stellen en te anticiperen op de manier waarop andere onderzoekers de gegevens van jouw onderzoeksproject zouden kunnen hergebruiken. Er zijn verschillende niveaus om onderzoeksgegevens FAIR te maken. Ons doel is om verschillende checklists te maken die gebruikt kunnen worden door onderzoekers en ondersteunend personeel tijdens een onderzoeksproject.

FAIR genoeg checklist.

De eerste checklist beschrijft de minimale inspanning voor Urban Vitality (UV) onderzoeksprojecten en kan worden toegepast door onderzoekers met minimale hulp van een data steward. Het volgen van deze checklist maakt de onderzoeksgegevens behoorlijk FAIR voor mensen en enigszins FAIR voor machines (computers). De checklist moet direct na het verkrijgen van onderzoeksfinanciering worden gebruikt.

DOI: https://doi.org/10.21943/auas.20178863.v1

FAIRder checklist

Nog te ontwikkelen checklist die jouw onderzoeksdata nog meer FAIR compliant maakt. Deze checklist zal in overleg met datasteward ingevuld moeten worden.

FAIRy innovatieve checklist

Nog te ontwikkelen checklist die onderzoeksdata en metadata volledig 'machine actionable' maakt (door computers vindbaar, begrijpelijk en interpreteerbaar). Het gaat om de ontwikkeling van een semantisch model, zie bijvoorbeeld hier . Dit is een team effort van onderzoekers, datasteward en mogelijk andere expertise van buiten de HvA (data engineers, FAIR experts).

Referenties en nuttige links

FAIR verwijst naar de volgende hoofdstukken binnen het Handboek Onderzoek:

  1. Datamanagementplan
  2. Datapakket
  3. Onderzoeksprotocol

De tool FAIR-aware maakt u op een laagdrempelige manier bewust van FAIR principes:

https://fairaware.dans.knaw.nl/

Kennisclip: FAIR-dataprincipes. https://www.youtube.com/watch?v=2uZxFu9SFi8

Het GO-FAIR initiatief legt de FAIR principes uit (vrij technisch van aard):

https://www.go-fair.org/fair-principles/

Een Deense "deep dive" in FAIR:

https://www.howtofair.dk/

De Universiteit Utrecht geeft duidelijke informatie over het FAIR maken van data:

https://www.uu.nl/en/research/research-data-management/guides/how-to-make-your-data-fair

Wilkinson et al. (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientic Data, 3, 160018. https://doi.org/10.1038/sdata.2016.18 .

Jacobsen et al. (2020). A Generic Workflow for the Data FAIRification Process. Data Intelligence, 2:1-2, 56-65. https://doi.org/10.1162/dint_a_00028 .

Kanis et al. (2020). FAIR: Geen woorden maar data. Universiteit van Amsterdam / Hogeschool van Amsterdam. Online bron. https://uvaauas.figshare.com/projects/FAIR_Geen_woorden_maar_data/83840 .

De Persoonlijke GezondheidsTrein in de zorg. Verhalen uit de praktijk (juli 2020). Opgehaald van https://pht.health-ri.nl/sites/healthtrain/files/2020-07/PHT%20in%20de%20zorgpraktijk.pdf .

Deist et al. (2020). Gedistribueerd leren bij 20 000+ longkankerpatiënten - De Persoonlijke GezondheidsTrein. Radiotherapie en Oncologie, 144, 189-200. https://doi.org/10.1016/j.radonc.2019.11.019 .

Gepubliceerd door  Urban Vitality 11 maart 2024