Werkpakket Data

DCC 2020 Project: Integraal RDM in Yoda en Research Cloud

Werkpakket Data

(terug naar index)

Ambitie

Als onderzoeker wil ik gemakkelijk data kunnen uitwisselen tussen Yoda en SURF Research Cloud zodat ik van mijn analyses in workspaces de data goed kan beheren.

Als data manager wil ik gevoelige data kunnen uitwisselen tussen Yoda en SURF Research Cloud zodat gevoelige data veilig in analyses gebruikt kunnen worden.

Uitvoering en resultaten

In dit werkpakket maken we een aantal realisaties voor het benaderen van in Yoda vastgelegde data binnen de context van een SURF Research Cloud (SRC) workspace. Daarnaast onderzoeken we hoe gevoelige data op een veilige wijze beschikbaar kan worden gemaakt in een SRC workspace.

Voor het benaderen van Yoda data vanuit een SRC workspace zijn meerdere realisaties gewenst omdat er verschillende behoeften bestaan voor de interactie tussen gebruiker en systeem. Er zijn onderzoekers die graag een grafische desktop omgeving gebruiken en andere onderzoekers die opdrachten liever via de commandline shell verstrekken. De voor SRC gerealiseerde integraties zijn: desktop applicatie voor synchronisatie, netwerk disk, commandline.
Gerelateerd materiaal:

Een veelvoorkomende use-case in onderzoek betreft het verwerken van tijdelijk beschikbaar gestelde privacy- of anderszins gevoelige data.
Instellingen en onderzoekers wensen hiervoor voldoende maatregelen te kunnen treffen om de vertrouwelijkheid van de data te beschermen. Een onderdeel van deze maatregelen vormt het gecontroleerd transport van data van en naar de verwerkingslokatie.
We onderzoeken hoe deze ‘sluis’ functie kan worden geimplementeerd. We onderkennen drie varianten waarbij de implementatie van de sluisfunctie in een separate omgeving in SRC onze voorkeur heeft.
Gerelateerd materiaal:

Bevindingen en aanbevelingen

Voor de verwerking van gevoelige data is de huidige functionaliteit van SURF Research Cloud onvoldoende geschikt. De beoogde sluisfunctie zal alleen effect hebben als de workspace voldoende geisoleerd is van het internet.

Aanbeveling 1: Implementatie van een workspace configuratie geschikt voor gevoelige data (SURF). Na oplevering kan de ontworpen sluisfunctie geimplementeerd kan worden (UU).

De gerealiseerde gebruiksvriendelijke interface voor het uitwisselen van data met Yoda/iRODS is nog niet geschikt voor grotere bestanden (Terabytes) waar eisen worden gesteld aan herstartbaarheid van het data transfer proces.

Aanbeveling 2: Aandacht vragen bij iRODS consortium voor de realisatie van betere client-side tools (UU, SURF en andere iRODS Consortium leden).