DCC 2020 Project: Integraal RDM in Yoda en Research Cloud
Als onderzoeker wil ik gemakkelijk data kunnen uitwisselen tussen Yoda en SURF Research Cloud zodat ik van mijn analyses in workspaces de data goed kan beheren.
Als data manager wil ik gevoelige data kunnen uitwisselen tussen Yoda en SURF Research Cloud zodat gevoelige data veilig in analyses gebruikt kunnen worden.
In dit werkpakket maken we een aantal realisaties voor het benaderen van in Yoda vastgelegde data binnen de context van een SURF Research Cloud (SRC) workspace. Daarnaast onderzoeken we hoe gevoelige data op een veilige wijze beschikbaar kan worden gemaakt in een SRC workspace.
Voor het benaderen van Yoda data vanuit een SRC workspace zijn meerdere
realisaties gewenst omdat er verschillende behoeften
bestaan voor de interactie tussen gebruiker en systeem.
Er zijn onderzoekers die graag een grafische desktop omgeving gebruiken
en andere onderzoekers die opdrachten liever via de commandline shell verstrekken.
De voor SRC gerealiseerde integraties zijn:
desktop applicatie voor synchronisatie, netwerk disk, commandline.
Gerelateerd materiaal:
Een veelvoorkomende use-case in onderzoek betreft het verwerken van tijdelijk beschikbaar gestelde
privacy- of anderszins gevoelige data.
Instellingen en onderzoekers wensen hiervoor voldoende maatregelen te kunnen treffen om de
vertrouwelijkheid van de data te beschermen. Een onderdeel van deze maatregelen vormt het
gecontroleerd transport van data van en naar de verwerkingslokatie.
We onderzoeken hoe deze ‘sluis’ functie kan worden geimplementeerd. We onderkennen drie varianten
waarbij de implementatie van de sluisfunctie in een separate omgeving in SRC onze voorkeur heeft.
Gerelateerd materiaal:
Voor de verwerking van gevoelige data is de huidige functionaliteit van SURF Research Cloud onvoldoende geschikt. De beoogde sluisfunctie zal alleen effect hebben als de workspace voldoende geisoleerd is van het internet.
Aanbeveling 1: Implementatie van een workspace configuratie geschikt voor gevoelige data (SURF). Na oplevering kan de ontworpen sluisfunctie geimplementeerd kan worden (UU).
De gerealiseerde gebruiksvriendelijke interface voor het uitwisselen van data met Yoda/iRODS is nog niet geschikt voor grotere bestanden (Terabytes) waar eisen worden gesteld aan herstartbaarheid van het data transfer proces.
Aanbeveling 2: Aandacht vragen bij iRODS consortium voor de realisatie van betere client-side tools (UU, SURF en andere iRODS Consortium leden).