Hyppää pääsisältöön

Tutkimusaineistojen säilyvyyden hallinta

Miten säilyttää digitaalista tutkimusaineistoa, jonka olemassaolo itsessään on jo merkittävää? Aineisto voi olla ainutlaatuista, sen kerääminen saattaa olla erityisen työlästä tai sitä pystytään hyödyntämään useissa erilaisissa tutkimuksissa. Sellaisen tutkimusaineiston soisi säilyvän läpi organisaatioiden muuttumisen, tietojärjestelmien vanhentumisen ja päihittävän ihmisiänkin.

CSC järjesti vuoden 2022 aikana kolme työpajaa korkeakoulujen yhteisen pitkäaikaissäilytysprosessin (PAS-prosessin) käyttötapauksista, joissa korkeakoulujen asiantuntijat pääsivät keskustelemaan pitkäaikaissäilytyksen käytännöistä. Keskusteluissa nousi esille aineistonhallinnan keskeisyys korkeakouluissa ja tutkimusprojekteissa pitkäaikaissäilytyksen edellytyksenä. Aineistonhallinnan suunnittelulla voidaankin suoraan vaikuttaa tutkimusaineistojen säilytettävyyteen jo aikaisessa vaiheessa. Kun tutkimusaineisto halutaan pitkäaikaissäilyttää, se voidaan siirtää PAS-palveluun, jossa aineisto säilyy käyttökelpoisena niin kauan kuin on tarpeen.

Fairdata PAS-palvelu on tutkimusaineistojen kansallinen digitaalinen pitkäaikaissäilytyspalvelu. Tutkimusaineisto voidaan hyväksyä säilytykseen PAS-palveluun, kun aineisto täyttää säilyttämisen edellytykset eli sen säilyttäminen eheänä ja käyttökelpoisena on mahdollista ja perusteltua. Aineiston sopivuutta pitkäaikaissäilytettäväksi arvioidaan sekä tekniseltä kannalta että aineiston merkityksellisyyden kannalta. Aineiston merkittävyyden arvioinnista, ja myös merkityksen välittymisestä, kun aineistoa myöhemmin halutaan hyödyntää, vastaa palvelun käyttäjä. PAS-palveluun voidaan hyväksyä vain teknisesti pitkäaikaissäilytykseen sopiva aineisto, joka on pitkäaikaissäilytykseen soveltuvassa muodossa sekä kuvailee itse itsensä, jolloin PAS-palvelu voi säilyttää aineistoa käyttäjän puolesta.

Fairdata PAS-palvelun käyttäjiä ovat palvelua hyödyntävät organisaatiot eli korkeakoulut ja valtion tutkimuslaitokset. Pitkäaikaissäilytyksen luonteesta johtuen sekä tutkimusaineiston luoneen tutkijan tai tutkimusryhmän että hyödyntävän organisaation on säilytystä suunnitellessa otettava huomioon aineiston käyttöoikeutta ja omistajuutta koskevat oikeudelliset näkökulmat, sillä aineiston elinkaari kasvaa pitkäaikaissäilytyksessä vuosikymmeniin tai -satoihin. PAS-palvelussa säilytettävään aineistoon on pääsy ainoastaan aineistosta vastaavalla taholla eli käytännössä PAS-palvelua hyödyntävällä organisaatiolla, jolle tutkija tai tutkimusryhmä on siirtänyt pitkäaikaissäilyttämisen mahdollistavat oikeudet. Aineistosta vastaava taho myös päättää säilytyksessä olevan tutkimusaineiston jakelusta tutkijoille. Aineistojen käyttämisen ja hyödyntämisen kannalta PAS-palvelu ei välttämättä ole ensisijainen säilytyspaikka. Säilytyksessä oleva aineisto voidaan asettaa tutkijoiden saataville erillisiin käytön palveluihin, kuten Fairdata- ja SD-palveluihin tai organisaatioiden omiin tallennusarkistoihin, tieteenala- ja datatyyppikohtaisiin palveluihin sekä kansainvälisiin palveluihin.

Oikeudellisten kysymysten lisäksi tutkimusaineiston säilyttäminen Fairdata PAS-palvelussa edellyttää OKM:n säilytyspäätöstä, jota varten tutkimusaineistolle on tehtävä arvonmääritys. Arvonmääritys tehdään hyödyntävässä organisaatiossa ja se on osaltaan osoitus tutkimusaineiston merkityksellisyydestä.

Kun tutkimusaineisto sisältää tietosuojalain mukaan erityisiin henkilötietoryhmiin kuuluvia eli niin sanottuja arkaluonteisia tietoja, hyödyntävä organisaatio laatii säilyttämistä varten tietosuojaa koskevan vaikutustenarvioinnin (DPIA). CSC henkilötietojen käsittelijänä auttaa hyödyntävää organisaatiota eli rekisterinpitäjää vaikutusarvioinnin tekemisessä. Vaikutustenarvioinnin tekemisen avuksi CSC on tuottanut DPIA-lomakepohjan. Vaikutustenarviointi auttaa rekisterinpitäjää tietosuojalainsäädännön vaatimusten noudattamisessa, sen dokumentoinnissa ja osoittamisessa. Vaikutustenarvioinnin tavoitteena on arvioida, onko jäljelle jäänyt riski oikeutettu ja hyväksyttävissä käsillä olevissa olosuhteissa.

Suunnitelmallisella säilyttämisellä varmistetaan aineistojen hyödynnettävyys tulevaisuudessa. Fairdata PAS-palvelussa pitkäaikaissäilytykseen soveltuvat tiedostomuodot ja vaadittavat kuvailutiedot löytyvät palvelun määrittelyistä. Hyödyntävät organisaatiot voivat yhdessä vaikuttaa määrittelyihin tuomalla esiin tarpeitaan palautteella tai suoralla tukipyynnöllä, mutta myös yhteistyöverkostojen, kuten Fairdata-verkoston kautta. Kun tutkimusaineisto viedään PAS-palveluun, aineisto paketoidaan määrittelyiden mukaisesti siirtopaketiksi, joka sisältää tutkimusaineiston lisäksi metatiedot, jotka kuvailevat tutkimusaineiston ja kertovat mitä siirtopaketti sisältää. Paketointi voidaan suorittaa paketointipalvelussa, josta aineisto siirretään Fairdata PAS-palvelun vastaanottoon. Vastaanotossa siirtopaketin sisältö tarkastetaan ja tarkastuksen tulos koostetaan siirtopaketin tarkastusraportiksi, jonka palvelun käyttäjä voi tarkistaa. Hyväksytyn siirtopaketin tarkastusraportti liitetään osaksi säilytettävän aineiston metatietoja. Säilyttäminen alkaa, kun siirtopaketti on tarkastettu hyväksytysti ja PAS-palvelu on muodostanut siirretystä aineistosta säilytyspaketin ja tallentanut sen kopiot. Säilytyspaketteihin kohdistetaan säilytyksen aikana säilytystoimenpiteitä, joilla aktiivisesti valvotaan säilymistä ja pidennetään säilytettävän aineiston elinkaarta. Säilyttämistä ohjaa säilytyssuunnitelma, jonka tarkoituksena on aineiston merkittävien piirteiden tunnistaminen ja säilyttäminen.

Säilytyksessä olevan tutkimusaineiston hyödyntäminen tapahtuu kahdessa vaiheessa. Ensin tutkija pyytää säilytyksessä olevaa aineistoa hyödyntävältä organisaatiolta. Hyödyntävä organisaatio arvioi pyynnön. Kun aineisto on päätetty luovuttaa hyödynnettäväksi, organisaatio noutaa tutkimusaineiston PAS-palvelusta ja asettaa sen jälkeen aineiston tutkijan saataville. Arkaluonteisia tietoja sisältävät aineistot luovutetaan käytettäväksi ainoastaan tietoturvalliseen ympäristöön. Aineisto on noudettavissa PAS-palvelusta jakelupakettina, joka sisältää siirtopaketissa olleiden tietojen lisäksi tiedot vastaanoton tapahtumista sekä säilytyksenaikaisista tapahtumista.

PAS-palvelu tukee hyödyntäviä organisaatioita palvelun teknisessä ja hallinnollisessa käyttöönotossa sekä kaikissa käytön myöhemmissä vaiheissa. PAS-palvelu tarjoaa pitkäaikaissäilyttämisen asiantuntijapalveluita sekä hyödyntäville että palvelun käyttöönottoa suunnitteleville organisaatioille. Käyttöönottoa suunnittelevat voivat tutustua ohjeisiin PAS-palvelun hyödyntämisestä. PAS-palveluun voi ottaa yhteyttä lähettämällä sähköpostia osoitteeseen pas-support@csc.fi.