Skip to main content

Tutkijalle

Miksi aineistonhallintaa?

Aineistonhallinnalla tarkoitetaan tutkimukseen liittyvien aineistojen ja niihin liittyvän liittyvän kuvailevan tiedon (metadatan) luomista, käsittelyä ja tallentamista siten että aineistot säilyvät käyttökelpoisina ja luotettavina. Myös aineistojen tietosuojan ja tietoturvan tulee olla varmistettuna sekä tutkimuksen aikana että sen jälkeen. 

Lapin yliopiston edustamilla tieteenaloilla tutkimusaineistoina käytetään paljon myös arkistoaineistoja ja julkaisuja, mahdollisesti myös museoihin tallennettuja aineistoja. Näiden säilyttämisestä, järjestämisestä ja metadatan luomisesta vastaavat asianomaiset arkistot, kirjastot ja museot niitä koskevan lainsäädännön mukaisesti. Tutkijan oman aineistonhallinnan piiriin kuuluvat siten ennen kaikkea itse esim. kyselyillä, haastatteluilla, kuvaamalla, havainnoimalla, mittaamalla tms. kootut tai luodut aineistot.

Hyvällä aineistonhallinnalla

  • Varmistat oman työsi laadun
  • Helpotat omaa työtäsi, erityisesti jos siihen tulee keskeytyksiä syystä tai toisesta
  • Helpotat yhteistyökumppaniesi ja joissakin tilanteissa mahdollisen työsi jatkajan työtä
  • Säästät aikaa
  • Parannat tutkimuksen näkyvyyttä
  • Löydät ja voit jatkokäyttää dataa tulevaisuudessa
  • Täytät rahoittajien vaatimukset
  • Saat viittauksia jos muut käyttävät dataasi
  • Tuet avoimen tieteen kehitystä
[kuva] tutkimusaineiston elinkaari
Aineistohallinnan käsikirja [Online]. Tampere: Tietoarkisto.. <http://www.fsd.uta.fi/aineistonhallinta/fi/miksi-aineistonhallintaa-ja-jatkokayttoa.html#elinkaari>.Viitattu 18.11.2016

Aineistonhallintasuunnitelman kirjoittaminen

Kunnollinen aineistonhallintasuunnitelma auttaa aineistojen hallinnassa projektin aikana, vaaditaan hakemuksen liitteeksi monille rahoittajille ja tukee aineistojen säilyvyyttä ja jatkokäyttöä.

DMPTuuli on työkalu, joka helpottaa aineistonhallintasuunnitelman tekemistä ja ylläpitoa. DMPTuulissa on mm. Suomen Akatemian ohjeistus suunnitelman tekoon.

Aineistonhallintasuunnitelmassa kerrotaan

  • miten tutkimusaineistot hankitaan
  • miten aineistot dokumentoidaan
  • miten aineistojen laatu varmistetaan
  • miten aineistot säilytetään 
  • eettiset ja oikeudelliset näkökohdat
  • aineistojen myöhempi käyttö ja pitkäaikaissäilytys

Aineiston kuvailu

Tutkimusaineiston sisällön, keruun ja muuttujien huolellinen kuvailu on edellytys aineiston käyttökelpoisuuden säilymiselle. Ilman kuvailevaa tietoa eli metadataa tutkimusaineisto on vain merkityksetön kokoelma yksittäisiä tiedostoja, numeroita ja merkkejä. Lisäksi hyvin tehty kuvailu helpottaa tutkimusaineiston löytämistä. Tutkimusaineiston perustietojen huolellinen ja kattava kuvaus (esimerkiksi julkaisun liitteessä) on tärkeä luotettavuuden osoitus myös tutkimustulosten raportoinnissa. (Aineistohallinnan käsikirja. Tampere: Tietoarkisto)

  • Aineiston kuvailu varmistaa että aineistosi on muiden ymmärrettävissä ja tulkittavissa.
  • Kuvailu tekee aineistosta jaettavan, haettavan, viitattavan ja mahdollistaa aineiston pitkäaikaisen hyödyntämisen.
  • Aineiston kuvailu kannattaa aloittaa välittömästi tutkimusprojektin alussa.

Kuvaile aineistosi tutkimuksen tasolla ja muuttujan ja aineistoyksikön tasolla

Seuraavassa on joitakin yleisiä ohjeita niistä asioista joita projektista ja datasta tulisi kuvailla tieteenalasta riippumatta. Minimissään tämä dokumentaatio tulee säilyttää readme.txt-tiedostona tai vastaavana yhdessä datan kanssa.

  • TITLE: Aineiston tai sen tuottaneen projektin nimi
  • CREATOR: Aineiston luoneet henkilöt tai organisaatiot osoitetietoineen
  • IDENTIFIER: Aineiston identifiointinumero, vaikka se olisi vain organisaation sisäinen projektitunnus
  • DATES: Keskeiset aineistoon liittyvät päivämäärät, ml. projektin alku- ja loppupäivät, aineiston muokkaus- ja valmistumispäivät sekä ajanjakso, jota aineisto kattaa
  • SUBJECT: Avainsanat tai ilmaukset, joilla aineiston aihetta tai sisältöä kuvataan
  • FUNDERS: Tutkimuksen rahoittajat
  • RIGHTS: Aineistoon liittyvät immateriaalioikeudet
  • LANGUAGE: Aineiston sisällön kieli (kielet), jos sellaisia on
  • LOCATION: Kun aineisto liittyy fyysiseen paikkaan, kirjaa sen alueellinen kattavuus
  • METHODOLOGY: Kuvaile, miten aineisto on koottu tai luotu, mukaan lukien käytetty välineistö ja ohjelmistot, koeohjelmat, haastattelurungot ym. seikat, joita kuvailisit myös tutkimuksenaikaisiin muistiinpanoihin

Tiedostomuodot

Varmista että aineistoa voidaan käyttää ja lukea myös tulevaisuudessa

Aineisto tulisi aina tallettaa sellaisessa muodossa että se on avattavissa ja luettavissa myös tulevaisuudessa. Tiedostomuodoissa suositellaan käytettäväksi yleisten standardien mukaisia muotoja tai sellaisia joita käytetään laajasti tieteellisessä yhteisössä. 

Yleisiä ohjeita tiedostomuotojen valintaan:

  1. Valitse käytettävät tiedostomuodot jo tutkimusprojektin alussa. Ei ole olemassa yhtä listaa tiedostomuodoista, joka olisi varmasti riittävä kaikissa tapauksissa.
  2. Tarkista että tiedostomuoto sopii tarkoitettuun käyttöön (aineiston luominen, analysointi, tarvittavat ohjelmistot, eri aineistotiedostojen yhdistäminen, soveltuvuus konversioihin, mahdollinen aineiston avaaminen, pitkäaikaissäilytys, tieteenalakohtaiset standardit, siirrot ohjelmistojen välillä, aineistojen luovuttaminen muille käyttäjille, varmuuskopiointi)
  3. Vältä yksittäisen kaupallisen yhtiön hallitsemia tiedostomuotoja. Laajasti käytetyt kaupallisetkin tiedostomuodot ovat todennäköisimmin käyttökelpoisia myös pitkä ajan kuluttua (esim. MS Word, MS Excel, RTF, SPSS format)
  4. Varmistaaksesi aineiston pitkäaikaissäilytyksen konvertoi aineisto avoimeen tai standardimuotoon (esim. PDF/A, CSV, TIFF, ODF, ASCII, XML). Konversiossa saattaa hävitä jotain dataa, joten säilytä aineisto myös alkuperäisessä tiedostomuodossa.

Aineiston laatu

Aineiston laatuun vaikuttavat tallennusvaiheessa tehtävät sisällölliset ja tekniset ratkaisut. Niitä ovat esimerkiksi tietojen syöttö havaintomatriisiin tai ääni- ja äänikuvatallennuksen tekninen toteutus. Myös aineiston keruun jälkeen tehtävät aineiston käsittelyn ratkaisut vaikuttavat aineiston laatuun. Niitä ovat esimerkiksi aineistotiedostojen nimeäminen ja järjestäminen, puuttuvien tietojen määrittäminen ja muuttujien nimeäminen kvantitatiiviselle aineistolle ja tekstintäminen eli litterointi kvalitatiiviselle aineistolle.

Huolellinen dokumentaatio aineiston keruun vaiheista ja aineiston käsittelystä varmistaa tutkimuksen laadun. Aineiston dokumentointi on elintärkeää myös aineiston pitkäaikaissäilyttämisessä. Aineiston kattava kuvailu eli huolella tehty metadata mahdollistaa aineiston informoidun jatkokäytön ja pitkän elinkaaren. (Aineistohallinnan käsikirja. Tampere: Tietoarkisto)

Tunnisteet

Pysyvät tunnisteet identifiioivat verkkoresursseja (esim. aineistoja) antamalla pysyvän linkin niihin. Vaikka aineisto siirtyisi verkossa paikasta toiseen, tunniste säilyy muuttumattomana ja tarjoaa linkin aineistoonsen uuteen paikkaan. Kolme yleistä pysyvää tunnistetta ovat DOI (Digital Object Identifier), URN ja Handle esim.:

  • doi:10.1007/s00300-017-2139-7
  • URN:NBN:fi:ula-201709081296
  • hdl:10024/62840

Kun aineisto arkistoidaan johonkin aineistoarkistoon, arkisto huolehtii tunnisteen antamisesta.

Video: Persistent identifiers and data citation explained / Research Data Netherlands

Aineiston tallentaminen

Aineiston tallentaminen

Yliopiston intrassa on IT-palvelun yleisohjeet erilaisten tietoaineistojen käsittelemisestä ja tallentamisesta. Intrassa olevan tietoturvaluokituksen perusteella voi arvioida, mitä tallennuspaikkaa kulloinkin voi käyttää.

Henkilökohtainen levytila (H-asema)
Suojattu ja varmuuskopioitu levytila johon henkilökunta voi tallentaa tiedostoja.

Ryhmälle luotava tallennustila
IT-palvelut voivat perustaa suojatun ja varmuuskopioidun verkkolevytilan työryhmille. Kaikki ryhmän jäsenet pystyvät tallentamaan ja muokkaamaan tiedostoja, mutta ne on suojattu ulkopuolisilta käyttäjiltä. 

Office 365: OneDrive for Business
OneDrive on pilvipalvelu tiedostojen tallentamiseen ja jakamiseen. Käyttäjäkohtainen levytila on 1 tera. 

IDA - Tutkimusaineistojen säilytyspalvelu
Suurta tallennuskapasitettia vaativat aineistot kannattaa säilyttää tutkimuksen ajan CSC:n tarjoamassa IDA-säilytyspalvelussa. IDA-säilytyspalvelu on hyödyllinen ja tietoturvallinen ratkaisu myös eri yliopistojen välisille yhteisprojekteille, joissa analysoidaan samaa aineistoa. Palvelu on tarkoitettu Suomen korkeakouluille ja Suomen Akatemian projekteille (akatemiahankkeet, huippuyksiköt, tutkimusohjelmat, tutkimusinfrastruktuurit). 

EUDAT B2Share
Palvelu tutkimusdatan tallentamiseen ja jakamiseen, tarjoana EUDAT.

Zenodo
Palvelu tutkimusdatan tallentamiseen ja jakamiseen, tarjoana CERN. 

Aineiston turvallisuus

Tietoturvalla tai tietoturvallisuudella tarkoitetaan tietojen, järjestelmien ja tietoliikenteen suojausta. Sähköisen tutkimusaineiston kopioiminen ja levittäminen on helppoa, samoin esimerkiksi tahaton tuhoaminen tai muuttaminen. Varmuuskopiointi on osa tietoturvaa, mutta lisäksi on varmistettava, että aineiston ulkopuolinen (luvaton) käyttö on estetty.

Aineiston suojaamisen suunnitelma voi sisältää seuraavia seikkoja:

  • Henkilökohtaisen aineiston tallentaminen ja turvallisuus
  • Aineiston tietotekninen salaaminen (Encrypting)
  • Aineiston varmuuskopiointisuunnitelma (Miten, milloin, missä? Kolme kopiota ja alkuperäinen.)
  • Aineiston oikeellisuuden varmistaminen (Checksums)
  • Aineiston versionhallinta
  • Aineiston poistaminen pysyvästi ja turvallisesti

Tiedostojen varmuuskopiointi on olennainen osa aineistojen hallintaa. Säännölliset varmuuskopiot suojaavat vahingossa tai tahallisesti aiheutetuilta tietojen menetyksiltä ja niitä voidaan käyttää palautettaessa aikaisemmat tiedot, jos aineistolle on tapahtunut jotain vahingollista. Jos organisaatiosi huolehtii laitteidesi ja verkkolevysi varmistuksista, sinun on huolehdittava vain tiedostoistasi. Jos taas et tee tutkimusta sellaisessa organisaatiossa, joka huolehtisi varmistuksista, sinun on huolehdittava itse sekä laitteidesi että tiedostojesi varmuuskopioinneista. Varmuuskopiointi on siis tehtävä kannettaville tietokoneille ja laitteille, sellaisille tietokoneille, joita ei ole liitetty verkkoon, ja kotisi tietokoneille.

Varmistaaksesi, että varmuuskopiointijärjestelmäsi toimii kunnolla, testaa se aika ajoin. Koeta palauttaa tiedostoja ja varmista, että ne ovat luettavissa. Käytätpä mitä järjestelmää tahansa, älä tallenna uusia varmuuskopioita vanhojen päälle.

Varmuuskopiointi (Miten, milloin ja missä? Kolme kopiota ja alkuperäinen.)

  1.  Varmista, että aineistoistasi tehdään säännöllisesti varmuuskopiot.
  2. Tee kolme kopiota ja sijoita ne fyysisesti eri paikkoihin.
  3. Varmuuskopioi tietyt tiedostot tai koko tietokoneesi.
  4. Varmuuskopioinnin aikataulu: joka muutoksen jälkeen vai määrävälein?

Kriittiset tiedostot sekä alkuperäistiedostot

  • varmuuskopioidaan päivittäin käyttäen automaattista prosessia ja tallennetaan omalle tai organisaatiosi tallennusalustalle, ei pilvipalveluun tai muualle verkkoon
  • tulisi säilyttää avoimissa tiedostoformaateissa pitkäaikaisen käytettävyyden varmistamiseksi
  • eheys ja toimivuus varmistetaan säännöllisesti

Aineiston versionhallinnalla tarkoitetaan uuden kopion tekemistä tiedostosta muutoksien jälkeen. Näin työn eri vaiheisiin voidaan palata myöhemmin.

Footer

Lapin korkeakoulukirjasto / yliopisto
PL 8123, 96101 Rovaniemi
Käyntiosoite: Yliopistonkatu 8, 96300 Rovaniemi
Lainat ja uusinnat: 040 484 4302 kirjasto(at)ulapland.fi
Julkaisumyynti: julkaisu(at)ulapland.fi

Arktisen keskuksen kirjasto
PL 122, 96101 Rovaniemi
Käyntiosoite: Arktikum-talo, Pohjoisranta 4

Lapin korkeakoulukirjasto / Lapin AMK

Aukioloajat
Henkilökunta ja yhteystiedot
Yleistietoja kirjastosta
Kirjaston esteettömyys
Rekisteriseloste
LUC 2020 - Kohti uudistuvaa kirjastoa!
 

Osoitteenmuutos
Kaukolainapyyntö
Hankintaesitys
Tiedonhaun ajanvaraus
Palautelomake

LUC-Finna
LaCRIS
Lauda