Hvordan få norske forskere til å dele?

Open E-science handler om å benytte ny digital teknologi for å samarbeide på tvers av disipliner, dele forskningsmateriale innenfor en disiplin eller på andre måter benytte ny teknologi for å få fram resultater. Dette er vi ikke flinke på i Norge.

Hvorfor dele forskningsdata

Forskning som er finansiert av det offentlige, skal også være åpent tilgjengelig for allmennheten. Dette er grunnprinsippet i åpen forskning og hovedargumentet for å gjøre forskningsdata åpent tilgjengelig. Tilgjengeliggjøring av data gir nye muligheter for å sette sammen og kombinere datasett, både innenfor en disiplin og på tvers av disipliner. Åpenhet gjennom hele forskningsprosessen vil minske risikoen for fusk, og gjøre slikt lettere å oppdage.

Argumentene mot deling av forskningsdata er todelte og baserer seg enten på en frykt for misbruk av data gjennom at andre skal andre skal «stjele ideene» eller rettighetene til et innsamlet forskningsmateriale, eller på en frykt for at lagring og tilgjengeliggjøring vil legge merarbeid på forskeren og på den måten «stjele tid» som burde vært brukt på forskning.

Slik jeg ser det, presenterer motargumentene viktige hensyn som må tas, uten at de dermed bør ekskludere muligheten for å etablere en åpen infrastruktur for deling av forskningsdata. Frykten for at ideer og materiale “stjeles” kan imøtegås gjennom å klargjøre hvilke rettigheter forskeren har til innsamlede data, og gjennom å etablere en siteringstradisjon for rådata på lik linje med det vi i dag finner for publisert materiale.

Arbeidsmengden som går med til å sikre lesbarheten av forskningsdata for ettertiden, kan reduseres gjennom en kombinasjon av et funksjonelt system og gode støttefunksjoner. Samtidig må man tydeliggjøre både hvilken verdi det har for forskeren at andre kan dra nytte av materialet, og at tilgjengeliggjøring av data gir bedre etterprøvbarhet av publiserte resultater samtidig som det fyller behovet for lagring.

Infrastrukturer for datalagring i Australia og USA

Australske ANDS ble startet i 2007 og er kanskje det største prosjektet for deling og tilgjengeliggjøring av forskningsdata internasjonalt. ANDS knytter sammen institusjonelle arkiv for forskningsdata ved landets forskningsinstitusjoner og gjør dem tilgjengelige over en plattform. Samtidig hjelper ANDS til med å opprette lokale arkiv ved forskingsinstitusjoner som enda ikke har dette.

I USA finnes det ikke et tilsvarende enhetlig system, men det etableres stadig flere mindre lagringsinfrastrukturer med tilknytning til fagområder eller institusjoner. Det eldste av disse er Sloan Digital Sky Survey ved Johns Hopkins University som ble etablert allerede i 1998. I 2011 bestemte National Science Foundation at alle søknader om forskningsmidler må inneholde en plan for datahåndtering. Ut fra disse kravene utvikles infrastrukturer for datahåndtering ved stadig flere universitet. Samtidig gis det nå støtte til planlegging av datahåndtering fra fagbibliotekene, og e-science librarianship har oppstått som begrep.

Framtiden for datadeling i Norge

Ved å studere hva som blir gjort i andre deler av verden, og hvordan deling av forskningsdata løses med hensyn til både praktiske, tekniske og rettighetsrelaterte spørsmål, bør det være mulig å utvikle infrastrukturer for åpen deling av forskningsdata også i Norge. Jeg sitter ikke på de endelige svarene om hvordan datadeling bør organiseres i Norge, men jeg har noen klare meninger:

  1. Forskningsrådet bør, i likhet med NSF, kreve en plan for datahåndtering som en del av alle søknader om støtte. På samme måte bør universitetene ved ansettelse av doktorgradsstudenter og forskere kreve at disse gjør innsamlet datamateriale tilgjengelig for andre ved publisering. Med mindre det stilles krav fra de som fordeler støtten, vil vi kun se enkelte initiativ innenfor de fagområdene der behovene er tydeligst.
  2. Fag-, forsknings- og universitetsbibliotekene må utvikle ekspertise innen datahåndtering og involvere seg som støttefunksjon for forskere. På den måten kan de både lette arbeidsmengden som faller på forskeren og samtidig kvalitetssikre metadata, søk- og gjenfinnbarbarhet
  3. Infrastrukturer må etableres av ikke-kommersielle aktører med langtidsperspektiv. Etablering av en struktur kan muligens gjøres med prosjektmidler, men en plan og midler for langsiktig drift og langsiktige utviklingsmål er nødvendig. Jeg foreslår at universitetene står for opprettelse av en infrastruktur for deling og lagring av forskningsdata, men samtidig at Cristin,som i dag sitter med et nasjonalt ansvar for synliggjøring av forskning blant annet gjennom Open Access, også tillegges et nasjonalt ansvar for synliggjøring av forskningsdata.

Noen lenker til inspirerende lesning:
Science in the open: http://cameronneylon.net/
Scientific data sharing project: http://scientificdatasharing.com/
Journal of e-science librarianship: http://escholarship.umassmed.edu/jeslib/

  • Hei Live!

    Takk for et innlegg som gir god og oppdatert innsikt over hvordan vi ligger an i Norge i forhold til foregangsland på åpne data.

    Masterbloggen er et initiativ som er betinget av at universitetene deler/publiserer sine masteroppgaver digitalt. Slik kan vi fange opp oppgavene uten for mye arbeid, og tilgjengeliggjøre dem i et maskinlesbart bloggformat, der skribentene selv må være beredt på å svare på kommentarer fra leserne.

    I 2010 vant Masterbloggen Fornyingsdepartementets Nettskap 2.0 midler på grunn av dette 🙂 I Norge går altså masterstudentene foran og viser vei for den eldre, mer konservative generasjonen forskere.

    Men det er fortsatt universiteter og andre læresteder som ikke tilgjengeliggjør sine masteroppgaver. Og de som gjør det tilgjengeliggjør kun via pdf, og rådata har man foreløpig ikke tilgang til.

    Det er fantastisk å se bibliotekarer som er kunnskapsrike om mulighetene innenfor tilgjengeliggjøring av forskningsdata. Håper på flere innlegg som belyser dette for oss.

    Takk!

  • Dagmar Langeggen

    I oppgaven gis det utrykk for at det må utøves varsomhet mot å konkludere med at det er overføringsverdi til andre fagdisipliner på bakgrunn undersøkelsen (s 13). Den er skrevet med en ydmykhet som er et godt utgangspunkt for en debatt om hvordan bibliotekene kan bidra til å understøtte forskningens behov for infrastruktur for forskningsdata.

    Oppgaven hadde som målsetting å avklare hvordan forskerne stilte seg til Open Science. Funnene bekrefter at tiden er overmoden for å arbeide frem institusjonelle løsninger for mottak av, forvaltning og eksport av forskningsdata, men forskerne er krystallklare på at de selv må definere premissene for deling.

    Slik jeg leser anbefalingen i bloggen, er disse ikke basert på funn i oppgaven, men mer et utrykk for forfatterens personlige ønske om at det kommer på plass nasjonale direktiver for Open Research.
    Borgman blir flere ganger sitert i oppgaven og jeg antar at dette kan tolkes dithen at Borgman oppfattes som en autoritet. Sitat …”Research data are the new spesial collection”…, …”research data is the responsibility of the research libraries”
    Inntrykket blir bekreftet at spørsmålene som omhandler metadata. Jeg kjenner få forskere som bruker begrepet metadata. Datakoding er de til gjengjeld veldig opptatt av. Datakoder basert på datahåndbøker som de faglige selv utvikler og vedlikeholder. Kodingen er som Live sier kritisk for å ungå misbruk og misforståelser.
    Av spørsmålsbatteriet ser det ut til at det ikke er blitt spurt om forskerne kjøper data, bruker data tilgjengelig via biblioteket (eks. finansdata, bedriftsdata, forbrukerdata, statistikk) og andre type data hvor avtaler regulerer mulighet for deling. At deling vanskeliggjøres av personvernet kan jeg ikke se at blir berørt.
    Ved Universitetet i Stanford har de valgt Borgmans strategi. Det betyr i praksis at kun forskere som vil (eller kan) dele forskningsdata får anledning til å benytte det institusjonelle arkivet.
    Hva slags rolle ønsker bibliotekene å innta? En samspiller på bibliotekets premisser eller forskningens?

    Av oppgaven fremgår at forskerne i hovedsak får data gjennom deling med kolleger.
    La oss snu dette til noe positivt. Forskene ved UMB ønsker en institiusjonell løsning som kan samhandle med andre institusjonelle løsninger.
    De ønsker ekslusiv tilgang i en periode (s. 69), og de trekker frem krav om god henvisningsskikk.

    I steden for en top-down strategi, hvorfor ikke starte med å imøtekomme forskernes behov for en infrastruktur som tilrettelegger for mottak, forvaltning og eksport av data. Samarbeidsviljen er der allerede.

  • Hei Dagmar!

    Takk for innlegg! Innleggsforfatter er ikke tilgjengelig pga ferie, men vil svare når hun er tilbake.

    I mellomtiden vil jeg bare spørre deg om hvilken oppgave du refererer til, og så lurer jeg på om hvordan du vurderer de tre punktene Live setter opp som mulig utviklingsbaner?

  • Almuth Gastinger

    Hei Live
    Tusen takk for et veldig bra innlegg. Det er også fint å høre at du har avsluttet mastergraden din. Gratulerer!
    Som du vet trodde jeg jo at jeg var mer eller mindre alene om å prøve å gjøre norske bibliotek oppmerksom på E-science og dens muligheter og utfordringer for bibliotekene. Jeg er glad at jeg ikke er det. Etter at vi møttes har jeg også blitt kjent med flere som er opptatt av temaet og det er jo bra.
    På fagreferentkonferansen i Stavanger i juni snakket vi også om bibliotekenes forskningsstøtte og jeg fikk høre at UHR sitt bibliotekutvalg skal lage en strategi ang. E-Science og forskningsinfrastrukturer. Har ikke hørt noe siden men håper at de virkelig jobber med saken.
    Hilsen Almuth

  • Hei Almuth!

    Bra du likte innlegget. Og at du forteller om engasjementet som finnes rundt dette. Dette innlegget er publisert i vår gjestespalte som meningsinnlegg. Så Live kommer med et eget innlegg der hun kommer til å snakke mer om sin masteroppgave 🙂

  • Dagmar Langeggen

    Jeg refererer gjennomgående til masteroppgaven til Live Kvålsvik.

    Til pkt. 1. Jeg spør: I steden å hoppe rett til en top-down strategi, hvorfor ikke starte med å imøtekomme forskernes behov for en infrastruktur som tilrettelegger for mottak, forvaltning og eksport av data.
    Før vi tenker nasjonalt, trenger vi å bygge erfaringer gjennom piloter lokalt.

    Til pkt 2. Jeg er enig i at dette er et felt bibliotekene trenger større innsikt i, men jeg forsøker å understreke at dette må skje på forskningens premisser.

    Til pkt 3. Jeg mener det er svært uheldig hvis dette gjøres til en sak om Open Access. Dette handler primært om å bistå forskningsmiljøene med oppbygging av god infrastruktur for forskningsdata. Gjennom dette får vi også en infrastruktur som tilrettelegger for deling for de forskerne og fagmiljøene som ønsker dette. Det er derfor prematurt å snakke om at noen nasjonale organer skal ha et nasjonalt ansvar for forskningsdata.

    Dagmar Langeggen, bibliotekdirektør ved Handelshøyskolen BI.

  • Almuth

    Ville bare si at fagreferentkonferansen jeg snakket om var i Kristiansand og ikke i Stavanger…

  • Almuth

    Jeg er enig med Dagmar at forskningsinfrastrukturer må utvikles på forskernes premisser. Det er jo selvsagt, ville jeg påstå.

    Og klart trenger vi erfaringer fra “lokale” prosjekter. De finnes allerede, om enn ikke så veldig mange i Norge.
    Samtidig mener jeg at UHR-B eller andre nasjonale organer må “være med” så tidlig som mulig. Mange bibliotekledere er med i UHR-B og det er viktig at det lages strategier/retningslinjer på dette nivået. Det er i hvert fall mitt synspunkt. Nye tjenester og deres integrering i forskernes arbeidsprosesser/verktøy kan vi nemlig ikke få til uten ledere som både har peiling på temaet og som gir retning (dvs. som LEDER og ikke bare administrerer!). Jeg har snakket om dette temaet i flere år men det har ikke skjedd noe.

    Det beste hadde jo vært om noen fra biblioteket hadde vært med i norske/nordiske organer/institusjoner/programmer som finnes for E-Science og forskningsinfrastrukturer, som f.eks. programmet eVita som ble allerede startet i 2006.

  • Leif Longva

    Og vi gleder oss til å høre Live Kvale snakke om funnene sine på årets Muninkonferanse, i Tromsø 22. og 23. november:
    http://www.ub.uit.no/mc7

    🙂

  • Live Kvale

    Hei Dagmar

    Takk for svar og kommentarer. Som du påpeker er dette innlegget ikke basert direkte på min masteroppgave, men er et gjesteinnlegg der jeg presenterer mitt noe mer subjektive syn på saken. Et innlegg som går igjennom funn i masteroppgaven kommer i løpet av høsten.

    Gjennom forarbeidet med masteroppgaven har jeg gått igjennom mye litteratur og også satt meg inn i hvordan arbeidet med forskningsdata løses utenfor Norge, materiale som ikke har noen sentral posisjon i masteroppgaven min, men som jeg like fullt syns er viktig å diskutere. Svarene fra UMB viser at forskerne generelt er åpne for å gjøre sine data tilgjengelige for andre, med visse forbehold som jeg mener det bør være mulig å ivareta.

    Du spør hva slags rolle bibliotekene ønsker å innta. Jeg håper at bibliotekene ønsker å gå inn i et samarbeid som kombinerer forskningens premisser med bibliotekenes prinsipper om åpenhet og deling. Samtidig lurer jeg på om universitets bibliotekene er interessert i å delta? Det som foregår på feltet i Norge i dag er all hovedsak uten at universitets bibliotekene er involvert, samtidig som vi i andre land ser at bibliotekene har en sentral rolle gjennom å overføre sin erfaring med kunnskapsorganisasjon til håndtering av forskningsdata. Jeg etterspør engasjement fra Universitets bibliotekenes side, vi må faktisk markedsføre vår kunnskap og invitere oss med i et samarbeid, ikke sitte på sidelinjen å vente.

    Når det gjelder top-down eller bottom-upp er jeg klar over at den siste av disse er i vinden for tiden, min frykt er at for mye bottom-upp blir mye snakk og lite resultater. Misforstå meg rett, jeg er for en åpen diskusjon der alle blir hørt, men jeg tror samtidig at enkelte retningslinjer fra toppen, vil være den mest effektive måte å få deling av forskningsdata til å bli er prioritert felt på universene rundt om. Almuth nevner at UHR sitt bibliotekutvalg skal lage en strategi ang. E-Science og forskningsinfrastrukturer, og jeg tror at strategier og retningslinjer er nødvendig for at forskningsdata skal bli prioritert.

    Kanskje er mine ideer om hvordan dette kan organiseres premature, da alt for lite har skjedd på området her til lands, men jeg mener at det må være mulig å høste av erfaringer gjort andre steder i verden. Jeg ser ikke for meg noen norsk parallell til ANDS, men jeg tror at når vi begynner å se ulike initiativ ved landet universiteter så vil disse ha en fordel av en felles portal. Tilgjengeliggjøring av forskningsdata handler om Åpen forskning, eller Open Science. Jeg ser Open Access som en brikke i Åpen forskning som bibliotekene har tatt mye ansvar for å få på plass, tilgjengeliggjøring av forskningsdata er en annen brikke som ikke skal håndteres på samme måte fordi materialet er ulikt, det utelukker slik jeg ser det ikke muligheten for å bruke erfaringer fra OA i arbeidet med en infrastruktur for tilgjengeliggjøring av forskningsdata.

    Jeg setter stor pris på å høre dine holdninger og håper denne utdypningen gir deg svar på noen av dine spørsmål, som du påpeker er samarbeidsviljen til stede, så da er det vel egentlig på høy til å sette i gang noen pilotprosjekt, som du etterspør for å også skape erfaringer med deling av forskningsdata ved norske universitet.

    Mvh
    Live Kvale

    Alle spørsmålene som ble stille i min undersøkelse finner du her (http://sharingandaccess.files.wordpress.com/2012/02/resultater-som-kan-deles.pdf) svarene kan avvike noe fra de faktiske tallene, da enkelte forskere ikke ønsket at jeg skulle gjøre svarene deres tilgjengelige. Undersøkelsen baserer seg i store trekk på en undersøkelse gjort av Pares Insight (http://www.parse-insight.eu/index.php) i 2009, spørsmålene fra denne finner du her (http://www.parse-insight.eu/downloads/PARSE-insight_survey_questions_research.pdf)

  • Live Kvale

    Hei Almuth

    Takk for gratulasjoner  jeg er veldig fornøyd mer å være ferdig og etter en lenger ferie ser jeg fram til å komme i gang med ny jobb på realfagsbiblioteket ved UIO.

    Så spennende å høre at det er noen som har begynt å jobbe med saken! Send meg gjerne en mail om du vet noe mer. Det er på høy tid at det skjer noe på området også i Norge, når det skjer så mye internasjonalt.

    -live-

  • Live Kvale

    Hei Leif

    Gleder meg også til presenter funnene fra masteroppgaven i Tromsø i november og håper på både spennende presentasjoner og diskusjoner om emnet der. Cameron Neylons presentasjon i fjor var til stor inspirasjon både for meg, som kun så den over nett og andre jeg har snakket med som var der.

    Mvh
    Live Kvale