Miljødata - Vox Publica https://voxpublica.no/tag/miljodata/ Magasin om demokrati og ytringsfrihet Fri, 16 Jun 2017 10:50:03 +0000 nb-NO hourly 1 Gerilja-lagring: Bibliotek i USA slår ring om forskingsdata https://voxpublica.no/2017/06/gerilja-lagring-bibliotek-i-usa-slar-ring-om-forskingsdata/ Thu, 15 Jun 2017 11:16:23 +0000 https://voxpublica.no/?p=17470 – Vi kjente heilt frå starten at dette var ei oppgåve for oss i forskingsbiblioteka, seier Margaret Janz. Ho er bibliotekar ved Van Pelt Library, hovudbiblioteket ved Universitetet i Pennsylvania i USA. No sit ho på eit kontor i lag med kollegaene Laurie Allen og Kimberly Eke, og fortel via Skype om korleis dei hamna i sentrum av ei rørsle som jobbar med å «geriljalagre» offentlege forskingsdata.

Rørsla består av bibliotekarar, forskarar, it-folk og andre interesserte, og sidan november i fjor har dei frenetisk lasta ned og sikkerheitslagra datasett og annan informasjon frå nettsidene til føderale forskings- og forvaltingsorgan. Høgast prioritet har klima- og miljødata.

– Eigd av folket

– Det dreier seg om store datamengder som er produserte av institusjonar som ligg under styresmaktene, men som er eigd av folket. Dei finst berre digitalt, og det er opp til styresmaktene å sikre at dei er tilgjengelege for deg og meg. I realiteten er informasjonen prisgitt det gjeldande politiske klimaet, seier Janz.

Då Donald Trump vann presidentvalet i USA sist november, var det mange som brått vart urolege for dei store mengdene forskingsdata og annan informasjon knytt til klima og miljø, som låg spreidd på mange offentlege nettstader. Det var ikkje slik at ein frykta at informasjonen brått ville bli sletta. Slikt finst det lover mot. Men ein av dei få tinga Trump snakka systematisk om gjennom heile valkampen, var at han ville vengestekke det amerikanske miljødirektoratet EPA, og løyve mindre pengar til klimaforsking (denne lovnaden har han innfridd).

Fra stor protestmarsj mot Trumps forskningspolitikk i Washington DC 22. april 2017.

DataRefuge. DataRefuge sette straks i gang med såkalla databerging, der interesserte møttest for å peike ut viktige datasett og laste dei ned på sikre stader. Ei rekkje organisasjonar og institusjonar slutta seg til, nokre nystarta for føremålet, og mange databergingar gjekk av stabelen både i USA og i Canada i dei første hektiske månadane.

Det vart raskt klart at det å ta vare på informasjon som berre finst på nett, ikkje er enkelt. For det første finst det inga oversikt over kva data som finst der ute. Dessutan er informasjonen ofte ikkje spesielt godt organisert. Det er der bibliotekarane kjem inn.

– Særleg dei store forskingsbiblioteka, som oss, har lenge vore opptekne av desse problemstillingane. Etter kvart danna vi nettverket Libraries+, der vi prøver å finne løysingar for å handtere problemet i stor skala, og ikkje berre det som gjeld miljødata, men alle fagområde, fortel Laurie Allen, hovudbibliotekar med ansvar for digital forskingsstøtte, også ved Universitetet i Pennsylvania.

Var ikkje på radaren

Mange av reglane som gjeld det å ta vare på og tilgjengeleggjere offentleg informasjon, er laga for trykte medium og fungerer ikkje så godt i den digitale tidsalderen. Den nye politiske situasjonen avslørte mange mentale blindsonar.

– Vi trudde vi allereie gjorde mykje rett. Det blir til dømes arbeidd mykje med open tilgang til forsking, altså å få informasjonen ut på nett i det heile. Og ved forskingsbiblioteka har vi gjort mykje for å leggje til rette for våre eigne forskarar. Men dette enorme landskapet av offentleg informasjon som allereie ligg på nett, og som veldig mange menneske nyttar dagleg – det var ikkje på radaren, sjølv om problemet sjølvsagt har vore der heile tida. Presidentvalet vart ein augeopnar som gjorde folk merksame på problemet, seier Allen.

– Og kor store datamengder snakkar vi om?

– Ingen veit. Vi veit at det er snakk om mange petabyte. Kva heiter den tingen som kjem etter petabyte – exabyte? Eg vil tru det er nokre slike. Eitt av dei viktige spørsmåla er korleis vi avgjer kva som skal takast vare på. Prøver vi å spare på alt som nokon gong er blitt publisert, så løyser vi jo ikkje noko problem, tvert imot, seier Allen.

Må sikre truverdet

Eit anna problem er korleis ein kan vite at den informasjonen ein tek vare på, er identisk med originalen. I motsetnad til trykt informasjon, kan digital informasjon endrast med eit tastetrykk. Straks Trump overtok som president, vart til dømes nettsidene til EPA endra i påvente av at den nye politiske leiinga skulle avgjere kva informasjon dei ville presentere. Eit augeblikksbilete av nettsidene slik dei framsto før endringa, vart gjort tilgjengeleg på dei nye nettsidene, men i ettertid har det vist seg at ikkje all informasjonen på dei gamle nettsidene er inkludert i dette augeblikksbiletet, men er forsvunne. Slikt er vanskeleg å avsløre om ein ikkje har ein påliteleg original å samanlikne med.

President Donald Trump annonserer at han vil trekke USA ut av Paris-avtalen. Rosehagen ved Det hvite hus 1. juni 2017. (Foto: Det hvite hus/Joyce N. Boghosian)

– Kampen for open tilgang til forskingsdata har heile tida hatt som mål at alle skal kunne bruke datasetta til det dei vil. Men i så fall må ein jo også vere sikker på at dei er pålitelege. Det var forskarane som påpeikte dette problemet og sa at data må kunne siterast. Noko anna er at data kan vere veldig mykje forskjellig. Mange ser for seg vitskaplege data som lister med tal i eit stabilt format som lett kan delast, men eigentleg snakkar vi om all type informasjon på skjerm. Det kan like gjerne vere ei nettside som fortel skulelærarar om økologi, peikar Laurie Allen på.

Omgrepet «gerilja-arkivering» oppsto og vart raskt teke i bruk i samband med dei første organiserte databergingane etter valet. Men Kimberly Eke, avdelingsdirektør for lærings- og forskingsstøtte og den tredje rundt bordet, fortel at dei ser på seg sjølve først og fremst som bibliotekarar, ikkje som politiske aktivistar.

– Dette er rett og slett ting vi lenge har visst at vi må finne ut av, og no er vi i ein spesiell politisk situasjon der mange er interesserte i å involvere seg.

Aktivisme i arkivet

Når omstenda ligg til rette for det, kan det å ta vare på informasjon bli ei politisk opprørshandling.

For nokre år sidan var det mange som vart djupt rørde over å høyre om korleis bibliotekarar og lokale innbyggjarar i Timbuktu i Mali greidde å smugle ut store mengder uerstattelege mellomaldermanuskript og dermed hindre dei frå å bli øydelagte av islamistar. Takka vere innsatsen deira, kan dokumenta no bli digitaliserte og bevarte for ettertida.

Å lage arkiv og samle dokumentasjon har truleg alltid vore ein del av sosial og politisk aktivisme. Det omfattande arkivet etter den jødiske filosofen Edmund Husserl, som i dag finst i Leuven i Belgia, ville neppe ha eksistert om ikkje fransiskanarmunken Herman Van Breda hadde lukkast i å smugle det ut av Nazi-Tyskland i 1939. På same tid kunne ei stor mengde tyskspråklege sosialistiske tidsskrift, som vart øydelagde i Tyskland under andre verdskrigen, etterpå finnast att på «Det røde bibliotek» på Rjukan. Dei vart møysommeleg samla av Henrik J. Hjartøy, arbeidarpartimann og biblioteksjef frå 1917 til 1936, og finst i dag berre éin annan stad i verda, i nasjonalbiblioteket i Paris.

Utfordra majoritetskulturen

Andre halvdel av 1900-talet såg ei rekkje initiativ der til dømes kvinnerørsler, arbeidarrørsler og organisasjonar for homofile og lesbiske etablerte eigne arkiv som kunne fortelje om andre sider ved historia enn dei som vart fortalde i den dominerande kulturen. Slike arkiv kunne ha fleire føremål: Forstå historia betre, ta eigarskap til minne og identitet, eller avdekke maktmisbruk og urettvise. Uavhengigheit frå institusjonsarkiva var naudsynt i desse tilfella. Marginaliserte grupper kunne sjeldan lite på at institusjonane til majoritetssamfunnet vil ta tilfredsstillande vare på deira historie.

I seinare år har mange institusjonsarkiv fått meir inkluderande retningsliner, og det har igjen resultert i, til dømes, ulike dokumentasjonsprosjekt som har sprunge ut av «Black lives matter»-rørsla. Der går arkivarar, organisasjonar og vanlege borgarar saman om å dokumentere politivald mot svarte i USA.

Eit anna døme er «Skeivt arkiv», Noregs største samling dokument frå personar og organisasjonar relatert til «skeiv» historie, som no held hus ved Universitetsbiblioteket i Bergen.

Gerilja-arkiveringa i dagens USA skil seg frå mykje annan aktivist-arkivering ved at aktivistane ikkje er ute etter å fortelje nye historiar, men å bevare den etablerte. I lys av «postfaktasamfunnet» kan det å insistere på at vitskapleg informasjon er offentleg eigedom, like fullt oppfattast som politisk aktivisme.

– Liten grunn til uro i Noreg

Her til lands er offentleg digital informasjon meir truga av manglande systematikk, enn av politisk motivert historieforfalsking, meiner Herbjørn Andresen, førsteamanuensis ved Institutt for arkiv‑, bibliotek- og informasjonsfag ved Høgskolen i Oslo og Akershus..

– Den typen uro vi ser i USA, over at til dømes Environmental Protection Agency brått fjernar ein masse informasjon frå nettsidene sine, den er det førebels lite grunnlag for i Noreg, seier Andresen.

Han fortel at når det gjeld dokumentasjon av slikt som saksbehandling og korrespondanse, er det stort sett stødige system på plass i forvaltinga, og informasjonen er tilgjengeleg i den grad ein kan få dispensasjon frå reglane om personvern. Det vil ikkje seie at arkiveringa er feilfri, men det eksisterer planar og rutiner for å ta vare på informasjonen.

Systematikken manglar

– Nettsider er ei anna sak. Nasjonalbiblioteket «haustar» informasjon frå norske nettdomene, men vansken er å vite kva som vil vise seg å vere viktig i ettertid, seier Andresen.

Han nemner nettadressa pandemi.no som døme. Den vart oppretta av Helsedirektoratet i 2009 for å gje informasjon om svineinfluensaepidemien og massevaksineringa som styresmaktene sette i gang.

– I dag sender adressa deg til nettstaden til Folkehelseinstituttet. Men innhaldet på den opphavlege nettsida vart teke vare på for ettertida, på initiativ frå Riksarkivaren som såg på det som eit interessant historisk dokument. Ein systematisk gjennomgang av kva som blir publisert av offentlege verksemder, derimot, det manglar, seier han.

Prioriterer det nasjonalt viktige

Gretel Mari Braaten Westman er teamleiar for nettarkivet ved Nasjonalbiblioteket, som «haustar» informasjon frå norske nettstader. Ho seier at nettsider som tilhøyrer det offentlege heile tida har vore høgt prioritert.

– Vi har nokre seleksjonskriterium for kva vi hauster, til dømes hendingar av nasjonal viktigheit, slik som val, eller terroråtaket i 2011. Også kultur- og samfunnsliv skal dokumenterast, så vi haustar til dømes alt av nettaviser.

I januar 2016 kom lova om pliktavlevering til Nasjonalbiblioteket i ny utgåve. Den gjev Nasjonalbiblioteket rett til å samle inn informasjon som er allmennt tilgjengeleg på norske domene, utan å be om førehandsgodkjenning.

– Korleis kan de vite at de får med dykk det vesentlege?

– Vi er heldige i Noreg som har Brønnøysundregisteret, som er offentleg tilgjengeleg. Ein kan sortere verksemder på sektor og fange opp, til dømes, alt innanfor statleg sektor. Vi får også tips. Ved ei kommunesamanslåing nyleg, fekk vi tips om at nettsidene til dei to kommunane som skulle slåast i hop, ville bli erstatta av ei ny felles nettside frå ein viss dato. Dermed fekk vi tid til å ta vare på dei gamle. Slike endringar er det sjølvsagt veldig interessant for oss å vite om.

]]>
Klimadata: Et supert regneark https://voxpublica.no/2013/02/klimadata-et-supert-regneark/ Fri, 01 Feb 2013 14:12:06 +0000 https://voxpublica.no/?p=9849 Det finnes mange kilder til data om utslipp og klimaendringer. Alle er imidlertid ikke like lett tilgjengelige. Designeren David McCandless og hans team har gjort (og gjør) en kjempejobb med å samle inn og presentere nøkkeldata i et Google-regneark. Herfra kan du lett kopiere ut eller laste ned dataene i formatet du selv ønsker. Blant dataene du finner: Klodens “karbonbudsjett”, utslipp per land og innbygger, temperaturer siden 1850, forventet oppvarming og konsekvenser. Regnearket er også fullt av henvisninger til primærkildene.

Blogginnlegget er publisert i samarbeid med nettmagasinet Energi og Klima.

]]>
Energistatus for Europa https://voxpublica.no/2012/05/energistatus-for-europa/ Wed, 16 May 2012 08:06:54 +0000 https://voxpublica.no/?p=8314 Hvor langt er Europa kommet i å erstatte fossil energi med fornybar? Hvilke land har effektivisert energibruken mest? EUs miljøbyrå EEA gir svar på disse og mange andre spørsmål i en nyttig samling av indikatorer og datakilder om energi, klima og andre miljøtemaer. Et eksempel: Energieffektivisering og energiforbruk i husholdningene.

Byrået supplerer datakildene med oppdaterte vurderinger av framgangen på nøkkelområder. Data fra Norge er inkludert i mange av indikatorene.

Som en bonus til utviklerne der ute har EEA gjort et API — programmeringsgrensesnitt — tilgjengelig, for effektiv tilgang til dataene. Data kan gjenbrukes i henhold til en åpen lisens, Creative Commons navngivelse. Kommersiell bruk er altså eksplisitt tillatt.

Blogginnlegget er publisert i samarbeid med nettmagasinet Energi og Klima.

]]>
Spor utslippene helt tilbake til kilden https://voxpublica.no/2012/01/spor-utslippene-helt-tilbake-til-kilden/ Thu, 12 Jan 2012 09:59:53 +0000 https://voxpublica.no/?p=7534 Forskningsprosjektet “The Supply Chain of CO2 emissions” kobler data om utslipp fra fossile energikilder fordelt på land og regioner med data om verdenshandel og økonomi. Slik kan utslippskilder spores gjennom hele den globale forsyningskjeden. Det gjør det bl.a. mulig å se hvor i verden CO2 ble sluppet ut for å produsere de varer og tjenester som forbrukes i et bestemt land. En kan også gå et skritt til bakover i kjeden og se hvor det fossile brenselet som trengtes for å produsere de samme varene og tjenestene, stammer fra.

Bak prosjektet står forskere fra Carnegie Institution for Science og norske Cicero.

The Supply Chain of CO2 emissions:

Blogginnlegget ble først publisert i nettmagasinet Energi og Klima.

]]>
Hvor er dataene bak finnsenderen.no? https://voxpublica.no/2010/02/hvor-er-dataene-bak-finnsenderen-no/ https://voxpublica.no/2010/02/hvor-er-dataene-bak-finnsenderen-no/#comments Fri, 26 Feb 2010 14:57:08 +0000 https://voxpublica.no/?p=2993 Post- og teletilsynet presenterte for noen dager siden sin nye tjeneste kalt finnsenderen.no. Her er mobiltelefoni-master plottet inn på norgeskartet, og det er tilknyttet en strålingskalkulator man kan bruke for å finne ut om en er utsatt for farlig stråling.

Dette er en nyttig tjeneste, men den har også en veldig tydelig mangel: Dataene bak tjenesten er ikke publisert. Dermed stenges muligheten for andre aktører — utviklere, redaksjoner, aktivister — til å bruke dataene i andre sammenhenger. For eksempel kan det være veldig interessant å sammenstille mobilmast-dataene med andre miljødata som offentlige virksomheter publiserer. En åpenbar ide er å samle så mange kilder for lokale miljødata som mulig og presentere dem i sammenheng.

Rekkefølgen bør være den motsatte når offentlig sektor vurderer å gjøre data tilgjengelig: Publiser først dataene i “rått” format, helst med et API hvis det er relevant. Vurder deretter om det er nødvendig å bruke ressurser på å lage egne nett-tjenester for å presentere dataene. Kanskje informasjonsbehovet blir godt ivaretatt av mediene, organisasjoner og bedrifter?

Akkurat denne saken om mobilmaster og stråling har en spesiell forhistorie: NRK Brennpunkt kjempet lenge for å få utlevert listen over mobilmaster, og klarte det til slutt. Se NRKs kart. Dette arbeidet kunne redaksjonen altså vært spart for hvis Post- og teletilsynet hadde gjort dataene tilgjengelig tidligere — og folk kunne fått informasjonen om mastene før.

]]>
https://voxpublica.no/2010/02/hvor-er-dataene-bak-finnsenderen-no/feed/ 4