Staten vil gemme alle danske hjemmesider

Alle danske hjemmesider, fra familiebloggen til de største nyhedsmedier, bevares i et enestående samtidshistorisk arkiv.

Sådan så Berlingske.dk ud 23. august 2005. Det er sider som disse, der bliver gemt for eftertiden af netarkivet.dk til forskningsbrug.
Sådan så Berlingske.dk ud 23. august 2005. Det er sider som disse, der bliver gemt for eftertiden af netarkivet.dk til forskningsbrug.

»Goddag, jeg vil gerne låne aprilnummeret af internettet, årgang 14, den danske udgave, tak!« Indtil videre kan bibliotekaren på nærmeste folkebibliotek ikke hjælpe med den anmodning, men ønsket er ikke så afsindigt, som det lyder. Siden 2005 har Statsbiblioteket i Aarhus og Det Kongelige Bibliotek samlet på »eksemplarer« af danske internetudgivelser ud fra loven om pligtaflevering, der betyder, at alle danske tryksager og TV/radioudsendelser skal indsamles og bevares for eftertiden.

Et netarkiv bygges dog ikke natten over, og først til næste år kan forskere regne med at få adgang til arkivet som samtidshistorisk kilde. Samtidig er en nærmest arkæologisk jagt på gamle hjemmesider gået ind – med henblik på at rekonstruere det danske internets spæde begyndelse.

»Internettet spiller en stadig større rolle i samfundet, og det er allerede i dag den vigtigste kilde til samfundshistorisk forskning. Netmateriale giver et mere omfattende og mere komplekst billede end samtlige andre kilder, og hvis vi ikke får det arkiveret, forsvinder det,« siger professor Niels Ole Finneman fra Institut for Informations- og Medievidenskab ved Aarhus Universitet. Han har været med til at udvikle metoderne bag det danske netarkivet.dk.

»Der er begivenheder, som kun kan rekonstrueres ud fra internettet, fordi de finder sted på internettet. Under en valgkamp er der betydelige debatter, som aldrig kommer længere end til internettet, og som ikke er registreret i dagblade eller andre steder, hvis man senere skal forske i perioden,« siger Niels Ole Finneman.

Det danske internet kan selvfølgelig ikke arkiveres i sin fulde udstrækning.

»Vi kan aldrig få arkiveret nettet i forholdet 1:1. Hvis man vil studere indholdet på et websted, som ikke er med i den selektive arkivering, kan hullerne godt vise sig at være meget store. Men det er vilkår, man som bruger af det danske internetarkiv må tage med, og alt andet lige er det en uvurderlig kilde for forskere, som gerne vil vide noget om vores kultur fra begyndelsen af 90erne og frem til i dag,« siger lektor Niels Brügger fra Institut for Informations- og Medievidenskab ved Aarhus Universitet.

Han nævner i den forbindelse den ekstreme venstre- eller højrefløjs historie efter 2000 som et emne, som det vil være meget svært at analysere uden netkilder. De ekstreme miljøer har nemlig i meget høj grad brugt nettet til at kommunikere med og samles på.

»Webhistorikerens arbejde er lige som de klassiske arkæologers: Vi har nogle skår, som vi efter bedste evne kan forsøge at samle og få til at ligne den vase, der sikkert eksisterede engang.« siger Niels Brügger, som selv har brugt mange ressourcer på at klinke skårene og genskabe blot et enkelt dansk domæne – som dog er meget stort – nemlig dr.dk fra 1996 til 2006. Det utroligt omfattende forskningsprojekt kan ses på drdk.dk.

Mens trykt materiale skal afleveres i to eksemplarer til pligtarkiveringen – af enten udgiveren eller trykkeriet – er det som hjemmeside-ejer ikke nødvendigt at foretage sig andet end at give netarkivet.dks høsteprogrammer adgang til at læse og kopiere indholdet. Som udgiver af en dansk hjemmeside kan man ikke nægte at gøre det. Pligtafleveringsloven pålægger samtidig administratoren af .dk-domænet – DK-hostmaster – at identificere ejerne af samtlige danske .dk-domæner. Dem er der efterhånden en million af.

»Danmark har den bedste pligtafleveringslov i verden, fordi loven er opdateret med medieudviklingen. Der er andre lande, som samler indhold fra nettet, men Danmark er virkelig i front,« siger Eva Fønss-Jørgensen, leder af Nationalbiblioteksområdet ved Statsbiblioteket i Aarhus, der har ansvaret for pligtindsamlingen.

Andre lande er dog også langt fremme med at høste netindhold på nationalsproget, det gælder for eksempel Frankrig, Israel, Island, Norge og Sverige, og det amerikanske archive.org har en stor sektion med netindhold, som pt. omfatter 150 milliarder øjebliksbilleder af hjemmesider fra hele verden. De ældste er fra 1996, fem år efter World Wide Webs officielle fødselsdag. Dengang var der utroligt langt mellem dansk indhold på nettet. I 1996 var der 6.500 registrerede .dk-domæner. Mange af dem var uden indhold.

Berlingske.dk-domænet havde været registreret i halvandet år, da Berlingske Tidende som den sidste af morgenaviserne gik på nettet. Det skete 5. november 1997 med en hjemmeside, der udelukkende handlede om internettet, fordi den trykte avis tog sig af de rigtige nyheder. Dette ændrede sig natten over, 27. april 1998, hvor en storkonflikt medførte strejke på trykkeriet, mens journalisterne stadig var på arbejde. Alle artikler blev derfor lagt ud på berlingske.dk, der med ét slag blev et generelt nyhedssite og endda kortvarigt det mest læste på det danske internet. Artikeltekster fra alle netaviserne begyndte også forholdsvis hurtigt at blive arkiveret i infomedia.dk, som er den danske dagpresses fælles avisarkiv, men opsætning og hjemmesidedesign er for en stor dels vedkommende forsvundet. Det ældste snapshot af berlingske.dk på archive.org er således fra 25. januar 1998. Der var tilsyneladende ingen omkring netavisen, der selv fandt på f.eks. at gemme en fuld dagsproduktion af den gamle version, når der hvert andet-tredje år blev opgraderet til nye online-produktionssystemer og nye designs.

»Jeg kan ikke huske, at der blev truffet en egentlig beslutning om at lade være med at gemme noget, men det hele gik jo ret stærkt dengang,« siger Casper Bruun Møller, der i dag er driftschef for Berlingskes onlinemedier, og som har været med til at lave bladhusets netaviser siden 1999.

Fagbladet Ingeniøren var et af de første danske medier, der for alvor gik på nettet, og bladets netudgaver er samtidig en af de bedst bevarede netkilder. En medarbejder ved Ingeniøren har gemt netversioner helt tilbage fra 1994 og doneret materialet til netarkivet.dk, hvor det i dag udgør nogle af de tidligste spor af det danske internet.

»Internettet var jo over 10 år gammelt, da vi i 2005 begyndte at indsamle systematisk. Men det er meget interessant for medieforskere at se på opkomsten og fødslen af det danske internet, fordi det siden blev så stort og vigtigt,« siger Eva Fønss-Jørgensen, der i samarbejde med Det Kongelige Bibliotek arbejder på at opspore de gamle netudgivelser.

Det gør de blandt andet ved at henvende sig til større dagblade for at høre, om disse selv ligger inde med arkiverede versioner af hjemmesider, som ikke længere er offentligt tilgængelige. Men desværre uden større held. Man opfordres derfor til at henvende sig, hvis man ligger inde med arkiverede versioner af danske hjemmesider fra før 2005, som ikke allerede ligger på archive.org.

Teknikken til at søge i det stadig mere omfattende netarkivet.dk er ikke helt på plads endnu, og i første omgang er det kun forskere med forhåndsgodkendte projekter, der har onlineadgang til arkivet. Foruden teknikken er der juridiske begrænsninger, for selvom der enkeltvis er tale om offentligt tilgængelige hjemmesider, bliver de tilsammen til et register, når de ender i netarkivet.dk. Der kan være personfølsomme oplysninger i det høstede materiale, og i persondatalovens fortolkning er det ikke kun CPR-numre og økonomiske forhold, der er personfølsomme, det kan oplysninger om helbred, politisk eller religiøst tilhørsforhold eller holdningstilkendegivelser i meget bred forstand også være. Datatilsynet stiller derfor en række krav om screening af indholdet for personoplysninger, før arkivet kan gøres offentligt tilgængeligt.

»Vi regner med at kunne tilbyde et deklassificeret arkiv til en større kreds, når vi bliver sikre nok på at have løst screeningsproblemet,« fortæller Eva Fønss-Jørgensen.

Det bliver dog stadig nødvendigt at møde personligt op på Statsbiblioteket i Aarhus eller på Det Kongelige Bibliotek i København og søge adgang til netarkivet.dk via en computer på stedet. Ambitionen er, at der også skal være adgang fra folkebibliotekerne, men en bred onlineadgang fra hjemmecomputeren ligger ikke i kortene.

Vi kan se, at du har installeret en adblocker, så vi ikke kan vise dig annoncer.

Det er vi kede af, fordi indtægter fra annoncer er en helt afgørende årsag til, at vi dagligt kan tilbyde dig journalistik af høj kvalitet.

For få adgang til indhold på b.dk skal du tillade visning af annoncer på b.dk. Se hvordan du gør her..

Tak for din forståelse.

Hov! Hvor blev min artikel af..!?

Du er træt af reklamer. Vi ved det godt! Men de betaler for den artikel, du du sidder og læser. Vi vil derfor sætte stor pris på, at du tilføjer b.dk til din adblocker's "whiteliste".

Tak for din forståelse.