Indeksering og eksemplarfremstilling

Meltwater, ledende norsk medie-monitoreringsfirma, er dømt for å ha indeksert nyhetsartikler uten tillatelse. Dommen vil opplagt bli anket, men jeg savner en klargjøring av hva det egentlig er Meltwater har gjort.

Hvis du ikke ønsker at ditt webmateriale skal indekseres av søkemotorer, er det enkelt å lage en liten fil (med navnet robots.txt) som hindrer dette. Alle de store søkemotorene respekterer dette, og dermed regner jeg med at hvis man legger noe ut uten å ha spesifisert at det ikke skal indekseres, kan man ikke klage over at søkemotorer indekserer materialet. Hvis man derimot har spesifisert at det ikke skal indekseres, så bør søkemotorer, inkludert Meltwater, respektere dette. (At jeg personlig synes det er tåpelig å stenge søkemotorer ute fra et nettsted som ønsker lesere, er en annen sak. Hver sin lyst.) For at denne diskusjonen skal ha mening rent forretningsmessig sett (juridisk er det noe annet, siden lovene ikke helt er tilpasset digital informasjon ennå) må etter mitt skjønn Meltwater ha ignorert et robots.txt direktiv.

Meltwater og andre medieovervåkningsfirma lever av å finne ut hva som blir skrevet om et firma eller en person. De har derved interesse av å søke i alt. Deretter skal materialet vises til kunden, og da blir spørsmålet om man skal vise en kopi (dermed er det eksemplarfremstiling) eller bare lenke til materialet på Internett. Man kan selvfølgelig hevde at når man ser på noe i en browser, så lages det en local kopi av websiden, men dette er opplagt lovlig (når jeg leser Aftenposten på nett, kan avisen ikke klage over at det ligger en lokal kopi på min harddisk – det er slik nettlesere fungerer. Hovedargumentet her regner meg med er trafikk – hvis kunden må gå til originalsiden for å lese, får denne siden trafikk og dermed annonseinntekter.

Når en side indekseres, skjer det to eksemplarfremstillinger: Hele siden lagres midlertidig for analyse, og deretter trekkes alle mulige informasjonsenheter ut og legges inn i en indeks – omtrent som om man tar en bil fra hverandre og sorterer delene, men samtidig lager en tegning som sier hvordan man kan sette den sammen igjen. Skal det være mulig å finne tilbake til originaldokumentet, må dette gjøres – og jeg kan ikke se at dette er eksemplarfremstilling heller. Så er spørsmålet – hva skjer med den midlertidig lagrede siden – skal kunden se denne, eller bare den originale?

Argumentet for å lagre en egen versjon er at sider hele tiden endres og ganske ofte fjernes. Har man en lokal kopi, kan man vise den i stedet for originalen, og da er det også en match mellom søkeindeksen og det som vises. En midlertidig lagring for analyse er etter min mening ikke en eksemplarfremstilling. Men hvis den vises frem (slik Google gjør ved å tilby å hente dokumentet fra cache) er det etter min mening eksemplarfremstilling.

Så der står etter mitt skjønn spørsmålet: A) Skal en søkemotor måtte respektere robots.txt, og B) og er det eksemplarfremstilling før noen ser resultatet? Jeg svarer ja på A), og nei på B). Meltwater kunne indeksere hva som helst uten å be om tillatelse sålenge man respekterer robots.txt, men bør ikke fremstille egne kopier som vises til kunden uten å innhente tillatelse.

(Forøvrig er det siste momentet egentlig en svært konkret versjon det gamle spørmålet om hvorvidt et tre som faller i skogen lager lyd hvis ingen er der for å høre det. Og her er det faktisk slik at lyden ikke er der før mottakeren er der.)

En helt annen side er at de som fremstiller nyheter og andre artikler har problemer med å få betalt for det, fordi færre og færre kjøper papiraviser og annonseinntekter på web ikke dekker opp forskjellen. Siden søkemotorer er forbrukere av materiale, ser det ut for avisene som at de bør betale. Samtidig driver søkemotorene trafikk mot avisenes sider – og maktkampen er igang. Begge sider trenger hverandre. Meltwater og andre medieovervåkere er litt forskjellige – de driver ikke trafikk i særlig grad, men driver opp relevansen av artikler ved å finne de få, men svært betalingsdyktige kundene som vil ha dem. Det burde være mulig å få til en avtale her – slipp Meltwater til, og få betaling mer direkte avhengig av hva kunden betaler for rettet søk.

Denne saken er langtfra ferdig og mye mer komplisert enn det som frestilles i digi.no artikkelen. Dessverre tror jeg ikke rettsalen er stedet å løse dette problemet, men det er der ting havner. La oss håpe på en dommer som i hvert fall bruker søketeknologi og vet hvor nyttig den kan være…

Kirsti Kierulf ny leder PFIT

image Jeg har vært formann i Polyteknisk Forenings IT-gruppe siden 1996 (ble faktisk først formann og så medlem) – og de siste årene har jeg forsøkt å få avløsning. Ingen bør være formann i noe som helst så lenge. Problemet har vært å finne noen med visjoner og kontakter og ikke minst lyst til å ta jobben.

Nu er det i boks, og jeg er svært fornøyd med at Kirsti Kierulf tar over som leder for PFITs styre. Kirsti har en sammensatt bakgrunn innen teknologi og entreprenørskap og er nå direktør for kunnskap og innovasjon i Accenture. Hun har mange ideer om hvordan teknologibasert innovasjon skal komme på kartet her i Norge, er en energisprøyte som har dratt igang en innovasjonlab for søketeknologi som et samarbeid mellom Accenture, Microsoft og Avanade, og har evne og vilje til å drive PFIT til nye høyder.

Selv fortsetter jeg som styremedlem og kommer til å holde liv i websiden, samt etterhvert flytte den inn under PFs sentrale nettsider.

Og med det – send forslag til nye spennende møter og temaer til Kirsti eller til andre medlemmer i styret, eller legg dem inn som kommentarer herunder. Vår gjennomføringsprosent er høy hvis forslagene er konkrete (inkludert foredragsholder(e) og ligger i et svært bredt definert skjæringspunkt mellom IT og samfunn. Alle forslag mottas med takk!