Kunnskapsrepresentasjon

Fredag var jeg på «toppmøte» om digitalisering, et møte der regjeringsmedlemmer (8 ministre på hvert sitt bord), universitetsrektorer, og andre samfunnstopper diskuterte digitalisering i Norge, primært rundt offentlig sektor. Det var innledende presentasjoner av Camilla Tepfers, Morten Dæhlen, Camilla Serck-Hanssen og Hege Skryseth. Gjennomgangstemaene var de det pleier å være: Vi mangler digital kompetanse, mangler tverrfaglighet (i mange dimensjoner) og skal det skje noe i offentlig sektor må vi rive eller i alle fall forbinde siloene.

Jeg fikk mye å tenke på og skrive om – og mitt hovedinntrykk er at vi vet hva vi skal gjøre, men vi gjør det bare ikke.

Nok om det. I denne omgang skal jeg ta for meg noe mer spesifikt, nemlig kunnskapsrepresentasjon.

Morten hadde et utmerket innlegg som han har delt på mat-nats blogg, og der hadde han dette som et av fire hovedpunkter:

Digital representasjon og visualisering. Behovet for kunnskap om digital representasjon av kunnskap synes å være undervurdert, men dette området er i vekst, noe som i all hovedsak skyldes dataeksplosjonen. Kunnskap om hvordan digitale representasjoner presenteres og visualiseres er også en vesentlig del av dette.

Jeg kunne ikke vært mer enig, men hva betyr egentlig digital representasjon og visualisering? Ved første øyekast kan det se ut som evnen til å lage delikate fremstillinger av data, som for eksempel Hans Roslings fantastiske TED-foredrag. Men egentlig betyr uttrykket mer å klare å gjøre data tilgjengelig i en form som datamaskiner kan behandle.

Wikipedia beskriver knowledge representation and reasoning som «the field of artificial intelligence (AI) dedicated to representing information about the world in a form that a computer system can utilize to solve complex tasks». Er det en ting jeg har funnet ut ved å undervise kurs i strategisk dataanalyse, så er det at det å få dataene inn i en form og med et innhold der man faktisk kan gjøre noe med dem er kanskje den nest største vanskeligheten. (Den største er å formulere spørsmål som faktisk lar seg besvare, mer om det en annen gang.)

La oss ta et helt banalt eksempel: Sett at du underviser et kurs (som jeg ofte gjør) og du skal lage deg et regneark for å holde orden på studentene. Du ber administrasjonen om en liste over hvem som er med i kurset, og får et regneark eller en tabell som ser slik ut:

hogwarts

Utmerket, i og for seg. Men vent litt – hva om jeg har lyst til sortere studentene alfabetisk på etternavn, eller å lage navneskilt til studentene med fornavnet på en linje og etternavnet under? Da er det ganske klart at kolonne B ikke er satt opp for dette, siden for- og etternavn ikke er adskilt. Hvis jeg skal gjøre det, må jeg enten gå gjennom alle studentene og manuelt skille for- og etternavn (tidkrevende og kjedelig), eller skrive en liten makro som gjør det automatisk. Den siste løsningen introduserer feilkilder: En av Harry Potters medstudenter hetter «Choo Chang» og omtales som Choo, men egentlig burde hun jo vært «Chang Choo» siden navnet er aseatisk. For ikke å snakke om studenter med navn som «Jose Maria Casiento Gomez-Caseres de Monteleon», hvor det ikke er helt enkelt å finne ut hva man skal kalle dem.

Og her er vi fremme ved hva kunnskapsrepresentasjon er – hvordan gjør man data tilgjengelig slik at man kan bruke det til noe, uten at man på forhånd vet hva dette «noe» er?

Dette er vanskeligere enn man tror, og har å gjøre med informasjonsarkitektur, databasestrukturer, metadata, APIer og masse annet morsomt. Men bare ha dette lille eksempelet i mente, så har du i alle fall litt av den digitale kompetansen Morten etterlyser…

3 tanker på “Kunnskapsrepresentasjon

Kommenter

Fyll inn i feltene under, eller klikk på et ikon for å logge inn:

WordPress.com-logo

Du kommenterer med bruk av din WordPress.com konto. Logg ut /  Endre )

Facebookbilde

Du kommenterer med bruk av din Facebook konto. Logg ut /  Endre )

Kobler til %s