Hva om vi alle får rådgivere som Donald Trump?

For noen måneder siden hadde jeg en videokonferanse med et ungt menneske som lurte på om hun skulle søke doktorgradsstudium på BI. Vedkommende var atypisk i mange dimensjoner fra de fleste doktorgradsstudenter jeg har møtt, men hadde tatt en mastergrad, likte jobben med masteroppgaven, og lurte på om det å fordype seg ytterligere kunne være det neste. I tillegg – og her er poenget – hadde hun blitt anbefalt å vurdere en doktorgrad av sin AI-baserte coach.

Vi diskuterte litt frem og tilbake, og jeg anbefalte henne å søke. Om hun gjorde det, vet jeg ikke. Men jeg ble sittende og tenke etterpå.

ELIZA-samtale (fra Wikimedia)

Det å ha en coach, terapeut, rådgiver eller for den saks skyld venn å snakke med, er jo i seg selv ikke noe negativt. Ei heller er det negativt at denne coach’en er digital – den er i alle fall billig (foreløpig) og tilgjengelig til alle døgnets tider. Gitt at den er «promptet» skikkelig (rolle, situasjon, målsetting) vil vel også svarene være noe i retning av hva en menneskelig coach. Og digitale samtalepartnere har jo lange tradisjoner, som Joseph Weizenbaums Eliza viste – i 1966!

Men hva slags motivasjon har en slik coach – eller, for å si det på AI-språket: Hva er dens belønningssystem (reward function), og hvordan påvirker målsettingen hvilke svar den gir?

Svaret er at de i hovedsak er designet til å være hyggelige mot oss.

Belønninger former resultater

Store språkmodeller svelger enorme tekstmengder og trener seg opp å forutsi neste ord i en rekkefølge, ved en rekke matematiske prosesser, hovedsaklig matriseregning (glimrende forklart i denne videoserien.) Etter denne treningen gjennomgår modellen en finpussfase kalt Reinforcement Learning from Human Feedback (RLHF). Mennesker rangerer modellens svar, og modellen justeres mot å produsere svar med høy rangering. Et av problemene med denne prosessen er at vi mennesker liker å få rett: Vi liker svar som bekrefter våre antagelser, som er formulert med selvtillit og en viss autoritet, og som ikke utfordrer oss for mye. Dermed lærer ikke nødvendigvis modellene å bli sannferdige eller kloke. De lærer å være behagelige.

Dette blir et utbredt problem etterhvert. Sharma et al (2023) fant at ulike modeller hadde en tendens til å være smigrende. (Det engelske utrykket er sycophancy. Jeg har ikke funnet noe direkte norsk oversettelse av dette. Og jeg som trodde sykopant og sykopantisk var norske ord. Akk ja. Herved foreslått.) Modellene endrer korrekte svar når brukeren uttrykker tvil, gir etter for press selv om de har rett, og tilpasser meninger til hva brukerne signaliserer at de ville høre.

Av og til kan smigeren bli for åpenbar: I april 2025 slapp OpenAI en oppdatering av GPT-4o som hyllet trivielle innfall som geniale, bekreftet tvilsomme forretningsidéer som strålende, og strøk brukerne såpass mye med hårene at det ble pinlig. OpenAI rullet tilbake oppdateringen og publiserte en forklaring der de innrømmet at de hadde lagt for mye vekt på kortsiktige tilbakemeldinger fra brukerne i treningsprosessen.

Problemet er at det er ikke så lett å måle om et svar er godt, i hvert fall ikke en måte som er skalerbar, rask og billig. Reinforcement learning – å la maskinen prøve seg om og om igjen til ting blir riktig – fungerer så lenge det finnes et klart formulert mål, enten dette er å spille Breakout eller diagnostisere kreft. Det å ikke ha data – spesifikt, data med korrekte svar å trene mot – er den vanligste grunnen til at analyseprosjekter mer eller mindre mislykkes, noe jeg har sett mange ganger i kursene mine.

Problemstillingen kalles «AI alignment» og er ikke enkel. Anthropic har forsøkt seg med noe de kaller «constitutional AI«, som i hovedsak går ut på å la modellen måle sine svar opp mot anerkjente verdier – som FNs menneskerettighetserklæring. Dette er også en teknikk som blir anbefalt av produsentene av modellen selv: Bruk modellen til å være kritisk til hva den selv sier.

Digital Trumpisme

Donald Trump omgir seg med rådgivere som snakker ham etter munnen. Han har klart målbare målsettinger – kortsiktig popularitet og kortsiktig økonomisk gevinst – og ingen som helst sperre på hvor sterkt og åpent de uttrykkes. Siden han kan velge sine medarbeidere, foretrekker han de som skryter av ham heller enn å gi ham motstand, og dermed ender man opp med noksagter som Pam Bondi, fanatikere som Pete Hegseth eller værhaner som JD Vance.

Den katolske kirken hadde tidligere noe som heter «djevelens advokat» – en person som har som oppgave å argumentere kraftig og nesten vitenskapelig mot at en person skal erklæres for helgen. Christopher Hitchens var ganske imponert over de katolske geistlige som besøkte ham da Mor Theresa skulle kanonseres. De lyttet nøye til hans motforestillinger både mot hennes gjerning og de miraklene som skulle gi henne helgenstatus – men trass i gode begrunnelsen ble hun altså helgen. Med andre ord, det hjelper lite å ha institusjonelle motforestillinger, digitale eller ikke, hvis de ikke blir lyttet til.

Og dit kommer vi kanskje. Jeg har hatt en hel del studenter som har kommet til meg med AI-resultater og presentert dem som sine egne. Men jeg har ennå ikke hatt noen som har insistert på at det AI har produsert er sant, og lurer litt på når det skjer og hva jeg skal si da (uten å eksplodere). Den første generasjonen studenter som har hatt tilgang til språkmodeller uteksamineres i disse dager, og de liker ikke AI, delvis fordi de er usikre på om de faktisk kan noe, delvis fordi arbeidsmarkedet for nyutdannede er dårligere enn det har vært på lenge, noe som tilskrives AI.

Men det spørs jo om ikke det behagelige etter hvert blir det sanne og eneste. Slik det har blitt for Trump.

(Og ja, jeg startet dette innlegget med Claude, men endte opp med å skrive neste hele greia selv, siden jeg skriver forblommet nok som det er, uten hjelp fra en entusiastisk språkmodell.)

AI som informasjonsdisrupsjon?

Hvis du lever av å levere kvalitetsinformasjon til betalingsvillige kunder – hvor redd skal du være for AI-basert konkurranse?

Det altseende monsteret Argos, i følge Gemini.

(En versjon av denne bloggposten ble først publisert på Comunita.no – et ledernettverk for folk med interesse for, nettopp, strategisk forretningsutvikling. Ta kontakt om du ønsker å vite mer om Comunita!)

Den gang jeg var student – tidlig 80-tall, intet mindre – fantes ikke sosiale medier, Internett, kommentarfelt eller fake news (i hvert fall ikke fake news produsert av privatpersoner.) Ikke desto mindre følte mange bedriftsledere et behov for å følge med på hva som ble skrevet om dem og bedriften deres. Derfor hadde de gjerne abonnement på Argus (oppkalt etter et altseende monster fra gresk mytologi), en utklippstjeneste der folk var ansatt for å lese gjennom aviser, klippe ut artikler skrevet om hva det nå var man var opptatt av, lime dette på papir og levere eller sende det til kundene.

Om dette høres tregt, dyrt og primitivt ut, så må man huske at alt er relativt: Aviser kom (som oftest) bare en gang om dagen og det fantes bare én TV- og radiokanal med nyheter. Hadde man en faks, fikk man kopier av artikler og annet hver morgen – raskere enn om man pløyde gjennom avisene selv, og med mindre risiko for at man gikk glipp av noe i en eller annen lokalavis.

Men så lenge medieovervåkningen var raskere enn mediet, hadde man jo nogenlunde kontroll.

Digitalisering

Etter hvert ble avisenes arkiver digitalisert: Aftenposten var en pioner her, de hadde digitalt arkiv fra ca. 1983 og var tidlig ute med å lage en nokså primitive søkemotorer mot dette arkivene. Medieovervåkningsbransjen endret seg: Først ved at det ble etablert digitale overvåkningstjenester med tilgang til avisenes interne arkiver, deretter, etter hvert som avisene ble tilgjengelige over Internett fra midten av 90-tallet, mer automatiserte tjenester (basert på søkeord) som brukte det åpne nettet, ikke avisenes eget materiale, som viktigste kilde. (Hvis du er interessert i mer detaljer, se denne artikkelen fra 2008.)

De nye medietjenestene var billigere og raskere enn de eksisterende – de kunne søke på mange søkeord og levere resultatet via epost, uberørt av menneskehender. Tjenestene deres var av dårligere kvalitet enn de manuelle, dyre tjenestene, men de vant frem fordi de fant nye kunder som ikke trengte den samme kvaliteten. Det betød at de ofte fikk falske alarmer, men prisen var lav og hastigheten høy, og over tid ble den nye tjenesten bra nok, samtidig som mer og mer av nyhetsbildet skjedde utenfor papirbaserte og/eller lukkede kanaler.

Og i dag finnes – såvidt jeg vet – ikke manuelle medieovervåkningstjenester lenger. Noen av firmaene er borte, noen av deres etterfølgere lever videre og leverer tjenester på toppen av søkesystemer, som for eksempel systemer for å levere pressemeldinger eller forholde seg til investorer (og noen av dem gjør det bra). Selve søketjenesten er nå, for de flestes vedkommende, automatisert bort til en enkel abonnementstjeneste, programmert inn som en IFTTT-makro, eller ved at man legger inn faste søk i Google eller (mistenker jeg) bruker en AI-agent.

Den dødelige jakten på lønnsomhet

Det er ikke så uvanlig at nye selskaper kommer til etter hvert som teknologien utvikler seg – det skjer naturligvis hele tiden. Gåten ligger i hva som skjer i de gamle selskapene – hvorfor reagerer de ikke på den nye konkurransen og begynner å levere de sammen tjenestene? De burde ha alle fordeler – kunderelasjoner, kunnskaper, og bedre kildetilgang.

Svaret heter naturligvis disrupsjon – eller rettere sagt, disruptive innovasjoner.

Sett at du er et selskap som leverer en informasjonstjeneste av god kvalitet – for eksempel ved at du bruker mennesker som velger ut materiale, mennesker som forstår hva kunden er ute etter og velger ut det som er aktuelt og faktisk handler om ditt selskap og din bransje og ikke noe som tilfeldigvis ligner. Så dukker det opp en konkurrent som leverer noe som er dårligere, men billigere. Dine gode, trofaste kunder bryr seg ikke om dem, men de tar endel av de marginale kundene dine – kunder som synes dine tjenester er bra, men for dyre, og som ikke trenger den kvaliteten du leverer.

Hvordan skal du respondere? Hvis du forsøker å tilby en dårligere tjeneste til billigere pris, utkonkurrerer du deg selv – og selv om du vinner, vil du vinne et marked som er mindre lønnsomt (om enn kanskje større) enn det du er i nå. Selv om det finnes eksempler på selskaper som har gjort dette – Schibsted, for eksempel – hører det til sjeldenhetene.

Mye vanligere er at man forsøker å gjøre produktet sitt enda bedre, for å kunne ta en høyere pris av de kundene man allerede har (og kanskje skaffe seg nye, betalingsvillig kunder). Denne strategien fungerer ofte i praksis, i alle fall hvis markedet har plass, tjenestene ikke er for sammenlignbare, og utviklingen ikke går for fort. Selv om disrupsjon er lett å beskrive, tar ting tid og man mister gjerne fokus.

Et alternativ er å lage en ny løsning – en billigversjon – som utnytter den nye teknologien, samtidig som man trekker på den erfaringen og informasjonstilgangen bedriften allerede har. Vanskeligheten her ligger dels i markedsføring – det er viktig å holde merkevarer fra hverandre – men også i organisasjon. Da Intel på 90-tallet introduserte en billig chip for å utkonkurrere nye leverandører, la man design og produksjon til et sted langt unna eksisterende fabrikker, slik at man fikk fokus på å lage noe billig som var bra nok, heller enn å lage noe som var så bra som mulig.

Det er kulturforskjell på Skoda og Audi, må vite.

I virkeligheten tar ting tid og er ikke så krystallklart som teorien vil ha det til, ganske enkelt.