Om smittesporing og digital nøyaktighet

Nok en kommentar i digi.no, denne gangen om et svært viktig tema, som dessverre har blitt litt borte i diskusjonen om personvern og smittesporing. Jeg liker ikke konspirasjonsteorier og alt som har med Covid-19 haster, men før man lanserer noe som sporer folk overalt må man vite at det faktisk gir den effekten man er ute etter.

.Alle datakilder og alle modeller har feil. Det må vi leve med. Det vi må vurdere, er om feilene er store nok til at vi ikke kan bruke resultatet.

Lydfil herunder, også tilgjengelig på Spotify.

Til deg som er leder der ute – hva er vanskelig nå?

Det har vært noen hektiske uker – for min del med å flytte undervisning online og hjelpe kolleger og andre med det samme. COVID-19 har virkninger på kort sikt, men også svært interessante konsekvenser på lengre sikt, spesielt innenfor digitalisering. For meg er det ikke tvil om at bedrifter med høy digital kompetanse, endringserfaring og en eksisterende digital tilstedeværelse nå virkelig har sjansen til å løpe fra konkurrentene – hvis ledelsen kjenner sin besøkelsestid.

Samtidig er jeg klar over at dette er vanskelig for mange, kanskje de fleste. Det er mange grunner til at man har latt det digitale ligge, som regel fordi andre ting er har (helt legitimt) vært viktigere. Jeg har (selvfølgelig) masse oppfatninger om hva man kan gjøre rundt det å digitalisere og utvikle sin bedrift i denne situasjonen.

Men så slår det meg – kanskje jeg ikke skal gå ut fra hva jeg tror og mener i denne situasjonen, men heller spørre: Alle dere som er ledere i små og store bedrifter der ute: Hva er vanskelig akkurat nå, hva trenger dere hjelp til å få til?

Dette er ikke starten på et kommentarfelt eller en artikkel – send meg en (konfidensiell, naturligvis) epost på self@espen.com, så skal jeg (om det er aktuelt, lover ikke) summere opp og rapportere tilbake.

Og for all del: Del dette innlegget med hvem du vil, jo flere jo bedre!

Hvorfor du skal lære matematikk (igjen)

Jeg slo på radioen i bilen i går og inne i mellom all viruspraten (som jo i prinsippet handler om matematiske spredningskurver) fikk jeg høre to matematikklærere, begge tydeligvis flinke folk (de har begge skrevet lærebøker) som strevet med å artikulere nytten av matematikk for sine elever. Det er ikke enkelt å snakke på direkten, særlig når programlederen starter med den vanlige «jeg har ikke hatt nytte av matematikken» tiraden, men debattartikkelen det hele bygger på, er velskrevet og bra – bortsett fra overskriften (som er det de fleste leser, og som forfatteren ikke setter selv.)

Skal ungdom forstå hvorfor de skal lære matematikk, må vi være direkte. Så derfor vil jeg nok en gang å gjengi mine grunner til å lære matematikk, denne gang oppdatert med et punkt til – om klima og forurensning og (hvorfor ikke) pandemier.

( Tidligere versjoner av denne kom først som en kronikk fra Aftenposten fra 2006, også her i 2015, og tidligere publisert mange steder og i mange språkdrakter rundt omkring i verden.)

Her også som lydfil – tilgjengelig som podkast på Spotify.

13 grunner til å lære matematikk

Du skal lære matematikk for å bli smartere. Matematikk er for læring hva kondisjons- og styrketrening er for idrett: Grunnlaget som setter deg i stand til å bli bra i den spesialiteten du ender opp med. Du blir ikke idrettsstjerne uten å ha god kondis. Du blir ikke stjerne innen din jobb eller flink i dine fag uten å kunne tenke smart og kritisk – og matematikk lærer deg det.

Du skal lære matematikk for å tjene mer penger. Idol-vinnere og andre kjendiser tjener penger, men det er få av dem, og de fleste tjener bare penger i noen få år. Deretter er det tilbake til skolebenken. Dersom du kutter ut Idol-køen og TV-fotball og i stedet gjør leksene dine – særlig matematikken – kan du gå videre med en utdannelse som gir deg en godt betalt jobb, for eksempel innen stordataanalyse og kunstig intelligens. Du vil tjene mye mer enn popsangere og idrettsfolk – kanskje ikke med en gang, men helt sikkert når du regner gjennomsnitt og over hele livet.

Du skal lære matematikk for å tape mindre penger. Når massevis av mennesker bruker pengene sine på dårlige investeringer, inkludert pyramideselskaper, forbruksgjeld og tilbud som er for gode til å være sanne, så er det fordi de ikke kan regne. Hvis du skjønner litt statistikk og renteregning, kan du gjennomskue økonomiske løgner og luftige drømmer. Med litt naturfag i bagasjen blir du sikkert friskere også, siden du unngår alternative medisiner, krystaller, magneter, homøopati, shamaner og annen svindel fordi du vet det ikke virker.

Du skal lære matematikk for å få det lettere senere i studiene. Ja, det kan være endel jobb å lære seg matematikk mens du går i videregående. Men når du kommer videre til universitet eller høyskole, slipper du ofte å pese deg gjennom hundrevis av overforklarende tekstsider. I stedet kan du lese en formel eller se på en graf, og straks forstå hvordan ting henger sammen. Matematikk er mer kortfattet og effektivt enn andre språk. Kan du matematikk, kan du jobbe smart i stedet for hardt.

Du skal lære matematikk fordi du skal leve i en global verden. I en global verden konkurrerer du om de interessante jobbene med folk fra hele verden – og de smarteste studentene i Øst-Europa, India og Kina kaster seg over matematikk og andre “harde” fag for å skaffe seg en billett ut av fattigdom og sosial undertrykkelse. Hvorfor ikke gjøre som dem – skaffe seg kunnskaper som er etterspurt over hele verden, ikke bare i Norge?

Du skal lære matematikk fordi du skal leve i en verden i stadig endring. Ny teknologi og nye måter å gjøre ting på endrer hverdag og arbeidsliv i stadig større tempo. Hvis du har lært din matematikk, kan du lære deg hvordan og hvorfor ting fungerer, og slippe å skrape deg gjennom arbeidsdagen med huskelapper og hjelpetekster, livredd for å trykke på feil knapp og komme ut for noe nytt.

Du skal lære matematikk fordi det lukker ingen dører. Hvis du ikke velger full matematikk i videregående, lukker du døren til interessante studier og yrker. Du synes kanskje ikke disse yrkene og studiene er interessante nå, men tenk om du skifter mening? Dessuten er matematikk lettest å lære seg mens man er ung, mens samfunnsfag, historie, kunst og filosofi bare har godt av litt modning – og litt matematikk.

Du skal lære matematikk fordi det er interessant i seg selv. Altfor mange mennesker – også lærere – sier matematikk er vanskelig og kjedelig. Men hva vet de om det? Du spør ikke bestemoren din hva slags smarttelefon du skal kjøpe? Du ber ikke foreldrene dine om hjelp til å legge ut noe på Tiktok? Hvorfor spørre noen som aldri lærte seg matematikk om du skal lære matematikk? Hvis du gjør jobben og holder ut, vil du finne ut at matematikk er morsomt, spennende og intellektuelt elegant.

Du skal lære matematikk fordi du kommer på parti med fremtiden. Matematikk blir viktigere og viktigere innen alle yrker. Fremtidens journalister og politikere vil prate mindre og analysere mer. Fremtidens politifolk og militære bruker stadig mer komplisert teknologi. Fremtidens sykepleiere og lærere må forholde seg til tall og teknologi hver dag. Fremtidens bilmekanikere og snekkere bruker chip-optimalisering og belastningsanalyser like mye som skiftenøkkel og hammer. Det blir mer matematikk i arbeidslivet, så du trenger mer matematikk på skolen.

Du skal lære matematikk fordi du får reell studiekompetanse. Hvis du slapper av i videregående, får du et papir som sier at du har ”almen studiekompetanse”. Det er jo kjekt med et papir, men kompetanse til å studere har du ikke. Det vil du merke når du går videre til universitet eller høyskole, og må ha intensivkurs i matematikk for å skjønne hva foreleseren snakker om.

Du skal lære matematikk fordi det er kult. Det er lov å være smart, det er lov ikke å gjøre som alle andre gjør. Velg matematikk, så slipper du for resten av livet å vitse bort at du ikke klarer enkle utregninger eller ikke skjønner hva du holder på med. Dessuten får du jobb i de kule selskapene, de som trenger folk med hjerner.

Du skal lære matematikk fordi det er kreativt*. Mange tror at matematikk bare har med logisk tenkning å gjøre og at logikk ikke kan være kreativt. Sannheten er at matematikk er noe av det mest kreative som finnes – bare man bruker kunnskapen riktig. Gode kunnskaper i matematikk og matematisk tenkning i kombinasjon med annen kunnskap gjør deg mer kreativ enn mange andre.

Du skal lære matematikk fordi du skal løse de store problemene. Verden sliter i dag med store problemer som klima, forurensning, fattigdom, sykdommer og et forvitrende demokrati. For å løse disse problemene trenger vi folk som kan forstå komplekse sammenhenger og lage nye løsninger – inkludert ny teknologi – for å gjøre verden bedre. Det er kjempebra at ungdom protesterer mot manglende klimatiltak og forurensning, men i det lange løp trenger vi ikke protester og symbolhandlinger – og matematikk vil sette deg i stand til å lage løsningene, ikke bare rope etter dem.

Du trenger ikke å bli matematiker fordi du velger matematikk i videregående. Men det hjelper bra å velge matematikk hvis du vil bli smart, tenke kritisk, forstå hvordan og hvorfor ting henger sammen, og argumentere effektivt og overbevisende.

Matematikk er en skarp kniv for å skjære gjennom problemstillinger. Vil du ha en skarp kniv i din mentale verktøykasse – velg matematikk.

*) Takk til Jon Holtan, matematiker, for det siste punktet.

Hva med å skaffe en AI?

Tenketanken Passivt-Agressivt Bøllefrø (@jeblad) er verdt å følge på Twitter. I går kom han med denne stripen med, tja, poengterte utsagn om den pågående AI-hypen:

Jeg må jo bare gi ham rett på alle punkter – og jeg driver faktisk og lærer opp bedrifter i å bruke disse teknikkene. I det siste har jeg til og med hørt folk snakke om å skaffe seg «en AI», omtrent som om det er noe personalavdelingen burde involveres i.

Men så er det jo slik at når teknologene mister kontrollen over det tekniske vokabularet (noen som husker debattene om den rette betydningen av «hacker»?) så er jo det et tegn på at teknologien faktisk begynner å brukes der ute. For oss som vet, naturligvis, er jo dette bittert. Som Stephen Fry sier (i en eller annen bok jeg ikke finner referansen til nå): Det er jo ingen som er surere enn de som digget Pink Floyd før The Dark Side of the Moon, og etter å ha snakket i årevis om hvor bra de var og at alle burde høre på dem så blir de sure når bandet blir allemannseie. Konklusjonen blir at Pink Floyd har solgt seg for popularitet og det er på tide å begynne å lete etter den neste nisjegreia verden ikke setter nok pris på.

Så vi teknosnobber får finne noen nye teknologier vi kan snakke om. Det pleier ikke være vanskelig.

Om forvirringsmatriser og lederansvar

I en datadrevet bedrift tar ikke lenger ledere beslutninger om hva som skal gjøres – det gjør modellene. Så hva står igjen for lederen å beslutte? Ny kommentar på Digi.no. Også gjengitt i BI Business Review.

(Og jeg synes det er på tide at vi får uttrykket forvirringsmatrise inn i norsk språk.)

(Lyst til å diskutere digitalisering med Ragnvald Sannes, Berit Svendsen og meg? Bli med til Frankrike i oktober!) Kort frist!

Som vanlig med lydfil. I denne lydfilen henviser jeg til to figurer og forsøker å beskrive dem – ta en titt på Digi eller se herunder hvis dette er uklart (og det er det…)

Vil du lære litt om Big Data og Data Science?

Data og dataanalyse blir mer og mer viktig for mange bransjer og organisasjoner. Er du interessert i dataanalyse og hva det kan gjøre med din bedrift? Velkommen til et tredagers seminar (executive short program) på BI med tittelen: Decisions from Data: Driving an Organization with Analytics. Datoene er 21-23 mai i år, og det haster derfor litt med påmelding! (Kontakt meg eller Kristin Røthe Søbakk (464 10 255, kristin.r.sobakk@bi.no) om du har spørsmål).

Kurset har vokst ut som en kortversjon av våre executive-kurs Analytics for Strategic Management, som har blitt meget populære og fort blir fulltegnet. (Sjekk denne listen for en smakebit av hva studentene på disse programmene holder på med.)

Seminaret er beregnet på ledere som er nysgjerrig på stordata og dataanalyse og ønsker seg en innføring, uten å måtte ta et fullt kurs om emnet. Vi kommer til å snakke om og vise ulike former for dataanalyse, diskutere de viktigste utfordringene organisasjoner har med å forholde seg både til data og til dataanalytikere – og naturligvis gi masse eksempler på hvordan man kan bruke dataanalyse til å styrke sin konkurransekraft. Det blir ikke mye teknologi, men vi skal ta og føle litt på noen verktøy også, bare for å vite litt om hva som er mulig og hva slags arbeid vi egentlig ber disse dataekspertene om å ta på seg.

Presentasjoner og diskusjon går på engelsk – siden, vel, de beste foreleserne vi har på dette (Chandler Johnson og Alessandra Luzzi) er fra henholdsvis USA og Italia, og dermed blir betydelig mer presise enn om de skulle snakke norsk. Selv henger jeg med så godt jeg kan…

Velkommen til tre dager med data og, etterhvert, strategi!

Oppgaver i maskinlæring

Sammen med Chandler Johnson og Alessandra Luzzi underviser jeg nå tredje iterasjon av kurset Analytics for Strategic Management. I løpet av kurset jobber studenter med reelle prosjekter for ordentlige selskaper, og bruker ulike former for maskinlæring (stordata, analytics, AI, hva du vil kalle det) til å løse forretningsproblemer. Her er en (for det meste anonymisert, bortsett fra offentlig eide selskaper) liste med resultatene så langt:

  • Et IT-serviceselskap som leverer data og analyser, ønsker å forutsi kundenes bruk av sine elektroniske produkter, for å kunne tilby bedre produkter og skreddersy dem mer til de mest aktive kundene. Resultat: Bedre salgsprediksjoner enn den eksisterende metoden (reduserte feilmodellering med 86%) – men modellen fungerer ikke langt frem i tid. Men den vil bli implementert.
  • En bensinstasjonskjede ønsker å beregne churn hos sine forretningskunder, for å finne måter å holde dem på (eller om nødvendig, endre noen av sine tilbud). Resultat: Fant en modell som identifiserer kunder som vil forlate dem, med en treffrate på 50% vil modellen forbedre resultatet med 25m kroner, og det er rom for å øke bruken av modellen utenfor de opprinnelige segmentene.
  • En frisørkjede ønsker å forutsi hvilke kunder som vil sette opp en ny avtale når de har klippet seg, for å bygge kundelojalitet. Resultat: Fant en modell som predikerte hvilke frisører som har problemer med å bygge opp en gruppe stamkunder (med omtrent 85% nøyaktighet), har klart å få en bedre forståelse av hva som driver kundelojalitet og dermed hvordan de kan hjelpe frisører med å få flere kunder.
  • En stor finansinstitusjon ønsker å finne ansatte som ser etter informasjon om kunder (for eksempel kjendiser), for å styrke personvern og datakonfidensialitet. Resultat: Slet med å få tak i nok og riktige data, men bygget en spesifikasjon av hva slags data som er nødvendig, hva det vil koste, og hva resultatet vil være – og fant at innenfor dette området finnes det svært få modeller, noe som er en mulighet. Og man fant noen lovende startpunkter for å bygge en slik modell. Vanskelig, men viktig område.
  • En stor offentlig IT-avdeling ønsker å forutsi hvilke ansatte som sannsynligvis vil forlate selskapet, for bedre å planlegge for rekruttering og kompetansebygging. Resultat: Bygget en prediksjonsmodell og en prosess som reduserer ledetiden for å ansette en ny person fra 9 til 8 måneder (en 10m innsparing) og dermed reduserer behovet for å utsette prosjekter på grunn av kapasitetsmangel, samt forbedre planleggingen av fremtidige kompetansebehov og øke sjansen for å beholde viktige ansatte.
  • OSL Gardermoen vil finne ut hvilke flypassasjerer som vil ønske å bruke taxfree-butikken etter at de har landet, for å øke salget (og ikke bry dem som ikke vil kjøpe taxfree). Resultat: Fant at noen variable man trodde ville øke taxfree-andelen ikke gjorde det, lærte mye om hva som gjør forskjell – og at modellen, hvis man klarer å bygge den, vil være mye verdt (en økning i taxfree-bruk på under en prosent vil øke Avinors inntekter med mer enn 100m). Samt at eksperimentering, ikke store prosjekter, er veien å gå videre.
  • En mindre bank ønsker å finne ut hvilke av sine yngre kunder som snart trenger et boliglån, for å øke sin markedsandel. Resultat: Bygget en modell som øker sannsynligheten for å identifisere førstegangs boliglånskunder, til en merverdi av 6,9 millioner kroner – samt at bruken av denne modellen introduserer datadrevne beslutninger for organisasjonen.
  • Et internasjonalt TV-selskap vil finne ut hvilke kunder som sannsynligvis vil si opp abonnementet sitt innen en bestemt tidsramme, for å bedre skreddersy sitt tilbud og markedsføring. Resultat: Bygget en modell med en kortsiktig beregnet merverdi på 500000 kroner per år, som treffer seks ganger bedre enn tilfeldige utvalg. I løpet av arbeidet har man funnet en rekke aktiviteter som kan øke kundelojaliteten uten store kostnader – og funnet inspirasjon for mer bruk av maskinlæring.
  • En leverandør av administrerte datasentre ønsker å forutsi sine kunders energibehov, for å kunne skrive og oppfylle konktrakter om sertifisert grønne datasentertjenester. Resultat: Bygget en modell basert på historiske sensordata for eksisterende kunder, for å forutsi forbruk for en ny kunde, og deretter en modell som inkluderer den nye kunden for å overvåke resultatet og forbedre modellen for alle kundene. En korrekt modell (som implementert) vil forbedre månedlig inntekt med 47% for en ny klient og redusere sjansen for kontraktsterminering.
  • Ruter (paraplyfirmaet for offentlig transport for Oslo-området) ønsker å bygge en modell for å bedre forutsi trengsel på busser, for å, vel, unngå trengsel. Resultat: Bygget en modell og et forslag til en tjeneste for å kunne fortelle Ruters kunder om det (sannsynligvis) er ledige seter på bussen eller ikke, går nå til testing.
  • Barnevernet ønsker å bygge en modell for å bedre forutsi hvilke familier som mest sannsynlig vil bli godkjent som fosterforeldre, for å kunne prioritere saksbehandling og redusere ventelister. Resultat: Tross mye manglende data klarte man å finne gode indikatorer på godkjente fosterforeldre og har lagt en plan for videreutvikling av modellen etterhvert som man får bedre data. Området er lovende, siden behovet for fosterforeldre er stort og selv en liten forbedring vil hjelpe.
  • Et strømproduksjonsselskap vil bygge en modell for å bedre forutsi strømforbruket i deres marked for å kunne planlegge produksjonsprosessen bedre. Resultat: Testet mange modeller og har funnet at å forutsi spot-priser er vanskelig, men har klart å finne indikatorer på økt volatilitet, noe som gjør at man kan produsere noe mer presist. Kortsiktig effekt av en liten modell er 100-200 tusen euro per år for hver produksjonsenhet, et tall som forventes å øke siden volatiliteten i markedet vil øke fremover.

Alt i alt er vi svært fornøyd – vi har klart å øke verdien, samlet sett, for disse selskapene adskillig mer enn kurset koster (I hvert fall 10-gangen, konservativt anslått). Flere av deltakerne har fått nye stillinger og flere av dem har bestemt seg for at data science er en retning de skal fortsette å utvikle seg i, og ønsket seg flere slike «tekniske» kurs. Og gitt at vi også har produsert en masse kunnskap og generelt økt deltakernes evne til å bygge bro mellom analytikere og forretningsfolk, tror jeg vi kan erklære dette prosjektet for en suksess…

Og her er (de fleste) av denne gjengen:

Hvorfor ser man de samme annonsene om igjen og om igjen?

veksthusFor noen uker siden kjøpte jeg en motorsag på Biltema (elektrisk, kr. 699, fungerer utmerket), etter å ha søkt litt på nettet. Siden har Facebook og mange andre sider vært nedluset med annonser for motorsager i alle farger og fasonger. I forigårs diskuterte fruen og jeg om vi skulle kjøpe oss et veksthus, og Googlet litt for å finne noen alternativer og hva de kostet. Siden har det blitt mye veksthus….

Nå er ikke jeg den første som har denne erfaringen, men hvorfor velger annonsører i mange situasjoner å vise deg annonser, av og til i ukevis, for produkter du allerede har kjøpt?

Årsaken er ganske enkel: De vet ikke så mye om deg. Det eneste annonsørene vet om meg, er at jeg har søkt på motorsag eller veksthus eller hotell i Venezia eller noe annet, nokså spesifikt. I fravær av mer spesifikk informasjon (inkludert om jeg har kjøpt dette produktet eller ikke) er den beste strategien å vise meg det jeg har sett på før. Faktisk er det slik at selv om jeg har kjøpt produktet, er det beste strategien å vise meg annonser for det jeg nettopp har kjøpt, siden man likevel ikke vet (i hvert fall ikke presist nok, siden man ikke ser helheten) hvilke andre produkter man er ute etter.

(Det er også slik at Facebook faktisk ikke har så mye informasjon om deg som man skulle tro. Informasjonen om deg og dine venner har Facebook, men informasjonen om hva du har sett på og hva du har kjøpt finnes i mange firma med navn som DoubleClick (nå eid av Google). Når du går inn på Facebook, startes en komplisert auksjonsprosess der annonsører går inn og byr på muligheten til å vise deg en annonse.2000px-adservingfull-svg

Disse auksjonene er over på millisekunder (fra du har klikket på noe i Facebook til siden kommer opp i webleseren) og dermed må man bruke ganske enkle kriterier for hva som skal vises, samtidig som kostnaden ved å ta feil er svært liten. I en slik situasjon blir det mange annonser for ting folk har kjøpt før.

Men det er bedre enn å skyte i blinde.

(Og vil du lese mer om dette og andre algoritmer som brukes til alle de beslutningene vi lurer på på Internett og andre steder, anbefaler jeg sterkt Algorithms to Live By: The Computer Science of Human Decisions av Brian Christian og Tom Griffiths. Morsom og lærerik.)

Er du smart nok for smarte organisasjoner?

dn-09272018-smart-nok-til-acc8a-lede-intelligente-organisasjoner_pdfLiten artikkel i DN i dag, bygget på en artikkel i BI Business Review (kommer etterhvert), som igjen bygger på dette kapittelet i BIs jubileumsbok. (Og stor takk til Audun Farbrot for en formidabel innsats i forskningskommunikasjonens tjeneste i denne sammenheng.)

Og artikkelen? Vel, jeg vedlegger en PDF, lenken (betalingsmur) finner du nedenfor, og som så meget annet handler denne artikkelen om at man ikke kan innføre nye teknologier (i dette tilfelle dataanalyse) uten samtidig å endre organisasjonen (i dette tilfelle ledelsesrollen.) Dataanalyse og den datadrevne organisasjonen må forholde seg til et faktabasert verdensbilde, noe som krever evne til å sanse, forstå, handle, lære og forklare – kontinuerlig, og i stor skala.

Lenke til DN: https://www.dn.no/innlegg/ledelse/digitalisering/smart-nok-for-smarte-organisasjoner/2-1-424362

PDF: DN 09272018 Smart nok til å lede intelligente organisasjoner

(Og nei, jeg har ikke begynt å jobbe for Accenture. Fire forfattere ble tydeligvis litt for vanskelig for DN…)

Odd Erik om replikering av AI-forskning

file (1)

Syntes jeg dro kjensel på fotografiet – og jammen var det ikke Odd Erik Gundersen (som jeg sitter i styret i SmartHelp sammen med) som ble intervjuet og har skrevet en glimrende (og tilgjengelig) kronikk i Morgenbladet om diskusjonen om forskningskvalitet. Det er et stendig problem innen forskning (også innen informatikk) at forskningsresultater ikke lar seg replikere.

Innenfor kunstig intelligens (eller, vel, maskinlæring som jeg regner med at det er snakk om her) er dette ekstra viktig fordi utviklingen av maskinlæringsalgoritmer i motsetning til vanlig vitenskapelig metode er teoriløs – man har masse data, kjører en søkealgoritme over mange modeller og modellvarianter, og så ender man opp med et eller annet resultat, gjerne uttrykket ved en confusion matrix eller en validation curve (også kalt learning curve).

Ofte finner man at når folk snakker om at de har en modell som er «94% nøyaktig» så snakker de om nøyaktigheten på treningsdataene (der modellen er utviklet) og ikke på testdataene (som er de dataene man holder til side for å se om modellen, utviklet på treningsdataene, er nøyaktig.) Dermed får man modeller som har svært høy nøyaktighet (ikke noe problem å komme til 100% hvis man bare er villig til å ta med nok variable) men som brukbare til noe som helst.

Og det er et problem ikke bare i maskinlæring, men i all forskning. Det er bare det at i maskinlæring finnes dataene og programmene lett tilgjengelige, problemet er synlig, og det er sjelden noen grunn til å skjule det.

Bortsett fra at noen trenger å publisere noe, heller enn å bygge en god modell.

Norsk Tipping – hvem skal de ringe til?

tanjadenne reportasjen i Aftenposten i dag, om hvordan Norsk Tipping kontakter folk som taper mye penger og gjør dem oppmerksom på at de kanskje har et spilleavhengighetsproblem. Og årsaken til at jeg blogger om det er at a) en av studentene mine fra kurset Analytics for Strategic Management, Tanja Sveen (se foto, fra Aftenposten) er omtalt (når jeg tenker meg om, har studentene eksamen i dag), og b) et av prosjektene i kurset (som jeg faktisk kan snakke om, de fleste er konfidensielle) er Norsk Tippings analyseprosjekt for å finne ut av hvem de skal ringe til.

Norsk Tipping har begrenset kapasitet for telefonsamtaler, så de må bestemme seg for hvem de skal ringe til, ikke bare ut fra hvem som spiller mest, men også ut fra faktorer som hvem som vil ha mest nytte av en slik samtale.

Prosessen Norsk Tipping må gå gjennom, er svært lik mange andre maskinlæringsprosjekter: Man har en historikk (folk som spiller (mange), folk man ringer til (færre), og hva som skjer etter at man har ringt (f.eks. om de slutter med eller reduserer spillevirksomheten eller ei.) Man identifiserer (basert på historikk og andre kriterier) hvem som står i fare for å utvikle spilleavhengighet, og lar maskinen se på historikken og lage en modell for hvem i utvalget man skal ringe til, basert på en rangering av sannsynligheten for positiv effekt.

Det er mange problemer med slike modeller, både før man spesifiserer den – hva er kriteriene for å bli valgt ut, for eksempel, siden det er vanskelig å avgjøre om folk er spilleavhengige eller bare har god råd, og hvordan man skal måle hva som er ønsket effekt eller ikke – og mer tekniske problemer – for eksempel ubalanserte datasett (man har mange observasjoner av spillere, men relativt få av folk med utviklet spilleavhenighet, for eksempel. Hvis du skal lete etter terrorister blant flypassasjerer, er ikke problemet at du har for få passasjerer – du har for få eksempler på terrorister…).

Alt dette lærer man om på kurset. Det som er interessant med Norsk Tipping, er at de tar en forskningsbasert tilnærming til dette: De tar utgangspunkt i det de vet, setter opp en modell for å vurdere om ting virker eller ikke, og hvordan de kan justere det de gjør, og så kommer de til å gjøre dette en stund og lære av erfaringene. Prosessen er i utgangspunktet teori-fri, hvilket vil si at man ikke (i hvert fall i prinsippet) skal ha forhåndsteorier om hva som virker eller ikke.

Og akkurat den utfordringen – å la dataene, heller enn intuisjonen, avgjøre hva man skal gjøre – er en av de vanskelige overgangene man må gjennom for å få en data-dreven organisasjon til å fungere.

Det skal bli spennende å se om Norsk Tipping får det til – så langt ser det lovende ut.

Rask teknologiutvikling innen Big Data

DataRobot-screenFor noen uker siden var jeg i London for å lære meg DataRobot, et verktøy som automatiserer store deler av jobben rundt avansert dataanalyse. Det eneste DataRobot (og lignende verktøy) trenger, er masse data i et rad-og-kolonneformat (Excel, CSV, SQL, Hadoop, etc), og dermed kan man bare sette i gang: Dataene leses inn, hver kolonne tolkes og kategoriseres (dvs. som tekst, numeriske data, kategorier, boolsk, etc.). Deretter spør DataRobot hva som skal være den uavhengige variabelen (det vil si, hva det er man skal prøve å predikere), hva det er som skal være grunnlag for å vurdere hvilken modell som er best (forklart varians, logloss, etc.). Så kan man trykke Start og dermed setter DataRobot i gang og kjører alle analyser den vet om. Modellene listes opp med de som gir best resultat på toppen, og deretter er det bare å sette i gang og forbedre dem – for eksempel ved å finne mer data, kombinerer datapunkter, og så videre.

Med andre ord, masse av det man tidligere måtte ha spesialister til å gjøre, kan man nå gjøre selv.

Som min kollega Chandler Johnson sa: For fire-fem år siden måtte han programmere opp hver metode i Python. Så kom SciKit-Learn og andre programmeringsbiblioteker (XGBoost, RTensorFlow, Wowpal Wabbit) som gjorde at man bare kunne hente inn de metodene man ville bruke. Nå kommer grafiske verktøy som DataRobot, som velger ut og tester modeller for deg – og fjerner mye av behovet for programmering i det hele tatt. Selskapet reklamerer med at man kan redusere antallet data scientists man trenger, og det er jo gode nyheter der man må lete med lys og lykte og bruke ganske mye penger for å finne folk som kan gjøre slikt.

En stor del av jobben man trenger data scientists til, er å gjøre dataene klar for analyse. De fleste bedrifter vet at de har endel data, men når man først skal bruke dem, finner man kjapt at de har masse feil, er mangelfulle, og ofte ikke har de variablene man trodde man hadde. (For en liste av mange vanlige feil, se The Quartz Guide to Bad Data.) Også her begynner det å komme gode verktøy som reduserer behovet for programmering, som for eksempel Alteryx. Som en av våre studenter fra Analytics for Strategic Management sa: «DataRobot is soooo September…!

(Og skulle du ha lyst til å lære mer om dette: Sjekk ut dette kurset, 5-7 desember.)

Kortfattet: Big Data og analytics

DFDDODData og dataanalyse blir mer og mer viktig for mange bransjer og organisasjoner. Er du interessert i dataanalyse og hva det kan gjøre med din bedrift? Velkommen til et tredagers seminar (executive short program) på BI med tittelen: Decisions from Data: Driving an Organization with Analytics. Datoene er 5-7 desember i år, og kurset har vokst ut som en kortversjon av våre executive-kurs Analytics for Strategic Management, som har blitt meget populære og er fulltegnet. (Sjekk denne listen for en smakebit av hva studentene på disse programmene holder på med.)

Seminaret er beregnet på ledere som er nysgjerrig på stordata og dataanalyse og ønsker seg en innføring, uten å måtte ta et fullt kurs om emnet. Vi kommer til å snakke om og vise ulike former for dataanalyse, diskutere de viktigste utfordringene organisasjoner har med å forholde seg både til data og til dataanalytikere – og naturligvis gi masse eksempler på hvordan man kan bruke dataanalyse til å styrke sin konkurransekraft. Det blir ikke mye teknologi, men vi skal ta og føle litt på noen verktøy også, bare for å vite litt om hva som er mulig og hva slags arbeid vi egentlig ber disse dataekspertene om å ta på seg.

Presentasjoner og diskusjon går på engelsk – siden, vel, de beste foreleserne vi har på dette (Chandler Johnson og Alessandra Luzzi) er fra henholdsvis USA og Italia, og dermed blir betydelig mer presise enn om de skulle snakke norsk. Selv henger jeg med så godt jeg kan…

Velkommen til datarevolusjonen!

Etterspørsel!

dn-etterspDigitalisering og analyse og teknologi i vinden om dagen. Jeg ble intervjuet at Dagens Næringsliv om dataanalyse og andre digitale kurs – og det er hyggelig å kunne melde at, joda, folk vil ha det og melder seg på som bare det. Her er situasjonen så langt:

  • Møtte studentene på Informatikk: Digital Økonomi og Ledelse i går. Flink og ivrig gjeng (31 har takket ja, vi hadde opprinnelig 27 plasser) med gode spørsmål og god stemning – de kommer til å sette spor etter seg i norsk teknologiverden, det er jeg sikker på. Opptakskrav
  • Ragnvald Sannes’ og mitt kurs Strategisk Forretningsutvikling og Innovasjon starter 13. september, og har vært fulltegnet siden april. Gleder meg til det, alltid masse spennende mennesker med gode ideer.
  • Analytics for Strategic Management starter sin første modul 10. oktober (andre gjennomføring av kurset, her er listen over prosjekter på det første). Blir spennende å se hvordan det ser ut med påmeldinger etterhvert – så langt ser det lovende ut.
  • Det korte kurset Digitalisering for vekst og innovasjon går fra 24-27 oktober i Antibes/Sophia Antipolis. Det kommer en mer detaljert bloggpost om dette etterhvert, men det er allerede nok påmeldte til at kurset kommer til å gå – og plass til flere. Denne gangen kommer kurset (det vil si, alle diskusjoner) til å arrangeres på norsk, slik at det kan bli et sted for å dele tanker og prosjekter mellom norske bedrifter. Hjertelig velkommen til et konfidensielt, praktisk og spennende forum for digitalisering!

Innimellom skal jeg ha noen andre kurs også (for M.Sc. og MBA), være vertskap for en stor utenlandsk bedrift som besøker Norge for å forstå digitalisering og nye energikilder innen transportbransjen, og holde noen foredrag. Men det er jo morsomt, da. Og for mye etterspørsel er jo et luksusproblem, ikke sant?

Big Data i praksis – analyseprosjekter

ml_mapJeg er nettopp ferdig med å undervise fire dager med stordataanalyse – skikkelig programmering og datafikling. Vi (Chandler, Alessandra og undertegnede) har klart å lure over 30 ledere og mellomleder i Norge til å delta på et programmerings- og statistikkurs (det er faktisk det stordataanalyse handler om), uten at vi er helt sikre på hvordan vi klarte det. men studentene er motiverte og arbeidsomme og har mange og smarte spørsmål. I et kurs som foreleses på engelsk. Det er nesten så man får lyst til å slutte å klage og syte over hvordan verden vanligvis ser ut.

Uansett – hva skal disse studentene med dette kurset? Vi jobber med ordentlige prosjekter, i den forstand at vi forlanger at folk kommer med et problem de vil finne ut av i sin egen jogg – helst noe som faktisk er viktig, og hvor dyp dataanalyse kan gjøre en forskjell. Det er ikke for alle gruppene at dette fungerer, men skal ikke klage: De fleste jobber med reelle problemer for reelle organisasjoner, og det er utrolig morsomt for en foreleser. Her er en liste med prosjektene, så får der bedømme selv. (Jeg identifiserer ingen studenter her, en tro meg – disse folkene har disse problemene rett opp i ansiktet, hver dag.) Jeg har i alle fall ingen problemer med å bruke tid og krefter på dette:

  • Hva er riktig pris for nybygde boliger? En gruppe jobber med å finne ut hvordan man skal prissette boliger som ikke er bygget ennå, for et stort boligbyggefirma.
  • Hva er egentlig skatteeffekten av delingsøkonomi? Denne gruppen (der en jobber for Skatteetaten) forsøker å finne ut hvordan man skal kjenne igjen folk som snyter på skatten som Uber-sjåfører – og samtidig komme med forslag til hvordan skattereglene kan tilpasses slik at det blir lett å være lovlydig.
  • Hva kjennetegner tilbud som blir akseptert? Et større konsulentfirma ønsker å bruke data fra sitt CRM-system (som dokumenterer tilbudsprosessen) til å forstå hva slag oppdrag de kommer til å vinne, eller tape?
  • Hvordan gjenkjenne hvitvaskingstransaksjoner? En bank ønsker å finne ut om noen av deres kunder bedriver hvitvasking av penger gjennom nettbaserte spillselskaper.
  • Hvordan gi kunder fordel av automatisert analyse? Et selskap som leverer aksjetradingterminaler ønsker å bruke dataanalyse for å skape et konkurransefortrinn.
  • Hvordan segmentere norske aksjeeiere? Et selskap som tilbyr netthandel av aksjer ønsker å identifisere segmenter av sine kunder for å spisse og forbedre sin markedsstrategi?
  • Hvordan senke kostnader og redusere risiko for produksjonsstopp i en prosessbedrift? Et kraftselskap ønsker å bedre forstå når og hvorfor kraftstasjonene deres trenger reparasjoner eller vedlikehold?
  • Hvordan identifisere kunder som er i ferd med å si opp? Et TV-selskap ønsker å forstå hva som kjennetegner «churn» – om noen av deres kunder er i ferd med å forlate dem eller ikke?
  • Hvorfor er noen viner mer populære enn andre? En gruppe skal jobbe med søkedata fra et vin-nettsted for å finne ut hva som gjør at noen viner blir mer etterspurt enn andre.
  • Hvilke kunder vil kjøpe et nytt produkt? En gruppe jobber med data fra en stor bank som ønsker å tilby sine eksisterende kunder flere tjenester.
  • Hvordan øke gjenvinningsgraden for søppel i Oslo? REN ønsker å finne ut av om man kan organisere ruter og rutiner annerledes for bedre å utnytte søppelbiler og gjenvinningsanlegg.
  • Hvordan unngå at man blir utsolgt for kampanjevarer? En av Norges største dagligvarekjeder ønsker å forbedre sine bestillingsrutiner slik at kundene slipper å komme til butikken og finne ut at det ikke er mer igjen av den tilbudsvaren de ville ha.
  • Hvordan modellere svindelrisiko i maritim forsikring? Et forsikringsselskap ønsker å bygge en modell for å forstå hvordan man kan finne kunder som forsøker å svindle selskap eller myndigheter.
  • Hvilke kunder er i ferd med å forlate oss? Et stort transportfirma ønsker å finne ut hvilke kunder som er i ferd med å gå til en konkurrent, slik at de kan ta affære før det skjer.
  • Hva kjennetegner studenter som dropper ut? BI tar inn 3500 nye studenter hvert år, men en del av dem slutter etter det første året. Hvordan kan vi finne tegn på at en student er i ferd med å droppe ut?

Felles for alle prosjektene – og slik er det med alle oppgaver jeg har veiledet siden jeg begynte i denne bransjen – er at man starter med et stort spørsmål og reduserer det ned til noe som faktisk kan besvares. Deretter ser man etter data og finner ut at man må redusere det enda mer. Så får man problemer med at dataene enten ikke finnes likevel, er upålitelige eller mangelfulle – og man må finne ut av hva man skal gjøre med det. Til slutt, etter at omtrent 90% av tids- og pengebudsjettet er borte, kan man begynne å tenke analyse. Da kan man risikere at man ikke finner noe.

Og det er litt av lærdommen i dette kurset – at man skal kunne nok om faktisk dataanalyse til å stille de rette spørsmålene og ha en realistisk forventning til hva man faktisk kan få svar på.

Det er stor etterspørsel etter dette kurset – så vi har satt opp et nytt kurs som starter til høsten. Vel møtt!

Mac vs. PC. Igjen.

lenovo-thinkpad-x260-nw-g01apple-macbook-air-11-inch-2014-angle

Jeg underviser nå i et kurs i dataanalyse – Analytics for Strategic Management. Kurset er nytt og innebærer masse arbeid. Blant annet skal vi bruke MySQL og Python og kanskje også R, og jeg er nokså rusten som programmerer, for å si det forsiktig (må tilbake til 80-tallet og litt på 90-tallet da jeg programmerte litt, på helt andre plattformer enn hva man finner nå.)

I alle fall, siden studentene har både Mac og PC, har jeg måttet kvittere ut en Windows-PC som jeg bruker parallelt med mine Mac’er. Denne er en Lenovo Thinkpad X260 med dockingstasjon og to 22-toms skjermer – og det er kanskje et uttrykk for hvordan datamaskiner har utviklet seg at jeg hverken vet hva slags prosessor den har, størrelsen på harddisken (vel, slo det opp nå, 256Gb, tipper jeg), eller internhukommelsen. Den kjører Windows i en versjon før versjon 10 (fikk nettopp melding fra IT-avdelingen om oppdatering til Windows 10)  Og dermed får jeg et friskt perspektiv på Mac vs. Windows og det hele. Her er noen inntrykk:

  • Mac’en starter opp øyeblikkelig – og jeg blir minnet om at det var en av årsakene til at jeg gikk over til en MacBook Air. Skal du ta et kjapt notat, trenger du ikke betrakte den forbaskede Windows-logoen.
  • I samme gate: Mac’en går og legger seg uten problemer. I går ettermiddag nappet jeg Windows-PCen den ut av dockingstasjonen uten å gjøre noe annet, og dermed har den ligget og kokt i vesken min over natten og hadde bare 5% batteri igjen. Det er for dårlig.
  • Mac’en er dyrere, men lever lenger. Jeg har nettopp byttet batteri på min fire år gamle MacBook Air, og den holder nok minst et par år til, til og med for programmering. Usikker på prisen på Lenovo, siden jeg har fått den av IT-avdelingen, men har nettopp kjøpt en HP laptop i en annen anledning, og forskjellen i pris/ytelse er vesentlig.
  • Hardwarekvaliteten på begge to, inkludert skjerm og batteritid, er upåklagelig. Macbook’en er tynnere og lettere å ta med seg, men dette er to forskjellige typer laptop’er, så der sammenligner jeg litt epler og bananer. Windows-maskinen har mer viftestøy, og det merker jeg er litt irriterende – har vent meg til iMac og MacBook og nesten absolutt stillhet.
  • Tastatur: Hipp som happ, smakssak, begge er bra. Men med Windows må man fortsatt trykke AltGr-2 for å få «@», mens Mac’en har en egen tast for snabel-a, som svenskene sier. Det burde Windows også få. På den annen side kan jeg bruke mitt spesialproduserte Das Keyboard-tastatur på Windows-maskinen, noe som fører til mye høylytt klakking på kontoret.Og avveksling fra Mac-tastaturet.
  • Når jeg hopper mellom vinduer med alt-Tab på Windows-PCen, behandler den flere ulike vinduer i Google Chrome (eller flere ulike dokumenter i Word) som egne vinduer. Mac’en hopper kun en gang til Crome eller Word, og så må du velge vindu i applikasjonen. Bedre på Windows. Mulig dette kan endres på Mac (noen som har tips?), jeg har ikke funnet ut hvordan.
  • Lenovoen har flere og bedre porter, bl.a. en HDMI-port, som gjør den til en bedre presentasjonsmaskin. Ingen ekstra kabler er greit.
  • Jeg synes touchpad’en på Mac’en fungerer bedre og mer intuitivt enn den på Lenovoen. På den annen side har Lenovoen en IBM-vorte midt i tastaturet, og den er bra. Vanesak, ganske enkelt.

I sum: Det er nesten ikke forskjell lenger, det meste er smak og behag. Dropbox og endel andre applikasjoner sørger for at innholdet er synkronisert. Jeg heller i retning av å beholde Mac’ene mine som hovedmaskiner, men hadde fint kunnet gå tilbake til Windows hvis det skulle bli nødvendig. Hvis bare den hadde startet opp litt raskere.

PS: Lyden er bedre på Mac’en.

Flykø og planlegging

Jeg sitter i styret i Råd AS, en liten bedrift i Trondheim (lager appen Smarthelp, som blir bedre og bedre – last den ned og fortell dine venner hvor du er!) Tirsdag neste uke skulle vi ha styremøte, så i morges gikk jeg på nettet for å finne en flybillett til Trondheim. Stor var min forundring da det viste seg at billigste billett – en vei – var 1999 på SAS. På Norwegian var det meste utsolgt og resten minst like dyrt.

Hva i all verden? Er det noe arrangement i Trondheim jeg ikke vet om? Lette litt rundt, fant ut at Elton John spiller i Trondheim 2. juli, Bruce Springsteen den 26. – men det burde jo ikke lage noe problem neste uke.

Så, nettopp som jeg har lagt på røret til Råd AS, ringer TV2-nyhetene og vil ha min kommentar til at SAS og Norwegian har bommet grovt i sin kapasitetsplanlegging og at det nå er omtrent umulig å komme seg mellom norske byer, særlig Oslo-Trondheim. Man har mer enn halvert antallet flyvninger, sendt for mange fly til utlandet og til charter-trafikk, for mye personell er på ferie (det var et av ankepunktene i nestenstreiken mellom pilotene og SAS for noen uker siden), det snakkes om å sette inn gamle Fokker propellfly, et gammelt Fokker 100 fly, og så videre.

Kapasitetsplanlegging for flyselskaper er vanskelig – det er store sesongsvingninger, men piloter og fly har man stort sett hele året (selv om pilot er i ferd med å bli et sesongyrke til en viss grad.) Men denne bommerten er nokså stor, og man hadde i alle fall i følge DN noe av det samme problemet i fjor, men antakelig flyr folk mer i år enn i fjor, muligens litt drevet av en svakere krone, som dreier trafikk innenlands og dessuten tiltrekker seg utlendinger.

Mer enn noe annet viser dette hvor små marginene er i luftfart. Lønnsomhet i flyselskaper handler om tre ting: Gjennomsnittlige priser pr. passasjerkilometer, gjennomsnittlige kostnader pr. setekilometer, og gjennomsnittlig fyllingsgrad av flyene (load factor). Grafen under (fra Airlines for America) viser forholdet mellom faktisk fylingsgrad og hvilken fyllingsgrad som skal til for at man tjener penger (break-even load factor). (Jeg tror akkurat disse tallene er for det amerikanske markedet, men tendensen er den samme over hele verden). Som synes har både gjennomsnittlig load factor og break-even load factor økt sterkt siden slutten av 70-tallet (da flytrafikk først ble deregulert i USA).

Load Factor Trend

Et av problemene med flytrafikk er at man kan ikke fylle flyene med et gjennomsnitt på 100%, medmindre man kun har et fly og flyr frem og tilbake mellom to steder hele tiden (og dessuten tar forhåndsbetalt). Årsaken er at et flyselskap (for det meste) er et nettverk og ikke en lineær verdikjede – man tilbyr et sett med flyruter og forbindelser mellom disse, og derfor får man alltid et dilemma om man skal selge alle plassene f.eks. mellom Oslo og Trondheim, eller holde av noen plasser til passasjerer som kommer inn fra Kina (man tjener alltid mest på langdistanse) og skal videre. Legg til at fullprispassasjerer betaler for retten til å kunne la være å fly (med full refusjon) om de vil, samt at det er tildels store variasjoner i etterspørsel (f.eks. om et fotballag fra et uventet sted kommer til cupfinalen). Legg videre til at fly er svindyre og flyseter ikke kan selges etter at flyet har tatt av, og du har en skikkelig komplisert verden. For nettverksselskaper (som SAS) er maks fyllingsgrad for hele nettverket antakelig et sted under 90%, for selskaper som Ryanair (som selger enkeltturer) endel høyere (men ikke 100%).

Så jeg har forståelse for at man av og til bommer – i hvert fall hva gjelder omprioritering av fly til mer lønnsomme ruter. Hva gjelder piloters og kabinansattes interesse i å ta ferie når alle andre gjør det, så er jo det forståelig, men det blir litt som kantineansatte som insisterer på å spise lunsj i den vanlige lunsjtiden – kanskje ikke så lurt? Uansett er det selskapet som godkjenner ferier, og, vel, her har det nok skjedd noen bommerter. (Typisk nok fikk jeg i går en epost fra SAS som lokket med billige Eurobonusbilletter etter 16. august og før midten av september, dvs. etter at skoleferien er slutt men før forretningsreisene kommer i gang – da har man med andre ord overkapasitet.)

Det er heller ikke så lett å mobilisere kapasitet på kort varsel – man kan ikke ha dyre fly stående i reserve, og gamle fly koster å ta ut av møllposen (selv om det helt sikkert ikke er noe galt med dem når de først er satt i trafikk.) Så her har vi det som kalles et interessant problem. Og en mulighet til å lære noe om planlegging under kapasitetsbegrensninger. For flyselskapene – og for passasjerene.

 

Big Data og Bad Data

«Big data» er stort om dagen, litt vel stort muligens, og selv om det er spennende hva man kan gjøre med data, både innen forskning og journalistikk, så er det ikke bare å laste ned kjempemengder med digitale lekkasjer og sette i gang. Som Tom Davenport har påpekt en rekke ganger, er det mange problemer med dataanalyse. Her er noen jeg selv har erfart:

  • Dataene er dårlige, og dermed må analytikerne bruke mesteparten av tiden sin på å rette opp feil og formater og gjøre dataene analyserbare.
  • Analytikerne er få og dyre. Det er mangel på smarte analytikere og utdanningssystemet, i Norge i hvert fall, følger ikke opp. Gode analytikere er dyre. Billige analytikere… vel, du får det du betaler for. Og muligens den analysen du liker, men ikke den du burde få.
  • Modeller mangler. Selv om du har data og analytikere, betyr det ikke at du har gode modeller. Det er faktisk et problem at data – spesielt tall – har en tendens til å bli altoppslukende for beslutningstakere, som sjelden setter spørsmålstegn ved hvor de kommer fra, hva de faktisk betyr, og hvordan man har konstruert de modellene som ligger bak.

luzzi20alessandra

Alessandra Luzzi

Dette kommer jeg til å følge opp som et nytt tema her på bloggen og som en aktivitet under BIs Senter for Digitalisering. En av aktivitetene er et nytt kurs, Analytics for Strategic Management, som jeg har ansvaret for sammen med Alessandra Luzzi og Chandler Johnson, to unge og meget smarte kolleger på Institutt for Strategi. Kurset er beregnet på ledere som ønsker å bli smarte konsumenter av analyse, og vil sette deg i stand til å forstå hva analytikerne kan og ikke kan gjøre, gi deg nok analyseerfaring til å forstå arbeidet deres og hvordan du kan få mest mulig ut av det, og eksponere deg for en rekke gode eksempler av både analyse og bedrifters bruk av den. Mer om dette siden.

I mellomtiden – skulle du stå overfor et datasett og en analyse og lure på om dette er Big Data eller Bad Data – ta en titt på The Quartz guide to bad data. Her finner du masse tips om hvordan du kjenner igjen feil og mangler, og hva du skal gjøre med dem. To av mine favoritteksempler er regneark med akkurat 65536 rader og data som er altfor presise. Tro meg, dette er ikke uvanlig!