…til kurset Chandler, Alessandra og jeg nettopp har avholdt på BI? Ja takk!
Lars Ove Brenna har nedtegnet sine inntrykk, og, vel, jeg har ikke mye å tilføre. Takker og bukker!
…til kurset Chandler, Alessandra og jeg nettopp har avholdt på BI? Ja takk!
Lars Ove Brenna har nedtegnet sine inntrykk, og, vel, jeg har ikke mye å tilføre. Takker og bukker!
For noen uker siden var jeg i London for å lære meg DataRobot, et verktøy som automatiserer store deler av jobben rundt avansert dataanalyse. Det eneste DataRobot (og lignende verktøy) trenger, er masse data i et rad-og-kolonneformat (Excel, CSV, SQL, Hadoop, etc), og dermed kan man bare sette i gang: Dataene leses inn, hver kolonne tolkes og kategoriseres (dvs. som tekst, numeriske data, kategorier, boolsk, etc.). Deretter spør DataRobot hva som skal være den uavhengige variabelen (det vil si, hva det er man skal prøve å predikere), hva det er som skal være grunnlag for å vurdere hvilken modell som er best (forklart varians, logloss, etc.). Så kan man trykke Start og dermed setter DataRobot i gang og kjører alle analyser den vet om. Modellene listes opp med de som gir best resultat på toppen, og deretter er det bare å sette i gang og forbedre dem – for eksempel ved å finne mer data, kombinerer datapunkter, og så videre.
Med andre ord, masse av det man tidligere måtte ha spesialister til å gjøre, kan man nå gjøre selv.
Som min kollega Chandler Johnson sa: For fire-fem år siden måtte han programmere opp hver metode i Python. Så kom SciKit-Learn og andre programmeringsbiblioteker (XGBoost, R, TensorFlow, Wowpal Wabbit) som gjorde at man bare kunne hente inn de metodene man ville bruke. Nå kommer grafiske verktøy som DataRobot, som velger ut og tester modeller for deg – og fjerner mye av behovet for programmering i det hele tatt. Selskapet reklamerer med at man kan redusere antallet data scientists man trenger, og det er jo gode nyheter der man må lete med lys og lykte og bruke ganske mye penger for å finne folk som kan gjøre slikt.
En stor del av jobben man trenger data scientists til, er å gjøre dataene klar for analyse. De fleste bedrifter vet at de har endel data, men når man først skal bruke dem, finner man kjapt at de har masse feil, er mangelfulle, og ofte ikke har de variablene man trodde man hadde. (For en liste av mange vanlige feil, se The Quartz Guide to Bad Data.) Også her begynner det å komme gode verktøy som reduserer behovet for programmering, som for eksempel Alteryx. Som en av våre studenter fra Analytics for Strategic Management sa: «DataRobot is soooo September…!
(Og skulle du ha lyst til å lære mer om dette: Sjekk ut dette kurset, 5-7 desember.)
Data og dataanalyse blir mer og mer viktig for mange bransjer og organisasjoner. Er du interessert i dataanalyse og hva det kan gjøre med din bedrift? Velkommen til et tredagers seminar (executive short program) på BI med tittelen: Decisions from Data: Driving an Organization with Analytics. Datoene er 5-7 desember i år, og kurset har vokst ut som en kortversjon av våre executive-kurs Analytics for Strategic Management, som har blitt meget populære og er fulltegnet. (Sjekk denne listen for en smakebit av hva studentene på disse programmene holder på med.)
Seminaret er beregnet på ledere som er nysgjerrig på stordata og dataanalyse og ønsker seg en innføring, uten å måtte ta et fullt kurs om emnet. Vi kommer til å snakke om og vise ulike former for dataanalyse, diskutere de viktigste utfordringene organisasjoner har med å forholde seg både til data og til dataanalytikere – og naturligvis gi masse eksempler på hvordan man kan bruke dataanalyse til å styrke sin konkurransekraft. Det blir ikke mye teknologi, men vi skal ta og føle litt på noen verktøy også, bare for å vite litt om hva som er mulig og hva slags arbeid vi egentlig ber disse dataekspertene om å ta på seg.
Presentasjoner og diskusjon går på engelsk – siden, vel, de beste foreleserne vi har på dette (Chandler Johnson og Alessandra Luzzi) er fra henholdsvis USA og Italia, og dermed blir betydelig mer presise enn om de skulle snakke norsk. Selv henger jeg med så godt jeg kan…
Velkommen til datarevolusjonen!
Digitalisering og analyse og teknologi i vinden om dagen. Jeg ble intervjuet at Dagens Næringsliv om dataanalyse og andre digitale kurs – og det er hyggelig å kunne melde at, joda, folk vil ha det og melder seg på som bare det. Her er situasjonen så langt:
Innimellom skal jeg ha noen andre kurs også (for M.Sc. og MBA), være vertskap for en stor utenlandsk bedrift som besøker Norge for å forstå digitalisering og nye energikilder innen transportbransjen, og holde noen foredrag. Men det er jo morsomt, da. Og for mye etterspørsel er jo et luksusproblem, ikke sant?
Jeg er nettopp ferdig med å undervise fire dager med stordataanalyse – skikkelig programmering og datafikling. Vi (Chandler, Alessandra og undertegnede) har klart å lure over 30 ledere og mellomleder i Norge til å delta på et programmerings- og statistikkurs (det er faktisk det stordataanalyse handler om), uten at vi er helt sikre på hvordan vi klarte det. men studentene er motiverte og arbeidsomme og har mange og smarte spørsmål. I et kurs som foreleses på engelsk. Det er nesten så man får lyst til å slutte å klage og syte over hvordan verden vanligvis ser ut.
Uansett – hva skal disse studentene med dette kurset? Vi jobber med ordentlige prosjekter, i den forstand at vi forlanger at folk kommer med et problem de vil finne ut av i sin egen jogg – helst noe som faktisk er viktig, og hvor dyp dataanalyse kan gjøre en forskjell. Det er ikke for alle gruppene at dette fungerer, men skal ikke klage: De fleste jobber med reelle problemer for reelle organisasjoner, og det er utrolig morsomt for en foreleser. Her er en liste med prosjektene, så får der bedømme selv. (Jeg identifiserer ingen studenter her, en tro meg – disse folkene har disse problemene rett opp i ansiktet, hver dag.) Jeg har i alle fall ingen problemer med å bruke tid og krefter på dette:
Felles for alle prosjektene – og slik er det med alle oppgaver jeg har veiledet siden jeg begynte i denne bransjen – er at man starter med et stort spørsmål og reduserer det ned til noe som faktisk kan besvares. Deretter ser man etter data og finner ut at man må redusere det enda mer. Så får man problemer med at dataene enten ikke finnes likevel, er upålitelige eller mangelfulle – og man må finne ut av hva man skal gjøre med det. Til slutt, etter at omtrent 90% av tids- og pengebudsjettet er borte, kan man begynne å tenke analyse. Da kan man risikere at man ikke finner noe.
Og det er litt av lærdommen i dette kurset – at man skal kunne nok om faktisk dataanalyse til å stille de rette spørsmålene og ha en realistisk forventning til hva man faktisk kan få svar på.
Det er stor etterspørsel etter dette kurset – så vi har satt opp et nytt kurs som starter til høsten. Vel møtt!


Jeg underviser nå i et kurs i dataanalyse – Analytics for Strategic Management. Kurset er nytt og innebærer masse arbeid. Blant annet skal vi bruke MySQL og Python og kanskje også R, og jeg er nokså rusten som programmerer, for å si det forsiktig (må tilbake til 80-tallet og litt på 90-tallet da jeg programmerte litt, på helt andre plattformer enn hva man finner nå.)
I alle fall, siden studentene har både Mac og PC, har jeg måttet kvittere ut en Windows-PC som jeg bruker parallelt med mine Mac’er. Denne er en Lenovo Thinkpad X260 med dockingstasjon og to 22-toms skjermer – og det er kanskje et uttrykk for hvordan datamaskiner har utviklet seg at jeg hverken vet hva slags prosessor den har, størrelsen på harddisken (vel, slo det opp nå, 256Gb, tipper jeg), eller internhukommelsen. Den kjører Windows i en versjon før versjon 10 (fikk nettopp melding fra IT-avdelingen om oppdatering til Windows 10) Og dermed får jeg et friskt perspektiv på Mac vs. Windows og det hele. Her er noen inntrykk:
I sum: Det er nesten ikke forskjell lenger, det meste er smak og behag. Dropbox og endel andre applikasjoner sørger for at innholdet er synkronisert. Jeg heller i retning av å beholde Mac’ene mine som hovedmaskiner, men hadde fint kunnet gå tilbake til Windows hvis det skulle bli nødvendig. Hvis bare den hadde startet opp litt raskere.
PS: Lyden er bedre på Mac’en.
Jeg sitter i styret i Råd AS, en liten bedrift i Trondheim (lager appen Smarthelp, som blir bedre og bedre – last den ned og fortell dine venner hvor du er!) Tirsdag neste uke skulle vi ha styremøte, så i morges gikk jeg på nettet for å finne en flybillett til Trondheim. Stor var min forundring da det viste seg at billigste billett – en vei – var 1999 på SAS. På Norwegian var det meste utsolgt og resten minst like dyrt.
Hva i all verden? Er det noe arrangement i Trondheim jeg ikke vet om? Lette litt rundt, fant ut at Elton John spiller i Trondheim 2. juli, Bruce Springsteen den 26. – men det burde jo ikke lage noe problem neste uke.
Så, nettopp som jeg har lagt på røret til Råd AS, ringer TV2-nyhetene og vil ha min kommentar til at SAS og Norwegian har bommet grovt i sin kapasitetsplanlegging og at det nå er omtrent umulig å komme seg mellom norske byer, særlig Oslo-Trondheim. Man har mer enn halvert antallet flyvninger, sendt for mange fly til utlandet og til charter-trafikk, for mye personell er på ferie (det var et av ankepunktene i nestenstreiken mellom pilotene og SAS for noen uker siden), det snakkes om å sette inn gamle Fokker propellfly, et gammelt Fokker 100 fly, og så videre.
Kapasitetsplanlegging for flyselskaper er vanskelig – det er store sesongsvingninger, men piloter og fly har man stort sett hele året (selv om pilot er i ferd med å bli et sesongyrke til en viss grad.) Men denne bommerten er nokså stor, og man hadde i alle fall i følge DN noe av det samme problemet i fjor, men antakelig flyr folk mer i år enn i fjor, muligens litt drevet av en svakere krone, som dreier trafikk innenlands og dessuten tiltrekker seg utlendinger.
Mer enn noe annet viser dette hvor små marginene er i luftfart. Lønnsomhet i flyselskaper handler om tre ting: Gjennomsnittlige priser pr. passasjerkilometer, gjennomsnittlige kostnader pr. setekilometer, og gjennomsnittlig fyllingsgrad av flyene (load factor). Grafen under (fra Airlines for America) viser forholdet mellom faktisk fylingsgrad og hvilken fyllingsgrad som skal til for at man tjener penger (break-even load factor). (Jeg tror akkurat disse tallene er for det amerikanske markedet, men tendensen er den samme over hele verden). Som synes har både gjennomsnittlig load factor og break-even load factor økt sterkt siden slutten av 70-tallet (da flytrafikk først ble deregulert i USA).

Et av problemene med flytrafikk er at man kan ikke fylle flyene med et gjennomsnitt på 100%, medmindre man kun har et fly og flyr frem og tilbake mellom to steder hele tiden (og dessuten tar forhåndsbetalt). Årsaken er at et flyselskap (for det meste) er et nettverk og ikke en lineær verdikjede – man tilbyr et sett med flyruter og forbindelser mellom disse, og derfor får man alltid et dilemma om man skal selge alle plassene f.eks. mellom Oslo og Trondheim, eller holde av noen plasser til passasjerer som kommer inn fra Kina (man tjener alltid mest på langdistanse) og skal videre. Legg til at fullprispassasjerer betaler for retten til å kunne la være å fly (med full refusjon) om de vil, samt at det er tildels store variasjoner i etterspørsel (f.eks. om et fotballag fra et uventet sted kommer til cupfinalen). Legg videre til at fly er svindyre og flyseter ikke kan selges etter at flyet har tatt av, og du har en skikkelig komplisert verden. For nettverksselskaper (som SAS) er maks fyllingsgrad for hele nettverket antakelig et sted under 90%, for selskaper som Ryanair (som selger enkeltturer) endel høyere (men ikke 100%).
Så jeg har forståelse for at man av og til bommer – i hvert fall hva gjelder omprioritering av fly til mer lønnsomme ruter. Hva gjelder piloters og kabinansattes interesse i å ta ferie når alle andre gjør det, så er jo det forståelig, men det blir litt som kantineansatte som insisterer på å spise lunsj i den vanlige lunsjtiden – kanskje ikke så lurt? Uansett er det selskapet som godkjenner ferier, og, vel, her har det nok skjedd noen bommerter. (Typisk nok fikk jeg i går en epost fra SAS som lokket med billige Eurobonusbilletter etter 16. august og før midten av september, dvs. etter at skoleferien er slutt men før forretningsreisene kommer i gang – da har man med andre ord overkapasitet.)
Det er heller ikke så lett å mobilisere kapasitet på kort varsel – man kan ikke ha dyre fly stående i reserve, og gamle fly koster å ta ut av møllposen (selv om det helt sikkert ikke er noe galt med dem når de først er satt i trafikk.) Så her har vi det som kalles et interessant problem. Og en mulighet til å lære noe om planlegging under kapasitetsbegrensninger. For flyselskapene – og for passasjerene.
«Big data» er stort om dagen, litt vel stort muligens, og selv om det er spennende hva man kan gjøre med data, både innen forskning og journalistikk, så er det ikke bare å laste ned kjempemengder med digitale lekkasjer og sette i gang. Som Tom Davenport har påpekt en rekke ganger, er det mange problemer med dataanalyse. Her er noen jeg selv har erfart:

Alessandra Luzzi
Dette kommer jeg til å følge opp som et nytt tema her på bloggen og som en aktivitet under BIs Senter for Digitalisering. En av aktivitetene er et nytt kurs, Analytics for Strategic Management, som jeg har ansvaret for sammen med Alessandra Luzzi og Chandler Johnson, to unge og meget smarte kolleger på Institutt for Strategi. Kurset er beregnet på ledere som ønsker å bli smarte konsumenter av analyse, og vil sette deg i stand til å forstå hva analytikerne kan og ikke kan gjøre, gi deg nok analyseerfaring til å forstå arbeidet deres og hvordan du kan få mest mulig ut av det, og eksponere deg for en rekke gode eksempler av både analyse og bedrifters bruk av den. Mer om dette siden.
I mellomtiden – skulle du stå overfor et datasett og en analyse og lure på om dette er Big Data eller Bad Data – ta en titt på The Quartz guide to bad data. Her finner du masse tips om hvordan du kjenner igjen feil og mangler, og hva du skal gjøre med dem. To av mine favoritteksempler er regneark med akkurat 65536 rader og data som er altfor presise. Tro meg, dette er ikke uvanlig!