Big Data i praksis – analyseprosjekter

ml_mapJeg er nettopp ferdig med å undervise fire dager med stordataanalyse – skikkelig programmering og datafikling. Vi (Chandler, Alessandra og undertegnede) har klart å lure over 30 ledere og mellomleder i Norge til å delta på et programmerings- og statistikkurs (det er faktisk det stordataanalyse handler om), uten at vi er helt sikre på hvordan vi klarte det. men studentene er motiverte og arbeidsomme og har mange og smarte spørsmål. I et kurs som foreleses på engelsk. Det er nesten så man får lyst til å slutte å klage og syte over hvordan verden vanligvis ser ut.

Uansett – hva skal disse studentene med dette kurset? Vi jobber med ordentlige prosjekter, i den forstand at vi forlanger at folk kommer med et problem de vil finne ut av i sin egen jogg – helst noe som faktisk er viktig, og hvor dyp dataanalyse kan gjøre en forskjell. Det er ikke for alle gruppene at dette fungerer, men skal ikke klage: De fleste jobber med reelle problemer for reelle organisasjoner, og det er utrolig morsomt for en foreleser. Her er en liste med prosjektene, så får der bedømme selv. (Jeg identifiserer ingen studenter her, en tro meg – disse folkene har disse problemene rett opp i ansiktet, hver dag.) Jeg har i alle fall ingen problemer med å bruke tid og krefter på dette:

  • Hva er riktig pris for nybygde boliger? En gruppe jobber med å finne ut hvordan man skal prissette boliger som ikke er bygget ennå, for et stort boligbyggefirma.
  • Hva er egentlig skatteeffekten av delingsøkonomi? Denne gruppen (der en jobber for Skatteetaten) forsøker å finne ut hvordan man skal kjenne igjen folk som snyter på skatten som Uber-sjåfører – og samtidig komme med forslag til hvordan skattereglene kan tilpasses slik at det blir lett å være lovlydig.
  • Hva kjennetegner tilbud som blir akseptert? Et større konsulentfirma ønsker å bruke data fra sitt CRM-system (som dokumenterer tilbudsprosessen) til å forstå hva slag oppdrag de kommer til å vinne, eller tape?
  • Hvordan gjenkjenne hvitvaskingstransaksjoner? En bank ønsker å finne ut om noen av deres kunder bedriver hvitvasking av penger gjennom nettbaserte spillselskaper.
  • Hvordan gi kunder fordel av automatisert analyse? Et selskap som leverer aksjetradingterminaler ønsker å bruke dataanalyse for å skape et konkurransefortrinn.
  • Hvordan segmentere norske aksjeeiere? Et selskap som tilbyr netthandel av aksjer ønsker å identifisere segmenter av sine kunder for å spisse og forbedre sin markedsstrategi?
  • Hvordan senke kostnader og redusere risiko for produksjonsstopp i en prosessbedrift? Et kraftselskap ønsker å bedre forstå når og hvorfor kraftstasjonene deres trenger reparasjoner eller vedlikehold?
  • Hvordan identifisere kunder som er i ferd med å si opp? Et TV-selskap ønsker å forstå hva som kjennetegner «churn» – om noen av deres kunder er i ferd med å forlate dem eller ikke?
  • Hvorfor er noen viner mer populære enn andre? En gruppe skal jobbe med søkedata fra et vin-nettsted for å finne ut hva som gjør at noen viner blir mer etterspurt enn andre.
  • Hvilke kunder vil kjøpe et nytt produkt? En gruppe jobber med data fra en stor bank som ønsker å tilby sine eksisterende kunder flere tjenester.
  • Hvordan øke gjenvinningsgraden for søppel i Oslo? REN ønsker å finne ut av om man kan organisere ruter og rutiner annerledes for bedre å utnytte søppelbiler og gjenvinningsanlegg.
  • Hvordan unngå at man blir utsolgt for kampanjevarer? En av Norges største dagligvarekjeder ønsker å forbedre sine bestillingsrutiner slik at kundene slipper å komme til butikken og finne ut at det ikke er mer igjen av den tilbudsvaren de ville ha.
  • Hvordan modellere svindelrisiko i maritim forsikring? Et forsikringsselskap ønsker å bygge en modell for å forstå hvordan man kan finne kunder som forsøker å svindle selskap eller myndigheter.
  • Hvilke kunder er i ferd med å forlate oss? Et stort transportfirma ønsker å finne ut hvilke kunder som er i ferd med å gå til en konkurrent, slik at de kan ta affære før det skjer.
  • Hva kjennetegner studenter som dropper ut? BI tar inn 3500 nye studenter hvert år, men en del av dem slutter etter det første året. Hvordan kan vi finne tegn på at en student er i ferd med å droppe ut?

Felles for alle prosjektene – og slik er det med alle oppgaver jeg har veiledet siden jeg begynte i denne bransjen – er at man starter med et stort spørsmål og reduserer det ned til noe som faktisk kan besvares. Deretter ser man etter data og finner ut at man må redusere det enda mer. Så får man problemer med at dataene enten ikke finnes likevel, er upålitelige eller mangelfulle – og man må finne ut av hva man skal gjøre med det. Til slutt, etter at omtrent 90% av tids- og pengebudsjettet er borte, kan man begynne å tenke analyse. Da kan man risikere at man ikke finner noe.

Og det er litt av lærdommen i dette kurset – at man skal kunne nok om faktisk dataanalyse til å stille de rette spørsmålene og ha en realistisk forventning til hva man faktisk kan få svar på.

Det er stor etterspørsel etter dette kurset – så vi har satt opp et nytt kurs som starter til høsten. Vel møtt!

Advertisements

2 thoughts on “Big Data i praksis – analyseprosjekter

  1. Tilbaketråkk: Big Data in practice | Applied Abstractions

  2. Tilbaketråkk: Etterspørsel! | Tversover

Kommenter

Fyll inn i feltene under, eller klikk på et ikon for å logge inn:

WordPress.com-logo

Du kommenterer med bruk av din WordPress.com konto. Logg ut / Endre )

Twitter picture

Du kommenterer med bruk av din Twitter konto. Logg ut / Endre )

Facebookbilde

Du kommenterer med bruk av din Facebook konto. Logg ut / Endre )

Google+ photo

Du kommenterer med bruk av din Google+ konto. Logg ut / Endre )

Kobler til %s