Vårt delingshjørne
Håkon Skogland
Halvorsen
2. juni 2022
Slik brukte vi maskinlæringsmodeller til å predikere klimautslipp til oljeplattformer.
Bakgrunn og problem
Norsk olje og gass har krav om å redusere klimautslipp med 50% innen 2030 sammenlignet med 2005 og videre redusere utslippene til nær null innen 2050. Selskapet Novatech AS bistår industrien med å løse dette problemet. Til i dag er dette omfattende manuelt arbeid i tunge Exceldokumenter. Novatech kom til oss for å utforske mulighetene til å bruke maskinlæring for å kunne predikere utslipp. På denne måten vil selskaper kunne se effekten av mulige klimatiltak raskt og treffsikkert.
Da energiforbruket til oljeplattformer er korrelert med klimautslippet, kan vi snevre problemet ned til prediksjon av energiforbruk.
Prosess for maskinlæringsprosjekter
Prosjektet begynte med en henvendelse fra Novatech AS, som har historiske data for flere oljeplattformer. De ønsket å finne ut om det er mulig å predikere energiforbruket med dataen de har tilgjengelig.
Vi ønsket å gi verdi raskt, så et rammeverk for rask implementering av ML-løsninger ble brukt. Dette rammeverket er avbildet nedenfor.
Rammeverket er delt inn i hovedsakelig 3 faser:
Forretnings- og dataforståelse: Vi startet med en kort workshop for å forstå problem og behov.
Modellutvikling: Vi startet utviklingen av modeller med mål om å løse identifiserte behov.
Operasjonalisering av modeller: Modellene tilgjengeliggjøres på en slik måte at kunden enkelt kan bruke modellene på en brukervennlig måte.
Vi startet prosjektet med å gjennomføre en workshop med kunden, og allerede første dag begynte vi å snakke om mulige løsninger. Vår tilnærming til en slik workshop er imidlertid først og fremst å lytte og lære - en god huskeregel er å la kunden snakke minimum 80% av tiden. Vår jobb er primært å stille spørsmål for å forstå mest mulig av kundens utfordringer og ønsker.
Workshopen resulterte i en felles forståelse for hva vi ønsket å oppnå. Vi avdekket tydelige utfordringer som vi måtte løse hvis produktet skal kunne bli en suksess. Derfor begynte vi med å lage en proof of concept (POC) for å løse nettopp disse utfordringene. Det er ingen vits å bruke tid på de enkle delene av et prosjekt, hvis det senere viser seg at vi ikke vil greie å løse de store utfordringene. Begynn derfor alltid med det vanskeligste. Greier vi å løse dette, vil vi alltids greie å komme i mål på de enklere delene.
Etter kun en ukes arbeid, presenterte vi første løsning for Novatech. Løsningen overgikk forventningene de hadde og vi hadde løst mer på en uke, enn de trodde var mulig.
Suksesskriterier
Suksesskriteriene for dette prosjektet kan vi dele inn i tre punkter.
God kommunikasjon og kartlegging av kundebehov: Vi brukte god tid på å forstå kundebehovet og hva leveransen skulle inneholde. Novatech ønsket en funksjon som kan predikere energiforbruk basert på noen hovedparametere og treningsdata. De ønsket også en oppskrift på hvordan de kan bruke funksjonen og ha dette dokumentert – dette ble gjort tilgjengelig privat på GitHub.
Prioritering og riktig fokus: Jobbing med de viktigste og mest kompliserte behovene først, slik at man får rask tilbakemelding på om produktet som utvikles står til forventningene.
Tydelig sluttdato: Sluttdatoen ble definert første dag, slik at begge parter hadde en konkret tidsramme å forholde seg til. Det gjorde det lettere å prioritere og gjennomføre prosjektet på en god måte.
Løsning
Løsningen er skrevet i Python, hvor man kan velge mellom å bruke en Python-funksjon i kommandovinduet eller en Jupyter Notebook for å analysere dataen og gjøre prediksjoner. To modeller ble utviklet for sammenligning: En multivariabel lineærregresjonsmodell og en maskinlæringsmodell «Gradient boosting regression».
Multivariabel lineærregresjon finner en lineær modell som minimerer feilen til hvert datapunkt.
Figur 1: Multivariabel lineærregresjon
Gradient boosting regression trener modellen med bruk av resultatet fra mange beslutningstrær.
Figur 2: Gradient boosting regression
Forskjellen mellom modellene ligger i ytelse og forklarbarhet. Der multivariabel lineærregresjon er god på forklarbarhet, er gradient boosting regression bedre på ytelse.
Et stort problem innen kunstig intelligens og maskinlæring er at modellene er lite forklarbare. Dette er et område som det forskes mye på om dagen – hvordan man kan åpne den svarte boksen i maskinlæring! Dette blir ofte omtalt som «Explainable AI».
Evaluering
Under vises en graf med resultater for en oljeplattform. «Utilized energy» er energiforbruket til oljeplattformen og fra 2020 har vi ikke data på dette – Men modellene vi har trent predikerer energiforbruket. De ulike parameterne som oljeeksport, gassinjeksjon og gasseksport som var grunnlaget for prediksjonen er også lagt til for å kunne forklare svingningene i energiforbruket.
Oppsummering
Gjennom kvalitetsbevisst arbeid basert på kundebehov innenfor et godt rammeverk, har vi utviklet en maskinlæringsmodell som kan predikere klimautslippet til oljeplattformer. Resultatet ble også veldig bra, der en trade-off må gjøres mellom ytelse og forklarbarhet. Der multivariabel lineærregresjon er god på forklarbarhet, er maskinlæringsmodeller bedre på ytelse.
I fremtiden er jeg også sikker på at maskinlæringsmodeller kan forklares bedre. Da tror jeg det vil være en stor oppgang i bruk av maskinlæring i næringslivet – jeg gleder meg!
---
Kundens synspunkt
Fra daglig leder i Novatech, Knut Husdal:
Novatech har noen idéer om hvordan en effektivt og treffsikkert kan beregne hvordan klimatiltak i industrien vil påvirke de fremtidige utslippene av klimagasser. Fremfor å gjøre omfattende og tidkrevende studier, bør en kunne se resultatene av tiltak i løpet av kort tid.
Vi så en potensiell mulighet: Vil bruk av maskinlæring kunne gjøre dette mulig?
For å finne ut om det virkelig var mulig, så trengte vi hjelp av eksperter på maskinlæring. Vi fikk anbefalinger om å kontakte selskapet Alv AS. Hvis det er mulig, så vil de klare det. Det ville bli en skikkelig lakmustest.
Turen ble tatt over fjellene til en workshop hos Alv. Våre forventninger var å få svar på spørsmålet. Er dette teoretisk mulig? Vi presenterte noen eksempler med data og Håkon Skogland Halvorsen tok utfordringen på strak arm. Under prosessen holdt Alv jevnlig kontakten og oppdaterte oss på fremgangen og vi oppdaget muligheter underveis som ble justert inn i prosjektet.
Det som ble levert overgikk våre forventninger. Med mye. Ikke bare fikk vi svar på det store spørsmålet; Er det mulig? Svaret var et krystallklart Ja. Levert på bare en uke. Vi gjennomførte en rekke tester som viste overbevisende treffsikkerhet og utslippsprognosene ble produsert i løpet av sekunder.Svaret var så overbevisende at Novatech nå går ut til kunder med løfte om at dette vil vi få til i stor skala.
I denne prosessen leverte Alv på alle de viktige punktene. Flinke mennesker som lyttet og forsto problemstillingen, var kreativ i utføringen, justerte ved feedback og leverte på tiden.
Nå går reisen videre for å ta teorien over i et fungerende produkt. Det viktigste suksesskriterium vil være flinke mennesker. Derfor ønsker vi å ha Alv med på reisen videre.