Vårt delingshjørne
Håkon Skogland
Halvorsen
30. mai 2023
I år reiste hele data og analyse-teamet sammen til konferansen Data Innovation Summit i Stockholm! Konferansen dekker det meste innenfor data som vi jobber med: Alt fra data engineering og dataanalyse til maskinlæring/AI og MLOps, men også mye om datastrategi. Konferansen er faktisk Nordens største innen data, AI og avansert analyse - med andre ord et bredt spekter av evner innenfor alle områder.
Årets konferanse varte fra 11. - 12. mai, huset 3400 deltakere, åtte parallelle foredrag hver dag, over hundre demoer, samt workshops fra ulike selskap. En svært innholdsrik konferanse!
Vi satt et par klare mål for turen:
Samle til oss så mye kunnskap som overhodet mulig gjennom foredrag og samtaler med andre – slik at vi kan utvikle fokusområdene i avdelingen enda mer!
Ha det gøy på reisen!
De beste foredragene
Foredragene hadde en stor bredde av tema man kunne lytte til. Vi gikk blant annet på foredrag som handlet om maskinlæring og MLOps, data mesh, data lakehouse, datakvalitet, open source, data pipelines, analyse og datastrategi. Generelt sett så gikk ikke noen foredrag spesielt inn i dybden i tema – men vi fikk en veldig god oversikt over datalandskapet!
Vi har plukket ut 4 foredrag fra 4 forskjellige scener som vi synes var veldig bra.
The Secret to AI innovation
Keynotes, Opening and Closing Stage
Cassie Kozyrkov – Chief Data Scientist – Google
Første dagen startet med et par keynote-foredrag. Et foredrag som bemerket seg veldig positivt var av Cassie Kozyrkov, Chief Decision Scientist fra Google. Hun klarte å presentere hva AI og maskinlæring er på en enkel måte uten alle buzz-ordene, samt legge frem hvordan en bedrift kan utnytte potensialet til AI.
“Solving problems for individuals is the secret to AI innovation today. Utilize OpenAI APIs into solutions to augment individuals and make them more productive.” – Cassie Kozyrkov
Dette sitatet baserer seg på at vi nå går inn i en UX revolusjon, ikke en AI-revolusjon. Det var først når ChatGPT kom med et UX-interface mot GPT at AI tok verden med storm. Dette viser viktigheten av å skape løsninger sentrert rundt mennesket!
Hvis du er interessert i å lære mer om maskinlæring, har Cassie et 6.5 timers kurs på Youtube som ikke krever noen forkunnskaper: Making Friends with Machine Learning
The Data Engineer’s Guide to Data Quality Testing
Data Engineering & DataOps Stage
Mahdi Karabiben – Staff Data Engineer – Zendesk
I dette foredraget ble det understreket viktigheten av datakvalitet for å oppnå tillit fra interessenter. En spesifikk løsning som ble presentert var bruken av SODA i kombinasjon med Python for testing. Det ble også nevnt at SODA kan integreres med Airflow for ytterligere funksjonalitet og automatisering.
Et annet nyttig verktøy for testing som ble nevnt var DBT. Dette gir fordelen av å unngå repetisjon av kode og gir mer effektive testprosesser.
Samlet sett handlet foredraget om å fremheve betydningen av datakvalitet og presentere praktiske verktøy som SODA og DBT for å sikre pålitelighet og effektivitet i testing og validering av data.
Creating Business Value with Advanced Analytics
Machine Learning & MLOps Stage
Peter Nord Andersson – Actuarial Consultant - Northinsight AB
Dette var et foredrag som var mer sentrert rundt hvordan vi som teknologer kan skape business-verdi og tillit hos kunder. For å bygge tillit, må man starte med enkle visualiseringer som er lette å forstå. Deretter kan man etablere enkle modeller – og i takt med at tilliten hos kunden øker, så kan vi øke kompleksiteten gradvis. Kunden må være med i hele prosessen!
Klarer vi å bygge tillit til kunden gjennom data og analyse, vil de ha lettere for å gjøre aksjoner basert på dataen. Dette leder så til positiv businessverdi.
Top 10 Analytics Mistakes
Business & Data Analytics Stage
Adam Greco – Product Evangelist – Amplitude
Lack of ownership can create departmental silos - Mer kommunikasjon og eierskap på tvers av selskapet.
Incongruent Analysis Model – Velg riktig analysemodell som passer til selskapets kultur. En sentralisert analysemodell kan passe bra for store selskap med lite datakunnskap på tvers av hele organisasjonen, mens en desentralisert analysemodell passer mer for de som har god kompetanse på tvers.
Lack of Strategic Business Objectives – Analysemålene til et selskap burde gå top-down istedenfor bottom-up. Det er ikke teknologene som skal finne ut hvilke problemer de skal løse!
Over-implementation – Du trenger ikke å tracke alt i en analyseløsning, fokuser heller på det viktigste. «Se etter metrikker og KPIer som kan føre til at noen blir sparket eller forfremmet når en metrikk øker eller minker betydelig»
Lack of Focus on Data Quality – Tillit blir fort ødelagt hvis noen bruker en analyseløsning som viser dårlig data.
Analytics not Embedded in Processes – Analyse burde være med fra starten av et prosjekt for å kunne vise utviklingen i henhold til målene som er satt underveis i prosjektet.
Using the Wrong Tool for the Job – Det er viktig å bruke de riktige verktøyene som fanger opp det man ønsker å fange opp fra brukerne. Da kan man gjøre nødvendige endringer som vil ha god påvirkning på resultatet.
Failure to integrate analytics data into other systems – Integrer data og analyse i andre systemer også! For eksempel kan man hente mye nyttig informasjon fra hvordan brukere navigerer på en webside eller app.
Treating Analytics as a Cost Center Instead of a Profit Center – Bruk analyse som et verktøy for å endre fremtiden, ikke bare for å lese fortiden. Bruk det som en termostat, ikke et termometer!
Failure to Show Financial Impact – Vis det finansielle potensialet som ligger i analysene, slik at beslutningstakere forstår det! Vis for eksempel hvor mye nettbutikker går glipp av i handlekurven i kroner og øre – vær konkret!
Konferanseområdet
Konferanseområdet ble holdt i en stor messehall med over 100 stands fra ulike bedrifter med en hovedscene i midten av lokalet. De åtte scenene der foredragene ble holdt, var delt opp i egne og avgrensede områder. Mellom foredragene besøkte vi flere boder for «networking» med representantene fra bedriftene som stod i messehallen.
Vi fikk også testet teamet sitt konkurranseinstinkt i forskjellige ferdigheter som presisjon, reaksjon og hurtighet. Vi fikk brynet oss på en runde pingpong på et miniatyrbordtennisbord. En av bodene tilbød smoothie, der vi måtte tråkke på en sykkel for at blenderen skulle fungere! Etter en dag med faglig innhold tok "data after dark" over messen, og hovedscenen ble forvandlet til et dansegulv med hele fire forskjellige live DJ-er. Vi dro også på en før-fest arrangert av Databricks i 34. etasje av Scandic Victoria Tower, hvor vi kunne nyte en fantastisk solnedgang og utsikt over byen.
Key takeaways fra teamet
Bygg tillit gjennom å forenkle løsninger. Det ligger i menneskers natur å ville forstå. Når mennesker først forstår, så tar de aksjon på forståelsen. Deretter kommer merverdi for bedriften ut i andre enden som en konsekvens.
Det hjelper ikke å ha masse data og kule pipelines hvis man ikke har en strategi for hvordan relevante nøkkelpersoner i bedriften skal ta i bruk dataene. Jobb mest med å forstå brukerbehov før man setter i gang, slik at løsningen treffer behovet så godt som overhodet mulig.
Landskapet for data og AI er gigantisk og komplekst. Det er vanskelig å skjønne hva forskjellen egentlig er på alle de ulike tilbyderne. Det viktigste er kanskje bare å gå for noe, prøve det og feile raskt!
Open-source verktøy sammen med en god plattform i skyen er nøkkelen til både fleksibilitet, stabilitet og sikkerhet.
Vi har funnet nærmere ut hva vi burde fokusere videre på, og hva som trigger interessen i oss.
Konklusjon
I løpet av konferansen ble vi sterkere som et team i data og analyse, da vi klarte å finne en fin balanse mellom sosialisering og faglig påfyll. Alle fant noe engasjerende å lytte til, og det var godt å få en oversikt over den aktuelle tilstanden og trender innen data. Med ny innsikt og inspirasjon er teamet nå bedre rustet til å utvikle en strategi for å ta i bruk dataene på en meningsfull måte og dra nytte av de potensielle forretningsverdiene de representerer.
Konferansen hadde mange positive sider, inkludert en nyttig app, tilgang til presentasjoner og videoer i etterkant, og et bredt spekter av foredrag rettet mot både strategi og teknologi. Det var verdifull innsikt fra store selskaper og gode nettverksmuligheter. Likevel var det utfordringer med manglende praktiske eksempler, korte pauser og noen salgspregede presentasjoner.
Men absolutt en konferanse å anbefale for andre dataentusiaster 🤓