Hoe krijg je goede bedrijfsresultaten met data science

with Geen reacties

Bedrijven zouden veel waarde kunnen halen uit data science, maar laten het vaak liggen omdat ze er te weinig van begrijpen. De gemiddelde manager vindt data science een moeilijk onderwerp dat aan de experts overgelaten moet worden. Maar als manager moet je voldoende weten om het aan te kunnen sturen en de juiste vragen te kunnen stellen. Dan kun je een data science initiatief op dezelfde manier managen als elk ander verbeterinitiatief. Hier is een korte uitleg van hoe data science werkt en hoe je ervoor zorgt dat het waarde oplevert voor het bedrijf.

Neem contact op als je meer wilt weten.

Business results

Als je naar de statistieken kijkt, dan leveren de meeste data science iniatieven geen concrete bedrijfsresultaten op. De interesse in data science en machine learning groeit al sinds 2012, maar de verwachting is dat zelfs in 2022, tien jaar later, maar 20% van inzichten uit data-analyse waarde zullen opleveren voor het bedrijf. [1] Het probleem is overal aanwezig en het wordt over tijd niet opgelost.

Er zijn twee redenen waarom leiders in een bedrijf de waarde niet uit de data kunnen halen. De eerste is onbekendheid met de materie, aangezien de technieken snel verbeteren en leken deze niet kunnen bijbenen. De tweede is geloven dat data science zo complex is dat ze het niet zullen kunnen begrijpen, en het dus niet proberen. Beide redenen moeten worden aangepakt, omdat ze leiden tot een aanpak waarin een team experts op afstand aan de slag gaat, terwijl de leiders zich afvragen wat ze doen en of er nog iets uit zal komen.


Een simpele uitleg van hoe data science werkt

Data science

Hier is een simpele uitleg van wat data science is, hoe het werkt en wat het kan doen, gezien door de ogen van een niet-data scientist. Uiteraard is er veel meer detail te krijgen, vaak in de vorm van een “data science voor executives” cursus, en het is zinvol voor de geïnteresseerde leider om haar/zijn kennis daarmee te verdiepen. Maar om te beginnen…

Er zijn verschillende soorten data scientists

Data science is een breed vakgebied en data scientists hebben niet allemaal dezelfde vaardigheden. [2] Sommige data scientists zijn gespecialiseerd in data analytics of business intelligence, zij kunnen data segmenteren en visualiseren. Sommige zijn gespecialiseerd in algoritmes en modelleren, zij kunnen modellen bouwen om voorspellingen aan de hand van data te doen. Statistici kunnen experimenten uitvoeren en kijken of er correlaties zijn in de data. Data engineers zijn gespecialiseerd in het definiëren, opslaan en managen van de data in een vorm die bruikbaar is voor andere data scientists. Het belangrijkste om te weten is dat het niet één persoon is met de titel “data scientist” die al deze vaardigheden in zich heeft. Als je een data scientist wilt inhuren is het belangrijk om te begrijpen welke expertise zij/hij heeft.

Datamodellen maken voorspellingen gebaseerd op patronen

Datamodellen werken door patronen in data te herkennen en datapunten in groepen te verdelen naarmate ze meer gelijkenissen hebben met de andere leden van de groep. Dit heet classificatie: het is een voorspelling dat een datapunt in een bepaalde groep zal passen. Het werkt op basis van een belangrijke aanname, dat datapunten met dezelfde eigenschappen als inputs dezelfde uitkomsten zullen behalen.

Bijvoorbeeld, als de data laten zien dat mensen die in steden wonen (eigenschap) meer geneigd zijn om een elektrische auto te kopen (uitkomst) dan mensen die in dorpen wonen (eigenschap), dan zal een datamodel voor een nieuwe persoon in een dorp (eigenschap) voorspellen dat het minder waarschijnlijk is dat hij een elektrische auto zal kopen (uitkomst). Deze methode van classificatie via patroonherkenning wordt gebruikt om spraak naar tekst om te zetten, teksten automatisch te vertalen, beelden te herkennen, klantverloop te voorspellen, enzovoorts. Het is belangrijk om je te beseffen dat de classificatie een inschatting is met een bepaalde kansberekening zonder absolute ja/nee voorspelling.

Er zijn verschillende manieren om de classificatie uit te voeren, van simpel tot complex. Sommige methodes hebben een begrijpelijke “logica” (zoals de weging van factoren in een beslissingsboom) waarmee we de redenering voor de classificatie kunnen volgen. Anderen zijn een “black box” die geen uitleg zullen geven over de uitkomst. Het meest bekende voorbeeld hiervan zijn de neurale netwerken die toegepast worden voor Machine Learning of AI.

Er is een populaire gedachte dat veel problemen kunnen worden opgelost door er gewoon wat AI tegenaan te gooien. Helaas is de werkelijkheid weerbarstiger. Om AI goed te kunnen gebruiken moet je de processen goed begrijpen waarin de AI zal worden toegepast, Je hebt ook grote hoeveelheden data nodig om de AI te trainen, en een goede methode om de AI in een echte omgeving te testen. De AI zal een uitkomst geven zonder uitleg [3], en het zal de vooroordelen en beperkingen van de brondata herhalen. Als de redenering belangrijk is (bijvoorbeeld welke factoren hebben tot deze uitkomst geleid) dan is AI geen geschikte hulpmiddel.

Datamodellen hebben specifieke vragen nodig

Aangezien datamodellen werken door datapunten in groepen te classificeren, moet een businessvraag worden omgezet in een classificatievraag. De vraag kan niet open en algemeen worden geformuleerd, zoals “hoe kunnen we omzet verhogen?” Een meer geschikte versie van deze vraag is “welke klanten zijn geneigd om meer producten van ons te kopen?” Een datamodel kan de klanten classificeren door ze te vergelijken met andere klanten die meer producten hebben gekocht. De verkopers kunnen dan die klanten met aanbiedingen benaderen, in de verwachting dat ze meer succes zullen hebben gebaseerd op de voorspellingen van het model.

De vragen niet precies genoeg formuleren komt vaak voor. Dertig procent van data scientists geeft aan dat het ontbreken van duidelijke vragen een barrière is voor hun effectiviteit. [4] Zet je businessvragen om in meer precieze datavragen zodat er datamodellen kunnen worden gemaakt om deze te beantwoorden.

Analyses kunnen over zowel het verleden als de toekomst gaan

Er zijn vier soorten data-analyse: beschrijvend, verklarend, voorspellend en voorschrijvend. [5] De eerste twee beantwoorden vragen over het verleden: wat is er gebeurd, en waarom is het gebeurd. Deze zijn het domein van business intelligence en analisten. De laatste twee beantwoorden vragen over de toekomst: wat zou er kunnen gebeuren, en wat kunnen we eraan doen. Deze zijn het domein van de modellenbouwers.

Alle vier zijn nuttig bij het beantwoorden van businessvragen. Laten we als voorbeeld de vraag “hoe kunnen we meer elektrische auto’s verkopen?” nemen. Een beschrijvende analyse laat zien wie elektrische auto’s heeft gekocht, van welk type, voor welke prijs, enzovoort. Een verklarende analyse kan de factoren vinden die correleren met de aankoop van elektrische auto’s. Dit model kan een voorspelling maken voor het aankoopgedrag van toekomstige klanten, en een voorschrijvend model zou acties kunnen aanbevelen die de aankoopkans verhogen zoals prijsstelling of opties.


Een data science initiatief managen

Teamwork

Businessleiders hebben veel ervaring in het managen van verbeterinitiatieven. Het managen van een data science initiatief volgt dezelfde principes. De leider moet direct betrokken zijn om te zorgen dat het project een duidelijk zakelijk doel dient, goed is afgebakend en gemanaged, en tot aan de implementatie wordt uitgevoerd.

Begin met een zakelijk doel

Data science initiatieven die in een silo bestaan kunnen in de valkuil trappen om alleen als doel te hebben het verzamelen van data of het gebruik van een tool. [6] De vragen zijn dan bijvoorbeeld “wat kunnen we doen met deze klantdata?” of “wat kunnen we doen met machine learning?” Dit zijn prima vragen als je aan het onderzoeken bent, maar niet als je een goed project wilt definiëren. Hoe kun je succes meten bij zo’n vage doelstelling? Wat is de ROI van een dergelijk project? Begin altijd met een zakelijk doel, bijvoorbeeld “hoe kunnen we klantconversie in onze salesfunnel verhogen?” Een project zonder zakelijk doel maakt meer kans om geannuleerd te worden dan om waarde te leveren.

Maak een datastrategie

Als je aan een data science initiatief begint zul je ongetwijfeld een data of analytics strategie willen maken. [7] Deze strategie moet de bedrijfsstrategie uitdiepen en ondersteunen net zoals andere functionele strategieën dat doen. Data scientists zijn niet opgeleid in bedrijfskunde of strategie. Neem geen data scientist in dienst om je te vertellen wat je moet doen met data. Stel een team samen dat bestaat uit een businessleider, strateeg, IT specialist, data privacy specialist en data scientist, en vraag dat team om de data strategie te maken. Kijk dan of het plan de zakelijke doelen van het bedrijf ondersteunt en een goede ROI biedt.

Neem de tijd en moeite om goede data te verzamelen

De grootste barrière voor succes in een dataproject is ontbrekende en slechte data. Data scientists zijn 80% van hun tijd kwijt aan het vinden, opschonen en organiseren van data [8] voordat de analyse kan beginnen. De brondata zijn vaak inconsistent, bijvoorbeeld omdat een geen definities zijn van wat de datavelden zijn, of omdat er fouten zijn gemaakt bij invoer, of omdat data uit verschillende systemen aan elkaar moeten worden gekoppeld. Het kan onduidelijk zijn wie de eigenaar is van bepaalde data, of de data bestaan in een silo waar anderen niet vanaf weten. Wees je ervan bewust dat het veel tijd kan kosten om de data te verzamelen, op te schonen, consistent te maken, en in een database te zetten in een format dat geschikt is voor analyse. De inzichten uit dit proces zouden ook kunnen leiden tot een groter initiatief om datakwaliteit bij de bron te verbeteren, en een andere manier van werken met data bedrijfsbreed in te voeren.

Manage het project om teleurstellingen te voorkomen

Data scientists gaan bij een bedrijf werken omdat ze complexe vraagstukken willen oplossen die grote impact hebben op het bedrijf. Als de realiteit tegenvalt raken ze teleurgesteld: [9] de data ontbreekt, de IT-infrastructuur is ontoereikend, de resultaten van hun werk leiden niet tot het nemen van besluiten. Sommigen gaan op zoek naar een baan bij een ander bedrijf waar de zaken beter geregeld zullen zijn.

Zakelijke leiders raken teleurgesteld als ze geen tastbare uitkomsten zien van het werk dat gedaan wordt. [10] Als de resultaten van de analyse niet in begrijpelijke taal worden uitgelegd zullen zij minder geneigd zijn om de aanbevelingen op te volgen. Als zij veel investeren in data science zonder het resultaat ervan te zien kunnen ze het project annuleren of het team opheffen.

Om deze teleurstellingen te voorkomen is een goede projectmanager of teamleider essentieel. Deze kan blokkades opheffen, cross-functionele samenwerking stimuleren, communicatie op gang houden en de resultaten in zakelijke termen vertalen. Daarnaast is een zakelijke leider nodig die als sponsor optreedt om ervoor te zorgen dat het project over voldoende middelen beschikt en aansluit bij de overige disciplines, om te voorkomen dat het in een silo opereert.

Ga door tot en met de implementatie

Het project moet niet eindigen bij het datamodel. Nadat het team het datamodel heeft opgeleverd moeten de uitkomsten in de business worden belegd: Wat betekenen de nieuwe inzichten uit data voor de doelstellingen, processen, besluitvorming of KPIs van het bedrijf? Wie moet op welke manier anders werken en hoe levert dat waarde op voor het bedrijf?

Hier zijn verandermanagers nodig die in staat zijn om deze veranderingen in het dagelijkse werk door te voeren. Maak het data science team ook onderdeel van het implementatieproces. Dan kunnen zijn de impact van hun werk zien, en het geeft iedereen de kans om te leren en verbeteren voor het volgende project.


Conclusie

De manier waarop bedrijven concurreren veranderen ingrijpend door data, analyse en AI, dus wordt het steeds moeilijker om ze te negeren. De meeste bedrijven staan aan het begin van het bouwen van goede analysevaardigheden. De onbekendheid en complexiteit van data science vormen barrières tegen adoptie waar zakelijke leiders zich niet door moeten laten weerhouden. Door te begrijpen hoe data science werkt, samen te werken met data science teams, en het onderwerp cross-functioneel te benaderen kunnen leiders goede bedrijfsresultaten behalen met data science.


[1] https://blogs.gartner.com/andrew_white/2019/01/03/our-top-data-and-analytics-predicts-for-2019/

[2] https://www.linkedin.com/pulse/one-data-science-job-doesnt-fit-all-elena-grewal/

[3] https://m3consultancy.nl/blog/three-requirements-for-successfully-implementing-artificial-intelligence

[4] https://www.kaggle.com/surveys/2017

[5] https://www.linkedin.com/pulse/4-stages-data-analytics-maturity-challenging-gartners-taras-kaduk/

[6] https://towardsdatascience.com/why-data-science-succeeds-or-fails-c24edd2d2f9

[7] https://www.bernardmarr.com/default.asp?contentID=768

[8] https://rapidminer.com/blog/data-prep-time-consuming-tedious/

[9] https://www.kdnuggets.com/2018/04/why-data-scientists-leaving-jobs.html

[10] https://hbr.org/2019/01/data-science-and-the-art-of-persuasion

© 2019-2021 Veridia Consulting