Hoe databedreven is jouw organisatie?

Inhoudsopgave

Niet iedereen loopt warm voor lastige discussies over informatie-entropie, schaduw-IT en technical debt. Martijn Evers kun je er echter wakker voor maken. Een geanimeerd gesprek over holistisch datamanagement en de kunst van het stieren temmen. Samen met Ronald Damhof richtte Martijn Evers, co-founder van het Bossche bedrijf i-Refact, een online beweging op die zich sterk maakt voor misschien wel de ultieme baan van de toekomst: full-scale data-architect. Het is wel een job die je moet liggen. “Meestal word je als data-architect geboren”, zo stelt de zelfbenoemde data-missionaris. Met andere woorden: het abstracte denken moet eigenlijk al in je genen zitten. Daarom doen organisaties voor de invulling van deze sleutelpositie meestal een appèl op de echte liefhebber. Inderdaad, adel verplicht.

Postermanie

“Ik heb er nog een paar in de achterbak van mijn auto liggen”, zo vertrouwt Evers mij op een vertrouwelijke fluistertoon toe. Het tafereel speelt zich af in een hoekje van de lounge van een keurig, modern kantoor op een industrieterreintje in de regio Utrecht. Het lijkt op het eerste gezicht misschien op een scène uit een nieuwe Nederlandstalige crimi. Niets is minder waar. Evers verwijst naar zijn, volgens eigen zeggen, ‘postermanie’. Als een ware posterfetisjist koestert hij zijn verzameling van ruim 25 verschillende posters op megaformaat (A0), waarvan hij altijd enkele exemplaren meeneemt naar afspraken. En er zitten nog meer posters in de pijplijn…

Psychedelische sfeer

De posters waaraan de gecertificeerde data vault master refereert vallen niet alleen op door de originele invalshoeken, de sterke associaties en de gewaagde analogieën, maar vooral ook door het veelkleurige kleurenpalet. Ze ademen de psychedelische sfeer van de platenhoezen uit de jaren zeventig. “Inderdaad, het zijn soms ware kunstwerken”, zo beaamt Evers met pretoogjes.

Maar al snel wordt duidelijk dat het hem menens is. Hij gebruikt de posters om zijn opdrachtgevers in één oogopslag te laten zien waar eventuele pijnpunten in de organisatie zitten en waar zogenoemde ‘gridlocks’ (knelpunten) kunnen ontstaan. Maar vooral ook om te illustreren welke grote belangen (‘concerns’) op het spel staan en welke oplossingsrichtingen er zijn als je serieus met data, datamanagement en data-architecturen aan de slag gaat. “Door een poster te laten zien of een matrix te tekenen, ontketen je vaak in een keer een levendige discussie.”

Groot geld verdienen

Over discussies gesproken: ‘data is the new oil’, zo beweren prominente sprekers tijdens congressen. In één adem benoemen ze een van de grote beloftes van onze tijd: big data. ‘Big data is big business’. Deze uitspraken vinden meestal vanzelf hun weg naar de boardroom. Ze galmen nog een tijdje na in de wandelgangen van directievleugels van grote corporates. En voor je het weet leiden ze al snel een eigen leven, helaas zonder de relevante context. Volgens Evers zijn deze oneliners meestal afkomstig van mensen die weinig of geen kaas hebben gegeten van data-architecturen.

Groot geld verdienen met data is tot dusverre slechts weggelegd voor de Amazons, Facebooks en Googles van deze wereld. De rest van de wereld worstelt vooral met de overvloed aan data die hen op een afschuwelijke manier overvalt. Naar analogie van de wet van de zwaartekracht van Newton bestaat er volgens Evers ook zoiets als ‘data-zwaartekracht’. Data heeft de neiging te clusteren en trekt ook weer nieuwe applicaties met nieuwe data aan. De data-zwaartekracht kun je voor je laten werken, zoals de grote ‘databoeren’ laten zien, maar voor veel organisaties is datazwaartekracht vooral een belemmering, bijvoorbeeld bij de migratie van data tussen de cloud en een lokaal datacenter.

Naar analogie van de wet van de zwaartekracht van Newton bestaat er ook zoiets als ‘data-zwaartekracht’.

Data als nucleaire optie

“Data is levensgevaarlijk en kan bedrijven, organisaties, landen en complete maatschappijen ten gronde richten”, zo gooit Evers de knuppel meteen maar in het hoenderhok. Hij vergelijkt de impact zelfs met de dreiging van nucleaire wapens. “Beïnvloeding van landen (zie ‘Cambridge Analytica’) is een reëel probleem geworden. En er gaan letterlijk bedrijven naar de knoppen als gevolg van slecht datamanagement. Alleen overheidsinstellingen of zelfstandige bestuursorganen beschikken over een escape, omdat ze in principe kunnen teren op de oneindige fondsen van een Rijksoverheid die meestal wel bijspringt. Ook als er soms welbewust verkeerde keuzes worden gemaakt ten aanzien van de inrichting van data, datamanagement en data-architecturen.” En dat gebeurt volgens Evers nogal eens, zo stelt hij met gevoel voor understatement vast. De berichten staan dagelijks in de krant.

Data is levensgevaarlijk en kan organisaties ten gronde richten.

Direct escaleren die hap

“Bij majeure IT-problemen in overheidsinstellingen zouden betrokkenen veel eerder moeten escaleren naar de staatssecretaris of de minister. Nu zitten daar zoveel managementlagen tussen dat bewindslieden veel te laat worden geïnformeerd over de risico’s en financiële gevolgen. Als een minister nu een seintje krijgt, is het meestal al veel te laat. De miljoenen zijn al verdampt, de betrokken directeuren zijn vertrokken of overgeplaatst en de eerste reorganisatie is al achter de rug. Alles ligt onder een dikke laag stof. Bij de overheid ontbreekt heel vaak de regievoering. Substantiële problemen met IT moeten zo hoog mogelijk in de organisatie worden opgelost. Van mij mag je een minister naar huis sturen als de datakwaliteit op zijn of haar ministerie niet op orde is. Als algoritmes gaan beslissen, nemen bovendien de risico’s toe en dus ook de ministeriële verantwoordelijkheid”, zo zet Evers de zaak op scherp.

Technical debt

Over technical debt, een IT-begrip dat afkomstig is uit de wereld van softwareontwikkeling, heeft Evers een uitgesproken mening. “Technical debt is een feit zodra een ontwikkelaar zelfs maar een blik op zijn toetsenbord werpt.” Technical debt ontstaat doordat ontwikkelaars bewust of onbewust kiezen voor een op het eerst gezicht voordelige kortetermijnoplossing die echter op de langere termijn extra kosten met zich meebrengt. Elk systeem is volgens hem in feite technical debt, want je had het eigenlijk liever niet gehad willen hebben.

Grip op de dataketens

In plaats van vast te houden aan oude, vaak achterhaalde technologie zouden organisaties hun tijd en geld moeten investeren in het échte werk: het managen van dataketens. Evers doelt hierbij op een duurzame, veilige en houdbare oplossing voor de verwerking van grote hoeveelheden data ten behoeve van een groot aantal belanghebbenden. Daarbij spelen de kwaliteit van processen en leverbetrouwbaarheid van data-leveringen een hoofdrol. “De business zou zich veel meer moeten verdiepen in data en data-organisatie en niet gemakzuchtig en kortzichtig denken: de data zit in het datawarehouse of datalake, dus dan zit het wel snor.” De business is tegelijk ook eigenaar van de data, niet de afdeling IT. Als het mis gaat, betaalt de business immers de boetes. Om data op orde te krijgen, is vaak wel een echte transitie noodzakelijk.

Organisaties zouden grip moeten krijgen op de dataketens en het liefst aan het begin van de keten en niet pas aan het einde van de dataketens, zoals het vaak bij data warehouses en datalakes het geval is. Dan is de situatie vaak al hopeloos en gooit men er wat betreft data en informatiekwaliteit met de pet naar. Ronald Damhof, Martijn’s partner in crime, zegt hierover: “Een datawarehouse, datalake of welk datafort dan ook, is een uiting van technische schuld die gewoon niet eerder in de dataketen is aangepakt”. Evers valt hem bij: “Organiseer data zo dat iedereen in de keten waarde kan halen uit de beschikbare data. Wij richten ons op de organisatorische kant, op de data- en ketenproblemen. De technologische oplossingen, of het nu gaat om een BI tool of een data vault, zijn hieraan altijd ondergeschikt. Technologie interesseert ons geen biet, we zijn wat dat betreft tegen ’technologische intimiteit’.”

Keten-entropie

Dataketens hebben echter enkele vervelende eigenschappen: ze ontstaan bijna altijd spontaan (emergentie), want iedereen wil elkaars data hebben en het kopiëren van data is kinderlijk eenvoudig. Een Excelletje is zo gemaakt. Als een onzichtbaar spinnenweb kruipt de data als het ware door de organisatie. De complexiteit neemt alleen maar toe en op een gegeven moment komt alles tot stilstand. De paniek van de datalogistiek is een feit. De chaos is compleet. Een ‘entropic death’ lijkt onafwendbaar. Entropie is een abstract begrip uit de thermodynamica. Het is op het meest fundamentele niveau een maat voor de wanorde of de ontaarding in een systeem.

Een entropic death lijkt onafwendbaar.

Ook organisaties worstelen hun hele leven met entropie. Je ruikt en ziet het echter niet. Als full-scale data-architect kun je er alleen maar voor waarschuwen. Evers ontwikkelde samen met de Full Scale-gemeenschap naar analogie van de energielabels A tot en met G voor elektrische apparaten en woningen daarom een labelsysteem voor informatieproducten met het oog op entropie. “Organisaties denken nog te veel in IT-principes en functies. Ze moeten meer oog krijgen voor het bestrijden van chaos en het leren denken in scheiding van machten, functies en belangen (de ‘concerns’) en de principes van de Trias Politica Data eerbiedigen (zie voor de uitleg deel 2 van dit artikel). Doe je dat niet, dan krijgt de entropie in de keten de overhand. Helaas zien directies en IT vaak niet wat het probleem is, en als het eenmaal duidelijk is, dan is het vaak (te) laat.”

Data-valorisatie versus data-organisatie

Een uit het juiste hout gesneden full-scale data-architect fungeert volgens Evers als brug tussen business en IT en is goud waard. Hij of zij bewaakt vaak de balans, tussen bijvoorbeeld data-valorisatie en data-organisatie. “Vergelijk het met Yin en Yang, de bekende Chinese begrippen die verwijzen naar twee tegengestelde principes of krachten waarvan alle aspecten van het leven en het universum doordrongen zijn. Yin en Yang houden elkaar in balans, maar in bedrijven en overheidsinstellingen is vaak sprake van een grote mate van onbalans. Sommige data zit nog vast in Excel, of is in verouderde bronsystemen ondergebracht, andere data bevindt zich in de cloud die benaderbaar is met een coole app.”

Risico’s mitigeren

Hoewel Evers een echte spraakwaterval is, kiest hij zijn woorden zorgvuldig. Hij heeft goed nagedacht over zijn kernboodschap. Zo gebruikt hij liever de term data-valorisatie dan het meer gangbare in zijn ogen ‘platte’ begrip data-monetarisatie, dit om aan te geven dat je met data veel meer verschillende waarden kunt realiseren dan louter geldelijk gewin. “Als je met behulp van doorwrocht data-management in staat bent om risico’s te mitigeren en te voldoen aan allerlei compliance-eisen die de toezichthouders stellen, creëer je immers ook waarde, alleen is die waarde niet direct in geld uit te drukken. Ook het voorkomen van dataproblemen vertegenwoordigt een waarde. Data is echter lang niet altijd te verzilveren. Een zorgverzekeraar bijvoorbeeld kan niet zomaar commercieel de boer op met zijn cliëntgegevens. Het met data opsporen van fraude vertegenwoordigt daarentegen wel weer een grote, interne waarde voor die verzekeraar. Algoritmes zijn daarin meestal the next step in datavalorisatie.”

Logisch datamodel

Is data een ‘asset’, een waardevol bezit, een ‘liability’, een verplichting of een blok aan het been, of biedt data toch vooral een strategisch voordeel? Hoe je het ook bekijkt, het belang van goed datamanagement neemt volgens Evers alleen maar toe. “Ik zie veel bedrijven worstelen met de keuzes. Waar zou onze aandacht primair naar uit moeten gaan. Veel initiatieven zijn ofwel technologiegedreven, of zodanig pragmatisch dat de toekomstvastheid en herbruikbaarheid moeilijk te beoordelen zijn. Vaker ontbreekt een doordachte data-architectuur helemaal en is de realisatie van onderliggende datamanagementplatform een kostbare, tijdrovende klus zonder direct tastbare waarden. In 2014 heb ik daarom samen met twee compagnons een eigen bedrijf opgericht, namelijk i-Refact, een samentrekking van de woorden ‘refactoring’ en ‘fact’, om aan te geven dat het bij datavalorisatie draait om het reorganiseren van de feiten.”

“Er zijn vele manieren om data goed te organiseren, bijvoorbeeld ‘feit of communicatie’ gebaseerd modelleren, maar het logische datamodel verdient wat ons betreft een speciale plek. Enerzijds vormt het een cruciale schakel tussen de abstracte, meer betekenisgedreven data(informatie) organisatie en data governance. Anderzijds verbindt het de meer concrete implementatie met een datamanagementsysteem. Zonder deze ‘schakel’ ontbreekt vaak de grip, de controle van de implementatie. Daarnaast ontkoppelt het netjes implementatie-activiteiten van activiteiten op het terrein van data/informatie definities. Dit heet dat heel chic de ‘Data Definitie en Implementatie Architectuur’ en is eigenlijk alleen bekend vanwege het feit dat hij nooit genoemd wordt. Mijn Data Model Matrix is misschien wel een van de eerste pogingen om dit op een structurele manier bij managers en architecten op de agenda te krijgen.”

De stier bij de horens pakken

De koe bij de horens pakken is een bekend Nederland spreekwoord. In het Engels is het echter een (woeste) stier. Martijn Evers, bedacht een eigen variant hierop: de ‘data bull’, naar aanleiding van het data-kwadrantenmodel van Ronald Damhof. Want data-architecten moeten vaak schipperen tussen twee tegengestelde belangen: kwaliteit versus flexibiliteit. Evers: “Je kunt deze twee begrippen zien als de twee hoorns van een woeste stier die je wilt temmen.”

Kwaliteit versus flexibiliteit

Kwaliteit staat dan voor een systematische manier van denken en ontwikkelen. Het gaat hierbij vooral om de consistentie, verifieerbaarheid, validiteit, integriteit, conformiteit, relevantie, transparantie en controleerbaarheid van de data. Flexibiliteit staat dan voor een opportunistisch manier van denken en ontwikkelen. Begrippen als flexibiliteit, wendbaarheid, bereidwilligheid, variëteit, toegankelijkheid, responsiviteit en verkrijgbaarheid van de data staan hierbij centraal. De kunst is om de twee hoorns van de spreekwoordelijke stier zo te manoeuvreren dat er geen ongelukken gebeuren.

Wie een beetje verstand van stierenvechten heeft, weet dat het met man en macht (met twee handen) drukken op een van de hoorns of het met gelijke kracht drukken op elke van de hoorns waarschijnlijk geen effect zal sorteren. Het loslaten van beide hoorns is ook geen optie. Dat is fataal. “Je zult je krachten behoedzaam moeten verdelen door op de ene hoorn druk uit te oefenen en tegelijkertijd de andere hoorn goed in de gaten te houden.” Vertaald in data-termen, betekent dit dat als je maximaal voor flexibiliteit kiest, je desondanks nog steeds een minimumniveau van kwaliteit dient te handhaven. En vice versa geldt hetzelfde.

Vier kwadranten

Door langs de verticale as de opportunistische en systematische manier van ontwikkelen te visualiseren en op de horizontale as de ‘push en pull’ factoren te plaatsen, ontstaat een matrix met vier kwadranten.

Vier kwadranten datamodel

  1. Kwadrant I staat voor sterk gestandaardiseerde processen en systemen die data innemen en beheren. De voorspelbaarheid en herhaalbaarheid in dit kwadrant zijn groot. De harde feiten staan centraal.
  2. In kwadrant II staan de kwalitatieve informatiecontexten en de waarheden centraal.
  3. Kwadrant III staat in het teken van het binnenhalen van laag gestandaardiseerde en beperkt beheerde data zoals eenmalige, ad-hoc data, of persoonlijke data-collecties. Een fenomeen als schaduw-IT krijgt hier alle ruimte. Governance is hier echter zeer beperkt.
  4. Kwadrant IV, tot slot, biedt ruim baan voor onderzoek, innovatie, prototyping en ontwerpen.

Tot zo ver de theorie. In deel 2 van dit artikel gaan we met name in op verschillende archetypen van data-architecten en de ‘Trias Politica Data’.

Bronnen:
  • Architectuur voor de digitale wereld, Hanno Wupper. Nijmegen, 2012
  • Full-scale Data Architects Posterbook, 0.2 version, Martijn Evers, i-Refact. Den Bosch, 2018

Reacties op dit artikel

Edwin schreef op 09.01.2019 - 07:01:

De spijker op z’n kop in dit artikel is: “De business zou zich veel meer moeten verdiepen in data en data-organisatie en niet gemakzuchtig en kortzichtig denken: de data zit in het datawarehouse of datalake, dus dan zit het wel snor.” Het aanstellen van een data architect helpt hierbij als deze vanuit de business wordt aangedragen en niet vanuit IT!

Bekijk het PDCA-handboek 'Datacratisch werken'

Productafbeelding van het PDCA-handboek 'Datacratisch werken'