Data Science | Tools voor Data Science | 100% Datawetenschappen

Data Science

Gretig grasduinen in enorme hoeveelheden big data

Hoe pak jij het vraagstuk van Data Science management aan?

Data Science is een vakgebied dat in een ware stroomversnelling is geraakt. Het gaat kort samengevat over het vinden van complexe patronen in grote stromen data. Patronen die je met het blote oog en traditionele analysetools onmogelijk kan vinden. Je bouwt een model om die patronen op te sporen, te analyseren en te valideren. Daarmee kun je proactief ingrijpen in operationele processen, bijsturen of innovaties doorvoeren in jouw organisatie.

Waardevolle informatie genereren uit die onmetelijke hoeveelheid data die we met z’n allen elke dag genereren. Daar gaat het om bij deze datawetenschappen. Je ontwikkelt nieuwe oplossingen om te kunnen blijven concurreren op alle fronten. Maar dat doe je niet zomaar, want:

  • Hoe pak je het Data Science management-vraagstuk aan in jouw organisatie?
  • Welke concrete voorbeelden kunnen als inspiratie dienen?
  • Zijn er al betrouwbare tools op de markt die je kunt inzetten?
  • Welke vaardigheden (opleidingen) zijn vereist om data science te implementeren?
  • Hoe kun je hierin toekomstbestendige keuzes maken?

Ook nieuwsgierig naar dit nieuwe vakgebied van Data Science? Onze data scientists helpen je graag deze nieuwe wereld met succes binnen te stappen. Neem nu contact op.

Definitie Data Science

In de definitie van data science zie je ook de belangrijkste vaardigheden terug waarover een professionele data scientist dient te beschikken:

Data Science is het vermogen om de juiste data te selecteren, te begrijpen, te verwerken en er waarde uit te halen, maar ook de kunst om data te visualiseren en de inzichten te communiceren.

We gebruiken hier de definitie van Hal Varian. Hij is een gerespecteerd econoom bij Google en emeritus professor aan Berkeley, de universiteit van Californië. Data science wordt volgens hem de komende decennia een ontzettend belangrijke, cruciale competentie voor organisaties.

De grote databedrijven geven het voorbeeld

Bedrijven zoals Google, Facebook, LinkedIn en Netflix zijn de absolute koplopers in Data Science. Die weten als geen ander hoe je uit verkregen interne en externe data nieuwe waardevolle informatie kan maken. Zij zijn producent van allerlei informatieproducten. Die creëren ze uit de data die al hun gebruikers hen nota bene (gratis) toevertrouwen.

Ook Amazon bewaart van elke aankoop de kopersinformatie. Zo weten ze waarnaar bestaande en nieuwe klanten waarschijnlijk nog meer op zoek zijn. Nog voordat die het zelf weten. Ze combineren al die interesses tot een dataprofiel per bezoeker. Een klant is verworden tot een dataproduct dat continu nieuwe data genereert. En niet alleen mensen genereren data. Ook voorwerpen generen die bij de vleet. Camera’s registreren auto’s, we volgen postpakketjes wereldwijd met slimme tags en traceren mobiele telefoons continu.

De hoeveelheid data die met het internet verbonden voorwerpen genereren (het Internet of Things), is inmiddels velen malen groter dan de menselijke productie. De grote uitdaging bij Data Science is daar waarde uit te halen, uiteraard binnen de kaders van de huidige en toekomstige wet- en regelgeving.

Het is bijna science fiction wat we doen

"Het is bijna science fiction wat we met BI doen"Maar ook dichter bij huis levert Data Science management baanbrekende resultaten op. “Elie van Strien is commandant van het Brandweerkorps Amsterdam-Amstelland. Al in 2013 werd zijn korps tot Slimste Organisatie van Nederland gekozen, dankzij een baanbrekende BI-innovatie: Brandweer Intelligence. Vervolgens nam Van Strien zitting in de jury van de verkiezing van de Slimste Organisatie van Nederland. Commandant Van Strien voelt zich een jongetje in de speelgoedwinkel.” Lees verder…

Hoe creëer je waarde met Data Science?

De massa van al maar groeiende data vertegenwoordigt een waarde. Veel waarde. Om die te verzilveren, ga je de verschillende datastromen op een slimme manier combineren en analyseren. Daarmee kun je dan nieuwe, waardevolle dataproducten of datadienstverlening creëren. Dat is in een notendop de uitdaging waar je met Data Science voor staat.

Of het nu gaat om aankopen of sensordata, zoekopdrachten, slimme meters of geluidsopnames van telefoongesprekken. Klanten en machines worden een steeds belangrijker onderdeel van een wereldwijd datageneratie-proces. We kunnen de omvang en impact ervan nog nauwelijks bevatten. Maar door het mixen van die verschillende interne en externe gegevensbronnen kan je uiteindelijk komen tot compleet nieuwe en onverwachte inzichten.

Welke Data Science tools zijn er?

Tools voor Data ScienceWelk Data Science tools staan tot je beschikking om die nieuwe en soms onverwachte inzichten te maken? Waarmee kun je op dit moment kwantitatieve methoden als statistiek, machine learning en datamining toepassen?

Open source wordt steeds meer mainstream

In de opensourcewereld vinden op dit gebied veel interessante ontwikkelingen plaats. Er wordt veel tijd gestoken in de verdere ontwikkeling van programmeertalen als R, Python en tools en platforms als Hadoop en RapidMiner.

  • R biedt vele verschillende statistische en grafische technieken zoals lineaire regressie en niet-lineaire modellen, klassieke statistische tests, tijdreeksanalyse, classificatie, clustering, et cetera. Het is redelijk eenvoudig uitbreidbaar ook door de objectgeoriënteerde opzet van R.
  • Python is een objectgeoriënteerd uitbreidbare programmeertaal met krachtige bibliotheken voor datamanipulatie en analyse.
  • Zowel R als Python kun je inzetten in combinatie met Hadoop en haar MapReduce routines.
  • RapidMiner is een platform waarvan slechts de kern open source is. Het biedt een geïntegreerde omgeving voor machine learning, text minig, datamining en predictive analytics.

Wat doen de grote BI-spelers met Data Science?

Ook de grote BI-spelers proberen zich te onderscheiden in deze nieuwe wereld van Data Science. Zo hebben SAS, IBM, Oracle, Microsoft en SAP allemaal statistische en datamining oplossingen en extensies in de markt gezet. SAS met EnterpriseMiner en Visual Analytics en IBM met SPSS en Watson Analytics zijn spelers om in de gaten te blijven houden.

Waarin onderscheidt een goede Data Scientist zich?

Wat maakt (of breekt) een goede Data Scientist?Allereerst verwacht je van een data scientist uiteraard de zogenoemde “harde vaardigheden”. Denk dan aan kwantitatieve vaardigheden als statistiek, machine learning en datamining. Maar ook de soft skills moeten wel degelijk aanwezig zijn.

1. Harde vaardigheden bij Data Science

Een data scientist heeft begrip van de wet van de grote getallen. Hoe groter de dataset, hoe kleiner de invloed zal zijn van vreemde uitschieters. Hij of zij heeft ook technisch inzicht en beschikt over een uitstekend begrip van het ontwerp en gebruik van databases en data lakes. Hij of zij heeft de attitude van een goede programmeur en hacker, vasthoudend, met oog voor detail. Hij of zij is in staat om te programmeren.

2. Zachte vaardigheden bij Data Science

Ook heeft de data scientist een goed begrip van de business. Hij of zij ziet de uitdagingen van zijn organisatie en welke rol data science daarbij kan spelen. Bij het selecteren van de optimale kwantitatieve techniek, moet je als data scientist rekening houden met de specifieke kenmerken van het business-probleem.

3. Analytische modellen selecteren

Typische eisen voor analytische modellen zijn:

  • actievermogen: in hoeverre kan het analytisch model het business-probleem oplossen?
  • prestaties: wat zijn de statistische prestaties van het analytisch model?
  • interpretatievermogen: kan je de werking van het analysemodel makkelijk verklaren aan beslissers?
  • operationele efficiëntie: hoeveel inspanning is nodig voor het opzetten, bouwen, evalueren en monitoren van het analytische model?
  • naleving van de regelgeving: is het model in lijn met de regelgeving en de ethiek?
  • economische kosten: wat zijn de kosten van het opzetten, bouwen, en het onderhouden van het model?

Met deze combinatie van eisen moet de data scientist in staat zijn de beste analytische techniek te selecteren om het business-probleem op te lossen.

4. Communicatieve vaardigheden

Daarnaast beschikt een goede data scientist over veelzijdige communicatievaardigheden. Hij of zij is een absolute teamspeler en heeft een aangeboren nieuwsgierigheid voor het verkennen en experimenteren met data science.

5. Complexe zaken vertalen voor gewone mensen

Hij of zij is in staat moeilijke complexe zaken te vertalen voor ‘gewone mensen’. Hij of zij slaat de brug tussen analytische modellen en de eindgebruiker. Data scientists maken adequaat gebruik van heldere datavisualisaties. Deze mensen hebben ook de neiging om sceptische en vasthoudende mensen te zijn. Ze stellen een heleboel vragen over de levensvatbaarheid van een bepaalde oplossing en of het wel echt zal werken. Nieuwsgierigheid en creativiteit zorgen ervoor dat de data scientist niet voor één gat te vangen is. Hij of zij bouwt uiteraard mee aan het snel ontwikkelende kennisgebied.

Bedenk een toepassing voor jouw datawetenschap

Net als bij Big Data is de belangrijkste stap het bedenken van een data science-toepassing. Je moet weten hoe je betere of snellere beslissingen (automatisch) kan nemen op basis van predictive analytics en datawetenschappen. Te vaak ligt hierbij de focus op de data en niet op de vraag wat deze moet gaan opleveren. De eerdergenoemde zachte vaardigheden in het Data Sciences-team moeten ervoor zorgen dat je deze valkuil tijdig herkent en gaat vermijden.

Ook aan de slag met Data Science?

Wij hebben een flink aantal adviseurs en experts aan boord die veel ervaring hebben met Data Science en datawetenschap. Neem contact met ons op voor een oriënterende afspraak. Of informeer naar de mogelijkheden voor een Business Analytics opleiding of onafhankelijk advies.

neem contact met ons op

Opleidingen
Kennisbank
Advies
Interim

Een selectie van onze klanten

Word nu ook klant

Wil je ook klant bij ons worden? Wij helpen je maar wat graag verder met data science (tools voor data science) of andere zaken waar je slimmer van wordt.

Ronald Fokkink, Data Scientist / BI specialist

drs. RONALD FOKKINK

Associate Partner

neem contact met mij op

Fact sheet

Organisaties geholpen
___
Trainingen & workshops
___
Deelnemers opgeleid
___
Beoordeling klanten
8,9
Consultants & docenten
___
Kantoren
3
Jaar ervaring
16
EDIT POST