data science of the shelf

Data Science off the Shelf: datawetenschappen verpakt als producten

Dataprojecten zijn vaak grote projecten waar consultants voor een langere tijd aan werken om iets op te leveren. Dat werkt misschien goed bij corporate bedrijven, maar bij het midden- en kleinbedrijf werkt dat minder goed, terwijl ook zij veel data hebben waar waardevolle inzichten uit zijn te halen. Daar moeten we iets mee, dachten ze bij Cmotions. Ze ontwikkelden twee ‘Data Science off the Shelf’-producten, DOTS in het kort. Daarmee profiteert het mkb van de kennis van ervaren datawetenschappers, zonder dat zij gebonden zijn aan langdurige dataprojecten. Bij True waren we benieuwd naar de eerste twee DOTS producten. Wat houden ze in en waarom zijn ze interessant? We vroegen het aan Jeanine, Thijs en Riens – de initiatiefnemers van de ‘Data Science off the Shelf’-productlijn.

Cmotions

Cmotions is van oorsprong een consultancyorganisatie. Grote corporates huren de dataspecialisten in zodat zij kunnen helpen met moeilijke datavraagstukken. “Heel veel bedrijven zijn onvoldoende in staat om waarde uit data te halen. Vanuit Cmotions helpen we daarbij”, vertelt Riens Koopman Managing Consultant bij Cmotions. Cmotions levert een breed palet aan datagerelateerde diensten, zoals Advanced Analytics, Data Governance, Data Science en Data Engineering, datavisualisaties, Omnichannel marketing en strategische adviezen.

Naast het leveren van kennis is Cmotions ook een actieve opleider met het Talent Program, waar jonge professionals worden opgeleid tot dataspecialist, en The Analytics Lab, een laboratorium waar nieuwe datadiensten ontstaan aan de hand van hackathons, trainingen en vrijdagmiddagexperimenten. “In The Analytics Lab hebben we bijvoorbeeld al een koffiezetapparaat met gezichtsherkenning ontwikkeld, een robot die notulen kan maken, een wedstrijd met zelfrijdende auto’s, en hackathons die we regelmatig organiseren”, zegt Jeanine Schoonemann, Principal Consultant & Data Scientist bij Cmotions.

Dataproducten

De succesvolle inzet van data is een combinatie van verschillende factoren, menen ze bij Cmotions. Riens: “Data succesvol inzetten betekent dat je enerzijds kennis moet hebben van data, de achterliggende technieken en algoritmes en datawetenschappen. Maar als je het succesvol wil maken dan is het heel belangrijk dat je ook de domeinkennis meeneemt.”

Cmotions heeft de mensen met kennis over data, en bij de opdrachtgever zitten vaak de mensen met domeinkennis. “Belangrijk is de samenwerking tussen klant en Cmotions, om samen met die klant te werken aan de oplossing. Met onze kennis en ervaring willen we ervoor zorgen dat die klant ook echt de oplossing gaat gebruiken”.

Sinds de toetreding van Cmotions in de Broad Horizon familie zag Cmotions een nieuwe markt ontstaan. “Doorgaans werken wij voor corporates, die zijn gewend om met consultants te werken. Maar er zijn ook genoeg bedrijven die liever geen consultants inhuren, omdat het bijvoorbeeld niet in de cultuur van het bedrijf zit.” Om die klanten te bereiken bracht Cmotions alle kennis over data samen in een productvorm: DOTS Predictive Services en DOTS DataSampler.

Voorspelmodellen

Een van de eerste producten die Cmotions standaardiseerde, was een voorspelmodel. “Een voorspelmodel kun je het best zien als een waarzegger”, zegt Thijs van der Velden, Data Science Consultant bij Cmotions. “Je vraagt iets en je krijgt antwoord”. In het geval van een voorspelmodel worden patronen herkend op basis van historische gegevens. Patronen die een mogelijke uitkomst kunnen voorspellen.

“We maken al veel voorspelmodellen voor onze klanten, maar merkten dat er ook vaak aanvullende kennis ontbreekt over bijvoorbeeld het trainen van de modellen en het in productie nemen hiervan”, zegt Jeanine. Een voorspelmodel is het best te omschrijven aan de hand van een voorbeeld, vindt zij. “Binnen de marketing kan een voorspelmodel bijvoorbeeld voorspellen hoeveel mensen een product of dienst gaan opzeggen”. Het model wordt gevoed met data uit bijvoorbeeld een CRM waar bepaald gedrag van bestaande en vertrokken klanten wordt geregistreerd. “Het model vergelijkt het gedrag vervolgens met blijvende klanten en herkent patronen hierin”, aldus Jeanine.

Predictive Services

De variabelen in een voorspelmodel zijn zeer afhankelijk van het type organisatie en de vraag van de klant. Dat maakt het werken met voorspelmodellen zeer specialistisch werk, waar Cmotions vaak per klant individueel mee bezig is. Daarnaast heeft een voorspelmodel ook een infrastructuur nodig én periodiek onderhoud, met name als het de bedoeling is dat het voorspelmodel regelmatig gebruikt wordt. Met die kennis in huis zijn de drie consultants daarom Predictive Services gestart – een data-abonnement waar klanten de kennis van Cmotions op gebied van voorspellen in huis halen en zich geen zorgen hoeven te maken over infrastructuur.

Cmotions richt het model in, maar traint het model ook om de zoveel tijd zodat het geoptimaliseerd wordt. De scores en resultaten komen ook periodiek bij de klant terecht. Helemaal ontzorgd. “De klant hoeft zich niet druk te maken of dit het beste model is want die expertise zit bij ons. De klant kan zich bezighouden met waar hij of zij voor op aard is. Hoe ga ik hier geld mee verdienen? Want daar zet je zo’n model voor in.”, aldus Riens.

Het model maakt gebruik van bewezen algoritmes maar maakt ook gebruik van state-of-the-art datatechnologie. Jeanine: “Data Science is heel erg in beweging. Kennis van twee jaar geleden is al eigenlijk al niet meer helemaal compleet. Er komen steeds meer methodieken bij om algoritmes beter te doorgronden.” Met name door de groeiende computerkracht van onder andere cloud-computing diensten kan er steeds meer. “Een neuraal netwerk kon je vroeger drie weken aanzetten, en hopen dat je daarna dan een werkend model had. Nu kun je op grote schaal cloud-computing inzetten en zo’n neuraal netwerk in no time trainen.”

Privacy by Design

Omdat de expertise van Cmotions ligt op het vlak van data, werken zij samen met True. “De Predictive Services-dienst draait op Microsoft Azure, waarbij gebruik wordt gemaakt van de kennis en expertise van True op het gebied van infrastructuur.”

Riens: “Klanten delen hun gegevens met ons. Wat daarin belangrijk is, is dat we dat in een veilige omgeving doen. In het marketingdomein gaat het bijvoorbeeld vaak over persoonsgegevens. Security en privacy speelt een belangrijke rol. Dan wil je data opslaan in een betrouwbare omgeving en dat je gebruikmaakt van een partij die daar dag in dag uit mee bezig zijn. Dat is niet de core van Cmotions. Bij ons zusterbedrijf True zit dit wel goed.

Ook bij het product zelf wordt uitgebreid stilgestaan bij welke gegevens er worden gebruikt om het model te maken, zodat bij het bouwen van een model kunnen dit met zo min mogelijk persoonsgegevens gebeurt. Daarnaast worden zoveel mogelijk gegevens gehasht en gepseudonimiseerd. Daardoor wordt de anonimisering van data zo concreet mogelijk gemaakt.

DataSampler

Naast consultantdiensten heeft Cmotions ook een opleidingsinstituut ‘The Talent Program’, waar jonge mensen die net van school afkomen een verdiepingsslag kunnen maken in de Data Science-wereld. Ze krijgen een snelkookcursus op het gebied van hard en soft skills. Riens: ”We leren ze bijvoorbeeld essentiële Python-vaardigheden, maar ook hoe ze iets moeten presenteren of hoe ze interviews moeten doen. Na acht weken halen ze een certificaat en kunnen ze aan de slag bij gerenommeerde bedrijven zoals een KPN of ABN Amro.”

Een collega moest lesgeven over klantwaarde-modellen. Jeanine”Er was ooit iemand die in Excel wat datasets bij elkaar had geraapt. Maar die dataset leefde niet bij de studenten. Geen leuke datasets”. Cmotions zag daarnaast dat de sets niet paste bij het doel. De collega was meer aan het uitleggen over de data dan over klantwaarde. “Ik wil duidelijke en leuke data, data over een discotheek. zei hij”. “Iedereen snapt dit”.

Het moet toch slimmer kunnen dan alleen Excel? Het eerste prototype ontstond in R, een van origine statistische taal. Al snel volgde andere docenten die ook datasets wilde. Vanuit daar is het product DataSampler gegroeid: een datamodel dat je zelf kunt definiëren. Daarin kun je zelf samenstellen hoe je data eruit komt te zien met allerlei relaties tussen de tabellen. Zelfs als het datamodel niet verandert kan de uitkomst iedere keer net even anders zijn. Hierdoor is de dataset ook voor andere lessen te gebruiken, antwoorden zijn meestal niet te kopiëren.

Templates

Voor DataSamler zijn er meerdere templates. Klanten kunnen op basis van templates hun eigen project inrichten of een van de templates kiezen. Riens: “In de basis is er één DataSampler. Als je daar een abonnement op neemt kun je met een basisset beginnen, en die kun je volledig tailor-made maken.”. Naast een template voor een Discotheek zijn er templates voor een sauna, zonnepanelen, telecombedrijf, klantenservice, en een koffiezaak. Voor ieder wat wils.

De DataSampler kan naast educatieve doeleinden ook ingezet worden voor demonstratieve doelen. Denk bijvoorbeeld aan het vullen van een dashboard met realistisch ogende gegevens. Stel je maakt een applicatie, dan kun je die ‘vullen’ met de data vanuit DataSampler om zo een realistische proof-of-concept te geven.

Toekomstmuziek

De datawereld staat niet stil en daarom de producten van Cmotions ook niet. Er zijn dan ook genoeg ideeën voor verdere producten, zoals een tool voor segmentatie en een tool voor forecasting.

Jeanine: “Maar we hebben meer goede ideeën dan we op dit moment uit kunnen voeren. Hier kunnen we iets gaafs mee doen. Alleen een product neerzetten is niet makkelijk, we zijn zelf pas tevreden als we onze klanten meer kunnen geven dan ze van ons verwachten.”

Op de website van Cmotions vind je meer informatie over de twee Data Science off the Shelf diensten.

data science of the shelf
Kilian Drewel
Techblogger

schrijf je in voor de nieuwsbrief

Ontvang de nieuwste blogs van True elke twee weken in je mail

Workspace - 19.03.2020

Om te communiceren in deze crisistijd nemen veel bedrijven maatregelen om dit zo effectief mogelijk te maken. Medewerkers worden verplicht om thuis te werken en dat levert toch een flink aantal vraagstukken op. Want hoe kun je het best online samenwerken met je collega’s? Microsoft Teams biedt een uitkomst. In dit artikel een overzicht met […]

Cloud - 25.09.2020

Net zoals alle andere Microsoft-evenementen was Microsoft Ignite 2020 dit jaar volledig digitaal. Ignite staat jaarlijks in het teken van ontwikkelingen die relevant zijn voor het partnernetwerk van de techgigant uit Redmond. Met talloze nieuwtjes was zelfs de digitale versie een geslaagde editie. We beschrijven een paar van de interessantste ontwikkelingen voor je in deze […]

Workspace - 12.08.2020

Het gebruik van Microsoft Office 365 groeit hard, maar trekt daarmee ook de aandacht van kwaadwillenden, zeggen cybersecurity onderzoekers van FireEye Mandiant tegen ZDNet. Volgens de onderzoekers is de hoeveelheid opgeslagen data in Office 365 enorm en zijn aanvaller hier in geïnteresseerd. Een van de voordelen is dat de data wordt opgeslagen in de cloud, […]

Blijf op de hoogte en schrijf u in voor onze nieuwsbrief
Schrijf u in voor de nieuwsbrief

Vraag offerte aan

Vul onderstaand formulier in. True neemt zo snel mogelijk contact met u op.