Bruikbare big data: hoe de kloof tussen gegevenswetenschappers en ingenieurs te overbruggen

Het geroezemoes rond big data heeft tot een wijdverbreide misvatting geleid: dat het louter bestaan ​​ervan een bedrijf bruikbare inzichten en positieve bedrijfsresultaten kan opleveren. De realiteit is een beetje ingewikkelder. Om waarde te halen uit big data, heb je een bekwaam team van datawetenschappers nodig om het te doorzoeken. Bedrijven begrijpen dit voor het grootste deel, zoals blijkt uit de 15x - 20x groei in banen voor gegevenswetenschappers van 2016 tot 2019. Maar zelfs als u een bekwaam team van gegevenswetenschappers bij de hand heeft, moet u nog steeds de grote hindernis van die ideeën in productie brengen. Om echte bedrijfswaarde te realiseren, moet u ervoor zorgen dat uw ingenieurs en datawetenschappers met elkaar samenwerken. In de kern zijn datawetenschappers innovators die nieuwe ideeën en gedachten extraheren uit de data die uw bedrijf dagelijks opneemt, terwijl ingenieurs op hun beurt die ideeën opbouwen en duurzame lenzen creëren om onze data te bekijken. Gegevenswetenschappers hebben de taak gegevens te ontcijferen, te manipuleren en te verhandelen voor positieve bedrijfsresultaten. Om dit voor elkaar te krijgen, voeren ze verschillende taken uit, van datamining tot statistische analyse. Het verzamelen, ordenen en interpreteren van gegevens gebeurt allemaal om belangrijke trends en relevante informatie te identificeren. Hoewel ingenieurs zeker samenwerken met gegevenswetenschappers, zijn er enkele duidelijke verschillen tussen de twee rollen. Een van de fundamentele verschillen is dat ingenieurs een duidelijk hogere waarde hechten aan de "productiegereedheid" van systemen. Van de veerkracht en veiligheid van de door datawetenschappers gegenereerde modellen tot het daadwerkelijke formaat en de schaalbaarheid, ingenieurs willen dat hun systemen snel en betrouwbaar functioneel zijn. Met andere woorden: datawetenschappers en technische teams hebben verschillende dagelijkse zorgen. Dit roept de vraag op, hoe kunt u beide rollen positioneren voor succes en uiteindelijk de meest zinvolle inzichten uit uw gegevens halen? Het antwoord ligt in het besteden van tijd en middelen aan het perfectioneren van gegevens en technische relaties. Net zoals het belangrijk is om de rommel of "ruis" rond datasets te verminderen, is het ook belangrijk om alle wrijving tussen deze twee teams die een cruciale rol spelen in uw zakelijk succes te verminderen. Hier zijn drie cruciale stappen om dit te realiseren. Het is niet genoeg om gewoon een paar wetenschappers en een paar ingenieurs in een kamer te plaatsen en hen te vragen de wereldproblemen op te lossen. Je moet ze eerst elkaars terminologie laten begrijpen en dezelfde taal gaan spreken. Een manier om dit te doen is door de teams te trainen. Door wetenschappers en ingenieurs te koppelen in pods van twee, kunt u gedeeld leren aanmoedigen en barrières doorbreken. Voor datawetenschappers betekent dit het leren van coderingspatronen, het schrijven van code op een meer georganiseerde manier en, misschien wel het allerbelangrijkste, het begrijpen van de technische stack en de afwegingen van infrastructuur die betrokken zijn bij het introduceren van een model in productie. Geplaatst op 7wData.be