Data Management

Datamigratie is meer dan “data” migratie

Recentelijk ben ik gevraagd voor een datamigratie project. Mijn derde over de afgelopen 5 jaar. Een logisch verzoek? Ervaring is wat telt in onze business, maar ik vraag me wel eens af hoe expert je daarin kunt zijn. Datamigratie is tenslotte toch gewoon data van het ene naar het andere systeem overzetten? Of omvat het meer? M.a.w. wat zijn eigenlijk de succesbepalende factoren?

Datamigraties kunnen behoorlijk verschillen. Althans, dat is mijn ervaring, kijkend naar de aanleiding waarbij de datamigratie noodzakelijk was. Enkele voorbeelden met daarbij één van de uitdagingen, die ik in mijn praktijk ben tegengekomen:

  • Database platformmigratie van bijvoorbeeld DB2 naar Microsoft waarbij de databasestructuur dezelfde dient te blijven. Dit is een puur technische datamigratie. De uitdaging zit dan met name in welke mate beide platformen op technische functionaliteit overeenkomen en 1-op-1 zijn over te zetten. Hoe reëel is het om als uitgangspunt te nemen, dat de applicatie ongewijzigd moet blijven functioneren?
  • Herbouw of vernieuwbouw van een applicatie. Uitfasering van legacy kan bijvoorbeeld de aanleiding zijn. In zo’n traject wordt functionaliteit en datastructuur integraal opnieuw ontworpen en gespecificeerd. Hoe geef je vorm aan de datamigratie als er in het begin nog veel onduidelijkheid bestaat, en dus wanneer kun je daarmee beginnen?
  • Vervanging van een maatwerkapplicatie door een standaardpakket. Welke kennis en aanpak heb je nodig om tot specificatie van de datamigratie te komen?

De vraag is, hoe standaard een datamigratie eigenlijk kan worden aangepakt. Globaal zie ik dezelfde stappen terugkomen: scope bepaling, bronanalyse en kwaliteitsbeoordeling, vaststelling van de strategie, uitvoering geven aan schoning, opstellen van de datamapping, realisatie/test, proefmigratie(s), vaststellen controle(s) en uiteindelijk de definitieve migratie. Mijn ervaring is dat elke datamigratie haar eigen specifieke omstandigheden kent. Datamigratie, in de kern het migreren van data, staat eigenlijk nooit los. Het maakt altijd onderdeel uit van een groter geheel.

Er langer over nadenkend komen er steeds meer vragen boven, zoals wat zijn de factoren die de omstandigheden van de datamigratie bepalen? Of welke systeemspecifieke aspecten zijn er om rekening mee te houden? Dus is het relevant om de (rand)voorwaarden en impact daarvan op de datamigratie vast te stellen. Maar hoe kom je tot de juiste specificaties? Hierna wat vragen en overwegingen, die nog niet eens op de inhoud betrekking hebben, maar wel in hoge mate de aanpak van de datamigratie bepalen:

  • Systemen werken vaak samen binnen het applicatielandschap en wisselen via interfaces gegevens uit. Dat vereist wederzijdse afstemming op inhoud en afhankelijkheid (metadata, masterdata).
  • Hoe zit het met het eigenaarschap en het beheer van data? In elk project staat data governance niet ter discussie, maar krijgt toch vaak onvoldoende aandacht. Door dit al vroeg in het migratietraject te adresseren, kun je beter aansluiten op bestaande werkwijze dan wel alvast anticiperen op de gewijzigde en gewenste situatie bij implementatie. Een goede voorbereiding is het halve werk.
  • Hoe is het gesteld met data kwaliteit (data analyse)? Binnen welke grenzen of onder welke condities mag worden ingegrepen om die kwaliteit te verbeteren?
  • Welke mogelijkheden zijn er om data in te laden: rechtstreeks naar de doeldatabase, via een importmechanisme of via functionele koppelingen (API’s, services).
  • Hoe stabiel zijn beide systeemomgevingen, wordt er nog actief op ontwikkeld?
  • Is het een volledige systeem migratie of een gefaseerde migratie op onderdelen?
  • Welke aanpak is de juiste: alle data vanuit het bronsysteem overzetten of je vanuit het doelsysteem afvragen welke data moet worden aangeleverd? En wat doe je met data die niet meegaat?
  • Welke eisen worden er gesteld aan de locatie waar en hoe de feitelijke datamigratie wordt uitgevoerd?
  • Hoe dient met privacy gevoelige data te worden omgegaan?
  • Welke doorlooptijd krijgt de feitelijke uitvoering van de datamigratie?

Naast de hiervoor genoemde randvoorwaardelijke zaken, speelt in elke datamigratietraject de data op inhoud ook haar rol. Dat dit in projecten de nodige uitdagingen kent, is evident. Denk maar eens aan de datastructuur in termen van sleutelgegevens en kardinaliteit. Of aan de gegevensdefinities van zowel entiteiten als haar attributen. Die hoeven niet perse een 1-op-1 vertaling te zijn van de oude naar het nieuwe systeem.

Zoals je ziet roept een datamigratie dus vooral veel vragen op voordat er echt met datamigratie aan de gang kan worden gegaan. Elk systeem heeft haar eigen manier van inrichting en gebruik. Het kunnen inladen van data in het doelsysteem is maar een eerste stap. Het kunnen werken met die gemigreerde data een tweede, maar eigenlijk wel de belangrijkste. Om in zo’n complex geheel structuur aan de datamigratie te geven, is mijn advies:

  • Bepaal de data scope, welke data moet mee of mag juist niet mee. Maak hierbij onderscheid naar stam-, master- en transactiedata.
  • Stel vast wie er functioneel bij betrokken zijn en wat hun rol is? Een CRUD-matrix op de data (entiteiten) geeft overzicht, verband en context.
  • Ontwikkel de processen op use case basis, waarbij de datamigratie in die context gelijk meegaat. Dat geeft richting en toetst de gemigreerde data direct in een gebruiksmatige context. Dat voorkomt veel re-work.
  • En last but not least, vergeet de te maken keuzes qua bedrijfsvoering niet. Deze vormen de contouren hoe de business haar diensten wil aanbieden, waarbij het doelsysteem de daarvoor de noodzakelijke administratie moet voeren.

Is datamigratie dan een kunstje of moet je dan daarvoor een expert zijn? ’t Is maar hoe je het bekijkt. Een greep uit de gereedschapskist van de datamigratie specialist: data analyse, data kwaliteitsdenken, datamodelleren, data integratie (ETL-tool), data management en governance. Een breed en allround specialisme dus. Maar gelukkig is er binnen menig project zoveel te doen dat deze vaardigheden niet onder één pet aanwezig hoeven te zijn. Een datamigratieteam kan hier prima op alle fronten meedenken om datamigratie als een specialisme in het project te organiseren en tot uitvoering te brengen.

Natuurlijk gaat het bij datamigratie om data. De data zelf is zeker belangrijk, maar diezelfde data maakt ook onderdeel van een groter geheel. Mjn ervaring is dan ook dat er in praktijk veel meer bij komt kijken dan het woord datamigratie feitelijk weergeeft. En dat wordt nog wel eens onderschat. Mijn tip in deze is: zet de data centraal in de vierhoek organisatie (business), proces, beheer en techniek. De data is daarin het gemeenschappelijke middel, waarmee vanuit al die vier invalshoeken het project in samenhang antwoord dient te geven hoe de datamigratie moet worden vormgegeven en uitgevoerd. Daarmee is datamigratie de spin in het web van het project. Het gaat om meer dan data alleen!

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *