Synthetische dataset generator voor testen

Onderzoek naar de juiste methode en tooling waarmee een synthetische test-dataset kan worden gegenereerd. Daar draait deze opdracht om. Om vervolgens een prototype van een dataset generator te bouwen die de basis kan vormen voor de database generator die we bij projecten van klanten gaan gebruiken.

Benodigde interesse(s)

  • Behaviour Driven Development
  • Data flows
  • Systeemintegratie
  • SQL/Python/dotnet/Machine Learning
  • Testen
  • OTAP release proces
  • Data modellen

Wat krijg je

  • Een uitdagende afstudeeropdracht
  • € 1000 vergoeding, € 500 + leaseauto of € 600 + woonruimte
  • Professionele begeleiding
  • Trainingen gericht op jouw afstudeertraject
  • Sparren met andere afstudeerders en collega’s
  • Twee vakantiedagen per maand

Wat je gaat doen

  • 35% Afstudeeronderzoek
  • 40% Analyseren, ontwerpen, realiseren
  • 25% Documentatie

Omdat privacy wet- en regelgeving is aangescherpt, is het nu meer dan ooit belangrijk om geen productiegegevens te gebruiken op een ontwikkeltest en applicatie omgeving. Om functionaliteit te ontwikkelen en te testen dient er een test-dataset gemaakt en goedgekeurd te worden. Maar een test-dataset dekt niet:

  • Alle scenario’s
  • Volume van data
  • Integratie tussen diverse applicaties
  • Een bepaalde tijdspanne voor een regressietest

Een voorbeeld: In een klantomgeving met een CRM-systeem en een financieel systeem kun je geen gebruik maken van willekeurig gegenereerde test-data voor klantgegevens. In dit geval zullen de systemen niet op elkaar aansluiten. De test-dataset zal synthetisch voor moeten komen in beide systemen.

We weten nog niet de juiste methode en tooling waarmee een synthetische test-dataset kan worden gegenereerd. Met dit probleem ga jij aan de slag.

De opdracht

Binnen Info Support hebben we veel oplossingen die de data combineren van geïntegreerde applicaties. Voor de afstudeeropdracht krijg je een datamodel waarvoor test-data gegeneerd kan worden.

Op basis van een data-model, ga je verschillende methodes, tooling en code onderzoeken waarmee je een synthetische dataset kunt generen. De methodes, tooling en/of code dienen te voldoen aan de gestelde eisen van de opdrachtgever. Na dit onderzoek wordt de meest geschikte methode, tooling of code uitgezocht en wordt een deliverable opgeleverd. Een protoype van deze dataset generator kan als basis dienen voor verdere ontwikkeling van een dataset generator die we bij projecten van klanten gaan gebruiken.

Meld je aan voor deze opdracht

  • Geaccepteerde bestandstypen: docx, doc, txt, pdf.
  • Geaccepteerde bestandstypen: docx, doc, txt, pdf.

Sollicitatieprocedure

  1. 1
  2. Kennismakingsgesprek

    Bespreek (studie) loopbaan, interesses en ambities en introductie Info Support.

  1. 2
  2. Beoordelingen

    Assessment van professionele kennis en persoonlijkheid (capaciteit, competenties en motieven).

  1. 3
  2. Selectie interview

    Professionele kennis en persoonlijkheid verdiepen.

  1. 4
  2. De ondertekening van een contract

    Contractaanbieding en uitnodiging voor tekenmomenten.