Toelichting

Datastreams zijn een set bestanden waarin de vastgelegde gegevens in de Xpert Suite in makkelijk analyseerbare vorm worden aangeboden. Deze zijn daardoor te gebruiken in eigen analyse tools zoals PowerBI, Qlik, Tableau, etc. Tevens kunnen ze verrijkt worden met gegevens uit andere bronnen. Van deze bestanden is beschrijvende documentatie aanwezig, zodat elke data-analist hiermee aan de slag kan zonder verdere noodzakelijke hulp van consultants van Otherside at Work.

De streams worden geplaatst op een door OaW beschikbaar gestelde SFTP locatie. 

De data is in een aantal feiten en dimensies georganiseerd. Hierdoor zijn de getallen in de feiten via simpele optellingen te gebruiken om zaken als ‘verzuimpercentage’, ‘aantal verzuimmeldingen’, ‘omzet’ te berekenen. Het aantal gegevens zal blijven toenemen.

 

Versies

Datastreams is een dienst die wordt aangeboden in abonnementsvorm en wordt daardoor ook doorontwikkeld. 

Er worden regelmatig nieuwe gegevens en streams toegevoegd.   

Om te voorkomen dat het ETL proces van de klant omvalt worden bestaande bestanden NIET gewijzigd. Mocht dit wel nodig zijn, dan wordt er een nieuwe versie gereleased.  

Nieuwe bestanden worden binnen de huidige versie wel toegevoegd, maar nieuwe bestanden en/of nieuwe versies zullen altijd in de release notes van XpertSuite aangekondigd worden. 

Als er een nieuwe versie beschikbaar komt worden de oude versies nog maximaal een jaar ondersteund. Op initiatief van de klant worden deze aangesloten op de nieuwe versie. Echter voordat dit gebeurt, zal er eerst een proefdump geleverd worden.

 

Sleutels

Elk bestand bevat een Primary key, wat een HASH is van de identificerende velden van het betreffende record. Hiermee kun je dus atijd het betreffende record uniek identificeren. Daarnaast bevat elk bestand een Record key, wat een HASH is van de attribuut velden en welke wijzigt zodra een (of meer)  attrbuutvelden zijn geupdatet.  De relatie tussen de bestanden vindt plaats via Dimensie sleutels (DIM) .De meeste bestanden hebben een DIM of FACT sleutel die in andere bestanden ook kan voorkomen. Via deze velden kunnen de verschillende bestanden dan gekoppeld worden.   

 

Medisch / niet medisch

Standaard wordt data dat gekenmerkt wordt als Medisch in de streams gefilterd, zoals bijvoorbeeld in formuliervelden of vragenlijsten het geval is. Op verzoek kan deze medisch gekenmerkte data worden toegevoegd.

 

Anoniem / niet anoniem

De dimensies Werkgever, afdeling en werknemer zijn in zowel een anonieme als een niet anonieme versie beschikbaar. Beide zijn in deze documentatie beschreven. De keuze of er anonieme streams worden afgenomen, bepaalt welke van de twee streams er geleverd wordt.

 

FULL load / incrementeel

De streams zijn beschikbaar als FULL load of als INCREMENTELE dump. In het eerste geval wordt alle data geleverd, maar dit kan in sommige gevallen een hoop data opleveren. Als voor een incrementele dump gekozen wordt, dan worden alleen de mutaties gestuurd sinds de laatste levering OF van de afgelopen x weken/maanden.  Bij de incrementele dumps worden ook de verwijderde records eenmalig aangeleverd. Deze zijn herkenbaar aan de primary key. De recordkey bevat de text:   ""Deleted"" en de attributen zijn in dat geval leeg.

 

Randvoorwaarden 

  1. DataStreams kunnen alleen beschikbaar gesteld worden als Opdrachtgever ook de bijbehorende Xpert Suite module afneemt en geactiveerd heeft.
  2. De verwerkingsverantwoordelijkheid voor de geleverde DataStreamsligt bij Opdrachtgever.
  3. De bestanden (keuze uit CSV, Excel of XML formaat) worden dagelijks beschikbaar gesteld via een SFTP server.
  4. In de bestanden zijn sleutel-ID’s en hash-waardes van de beschrijvende attributen opgenomen.
  5. Conversie, opslag en analyse tools om de DataStreams te verwerken zijn niet opgenomen in de standaard scope.