Veelgestelde vragen over het Datasetregister door ontwikkelaars die datasets willen vinden

Op welke wijze kan ik het Datasetregister doorzoeken?

Het Datasetregister biedt toegang tot datasetbeschrijvingen van erfgoedinstellingen. Via een frequente crawl worden de datasetbeschrijvingen in schema.org/Dataset of DCAT opgehaald, getransformeerd naar DCAT en opgeslagen in een openbare triplestore. Deze triplestore - op basis van GraphDB - heeft een web-gui die is te bereiken via https://qlever-ui.demo.netwerkdigitaalerfgoed.nl/datasetregister.

Is er een API op het Datasetregister?

Ja, twee zelfs. Eén is gericht op de erfgoedinstellingen (en hun IT-leveranciers) en betreft vooral het valideren en aanmelden van datasetbeschrijvingen.

De tweede API is gericht op ontwikkelaars die datasets willen vinden: het SPARQL-endpoint https://datasetregister.netwerkdigitaalerfgoed.nl/sparql.

Wat voor data vind ik in het Datasetregister?

Het Datasetregister bevat geen datasets, wel bevat het datasetbeschrijvingen en deze bevatten referentie naar (distributies van) data. Dit kunnen bestanden/datadumps zijn (bijvoorbeeld gecomprimeerde XML, CSV, NT bestanden) of API's (bijvoorbeeld OAI-PMH, SPARQL, SRU). Wanneer een datasetbeschrijving bij de bron wordt opgehaald en gevalideerd, dan wordt deze in een eigen graaf opgeslagen op basis van dcat:Dataset. De URL van de graaf correspondeert met de IRI van de dataset. Datasetbeschrijvingen die worden geleverd op basis van schema.org - zoals geadviseerd in de Requirements for Datasets - worden geconverteerd naar DCAT. Meer informatie hierover op de datamodel-pagina.

Onderstaande afbeelding geeft de gelaagdheid aan van datasetbeschrijvingen:

Zijn er voorbeelden van SPARQL queries?

Eenvoudige voorbeelden van zoek queries vindt je op de Doorzoek pagina. Dit is in wezen een SPARQL-generator die op basis van je zoekvraag een SPARQL-query maakt en afvuurt op de triplestore. Je vindt er ook een link om de gegenereerde SPARQL-query in de web-gui van de triplestore te openen.

Een andere manier om gevoel te krijgen bij de mogelijkheden is de data story. Alleen nog beschikbaar in het Nederlands, maar via de blauwwe pijl boven de resultaat tabellen tover je de SPARQL-query naar voren waarmee de gegevens voor tabel eronder zijn verkregen. Pas de query aan en je ziet gelijk het resultaat!

Wat mag ik met de data uit het Datasetregister?

Het gebruik van het SPARQL-endpoint staat open voor iedereen, zonder enige drempel. De datasetbeschrijvingen zelf worden door erfgoedinstellingen onder een open licentie beschikbaar gesteld. Je vindt dit terug in de verplichte property schema:license. De distributies binnen een dataset (dus de daadwerkelijke data) kunnen onderhevig zijn aan een meer restrictieve licentie.

Wie maakt en beheert het Datasetregister?

Het Datasetregister is gemaakt door de samenwerkende erfgoedinstellingen in het Netwerk Digitaal Erfgoed en wordt beheerd en onderhouden door het Nationaal Archief. Het Nationaal Archief staat in voor de werking en beschikbaarheid van het Datasetregister.

Wat is de status van het Datasetregister?

Het Datasetregister is klaar om verder gevuld te worden. De requirements, API en deze website zijn stabiel en worden op basis van feedback van gebruikers en leveranciers verfijnd.

Kan ik het Datasetregister nu al gebruiken?

Jazeker! Het Datasetregister wordt nog doorontwikkeld en nog verder gevuld, maar nu al te gebruiken. We horen dan ook graag wat je ervan vindt. Bijvoorbeeld: zijn de zoekmogelijkheden toereikend? Is de API bruikbaar?

Ga je aan de slag?

Ga je aan de slag met het publiceren van datasetbeschrijvingen en de API op het Datasetregister, laat het weten, zodat we je op de hoogte kunnen houden van ontwikkelingen, updates en beschikbaarheid.

Meer weten?

Heb je vragen en/of opmerkingen over de werking van het Datasetregister neem dan contact op met tech@netwerkdigitaalerfgoed.nl.