Reconciliatie

Kan ik het Termennetwerk gebruiken voor reconciliation, bijvoorbeeld in OpenRefine?

Ja! Het Termennetwerk biedt een Reconciliation Service waarmee je je data kunt matchen met termen. Hierdoor wordt het mogelijk om woorden om te zetten naar URI's, bijvoorbeeld van 'Rembrandt' naar diens URI in de bron RKDartists, https://data.rkd.nl/artists/66219. Dit proces heet reconciliation. Met de Reconciliation Service kun je deze omzettingen geautomatiseerd doen, voor een hele dataset. Dat bespaart je enorm veel tijd.

Je kunt de Reconciliation Service gebruiken in OpenRefine. Handleidingen hiervoor vind je in de volgende documenten:

Welke aandachtspunten zijn er bij het gebruik van het Termennetwerk voor reconciliation?

  • het Termennetwerk biedt weliswaar de Reconciliation Service, maar het daadwerkelijk matchen van termen wordt gedaan door de terminologiebronnen, niet door het Termennetwerk. Je zoekt dus altijd in de bronnen zelf, waardoor je altijd met actuele termen werkt. Dit betekent ook dat de snelheid waarmee termen gematcht worden, afhankelijk is van de bronnen; soms gaat dit snel, soms duurt dit iets langer. Ga ook verstandig om met de hoeveelheid woorden waarop je zoekt: de bronnen kunnen flink belast worden als het om grote aantallen gaat.
  • het Termennetwerk kan slechts eenvoudig zoeken in terminologiebronnen. Het heeft bijvoorbeeld geen weet van de types van termen, bijvoorbeeld of bronnen bestaan uit 'personen', 'plaatsen' of 'gebeurtenissen'; voor het Termennetwerk zijn alle termen van het type 'concept' ('skos:Concept'). Dit betekent dat het Termennetwerk meer matches kan vinden dan je nodig hebt.
  • bij het reconciliëren in OpenRefine moet je de optie Reconcile against no particular type selecteren.

Wat betekent het getal tussen haakjes achter elk zoekresultaat?

Dat is de procentuele relevantiescore van de zoekresultaten (op een schaal van 1 t/m 100). De score geeft aan in hoeverre elke gevonden term overeenkomt met de zoekwoorden. Omdat de terminologiebronnen dit niet zelf ondersteunen, wordt de score toegekend door het Termennetwerk. De score wordt bepaald op basis van de letterlijke overeenkomst tussen enerzijds de zoekwoorden uit je data en anderzijds de naam en alternatieve labels van elke term.

Wanneer bijvoorbeeld het woord ‘glas’ voorkomt in je data:

  • krijgt een gevonden term met naam ‘glas’ score 100%
  • een term met naam ‘breukglas’ score 55%
  • en een term met naam ‘borosilicaatglas’ en alternatief label ‘boraxglas’ ook score 55%.

Welke terminologiebronnen kan ik gebruiken voor reconciliation?

Hieronder vind je een lijst van beschikbare bronnen. Bij elke bron staat diens URL vermeld. Deze URL heb je bijvoorbeeld nodig om de bron te kunnen inrichten in OpenRefine als zogeheten 'Standaarddienst'.

Merk op: het Termennetwerk biedt niet voor alle bronnen een Reconciliation Service. Sommige bronnen hebben zelf al zo'n service, zoals Wikidata.