Beschrijving van Statline (de CBS toegang tot de CBS gegevens):
- Statline is een grote bak met gegevens. Ieder gegeven zit in een cell. (ja, CBS hanteert engelse namen voor haar gegevensmodel)
- Statline kent verder:
- Rapporten. Een rapport is een verzameling gegevens waarvan CBS het de moeite waard vind dat die gezamenlijk wordt bekeken
- Een rapport kent dimensies. Een dimensie is een aspect van de gegevens.
- Iedere dimensie bestaat uit één of meer categorieën. Een categorie is zeg maar een waarde van een aspect. Bijv. de dimensie Regio's kent de categorie Apeldoorn.
- Ieder rapport kent één of meer topics. Een topic geeft aan wat het getal in de cell betekent. Ik zou dit zelf de eenheid willen noemen.
- Ik kan triples gaan maken tussen een dimensie en een categorie en vice versa met het predicate category dan wel dimension. Ik kan triples gaan maken tussen een categorie en een cell met het predicate van het topic dat in de cell wordt getoond. Het grote voordeel van deze benadering is dat ze correct is. De data bevatten deze informatie. Echter, ik krijg hier door per categorie heel veel cellen. Bijv. alle cellen voor Nederland, dat is een flink aantal.
- Ik kan de combinaties gaan maken van de categorieën. Deze combinaties van categorieën zijn nodig om uiteindelijk bij één cell uit te komen. Niet meer. Echter, de combinaties moet ik zelf gaan afleiden. Ze staan niet in de data. Plus een combinatie kan een zeer lange tekst worden. Dus dit heeft niet de voorkeur.
- Ik kan een facet classificatie gaan maken op het voorstel dat ik in punt 1 suggereer. Deze facet classificatie geeft mogelijkheden om het aantal cellen die verbonden zijn met één categorie, te verkleinen.
- Ik kan van iedere cell-inhoud laten zien welke triples er allemaal aan hangen. Echter, een cell-inhoud is niet ambigu: zo bestaan er cellen met de waarde 100%. Daarvan zijn er heel wat!!
Conclusie punt 1 plus punt 3. En omdat een facet classificatie wel nog wat tijd zal gaan kosten, beperk ik me even tot de Tabulator (extension voor Firefox) waarmee je keurig alle triples voor één object in één keer krijgt te zien:
Geen opmerkingen:
Een reactie posten