vrijdag 10 juni 2011

Handvest "semantiek van gegevens" (10 juni 2011)

  1. "Semantiek van gegevens" gaat over betekenis van gegevens.
  2. De betekenis van een gegeven is het gedrag dat op basis van dat gegeven wordt uitgevoerd.
    • Om er achter te komen welk gedrag wordt veroorzaakt door het gegeven, achterhaalt men door het gegeven weg te laten. Het verschil tussen het gedrag dat zonder het gegeven wordt uitgevoerd en het gedrag dat op basis van het gegeven wordt uitgevoerd, vormt de betekenis van dat gegeven.
  3. De betekenis van een gegeven is relevant als de kwaliteit van een gegeven belangrijk is.
  4. De kwaliteit van een gegeven komt overeen met de beoordeling van het gedrag dat op basis van een gegeven wordt uitgevoerd.
  5. De kwaliteit "k" van gegevens wordt uitgedrukt door het percentage
    k = 100 - 'percentage ontbrekende gegevens' - 'het percentage foutieve gegevens'
  6. Een gegeven is fout als het gegeven leidt tot gedrag dat niet voldoet.
    • Voor het bepalen van foutieve gegevens is het noodzakelijk dat bekend is wanneer het gedrag voldoet
  7. Een gegeven ontbreekt als het gedrag niet voldoet vanwege het ontbreken van het gegeven (bijv. het ontbreken van dat gedrag: er wordt iets niet gedaan en er had wel wat gedaan moeten worden)
  8. Als kwaliteit van gegevens niet belangrijk is, dan is semantiek van gegevens niet belangrijk.
    • Als degene die de gegevens wil gebruiken, niet of weinig geïnteresseerd is hoeveel gegevens er fout zijn en hoeveel gegevens er ontbreken, dan speelt semantiek geen rol.
  9. Semantiek van gegevens wordt ook toegepast bij hergebruik van gegevens.
  10. Er is hergebruik van gegevens als hetzelfde gegeven wordt gebruikt voor een ander doel dan het doel waartoe het gegeven aanvankelijk is gecreëerd.
  11. Een gegeven kan alleen begrepen worden vanuit zijn context
    • m.a.w. als men de context niet kent, begrijpt men ook het gegeven niet
    • als er een andere context is, dan is er ook een ander gegeven, ook al is het gegeven zelf helemaal niet veranderd
      • Voorbeeld: de WOZ waarde van onroerend goed wordt gebruikt voor het berekenen van het Eigen Woning Forfait, onderdeel van de Inkomstenbelasting. Een aantal gemeenten wilden de WOZ waarde ook gebruiken voor het aankopen van huizen van dubbele huizenbezitters. Deze huizenbezitters vonden de WOZ waarde te hoog voor de Inkomstenbelasting en te laag voor het verkopen van hun huis. Een dergelijke huizenbezitter is niet tegenstrijdig omdat context bepalend is voor betekenis. (terloops: de WOZ zelf kent ook 3 verschillende opvattingen over de waarde van onroerend goed: marktwaarde, herbouw waarde en verhuur waarde)
  12. De context van een gegeven bestaat uit:
    • een persoon of organisatie
    • in een bepaalde situatie (de omgeving waarvan men zich bewust is)
    • die een bepaald doel nastreeft
      • inclusief bepaalde criteria
    • die een bepaalde kennis heeft van de wereld
  13. Het begrijpen van de context hangt sterk af van de ervaring en het doel (dus ook weer een context) van degene die de context wil begrijpen. Kent deze persoon een soortgelijke context, dan is er minder informatie over de context nodig. Is de persoon slechts weinig bekend met de context van het gegeven, dan zal er veel gecommuniceerd moeten worden voordat deze persoon de voor hem bekende contexten kan relateren aan de context van het gegeven.
  14. Het communiceren over de context verloopt net zoals andere communicatie. 
  15. Er is veel bekend over hoe men effectieve communicatie kan creëren, zowel synchroon (gesprek) als asynchroon (schrift).
  16. De één heeft een gegeven volgens de ander begrepen als de één op basis van dat gegeven immer gedrag uitvoert dat door de ander positief wordt beoordeeld.
  17. Voor het koppelen (hergebruiken) van gegevens waarbij kwaliteit relevant is (men wil niet koppelen aan zomaar iets, men wil dat de koppeling ook op betekenisniveau voldoende is), is het noodzakelijk dat men de context kent. Zonder kennis van de context, kan men gegevens niet hergebruiken. Immers, voordat men een gegeven kan hergebruiken, moet men het gegeven eerst begrijpen.
  18. Koppelen van gegevens kan op 3 niveau's gebeuren:
    1. een mens beoordeelt of het gegeven geschikt is voor hergebruik
    2. middels een sleutel wordt een gegeven 'hard' gekoppeld aan een nieuw gegeven. De 2 contexten dienen dan dezelfde identificatie te gebruiken.
    3. middels algoritmes wordt een koppeling automatisch gelegd (fonetisch zoeken, automatische classificatie, business rules, etc.)
  19.  Voor het ontwerp en onderhoud van ieder van deze koppelingen, moet de context van het gegeven begrepen worden.

    Geen opmerkingen:

    Een reactie posten