22  Geodata

Let op: deze pagina is in ontwikkeling!

De inhoud van deze pagina is nog in ontwikkeling en is nog niet bruikbaar.

22.1 Introductie

Niks is zo magisch als de eerste keer plotten van informatie op een kaart. Je hebt een dataset met een x-coördinaat en een y-coördinaat, je voert wat code uit, en je hebt een kaartje.

Maar het plotten van data is nog maar het begin, want je kunt nog veel meer met geografische data. Denk bijvoorbeeld aan het vinden van antwoorden op vragen als:

  • hoeveel vuilnisbakken zijn er gemiddeld per persoon per buurt in een gemeente?
  • hoe verhoudt zich dit tot het aantal meldingen van zwerfafval in diezelfde buurten?

of:

  • waar staan scholen met de grootste achterstandsscores?
  • en hoe verhoudt dit zich tot bepaalde buurtstatistieken?

En jij kunt vast nog veel meer vragen stellen die je misschien kunt beantwoorden met geodata.

In dit hoofdstuk behandelen we de meest relevantie kennis en vaardigheden die je nodig hebt om met geodata te werken. Na dit hoofdstuk:

  • weet je wat geodata zijn;

  • hoe je aan geodata komt;

  • hoe je geodata in R inleest;

  • hoe je (interactieve) kaarten maakt;

  • hoe je analyses kunt doen met geodata.

22.1.1 Opbouw van dit hoofdstuk

In de volgende paragraaf geven we een korte introductie in wat geodata is, hoe dit in data wordt gepresenteerd en hoe je hiermee in R moet werken. In de tweede paragraaf gaan we gelijk aan de slag met het maken van onze eerste kaarten. In de derde paragraaf gaan we een aantal statistische berekeningen op geodata doen. In de laatste paragraaf geven we een aantal tips en reiken we je aanvullende resources aan.

22.1.2 Recourses

De belangrijkste resources voor dit hoofdstuk zijn:

22.2 Wat is geodata?

Wikipedia geeft de volgende definitie van geo-informatie:

Geo-informatie is de term voor informatie met een ruimtelijke component (locatie). ‘Geo-’ is hierin de afkorting van geografische (ruimtelijke).

De essentie van geodata is dus dat de data aan een specifieke geografische locatie of geografish gebied te koppelen is. Voorbeelden van geodata zijn bijvoorbeeld:

  • de locaties van lantaarnpalen;

  • buurt-, wijk- en gemeentegrenzen;

  • je eigen locatiegeschiedenis.

22.2.1 Hoe ziet geodata eruit?

Het kenmerkende onderscheid van

  • rasterdata

  • vectordata (simple features)

    • x-y

    • shapefile

22.2.2 Geodata in R

22.2.3 Waar vind je geodata?

De openbare beschikbaarheid van geodata is de laatste jaren enorm gegroeid. Hieronder vind je een overzicht van de belangrijkste bronnen van geodata.

22.2.3.1 Overheid

De belangrijkste bron van geodata die door de overheid wordt aangeboden is PDOK: Publieke Dienstverlening Op de Kaart. Zoals op de website staat:

Bij PDOK vind je open datasets van de overheid met actuele geo-informatie. Deze datasets zijn benaderbaar via geo webservices en beschikbaar als downloads. Daarnaast vind je hier inspirerende cases over de mogelijkheden van deze geo datasets.

22.2.4 sf-package: het werkpaard voor geodata

22.2.4.1 Data omzetten naar een sf-object

22.2.5 Coordinate Reference Systems

CRS

22.2.6

22.3 Inlezen van geodata

“Allemaal interessante achtergrondinformatie, maar hoe krijg ik die informatie dan in R?” Een goede en terechte vraag! We laten je aan de hand van een aantal voorbeelden zien hoe je geodata vanuit een bestand inlaadt en hoe je dat door middel van een API vanuit PDOK doet.

22.3.1 Inlezen: de basis

Inlezen van een geodata-bestand doen we door middel van de functie sf::st_read(). Deze functie vraagt een aantal parameters, waarvan de belangrijkste zijn:

  • dns: de databron van de geodata. Dit kan zowel een bestand, een map of een GeoJSON-link zijn. Dit is de enige parameter die je altijd moet opgeven.
  • layer: een geodata-bestand kan verschillende lagen (layers) hebben. Zo zijn er bestanden met de historische data van gemeentegrenzen. Elke laag geeft dan een ander moment in de tijd aan. Bij de layer-parameter geef je aan wélke layer ingeladen moet worden.
  • query: met een SQL-query kun je de in te laden data filteren. Dit is vooral handig bij hele grote datasets.

22.3.2 Vanuit een bestand

22.3.3 Vanuit PDOK (of een andere webservice)

Het inlezen van een bestand vanuit PDOK gaat eigenlijk hetzelfde als vanuit een bestand. Het enige wat je hoeft te weten is welke URL je aan de dns-parameter van de sf::st_read()-functie moet geven. Om hier goed antwoord op te geven moet je eerst weten wat WFS is.

WFS staat voor Web Feature Service. Zoals het in de PDOK-documentatie is omschreven:

De Web Feature Service is een webservice voor het opvragen van geografische vector data en de bijbehorende administratieve gegevens.

Het gaat dus over vectordata.

22.4 Het maken van een (interactieve) kaart

22.4.1 Statische en interactieve kaarten

  • leaflet

  • tmap

22.4.2 Point-data plotten

22.4.3 Shapefile plotten

22.5 Statistische berekeningen met geodata

22.6 Tips en verdere resources

22.6.1 Tips

22.6.2 Resources