maandag 29 oktober 2012

Semantic Web en HTML Microdata



Semantic Web is het web van de verbonden data
In mijn post Helpen Schema's bij Zoekmachine Optimalisatie? besteed ik aandacht aan een mogelijke invloed van de implementatie van Schema.org in de content van een website, op de positie in de SERPs (search engine result pages). In het huidige bericht wil ik meer technische aspecten belichten om de verbanden te laten zien tussen Schema.org, HTML Microdata en HTML 5.0 

Tot nu toe is het wereldwijde web (oftewel in het Engels "world wide web" - www) een verzameling van documenten en toepassingen, die over het internet met elkaar verbonden zijn, of kunnen zijn. In de laatste decennia ontstonden er – logische – behoeftes aan een upgrade van het “wereldwijde web van documenten” naar het “wereldwijde web van data”. Een duidelijke voordeel van zo’n upgrade is dat het wereldwijde web veel slimmer gaat worden. Dan krijgen wij inderdaad het wereldwijde web van de verbonden data in de vorm van de een globale gegevensbank, waarin netjes gestructureerde gegevens klaar liggen voor die intelligente benadering. 

Het World Wide Web Consortium (W3C) heeft het wereldwijde web van de verbonden data verwoordt in de term "Semantic Web". Tot op heden heeft het W3C de leidende rol in de ontwikkeling en de standaardisering van gerelateerde internettoepassingen en technologieën.


HTML Microdata is de kern van Semantic Web
Simpelweg zijn de HTML Microdata de bouwmiddelen van de gestructureerde gegevens voor het wereldwijde web. In de strikte formele wijze zijn de HTML Microdata gedefinieerd als de syntaxis van de gestructureerde gegevens. Deze syntaxis regelt dat leesbare gegevens ingebouwd kunnen worden in de HTML-documenten met een ondubbelzinnig parsingmodel. Met andere woorden, ruïneert de syntactische structuur van de HTML Microdata de bestaande en toekomstige HTML websites niet. De huidige standaard van de HTML Microdata maakt deel uit van HTML 5.0 en wordt onderhouden door het W3C Consortium.




Schema.org omvat de eerste woordenschat van de HTML Microdata
Ja, inderdaad, Schema.org omvat de eerste “officiële” woordenschat (in het Engels - vocabulary) in de HTML Microdata taal. Dus, Schema.org is geen taal op zich, maar een gestructureerde woordenschat (lees ‘gegevensbank’), die door de Google, Yahoo en Bing gegarandeerd ondersteunt gaat worden. Hier is een voorbeeld van het gebruik van de Schema.org.



Een webpagina over de film Plan C met de implementatie van de schema-code (in vet lettertype) ziet er ongeveer zo uit:

<div itemscope itemtype="http://schema.org/Movie">
 <h1 itemprop="naam">Plan C</h1>
  <span>Filmregisseur: <span itemprop="director">Max Porcelijn</span></span>
  <span itemprop="genre"> Komedie, Thriller </span>
  <a href="../movies/ plan_c.html.html" itemprop="trailer">Trailer</a>
</div>

De verhouding tussen de microdata-taal en de schema-code wordt gegeven in de volgende illustratie: 



Semantic Web on its way!
De grote zoekmachinebedrijven Google, Bing en Yahoo hebben gezegd dat de weg van het “wereldwijde web van documenten” naar het “wereldwijde web van de verbonden data” begonnen is. Het gezamenlijke platform Schema.org is daarvan het overduidelijke bewijs.