maandag 29 oktober 2012

Semantic Web en HTML Microdata



Semantic Web is het web van de verbonden data
In mijn post Helpen Schema's bij Zoekmachine Optimalisatie? besteed ik aandacht aan een mogelijke invloed van de implementatie van Schema.org in de content van een website, op de positie in de SERPs (search engine result pages). In het huidige bericht wil ik meer technische aspecten belichten om de verbanden te laten zien tussen Schema.org, HTML Microdata en HTML 5.0 

Tot nu toe is het wereldwijde web (oftewel in het Engels "world wide web" - www) een verzameling van documenten en toepassingen, die over het internet met elkaar verbonden zijn, of kunnen zijn. In de laatste decennia ontstonden er – logische – behoeftes aan een upgrade van het “wereldwijde web van documenten” naar het “wereldwijde web van data”. Een duidelijke voordeel van zo’n upgrade is dat het wereldwijde web veel slimmer gaat worden. Dan krijgen wij inderdaad het wereldwijde web van de verbonden data in de vorm van de een globale gegevensbank, waarin netjes gestructureerde gegevens klaar liggen voor die intelligente benadering. 

Het World Wide Web Consortium (W3C) heeft het wereldwijde web van de verbonden data verwoordt in de term "Semantic Web". Tot op heden heeft het W3C de leidende rol in de ontwikkeling en de standaardisering van gerelateerde internettoepassingen en technologieën.


HTML Microdata is de kern van Semantic Web
Simpelweg zijn de HTML Microdata de bouwmiddelen van de gestructureerde gegevens voor het wereldwijde web. In de strikte formele wijze zijn de HTML Microdata gedefinieerd als de syntaxis van de gestructureerde gegevens. Deze syntaxis regelt dat leesbare gegevens ingebouwd kunnen worden in de HTML-documenten met een ondubbelzinnig parsingmodel. Met andere woorden, ruïneert de syntactische structuur van de HTML Microdata de bestaande en toekomstige HTML websites niet. De huidige standaard van de HTML Microdata maakt deel uit van HTML 5.0 en wordt onderhouden door het W3C Consortium.




Schema.org omvat de eerste woordenschat van de HTML Microdata
Ja, inderdaad, Schema.org omvat de eerste “officiële” woordenschat (in het Engels - vocabulary) in de HTML Microdata taal. Dus, Schema.org is geen taal op zich, maar een gestructureerde woordenschat (lees ‘gegevensbank’), die door de Google, Yahoo en Bing gegarandeerd ondersteunt gaat worden. Hier is een voorbeeld van het gebruik van de Schema.org.



Een webpagina over de film Plan C met de implementatie van de schema-code (in vet lettertype) ziet er ongeveer zo uit:

<div itemscope itemtype="http://schema.org/Movie">
 <h1 itemprop="naam">Plan C</h1>
  <span>Filmregisseur: <span itemprop="director">Max Porcelijn</span></span>
  <span itemprop="genre"> Komedie, Thriller </span>
  <a href="../movies/ plan_c.html.html" itemprop="trailer">Trailer</a>
</div>

De verhouding tussen de microdata-taal en de schema-code wordt gegeven in de volgende illustratie: 



Semantic Web on its way!
De grote zoekmachinebedrijven Google, Bing en Yahoo hebben gezegd dat de weg van het “wereldwijde web van documenten” naar het “wereldwijde web van de verbonden data” begonnen is. Het gezamenlijke platform Schema.org is daarvan het overduidelijke bewijs.








donderdag 18 oktober 2012

Helpen Schema's bij Zoekmachine Optimalisatie?


Schema.org is een nieuw initiatief van Google, Yahoo en Bing. Het is een platform voor het creëren en ondersteunen van gemeenschappelijke standaarden voor de gestructureerde gegevens op webpagina's. Deze standaarden heten schema's. De schema’s zijn verzameld op de schema.org site. Met schema’s kunnen webmasters en ontwikkelaars schema’s creëren of bestaande schema’s hergebruiken die relevant voor hun webcontent zijn. In feite vergemakkelijken ze de taak van de zoekmachines die de webcontent analyseren en indexeren.

Hierover kunt u alles lezen op:

Dus nu weten we dat. Nu is de vraag: hoe zal Schema.org de zoekmachine optimalisatie processen (SEO) beïnvloeden? 




In een eenvoudig bewoording


Schema is slechts een klein stukje code, die toegevoegd is aan de HTML bron code. Deze schema-code geeft aan waar een webpagina of een deel van de webpagina over gaat. Er is niets magisch aan, alleen maar bekende HTML tags met wat extra schema-attributen. U kunt meer leren over specifieke schema-attributen op de Schema.org - Getting Started site.

Hier is een voorbeeld van hoe de schema-code in een webpagina kan worden ingebouwd:

Stel dat wij een webpagina over de film Quiz hebben, dus een pagina met een link naar een filmtrailer, informatie over de filmregisseur, en ga zo maar door. Onze HTML-code ziet er ongeveer zo uit:

 <h1>Quiz</h1>
 <span>Filmregisseur: Dick Maas (Heemstede, 15 april 1951)</span>
 <span>Thriller</span>
 <a href="../movies/quiz_trailer.html">Trailer</a>

Het implementeren van de schema-code (in vet lettertype) verandert deze HTML-code op de volgende manier:

<div itemscope itemtype="http://schema.org/Movie">
 <h1 itemprop="naam">Quiz</h1>
  <span>Filmregisseur: <span itemprop="director">Dick Maas</span> (Heemstede, 15 april 1951)</span>
  <span itemprop="genre">Thriller</span>
  <a href="../movies/quiz_trailer.html" itemprop="trailer">Trailer</a>
</div>

Ten eerste, maakt u zich geen zorgen: door de schema-code verandert het beeld van de oorspronkelijke HTML-code in een webbrowser niet:


Maar nu is de informatie over de film Quiz ook (naast de bestaande content) aangegeven als gestructureerde data volgens het Movie schemastandaard (http://schema.org/Movie) op de webpagina. Deze gestructureerde data dient als input voor de zoekmachines. Maken de webpagina’s met geïmplementeerde schema’s dan meer kansen op een hogere positie in de zoekresultaten van de zoekmachines? Het antwoord op deze vraag is 1 miljoen euro waard, tenminste vandaag. 


Hoe zal Schema.org de zoekmachine optimalisatie processen (SEO) beïnvloeden?

Op dit moment kunnen we alleen veel gissen en voorspellingen doen. Sterker nog vanaf 2011 is er geen aantoonbaar bewijs dat schema’s de ranking van een aantal websites, die de schema-code  ingebed hebben, geholpen hebben.

Maar mijn mindset vraagt zich af: waarom niet? Mijn buikgevoel zegt dat niet voor niks  Google, Yahoo en Bing kwamen met dit initiatief!  Immers, het internet is een snel terugkoppelend platform waarin je kunt doen en laten wat je wilt en zaken snel kunt corrigeren. 

Persoonlijk heb ik al op enkele van mijn websites de schema-code geïmplementeerd. Tot nu toe gebeurde niks bijzonders, zoals extra bezoekersverkeer of een hogere positie op de SERP’s (search engine results page), maar ik zal dit blijven “monitoren”. 


Tot slot

Ik wil een aantal zorgen over de schema-initiatief van Google, Bing en Yahoo toch toevoegen aan deze post. Dit initiatief creëert een afstand met het W3C (het World Wide Web Consortium). We weten dat het W3C een internationale organisatie is, waar de organisatie, de fulltime medewerkers en het publiek samenwerken aan de ontwikkeling van internettoepassingen, en een rol speelt als de erkenbare standaardhouder voor deze internettoepassingen “voor iedereen”. 

W3C ontwikkelt al enkele jaren 'Semantic Web’-technologie, waarvan de doelen vergelijkbaar zijn met die van de schema’s van Google, Bing en Yahoo. Ik ben echter bang dat het schema-initiatief als platform kan dienen voor een toekomstige monopolie op dit gebeid exclusief voor deze grote internetbedrijven, terwijl de ‘Semantic Web’-technologie van W3C een open standaard is.