Google Bigdaddy datacenters

January 5th, 2006 - Posted by Ulco in Optimalisatie

Matt Cutts besprak de nieuwe technologie die vanaf nu langzaam in gebruik genomen zal worden door alle datacenters van Google. Via verschillende weblogs was er al een zogenaamd “Bigdaddy” datacenter bekend wat al een tijdje als test draaide. Nu is dus officieel aangekondigd dat deze technologie in de komende 1 à 2 maanden door alle datacenters in gebruik genomen zal worden.

Wat veranderd er?

Het is van de keer meer een technische ingreep om Google meer voorbereid op de toekomst te maken dan dat het daadwerkelijk wat voor de zoekresultaten betekend. Er wordt een nieuwe manier van indexeren toegepast en ook zullen de algoritmen anders te werk gaan. Belangrijkste reden voor de update is om de problemen met canonicalization, redirects, duplicate urls en www vs. non-www tegen te gaan. Hiervan hierna een kort overzicht.

Url canonicalization

Canonicalization betekend het kiezen van de beste URL waarop een document bereikbaar is. Vaak zijn documenten bereikbaar via verschillende URL’s waardoor problemen ontstaan, voorheen zag Google dit als “duplicate content” (kopieën) waardoor documenten delen van hun waarde konden verliezen. Als het goed is is dit nu verholpen en wordt er gewoon één document gekozen wat dan de volledige waarde zal krijgen. Een voorbeeld van url canonicalization is:

  • http://ulco.nl
  • http://ulco.nl/
  • http://ulco.nl/index.php
  • http://www.ulco.nl
  • http://www.ulco.nl/
  • http://www.ulco.nl/index.php

In het geval van deze website hebben we zelf al maatregelen genomen zodat zoekmachines zich hier niet in kunnen vergissen maar als het goed is zou Google dit nu ook eigenhanding zonder tussen oplossingen moeten kunnen.

302 Redirects

Een ander groot probleem waar Google een tijdje geleden mee geconfronteerd werd was het zogenaamde domain hijacking. Door een trucje met een 302 redirect was het mogelijk om de zoekresultaten van een domein te kapen. Als je dit slim deed was het mogelijk om voor elk keyword naar keuze op nummer 1 te komen. Google ondervondt dit zelf doordat iemand dit deed voor het keyword “adsense”.

Hiervoor is wel vrij snel een noodoplossing bedacht maar met de komst van de Bigdaddy datacenters moet dit probleem definitief tot het verleden horen.

Iets anders wat tegelijkertijd ook meteen opgelost wordt is de beslissing welke URL in de zoekresultaten moet komen als er gebruik gemaakt wordt van een 302 redirect. Denk hiervoor bijvoorbeeld aan domeinen die worden doorgestuurd naar een gratis host m.b.v. een 302 redirect. In principe is dit geen goede techniek maar het gebeurt wel dus moet Google er ook een oplossing voor vinden.

Bijvoorbeeld iemand heeft een website staan op http://blaat.gratis.host.nl/. Om het makkelijk te maken heeft hij een domeinnaam gekocht (www.blaat.nl) die hij doorstuurt naar de website. Welke URL moet Google dan gebruiken? Tot voor kort zou dat de lange versie geweest zijn maar als het goed is zou dit nu zo veranderd moeten zijn dat je nu de makkelijke versie (www.blaat.nl) in de zoekresultaten ziet.

Een uitgebreidere beschrijving kun je overigens op de site van Matt Cutts vinden

Invloed voor ons

Hier is momenteel nog niet zo veel over bekend. Wel is te zien dat het aantal resultaten voor keywords soms erg verschilt op de Bigdaddy datacenters maar de top resultaten zijn bijna overal hetzelfde. Overigens zullen er in de toekomst ongetwijfeld nog dingen wijzigen waar we wel rekening mee moeten houden. Daar komen we dan zo snel mogelijk mee!

Geen reacties tot nu toe