Links - de huidige officiële naam voor een link is uniform resource identifier (URI) - zijn de adressen van content op het web. Elk stukje webcontent heeft in theorie een eigen, uniek adres. Daardoor kan de content gedurende langere tijd gevonden worden. URI's hebben een doorslaggevende bijdrage geleverd aan de doorbraak van het web en vormen de basis voor de populariteit van zoekmachines. Goed gebruik van URI's is dus belangrijk voor een 'gezond' World Wide Web.
Daarnaast spelen URI's een rol in de gebruiksvriendelijkheid van een website; in veel user agents heeft de adresbalk waarin URI's worden getoond een prominente plaats, boven het venster waar de webcontent wordt getoond.
Concrete, duidelijke benaming is belangrijk bij het opstellen van een structuur. Veel websites zijn gebaseerd op een systeem dat informatie toont uit een database en dat automatisch URI's genereert. In de meest primitieve vorm bevat de URI niet veel meer dan het nummer van een databaserecord. Meer geavanceerde systemen zijn in staat om in de URI's de informatie-opbouw van de website weer te geven.
AAA
Identieke of sterk overeenkomende content kan bereikbaar zijn via meerdere URI's op hetzelfde domein. Soms is het een bewuste keuze, bijvoorbeeld als content zowel op type informatie als op onderwerp wordt ontsloten en de eigenaar van een website het belangrijk vindt dat deze kenmerken van de content in de URI tot uitdrukking komen. Soms gebeurt het onbedoeld, bijvoorbeeld als in een URI verschillende variabelen worden gebruikt die steeds is een andere volgorde staan. Ook sessie-informatie die in de URI is verwerkt leidt in de praktijk vaak tot dubbele content, net als het door elkaar gebruiken van kleine letters en hoofdletters in URI's, of een toevoeging als index.html.
Met name bij het indexeren van websites en bij webarchivering is de redundantie die dubbele content veroorzaakt een nadeel. Bovendien is meestal niet duidelijk welke van de URI's die leiden naar dubbele content de belangrijkste is.
Uiteindelijk hebben ook eigenaren van websites hier last van, niet in de laatste plaats omdat dubbele content op hetzelfde domein een negatieve invloed kan hebben op de waardering van de content door zoekmachines. En ook omdat in geval van onbedoelde dubbele content het aantal URI's exponentieel kan toenemen, wat weer tot gevolg zal hebben dat het opsporen van niet-werkende links ernstig wordt bemoeilijkt.
Het is voor de beheerder van een website mogelijk - en zelfs betrekkelijk eenvoudig - om in geval van URI's die verwijzen naar dubbele content:
te markeren dat sprake is van dubbele content en welke URI de belangrijkste is, of als dat niet wenselijk of onmogelijk is,
automatisch door te verwijzen naar de belangrijkste URI
reeks karakters volgens een open specificatie[1], die wordt gebruikt om te verwijzen naar content op het internet.
[1] zie http://tools.ietf.org/html/rfc3986 (deze toelichting is informatief).
Elk genummerd item in deze sectie staat voor een techniek of combinatie van technieken die afdoende wordt beschouwd om aan dit succescriterium te voldoen. Met de genoemde technieken wordt pas aan het succescriterium voldaan indien ze in overeenstemming zijn met de conformiteitseisen.
Hu10: Als in de content van een verzameling webpagina's URI's voorkomen die leiden naar content die identiek of zeer vergelijkbaar is, wordt de dubbele content gemarkeerd door middel van een canonial link
Opmerking: Zie voor meer informatie het artikel Over rel="canonical" op het Google Centrum voor webmasters.
Gu33: Dubbele content wordt vermeden door middel van automatische doorverwijzing door de server (301 redirect)
Als een 'gangbare fout' uit deze sectie van toepassing is, dan wordt niet aan het succescriterium voldaan.
(Er zijn nog geen gangbare fouten gedocumenteerd)
De volgende content op deze pagina heeft de status 'normatief' en is ongewijzigd overgenomen uit het normdocument Webrichtlijnen versie 2: