URI - Uniform Resource Identifier
Hinter diesem Begriff verbirgt sich ein allgemeines Konzept zur einheitlichen Adressierung beliebiger Internet Ressourcen, wobei eine Ressource ein Objekt ist, das sich irgendwo im Internet befindet: eine Datei, eine Datenbank, ein News-Artikel, eine Telnet-Sitzung mit einem entfernten Rechner oder ein HTTP-Server. Die Philosophie des WWW ist: "If it's there, we can point at it."
Dank dieses Konzepts stellt das WWW nicht eine weitere Insellösung unter den herkömmlichen Diensten im Internet dar, sondern integriert diese herkömmlichen Dienste. Neben Daten die WWW-Clients über HTTP von entsprechenden Servern abrufen, können sie auch auf andere Server wie z.B. FTP, Gopher, WAIS, News etc. zugreifen. Und da diese Ressourcen über URIs in einer einheitlichen Syntax aufrufbar sind, kann man sie bequem über Hypertextlinks adressieren.
URIs können (definiert in RFC 2396, 'proposed Standard') unterteilt werden in URLs (Uniform Resource Locator) und URNs (Uniform Resource Names). Die URNs sind derzeit noch Gegenstand der Entwicklung, deshalb soll hier das Konzept der URNs nur kurz angerissen werden. URLs sind in RFC 1738/1808/2368 spezifiziert (Status:'proposed Standard') worden. Da das URL Konzept wenigstens einen Nachteil hat - nämlich das jede URL auf einen bestimmten, DNS adressierbaren Host zeigen muss - wird das URN-Konzept entwickelt. Dabei wird ein Objekt eindeutig an einem Bezeichner erkannt, unabhängig von seinem Ort (oder Orten) im Internet. Eine URN unterscheidet sich von einer URL dadurch, dass ihr Hauptzweck darin besteht, eine Ressource mit einem persistenten Namen zu belegen, der netzweit eindeutig ist (und bleibt), sogar dann, wenn es die Ressource nicht mehr oder vorübergehend nicht mehr gibt. Dieser Bezeichner wird aus einer Menge von Namensräumen gewonnen, die jeder für sich ihre eigene Struktur und ihre eigenen Zuweisungsprozeduren haben. Als allgemeine Syntax für URNs schlägt RFC 2141 folgendes Schema vor: (in BNF): <URN> ::= "urn:" <NID> ":" <NSS>. Wobei NID für Namespace-Identifier und NSS für Namespace-specific-String steht.
Vorteil der URNs ist zum Beipiel, dass der zum Benutzer jeweils günstigste Server der das gewünschte Objekt bereitstellen kann, mit dem Benutzer verbunden wird; oder das Verbindungen zu Ressourcen last-/kostenabhängig gesteuert werden könenn. Die URNs sind im RFC 2141 (Status: Proposed Standard) und 2611 ('Best Current Practice') dokumentiert .
URLs bestehen aus drei Teilen:
Dem Protokoll (z.B. http), auch Schema genannt, dem DNS-Namen des Hosts
auf dem sich das Objekt befindet (www.fernuni-hagen.de) und dem Dateinamen
(welcome.html). Wegen der Äquivalenz einer URL zu einem Namen im
DNS-Namensraum kann statt des DNS-Namens auch direkt eine IP-Adresse
angegeben werden. Falls für den Zugriff auf das Objekt kein Standard
(=Wellknown-) Port benutzt werden soll, muß im Anschluß an den
DNS-Namen oder die IP-Adresse auch noch der TCP-Port angegeben werden. Die
Codierung etwaiger Sonderzeichen in URLs erfolgt in der Form '%xx' wobei
xx für den ISO-8859-1 Code des Zeichens steht, z.B. %20 für ein
Leerzeichen.
Beim Anfordern einer URL beispielsweise durch einen Mausklick auf einen HyperLink in einer Webpage laufen folgende Schritte ab: