Internet fuer Mediziner: WWW

Vortrag: World Wide Web


In den vergangenen Stunden haben Sie die Basisdienste des Internet kennengelernt. Folge der Entstehung des Internet als Experiment ist, daß die Bedienung dieser Dienste recht umständlich ist. Wo im PC-Bereich Fenster und Menüs den Umgang mit Programmen erleichtern, ist das Internet in seiner textorientierten Unix-Bedienung hängengeblieben. Umständliche Befehlsfolgen und Shellkommandos erschweren es, die vielfältigen Angebote des Netzwerks auszunutzen.

Ich möchte Ihnen heute Abend einen relativ jungen Dienst im Internet vorstellen, der mit diesen Problemen aufräumt, indem er die Vorteile einer grafischen Benutzeroberfläche auf das Netz überträgt. Es handelt sich dabei um das Gespann aus dem "World-Wide-Web", einem neuen Standard für Informationssysteme, und seinem meistverbreitetem Abfrageprogramm "Mosaic". Die beiden Schlagworte "WWW" und "Mosaic" sind in den letzten Monaten wiederholt von der Fachpresse aufgegriffen worden, so daß sie einigen von Ihnen bestimmt schon bekannt sind.
Ich möchte Ihnen im folgenden das Konzept des World-Wide-Webs vorstellen. Anschließend werde ich kurz die Bedienung von Mosaic erklären und mit Hilfe von Folien einige Beispiele für "Datenreisen" im WWW vorstellen.

Was unterscheidet aber nun das WWW von den bekannten Netzdiensten?
Kern des World-Wide-Webs ist die Darstellung der Information als Hypertext. Wie der Name andeutet, ist dies eine erweiterte Form von Text, die es erlaubt, multimediale Elemente in Form von Grafiken, Audio und sogar Video in die Information einzuflechten. Das entscheidende Merkmal von Hypertext ist jedoch die Fähigkeit, Verweise auf andere Textstellen, sogenannte Hyperlinks zu ermöchen. Durch diese Verbindungen fügen sich die Einzelinformationen zu einem Gewebe zusammen - dem World-Wide-Web.
Statt einer Insellösung, die den Informationsfluß nur innerhalb des Web erlaubt hätte, ist das WWW so konzipiert worden, daß es den Zugriff auf nahezu alle bekannten Netzdienste erlaubt. Diesem Umstand und der einfach zu erlernenden Hypertextsprache HTML (HyperText Markup Language) ist es verdanken, daß sich das WWW momentan zum meistgenutzten Netzwerktool überhaupt entwickelt.
Zwar ist das WWW wie bei Gopher in Anbieter (Server) und Nutzer (Clients) geteilt, aber prinzipiell kann jeder Rechner im Internet als Server fungieren, egal, in welcher Form er seine Informationen anbietet. Auf diese Weise konnte das WWW eine einheitliche Oberfläche über das gesamte Internet bilden, ohne daß große Anpassungen vorgenommen werden mußten.


Im folgenden möchte ich Ihnen kurz die für den Umgang mit dem WWW nötigen Fakten vermitteln. Dazu gehört zunächst die Kenntnis des Adressierungssystems im WWW.

Um die Vielfalt der Dienste im Internet über das Web abfragen zu können, wurde eine einheitliche Schreibweise für die Lokalisation von Dokumenten geschaffen, die mit "Uniform Resource Locator" oder kurz URL bezeichnet wird. Über seine URL kann jedes Dokument im Web eindeutig bezeichnet werden. Dazu sind drei Elemente nötig, die dann in einer speziellen Schreibweise zur URL zusammengesetzt werden. Die Elemente sind im einzelnen Dienst, Rechner und Pfad.
Als Dienst können die bereits bekannten Basisdienste des Internet angegeben werden, z.B. gopher, ftp, telnet oder news. Das für das Web spezifische Übertragungsprotokoll heißt HTTP, was für HyperText Transfer Protocol steht.
An die Stelle des Rechners wird in die URL der Hostname des Informationsanbieters, also des Servers, eingetragen. Die Schreibweise ist die Ihnen bekannte "Hostname"-Schreibweise mit durch Punkten getrennten Bezeichnungen für Rechnername, Einrichtung und Land (z.B. medsun06.uni-muenster.de).
Als Pfad wird die Position des Dokumentes innerhalb des Servers angegeben, wobei wie bei Ihrem heimischen PC Verzeichnisse und Unterverzeichnisse möglich sind.
Natürlich können auch Teile der URL weggelassen werden. Wenn beispielsweise der Pfad nicht angegeben wird, erreicht man automatisch die Leitseite (in der Websprache Homepage) des Servers. Wenn man sich auf Server innerhalb der eigenen Einrichtung bezieht, können Teile des Hostnames entfallen (z.B. einfach medsun06 für einen Rechner in unserem Institut).

Wie Ihnen vielleicht aufgefallen ist, fehlen einige Dienste. Dies liegt zum einen daran, daß ich hier nur die meistgenutzten Dienste aufgeführt habe. Zum anderen sind über die URL auch nicht alle Internet-Dienste darstellbar - beispielsweise solche, die nicht eine Dokumentenadresse, sondern ein Suchwort oder Benutzereingaben erfordern. Hier kommen Gateways ins Spiel - es handelt sich dabei um Kombinationen aus Bildschirmformularen und kurzen Programmen, die eine Schnittstelle zwischen dem Web und anderen Diensten herstellen. Auf diese Weise können Sie unter anderem elektronische Post über das Web verschicken, die "Archie"-Datenbank nach Programmen durchsuchen oder auch auf die professionelle Datenbank "Oracle" zugreifen. Die Gateways bringen dabei meist eine vereinfachte Benutzung der Dienste mit sich. Ganz generell ist es über Gateways möglich, ganz neue Dienste zu programmieren, die im ursprünglichen Konzept des WWW gar nicht vorgesehen waren.


Bei aller Freude über die Vielfalt und Freizügigkeit des WWW wird das Bild dadurch getrübt, daß das Web die dezentrale, sozusagen anarchistische Struktur des Internet geerbt hat. Es gibt somit keine zentrale Instanz, die in der Lage wäre, einen übergreifenden Index über das Web vorzuhalten. Die Suche nach einer bestimmten Information gestaltet sich im WWW daher oft schwierig und frustran.
Dennoch wird vielerorts an einem Indexsystem experimentiert, so daß es derzeit eine Reihe von Katalogen gibt, in denen man nach seiner Information suchen kann. Ich möchte einige der zugrundeliegenden Ansätze vorstellen: Aus der Vielzahl der vorgestellten Konzepte geht schon das derzeitige Hauptproblem bei der Recherche hervor: um sicherzugehen, auch wirklich alles zu finden, muß eine Unzahl von Katalogen durchsucht werden. Das zweite Problem ist die mangelnde Aktualität der Indizes, die einerseits in der enormen Ausbreitung des Webs und andererseits in der geringen Akzeptanz der Kataloge bei den Anbietern begründet liegt. Automatische Indizes sind zwar von diesem Nachteil nicht betroffen; da sie sich aber nur entlang der Hyperlinks durch das Web hangeln können, sind nur die Teile des Webs für sie sichtbar, die bereits referenziert werden. Von Hand zusammengestellte Listen sind oft ebensowenig aktuell, wie die anderen Indizes, und sind zudem in ihrer Zusammensetzung oft subjektiv.

Trotz der derzeitigen Verwirrung ist abzusehen, daß sich ein Standard aus den experimentellen Katalogen durchsetzen wird. Es wird sich dabei vermutlich um ein halbautomatisches System handeln - zu finden wäre dann nur noch die Organisation, die freiwillig die Rechenleistung und Plattenkapazität bereitstellt, um diese Datenmengen zu speichern.
Bis dahin muß man wohl oder übel mit dem jetzigen Flickwerk leben.


Die Ausbreitung des World-Wide-Webs ist auch an unserer Fakultät nicht vorübergegangen: Seit Mai 1994 wird hier im Institut an einem WWW-Server gearbeitet, der seit der Fachbereichsratssitzung im Oktober nun auch offizielles Informationssystem des Fachbereichs ist.
Das Informationsangebot erstreckt sich momentan auf etwa 50 Dokumente, erweitert sich aber nahezu täglich. Der Schwerpunkt liegt derzeit mit einer Vielzahl von Fachschaftsinformationen und Stundenplänen im studentischen Bereich, aber der Server richtet sich gleichermaßen an die Institute und wissenschaftlichen Mitarbeiter. Bereits geplant oder in der Umsetzung sind unter anderem

Zwecks Ausdehnung unseres Informationsangebots sind wir sehr an den Beiträgen der Institute interessiert. Mit aktuellen Ankündigungen, Berichten über Forschungsarbeiten und Veröffentlichungen, Resourcenlisten und Selbstdarstellungen ist sicher nur ein Teil der Informationen genannt, die von den Instituten eingebracht werden könnten.

Der Server wird zur Zeit von einer studentischen Hilfskraft betreut, die beim Einspielen von Informationen weiterhelfen kann. Für interessierte Mitarbeiter richten wir gerne einen Zugang auf unsere Servermaschine ein, so daß Sie eigenständig über ihre Dokumente verfügen können. Für die Einspeisung von Texten stehen diverse Konverter zur Verfügung, die die Dateien der gängigen Textprogramme in das HTML-Format umsetzen; für das Einlesen von Grafiken können wir einen Scanner bereitstellen. Derzeit in Arbeit ist ein Programmpaket, daß es erlaubt, die WWW-Oberfläche für die einfache Eingabe von Informationen auszunutzen.

Wenn Sie für Ihre Institute Informationen einbringen möchten, wenden Sie sich bitte an mich.


(C) Copyright 11/94: Thomas Ganslandt (ganslan@uni-muenster.de). 30.11.94