Nachhaltiger Internet-Service
Ihr kompetenter Partner seit 1998

Effiziente Internet-Nutzung im Labor (LABO 01/2001)

Dr. Torsten Beyer, Dr. Beyer Internet-Beratung


Als der Engländer Tim Berners-Lee im Jahr 1993 mit der Entwicklung des ersten grafikfähigen Web-Browsers den Siegeszug des World Wide Web einleitete, konnte noch niemand ahnen, dass dies den Informationsaustausch und die Kommunikation weltweit in nur wenigen Jahren revolutionieren würde. Wir stehen heute immer noch am Anfang dieser Entwicklung, die das Leben jedes einzelnen nachhaltig verändern wird. An der Schwelle von der Industrie- zur Informations- und Wissensgesellschaft liefert der vorliegende Beitrag eine kritische Analyse der aktuellen Möglichkeiten des Mediums Internet als Informationsquelle im Labor.


Probleme des World Wide Web

Die gezielte Recherche nach Fachinformationen im Internet ist bei weitem nicht so trivial wie es oft in den Medien dargestellt wird, denn "Drinsein" allein reicht zur effizienten Nutzung des Mediums nicht aus. Jeder, der schon einmal versucht hat, beispielsweise Grenzwerte für Schadstoffe in der Luft oder spezifische Stoffdaten zu finden, wird dies sicher bestätigen können. Diese Schwierigkeiten haben im wesentlichen vier Ursachen:

  1. Die Strukturen des Internet sind nicht auf eine zielgerichtete Recherche ausgelegt. Die Sprache HTML, in der Webseiten erstellt werden, besitzt zwar geordnete Strukturen wie ein Autorenfeld, die Möglichkeit der Vergabe von Stichworten und einer Beschreibung des Inhaltes der Seiten, vergleichbar mit Abstracts in Fachartikeln, diese Angaben sind aber freiwillig und vom Autor der Web-Seite beliebig manipulierbar, da keine unabhängige Prüfung vor deren Veröffentlichung erfolgt. In Suchmaschinen findet man bevorzugt diejenigen Seiten, die von ihrer Autoren gut vermarktet werden und nicht immer diejenigen mit den besten Inhalten.

  2. Die Freiheit jedes einzelnen, im Internet beliebig viele Seiten zu publizieren, hat zwar zu einer gigantischen Informationsmenge im Word Wide Web geführt (Schätzungen gehen von über 2,5 Milliarden HTML-Seiten aus, dazu kommen noch die Inhalte von Datenbanken und kostenpflichtigen Seiten, sodass man auf insgesamt 550 Milliarden Dokumente kommt !!!), die Qualität der vorhandenen Informationen ist allerdings teilweise sehr bescheiden, da sie unvollständig, veraltet oder schlicht und einfach falsch sind. Es liegt stets am Nutzer, die Qualität und Validität abzuschätzen, was aber oft schwierig ist.

  3. Es gibt kein zentrales Internet-Archiv. Täglich verschwinden viele Tausend Seiten unwiederbringlich, weil sie gelöscht werden. Zahlreiche Adressen ändern sich und sind erst nach vielen Monaten - wenn überhaupt - wieder in Suchmaschinen, Katalogen und Linksammlungen zu finden, ganz im Gegensatz zu den Inhalten kommerzieller Datenbanken, die auch viele Jahre nach der Veröffentlichung unverändert bleiben und recherchiert werden können.

  4. Viele Nutzer machen bei der Internet-Recherchen Fehler, da sie zum einen oft ungeeignete Hilfsmittel einsetzen und zum anderen insbesondere bei der Bedienung von Suchmaschinen die bestehenden Möglichkeiten nur unzureichend ausschöpfen oder falsch anwenden. Dazu braucht man sich beispielsweise nur einmal den Link "Life-Suche" in der Suchmaschine Fireball (http://www.fireball.de) anzusehen.

Aufgrund dieser ganz unterschiedlichen Probleme enden viele Internet-Recherchen mit unbefriedigenden Ergebnissen. Man entweder viel zu viele, oft unrelevante Treffer, die man gar nicht alle sichten kann, oder die Recherche endet gar ergebnislos.

Die ersten drei der oben genannten Punkte sind inhärente Probleme des Word Wide Web und für den Nutzer zumindest in absehbarer Zeit nicht zu ändern. Zukünftige Internet-Standards sollen zwar die Recherchierbarkeit und Archivierung von Web-Inhalten verbessern, dies wird aber sicherlich noch einige Jahre bis zur Realisierung beanspruchen. Der Einsatz der richtigen Recherchestrategie durch den optimalen Einsatz der vorhandenen Quellen liegt aber im Einflussbereich des Nutzers und kann die Ergebnisse von Internet-Recherchen entscheidend verbessern. Man muss manchmal ganz einfach wissen, wie man bei welcher Fragestellung vorgehen muss und dies erfordert wie auch bei der Recherche in kommerziellen Datenbanken eine gewisse Erfahrung, die man sich im Laufe der Zeit oder in Schulungen und Seminaren erarbeiten muss.

Im folgenden werden die wichtigsten Quellen für die Recherche nach Fachinformationen und deren Anwendungsbereiche näher vorgestellt.


Autoren im WWW

Das Word Wide Web ist ein Sammelsurium unterschiedlichster Quellen, seien es nun Texte, Grafiken, Multimedia-Dokumente wie Animationen und Videos oder die zahlreichen kostenfreien und kostenpflichtigen Datenbanken. Nach einer Studie aus dem Jahre 1999 sind inzwischen 83% aller Internet-Seiten kommerzieller Art und immerhin noch 6% wissenschaftlicher Natur. Zu den Anfangszeiten des Web war das Zahlenverhältnis umgekehrt, da damals die überwiegende Zahl der Seiten von Universitäten, Forschungseinrichtungen und Regierungsstellen ins Netz gestellt wurden. Viele Nutzer sehen diese Entwicklung mit Besorgnis, man sollte allerdings bedenken, dass immer mehr Firmen neben der puren Werbung für die eigenen Produkte auch weitergehende Informationen wie beispielsweise Produkt-Kataloge, Literaturlisten, Tutorien, Analysenmethoden oder Stoffinformationen publizieren. An vielen Stellen ist inzwischen auch eine Online-Bestellung möglich, sei es direkt auf den Firmen-Homepages oder in den zahlreichen "virtuellen Marktplätzen".

Aber auch die zahlreichen nichtkommerzielle Seiten von Verbänden, Organisationen, Behörden und Regierungsstellen bieten zum Teil sehr umfangreiche Informationen an, obwohl es hier immer noch große Unterschiede gibt. Wenn man sich beispielsweise den FDA-Server (http://www.fda.gov) oder die National Library of Medicine (http://www.nlm.nih.gov) ansieht, dann weiß man, wohin die Reise hier gehen wird. Diese offiziellen Quellen sind besonders wichtig, da es sich in der Regel um validierte Informationen handelt, denn oft wird man im Internet mit Informationen konfrontiert, deren Aktualität und Wahrheitsgehalt man oft gar nicht beurteilen kann.

Daneben sind unzählige Informationsdienste im Web präsent. Hier sind zuerst die kommerziellen Hosts zu nennen, die inzwischen ihre kostenpflichtigen Datenbanken auch über das Internet gegen Gebühr zugänglich gemacht haben. Es gibt darüber hinaus aber auch zahlreiche Linksammlungen, Branchenbücher und sogenannte "Portale", die Informationen zu bestimmten Fachgebieten zumeist kostenfrei anbieten, da die Seiten entweder durch Werbung finanziert oder teilweise auch im Rahmen des "Global-Info"-Projekts der Bundesregierung gefördert werden. Die Zahl dieser spezialisierten "Informationsportale" nimmt ständig zu und ist kaum mehr zu überblicken. Als Beispiele seien an dieser Stelle die Seiten "www.biologie.de" für Biologie und Life Sciences und "https://analytik.news" für die Analysentechnik und das Labor genannt. Unter den Betreibern solcher Dienste gibt es leider auch einige schwarze Schafe, die auf die schnelle Mark aus sind und oft minderwertige, veraltetet, unvollständige oder aber subjektive Informationen publizieren. Man sollte sich solche Seiten daher immer genau ansehen und die Motive der Betreiber herausfinden, bevor man den Inhalten blind vertraut.

Natürlich habe auch die klassischen Medien das Internet schon sehr früh für sich entdeckt. Nahezu alle Zeitungen, Zeitschriften und auch die Verlage sind präsent und bieten neben kostenpflichtigen Inhalten wie zum Beispiel die Volltexte von Publikationen oder komplette Archive von Zeitschriften auch kostenfreie Informationen wie beispielsweise ausgewählte Beiträge oder Inhaltsverzeichnisse online an. Auch viele Fernsehstationen und Radiosender betrieben Internet-Seiten, auf denen man Zusatzinformationen zu den ausgestrahlten Programmen finden kann.

Eine nicht zu vernachlässigende Autoren-Gruppe sind auch die vielen Privatpersonen, die auf eigenen Homepages teilweise sehr umfangreiche Linksammlungen betreiben oder eigene Inhalte publizieren, da die Kosten für Webspace in den letzten Jahren stark gesunken sind. Die schon angesprochene Bewertung der gefundenen Inhalte ist sicher in diesem Fall am schwierigsten.

Letztlich liegt es immer in der Verantwortung des Internet-Nutzers, zu beurteilen, ob Informationen im World Wide Web objektiv, aktuell und vollständig sind. Diese Sicherheit wird bei den Datenbank-Hosts durch die teilweise recht hohen Nutzungsgebühren bezahlt. Bei den kostenfreien Internet-Quellen steckt man leider sehr oft in einem Dilemma, das die kommerzielle Nutzbarkeit von Informationen, die man ausschließlich im World Wide Web gewonnen hat, stark einschränkt.


Informationsquellen im WWW

Im folgenden werden die wichtigsten Recherchetools wie Suchmaschinen, Kataloge, Linksammlungen, Datenbanken und Diskussionsforen näher vorgestellt und ihre Einsatzbereiche vorgestellt.

Suchmaschinen

Die wichtigsten Quellen insbesondere für die Recherche nach sehr speziellen Fachinformationen sind die Suchmaschinen. Hier muss man die allgemeinen Suchdienste wie "AltaVista" oder "Google" (Tabelle 1) und die immer wichtiger werdenden themenbezogenen Suchmaschinen unterscheiden. Gemeinsam ist nahezu allen, dass Sie über Werbung finanziert werden und dem Nutzer die kostenlose Recherche in einem selbstgenerierten Index, der aus Stichworten und zugehörigen Internet-Adressen (sogenannten URLs) besteht. Dieser Index wird durch Computerprogramme, sogenannte "Robots" oder "Spider" erzeugt, die Hyperlinks auf Webseiten automatisch verfolgen und die Inhalte der Seiten indexieren. Wegen der großen Dynamik und dem unkontrollierten Wachstum des WWW kann ein solcher Index nie vollständig sein. Eine Studie aus dem Jahr 1999 führte zu dem ernüchternden Ergebnis, dass kein Suchroboter mehr als 16% aller Webseiten indexiert hat, ein Jahr zuvor waren es noch 33%. Ein weitere Untersuchung ergab, dass 46% aller Internet-Seiten in gar keiner Suchmaschine verzeichnet sind Man spricht hier von sogenannten "Informations-Inseln", da sie nicht mit dem WWW verlinkt sind.


Tabelle 1: Die wichtigsten Suchroboter

Dienst URL
AltaVista http://www.altavista.de
FastSearch http://www.alltheweb.com
Fireball 1 http://www.fireball.de
Google https://www.google.com
NorthernLight http://www.northernlight.com

1 nur deutschsprachige Seiten


Wenn man hier in die Zukunft blickt, muss man eher pessimistisch sein, denn was nützen Suchmaschinen, wenn man dort fast nichts mehr findet. Dadurch ist es heute schon unmöglich zu behaupten, dass es bestimmte Informationen im Internet nicht gibt, man hat sie vielleicht nur nicht gefunden, weil die Seite in den eingesetzten Suchmaschinen nicht verzeichnet war.

Es gibt nun zwei Auswege aus dem Dilemma, zum einen der Einsatz von speziellen Suchmaschinen wie beispielsweise http://www.anavista.de für den Bereich Analysentechnik (Tabelle 2), zum anderen der Einsatz sogenannter Metasuchmaschinen wie "MetaGer" und "MetaCrawler" (Tabelle 3). Diese ermöglichen die simultane Abfrage mehrerer Suchdienste mit einer Suchanfrage. "MetaGer" findet nach eigenen Angaben 90% aller deutschsprachigen Seiten, "MetaCrawler" 43% aller Seiten weltweit. Leider sind die Suchmöglichkeiten hier sehr beschränkt, da es sich um den kleinsten gemeinsamen Nenner aller abgefragten Dienste handelt. Eine Zusammenstellung von über 1.000 Suchmaschinen findet man zum Beispiel unter http://www.klug-suchen.de.


Tabelle 2: Spezialsuchmaschinen (Auswahl)

Dienst URL
anavista (Analytik) https://anavista.de
Biologie.de https://www.biologie.de
ChemGuide http://www.chemguide.de
Medivista (Medizin) http://www.medivista.de

Tabelle 3: Metasuchdienste (Auswahl)

Dienst URL
MetaCrawler http://www.metacrawler.com
MetaGer 1 http://www.metager.de

1 nur deutschsprachige Seiten


Kataloge, Linksammlungen und Guides

Neben den softwaregenerierten Indizes der Suchmaschinen gibt es auch zahlreiche manuell gepflegte Kataloge und Verzeichnisse, von denen "Yahoo" der bekannteste ist (Tabelle 4). Diese Kataloge enthalten naturgemäß viel weniger Einträge als die robotergenerierten Indizes der Suchmaschinen, die Einträge sind aber in der Regel von einer weitaus höheren Qualität, da minderwertige Informationen durch manuelle Selektion von Seiten des Betreibers von vorneherein ausgeschlossen werden können. Die Stärke der Kataloge liegt in der Möglichkeit, einen Einstieg in ein Thema zu finden wie zum Beispiel die Frage nach einer Liste von Verlags-Homepages oder Lieferanten für bestimmte Produkte oder Geräte. Spezielle Fragen wie beispielsweise die Suche nach dem Grenzwert für eine Chemikalie in der Luft lassen sich damit allerdings nicht beantworten.


Tabelle 4: Kataloge (Auswahl)

Dienst URL
Dino-Online http://www.dino-online.de
Open Directory Project http://dmoz.org
Web.de http://web.de
Yahoo! https://yahoo.de
https://www.yahoo.com

Neben den allgemeinen Katalogen gibt es zahlreiche spezielle naturwissenschaftliche Kataloge, die sich auf ein bestimmtes Themengebiet beschränken und hier weitaus mehr Einträge als Yahoo bieten können (Tabelle 5), allerdings stellt sich auch hier wieder die Frage der Vollständigkeit und der Aktualität der Inhalte.

Vergessen darf man auf keinen Fall die vielen nichtkommerzielle Linksammlungen von Privatleuten oder auch Studenten, Schülern und Lehrern zu allen erdenklichen Themen. Der Wert dieser Quellen wird oft unterschätzt, aber wenn sich beispielsweise jemand die Mühe macht, eine Liste von Homepages zusammenzustellen, auf denen man kostenfrei zugängliche Massenspektren findet, dann kann diese Zusammenstellung viele Stunden der Recherche überflüssig machen. Exemplarisch sei an dieser Stelle die Adresse "www.chemlin.de" erwähnt, ein ständig aktualisiertes Verzeichnis mit zur Zeit über 8.500 kommentierten Links zu den Bereichen Chemie und Umwelt. Das Problem liegt immer darin, solche "Perlen" ausfindig zu machen und zu beobachten, da man so sehr gut auf dem laufenden bleiben kann, wenn die Seiten ständig aktualisiert werden.

Eine neuartige Variante, der Informationsflut im Internet Herr zu werden sind sogenannte Guides oder Besprechungsdienste wie about.com (Tabelle 5). Hier bereitet ein kompetenter Online-Redakteur interessante Internetadressen zu speziellen Themen auf und kommentiert die alle Links. Diese Vorauswahl erleichtert dem Nutzer die Entscheidung, ob die entsprechende Seite überhaupt einen Besuch wert ist. Hier kann naturgemäß immer nur eine subjektive Auswahl vorgestellt werden, als Einstieg in ein Thema sind solche Seiten neben den Katalogen aber sicher sehr gut geeignet.


Tabelle 5: Spezialkataloge und Guides (Auswahl)

Dienst URL
about.com http://www.about.com
ChemIndustry.com http://www.chemindustry.com
Chemlin https://www.chemlin.de
SciSeek http://www.sciseek.com

Es gibt zwar auch einige Fachbücher, in denen zahlreiche interessante Internet-Adressen für Naturwissenschaftler zusammengestellt wurden. Diese sind allerdings wegen der großen Dynamik, mit der sich das Internet verändert, sehr schnell veraltet, so dass man eher die Online-Kataloge bevorzugen sollte, insbesondere wenn das Veröffentlichungsdatum des Buches schon mehr als ein Jahr zurückliegt.


Datenbanken

Datenbanken sind mit die interessantesten Quellen im Internet, da sie im Gegensatz zu normalen Webseiten weitaus besser strukturierte Informationen bieten. Neben den klassischen Hosts wie "FIZ Karlsruhe" oder "FIZ Technik" (Tabelle 6), die den Zugang zu Hunderten von kostenpflichtigen wissenschaftlichen Datenbanken ermöglichen sind im Internet auch eine Vielzahl kostenfreier Datenbanken verfügbar, die die Recherche bei den Hosts ergänzen, aber auch zukünftig sicher nicht ersetzen können. Problematisch ist zum einen das Finden solcher Datenbanken, denn die Inhalte können durch eine Recherche mit einer Suchmaschine nicht abgefragt werden, zum anderen sind die kostenlosen Quellen teilweise unvollständig oder besitzen nur eingeschränkte Suchmöglichkeiten. Oft handelt es sich auch um Lockangebote zum Kauf einer kostenpflichtigen Version.


Tabelle 6: Datenbank-Anbieter (Auswahl)

Dienst URL
Dt. Patent- u. Markenamt https://www.dpma.de
DIMDI https://www.dimdi.de
FIZ Chemie http://www.fiz-chemie.de
FIZ Karlsruhe http://www.fiz-karlsruhe.de
FIZ Technik http://www.fiz-technik.de


News-Gruppen und Mailing-Listen

Eine für die meisten Nutzer weitgehend unbekannte Informationsquelle sind die vielen Tausend Newsgruppen, Diskussionsforen und Mailinglisten, die es schon weitaus länger gibt als das World Wide Web. Es handelt sich dabei bildlich gesprochen um globale "Schwarze Bretter", auf denen jeder Nutzer Anfragen stellen und Antworten geben kann. Die Formen haben normalerweise ein bestimmtes Thema wie beispielsweise Massenspektrometrie oder Toxikologie. Mit etwas Glück kann man hier Spezialisten weltweit ausfindig machen, die unter Umständen die gleichen Probleme wie man selbst bearbeiten oder diese schon gelöst haben und ihre Informationen an andere weitergeben. Allerdings sind die Foren sehr stark von Studenten frequentiert, man darf daher bei sehr speziellen Fragestellungen nicht allzu viel erwarten und hat natürlich auch keine Antwortgarantie. Der Zugang zu diesen wichtigen Quellen ist heute am einfachsten über spezielle Suchmaschinen wie "Deja" möglich (Tabelle 7).

Tabelle 7: Suchdienste für News-Gruppen und Mailing-Listen

Dienst URL
Deja http://www.deja.com
Lisde1 http://www.lisde.de
Meta-List.net http://www.meta-list.net

1nur deutschsprachige Listen


Recherchestrategien

Die Auswahl der geeigneten Quelle für die Durchführung einer Recherche ist sehr stark von der Art der Fragestellung abhängig. Will man einen allgemeinen Überblick über ein Thema, so sollte man zuerst Kataloge wie Yahoo bemühen, um spezielle Einstiegsseiten und Portale zum Thema zu finden um dann dort weiter zu recherchieren oder für das Thema interessante Links auszuwerten. Oftmals hilft auch die Überlegung weiter, wer eine bestimmte Informationen veröffentlich haben könnte, um dann die entsprechenden Behörden oder Firmen zu suchen und dann direkt auf deren Homepages zu recherchieren. Dies ist insofern ratsam, da einige Firmen ihre komplette Homepage für Suchmaschinen abschotten und auch nur selten alle Unterseiten einer Homepage von Suchrobotern erfasst werden.

Ist man auf der Suche nach Stoffdaten oder Strukturen, so werden diese Informationen sehr oft in Datenbanken zu finden sein. Da keine Suchmaschine die Inhalte von Datenbanken abfragen kann, muss man hier in Suchmaschinen, Katalogen oder Linksammlungen erst einmal geeignete Datenbanken ausfindig machen, um dann direkt dort zu recherchieren.

Mit der Zeit sammelt man so die für die tägliche Arbeit wichtigen Adressen und sollte diese Quellen als "Lesezeichen" oder "Favoriten" im Browser ablegen, um sich so seinen eigenen individuellen Katalog zusammenzustellen. Es macht auch durchaus Sinn, diese Listen firmenintern zentral zu verwalten und allen Mitarbeitern zur Verfügung zu stellen, damit das gleiche Wissen nicht von verschiedenen Personen mühsam mehrmals gesammelt werden muss.

Als Fazit bleibt zu ziehen, dass man am Ende vieler Internet-Recherchen doch wieder bei den kommerziellen Datenbanken landet, da man bei vielen Fragestellung nur hier die letzte Gewissheit bekommen kann, ob eine Information wirklich nicht existiert oder doch schon publiziert wurde. Das World Wide Web ist bei vielen Problemen eine gute Ergänzung dazu bei bestimmte Fragestellungen wie das Auffinden von Lieferanten für Chemikalien oder Geräten, von Analysenmethoden oder Gesetzestexten. Allerdings beginnt die Zeitrechnung des Word Wide Web erst vor 5 Jahren, das heißt ältere Informationen wurden hier zumeist nicht publiziert oder werden erst in Zukunft publiziert werden.


Ausblick

Wie sich das Internet weiter entwickeln wird, ist heute nur schwer zu prognostizieren. Klar ist auf jeden Fall, das die Entwicklung der letzten Jahre nicht mehr umzukehren ist und dass sowohl die Zahl der Internet-Nutzer als auch die verfügbare Informationsmenge weiter exponentiell wachsen wird. Die Recherche im Internet gleicht heute jedenfalls oft der Suche nach der Nadel im Heuhaufen, wobei der Heuhaufen täglich größer wird. Hier kann nur die Entwicklung neuartiger intelligenter Suchmaschinen und die Anpassung der Standards zur Erstellung von Webseiten langfristig zu Verbesserungen führen. Bis dahin muss man die Gegebenheiten akzeptieren und lernen, die bestehenden Hilfsmittel effektiv einzusetzen und die wichtigen Adressen für ein Fachgebiet ausfindig zu machen.

Der Autor selbst führt spezielle Internet-Schulungen für Naturwissenschaftler und Labormitarbeiter bereits seit mehreren Jahren durch und ist immer wieder überrascht, dass viele Nutzer außer der Suchmaschine AltaVista oder dem Katalog Yahoo gar keine anderen Suchdienste kennen und für Recherchen einsetzen. Die große Kunst der Recherche besteht aber gerade darin, spezielle Datenbanken, Linksammlungen, Kataloge oder auch Firmen- und Behördenseiten zu finden, die die eigenen Fragestellungen abdecken. Nur dann kann man das Internet wirklich effektiv nutzen und ist für die Informationsgesellschaft gewappnet, denn wer die richtige Information zur rechten Zeit und vor der Konkurrenz hat, kann sich langfristig Wettbewerbsvorteilen verschaffen. Wer die Entwicklung verpasst, wird sehr schnell den Anschluss verlieren.