Nachhaltiger Internet-Service
Ihr kompetenter Partner seit 1998

Publikationen

CLBInternet für Chemie und Labor - Teil 4: Suchtipps
Dr. Torsten Beyer, Saarbrücken
Chemie in Labor und Biotechnik 49 (1998) 309-310

Suchmaschinen und Web-Indizes gibt es Hunderte im Internet, doch nur wenige sind wirklich brauchbar. In diesem Teil der Serie "Internet für Chemie und Labor" werden die besten und größten Vertreter dieser unentbehrlichen Helfer vorgestellt. Darüber hinaus werden auch eine Reihe spezieller Suchdienste und Linksammlungen besprochen, die besonders interessant für den Laborbereich sind.

Der riesige Datenpool des Internet - man schätzt die Zahl der HTML-Seiten zurzeit auf 320 Millionen, dazu kommen Datenbanken und kostenpflichtige Dokumente in nicht bekannter Zahl - ist im Moment mit den gängigen Suchmaschinen nur noch zu einem erschreckend geringen Prozentsatz zugänglich. Nach einer neuen US-Studie sind über die größten Suchmaschinen "AltaVista" und "HotBot" nur noch ca. 1/3 der HTML-Seiten (also etwas mehr als 100 Millionen) zugänglich, alle anderen Suchmaschinen schneiden sogar weitaus schlechter ab.

Daher sollte man bei einer Recherche am besten mehrere Suchmaschinen zu Rate ziehen oder sogenannte Meta-Systeme (s.u.) einsetzen, um auf einen größeren Datenpool zuzugreifen. Die jeweils indexierten Seiten überschneiden sich immer nur teilweise. Will man ausschließlich in deutschsprachigen Seiten recherchieren, ist Fireball mit über 4 Millionen indexierten Seiten die beste Wahl, für globale Suchen sollte man AltaVista oder HotBot (s.o.) benutzen. Die URL in Tabelle 1 geben einen umfangreichen Überblick über die zur Zeit verfügbaren Suchmaschinen im Internet.


Tabelle 1: Einige Übersichten über Suchmaschinen im Internet

All-In-One* http://www.albany.net/allinone
CUSI https://www.unix-ag.uni-siegen.de/cusi
Klug Suchen http://www.klug-suchen.de

* ausschließlich internationale Suchmaschinen


Suchmaschine steuert Suchmaschinen

Um gleichzeitig in einem größeren Informationspool zu recherchieren, ist der Einsatz sogenannter Meta-Suchmaschinen oder Metacrawler (Tabelle 2) zu empfehlen. Diese fragen simultan mehrere Suchmaschinen mit dem gleichen Suchstring ab und geben idealerweise eine Gesamttrefferliste aus, in denen Dubletten entfernt wurden (was in der Realität aber leider noch nicht immer funktioniert). Solche Dienste sollte man bei sehr speziellen Anfragen einsetzen, da der Zeitaufwand für eine Recherche wegen der gleichzeitigen Anfrage mehrere Dienste höher ist, und natürlich die in der Regel sowieso zu langen Trefferlisten noch umfangreicher werden.


Tabelle 2: Meta-Suchmaschinen (Auswahl)

MetaCrawler http://www.metacrawler.com
MetaGer* https://metager.de/

* nur Abfrage deutscher Suchmaschinen


Großen Wert bei der Nutzung von Suchmaschinen sollte auf die Formulierung der Suchanfragen gelegt werden. Es ist sehr nützlich, die Hilfeseiten auszudrucken und durchzuarbeiten, damit man die teilweise sehr unterschiedlichen Suchmöglichkeiten optimal einsetzen kann. Hier bietet AltaVista die größte Funktionsvielfalt, Fireball hat aber nahezu identische Möglichkeiten. Nicht selten erhält man deswegen zu große Trefferlisten, weil man die Anfragen zu allgemein formuliert oder die Möglichkeiten der einzelnen Dienste nicht optimal ausgeschöpft hat. Die bislang vorgestellten Tools bedienen sich alle sogenannter Roboter bzw. Spider, um HTML-Seiten im Internet zu erfassen und in einer Indexdatenbank suchbar zu machen. Dabei handelt es sich um Computerprogramme, die weitgehend autark arbeiten und von Link zu Link springen. Dadurch sollten theoretisch im Laufe der Zeit alle vorhandenen Seiten aufgenommen und in regelmäßigen Abständen auch deren Gültigkeit überprüft werden, was aber wegen der immer größeren Zahl von Internetseiten immer schlechter funktioniert. Die Anmeldung neuer Homepages bei den einzelnen Suchrobotern beschleunigt die Zeit bis zur Aufnahme erheblich.


Weniger ist oft mehr

Neben diesen Roboter-Indizes gibt es manuell erstellte und redaktionell bearbeitete Indizes wie z.B. Yahoo, Web.de oder "Dino-Online". In solchen Verzeichnissen sind naturgemäß weitaus weniger Seiten erfaßt, die Qualität der Treffer ist aber in der Regel höher als bei Suchmaschinen, die Roboter einsetzen. Wer sich nur einen Überblick über ein Gebiet verschaffen möchte und nicht zu spezielle Fragestellungen bearbeitet, wird hier gut bedient. Yahoo besitzt den umfangreichsten Index und die US-Seite zählt nicht von ungefähr neben den Homepages von Netscape und Microsoft zu den drei am häufigsten besuchten Webseiten.

Die immer größere Informationsfülle im Internet und die damit verbundene schlechtere Auffindbarkeit relevanter Seiten führt inzwischen vermehrt dazu, dass spezialisierte Suchmaschinen, Indizes, Linksammlungen und Marktplätze entstehen, da nur so eine sinnvolle Recherche überhaupt noch möglich ist. Auch im Bereich der Chemie beginnt sich dieser Trend langsam zu etablieren. In Tabelle 3 sind einige der umfangreichsten Vertreter aufgelistet.

Diese Adressen sind sehr gute Einstiegspunkte bei der Suche nach Firmen, Herstellen, Laborprodukten, chemiespezifischen Dokumenten, Gesetzestexten, Diskussionsgruppen, Stoffdaten und vieles mehr. Man kommt so oft viel schneller zum Ziel als über den Einsatz universeller Suchmaschinen, obwohl auch hier sicher vieles noch verbesserungswürdig ist. Insbesondere die Aktualität solcher Angebote sollte man im Auge behalten, denn nichts ist ärgerlicher als ein ungültiger Link, wenn man glaubt, fündig geworden zu sein.


Bis jetzt noch kostenlos

Andererseits darf man aber auch nicht vergessen, daß alle diese Angebote momentan (noch) kostenlos sind und sich irgendwie refinanzieren müssen. Dies geschieht im Moment, wenn überhaupt, überwiegend durch die Einblendung von Werbebannern. Wenn aber geeignete Abrechnungsmechanismen im Internet etabliert sein werden, wird es hier, wie im Bereich kommerzieller Datenbanken schon seit Jahrzehnten üblich, auch kostenpflichtige Dienste mit hochwertigen Inhalten geben - erste Ansätze hierzu existieren bereits. Auch im Bereich Suchmaschinen gibt es inzwischen schon einige kommerzielle Produkte für den eigenen PC.

Mit kostenpflichtigen Internet-Angeboten im Bereich der Naturwissenschaften wird sich der nächste Teil dieser Reihe näher befassen.


Tabelle 3: Einige Highlights für Chemiker im Internet

ACS LabGuide http://pubs.acs.org/labguide Suchmaschine für Laborprodukte der American Chemical Society
Analytical Chemistry Springboard http://www.anachem.umu.se kommentierte Linksammlung zur Analytischen Chemie
Buyers Guide Chem http://www.buyersguidechem.de Datenbank, mit der Chemikalienhersteller gesucht werden können
ChemFinder (aufgelöst) Datenbank mit Informationen zu chem. Verbindungen
ChemGuide http://www.fiz-chemie.de Suchmaschine für Internetseiten chemischer Fachbereiche an deutschen Universitäten
Niven's Wonderful Virtual World of Chromatography (aufgelöst) Links und Infos zur Chromatographie
Online-Umweltmesse http://www.umweltrecht.de Informationen zu allen Umweltfragen