Nachhaltiger Internet-Service
Ihr kompetenter Partner seit 1998

Publikationen

CLBInternet für Chemie und Labor - Teil 5: Datenbanken
Dr. Torsten Beyer, Saarbrücken
Chemie in Labor und Biotechnik 49 (1998) 378-379

Das größte Problem bei der Suche im Internet sind die global verteilten und unstrukturierten Informationen, die eine effiziente Recherche sehr erschweren. Datenbanken hingegen bieten hervorragende Suchmöglichkeiten und definierte Datenstrukturen. Der vorliegende Beitrag gibt einen Überblick über interessante Datenbanken für Naturwissenschaftler im Internet.

Die Zahl der Datenbanken, die über das Internet zugänglich sind, wächst ebenso wie die Zahl der HTML-Dokumente ständig an. Auch im naturwissenschaftlichen Bereich gibt es viele nützliche Quellen, die teilweise sogar (noch) kostenfrei zugänglich sind (Tabelle 1). Die Benutzerschnittstellen sind aber oft sehr unterschiedlich in ihrer Leistungsfähigkeit und auch in den möglichen Suchoptionen. Außerdem sind Datenbankabfragen in der Regel langsamer als das Abrufen statischer HTML-Seiten, da die Suchanfrage erst durch ein Script an die Datenbank übergeben wird und die erhaltenen Trefferlisten danach zurück ins HTML-Format konvertiert werden müssen. Die Tendenz im Internet geht trotzdem eindeutig in Richtung von Datenbank-Applikationen, da dort jeweils ein definiertes Fachgebiet mit speziell auf dieses Gebiet optimierten Datenstrukturen abgedeckt wird. Die Daten sind daher von vorne herein eindeutig strukturiert und können so sehr leicht indexiert werden. Die HTML-Dokumente im Internet hingegen enthalten unstrukturierte Informationen zu allen möglichen Bereichen, weshalb sie durch Suchmaschinen nur sehr schwer zugänglich zu machen sind. Zudem ist der Aufbau eines HTML-Dokuments weitgehend frei, und Identifizierungs- und Authentifizierungsinformationen wie z.B. Angaben zu Autoren und Inhalten (Keywords), sind freiwillig und fehlen daher sehr oft. Diese Angaben können auch sehr leicht von den Autoren manipuliert werden, damit die Seiten in den Trefferlisten der Suchmaschinen weiter vorne auftauchen. Ein weiteres gravierendes Problem ist die fehlende Qualitätsprüfung von HTML-Dokumenten vor deren Veröffentlichung im Internet, während kommerzielle Anbieter alle Datensätze in der Regel vor der Aufnahme redaktionell prüfen.

Ein Nachteil von Internet-Datenbanken ist allerdings, daß deren Inhalte in der Regel noch nicht für Suchmaschinen zugänglich sind, d.h. man muß wissen, wo sich interessante Datenbanken befinden und dann direkt dort recherchieren!


Tabelle 1: Linksammlungen zu naturwissenschaftlichen Datenbanken im WWW

Beaucoup http://www.beaucoup.com
Internet Sleuth http://www.isleuth.com
The Virtual Chemistry Center http://www-sci.lib.uci.edu/HSG/GradChemistry.html


Kostenfreie Datenbanken

Es gibt inzwischen eine Reihe hochwertiger Datenbanken im Internet, die kostenfrei zugänglich sind. Die in Tabelle 2 aufgelisteten Adressen stellen nur einen sehr kleinen Teil des im naturwissenschaftlichen Bereich vorhandenen Materials dar. Ein absolutes Highlight ist der "ChemFinder", eine Meta-Datenbank, die Stoffdaten zu über 75000 Verbindungen enthält und ihre Trefferlisten durch Abfrage von über 200 Informationssystemen und Datenbanken weltweit generiert. Mit einem speziellen Plug-in sind sogar Struktursuchen möglich, ein Feature, das man bislang nur von kommerziellen Datenbanken wie Beilstein oder Gmelin kennt.

Insgesamt ist das in Deutschland vorhandene Material im Vergleich zum Informationsangebot in den Vereinigten Staaten noch relativ bescheiden, immerhin bieten hierzulande z.B. das ChemDB-Projekt, LabOnline und auch das Deutsche Patent- und Markenamt (Tabelle 2) wertvolle Informationen zum Nulltarif an.


Tabelle 2: kostenfreie Datenbanken im WWW (Auswahl)

ChemDB Projekt http://www.chemdb.de über 7000 Sicherheitsdatenblätter
ChemFinder http://chemfinder.camsoft.com Metadatenbank mit Stoffdaten zu über 75000 Verbindungen
Environmental Chemicals Data and Information Network (ECDIN) http://ulisse.etoit.eudra.org/Ecdin/
Ecdin.html
Stoffdaten für ca. 120.000 Verbindungen inkl. Literaturreferenzen
European Community Pharmaceutical Information Network (ECPHIN) http://ulisse.etoit.eudra.org/Ecphin/
Ecphin.html
Pharmazeutische Produktinformationen
Hazardous Chemical Database http://ull.chemistry.uakron.edu/erd/ chemische u. physikalische Daten zu knapp 2000 Gefahrstoffen
NIST Webbook Chemistry https://webbook.nist.gov Tausende IR- und Massenspektren, thermochem. Daten
Patendatenbanken https://www.dpma.de/service/links Patent-Recherche, Linkliste zu Patent-datenbanken im WWW


Auch einige kommerzielle Datenbankanbieter erlauben teilweise Zugriff auf Übungsdatenbanken oder sogar uneingeschränkt auf das komplette Angebot. Hervorzuheben ist hier die US National Library of Medicine (Zugang u.a. zu MEDLINE und TOXLINE) sowie das US Patent and Trademark Office (USPTO).


Kostenpflichtige Datenbanken

Die Zahl der kostenpflichtigen Datenbanken im Internet nimmt immer weiter zu. Praktisch alle kommerziellen Hosts ermöglichen inzwischen einen Zugang zu Ihren Datenbanken über eine WWW-Schnittstelle an. Allerdings bieten diese bislang noch nicht die Möglichkeiten wie die klassischen Zugänge über Modem oder Datex-P, da es sich nicht um gesicherte Verbindungen handelt und auch die Suchoptionen noch eingeschränkt sind. Hier wird sich der Standard aber sicher in absehbarer Zeit verbessern. Tabelle 3 enthält Links zu wichtigen Hosts im naturwissenschaftlichen Bereich. Die Angebote auf den Homepages der Hosts gehen meist über die reinen Datenbankzugänge hinaus und bieten in der Regel umfassende Informationen zu den angebotenen Datenbanken oder auch informative Linksammlungen.


Tabelle 3: Datenbank-Hosts im naturwissenschaftlichen Bereich (Auswahl)

Beilstein Informationssysteme http://www.beilstein.com
Biosciences Information Service and Biological Abstracts (BIOSIS) http://www.biosis.org
Chemical Abstracts Service (CAS) http://www.cas.org
Dechema e.V. http://dechema.de
Derwent Information Ltd. https://clarivate.com/derwent
Deutsches Institut für medizinische Dokumentation und Information (DIMDI) https://www.dimdi.de
Deutsches Patent- und Markenamt https://www.dpma.de
Dialog Corp. (DIALOG, DATASTAR) https://dialog.com
Europäisches Patentamt https://www.epo.org
Fachinformationszentrum Chemie GmbH http://www.fiz-chemie.de
Fachinformationszentrum Karlsruhe http://www.fiz-karlsruhe.de
Fachinformationszentrum Technik e.V http://www.fiz-technik.de
Institute for Scientific Information (ISI) http://www.isinet.com
Questel-Orbit Patent and Trademark https://www.questel.com
US National Library of Medicine http://www.nlm.nih.gov
US Patent and Trademark Office (USPTO) http://www.uspto.gov
Zentralstelle für Agrardokumentation und -information (ZADI) (aufgelöst)


Fazit

Zukünftig wird es immer mehr Datenbanken im Internet geben, da die Realisierung professioneller Schnittstellen durch spezielle Software relativ einfach zu bewerkstelligen ist und somit viele Nachteile statischer HTML-Dokumente umgangen werden.

Was momentan noch fehlt, sind spezielle Suchmaschinen wie der ChemFinder, die die Inhalte verschiedener Datenbanken mit einem einzigen Suchstring simultan abfragen können und die Ergebnisse dann in einer einzigen Trefferliste aufbereiten. Es ist sicher nur eine Frage der Zeit bis es solche Metasysteme auch für andere Bereiche geben wird.

In Teil 6 dieser Artikelserie werden wir uns mit dem Thema "Literaturbeschaffung im Internet"befassen. Dieser Teil erscheint voraussichtlich in der CLB-Dezember-Ausgabe.