Chemie & Life Sciences

Studie zur Nachnutzung von Daten aus der chemischen Forschung abgeschlossen

26.11.2010 -

Analyse- und Messdaten aus grundlegenden chemischen Untersuchungen und Experimenten, sog. chemische Primärdaten, sollen in Zukunft viel stärker durch Dritte nachgenutzt werden können als dies bisher möglich ist. Damit eine breite wissenschaftliche Öffentlichkeit auf die oft mit teuren Geräten und Apparaten in aufwendigen Untersuchungen gewonnenen Forschungsdaten zugreifen kann, um darauf eigene Forschungsarbeiten aufzubauen, sollen diese online für den Zugriff nach Bedarf verfügbar gemacht werden. In der Chemie gibt es bislang kaum Möglichkeiten, primäre Forschungsdaten in zentralen Repositorien zu speichern, um sie so für eine breite Nachnutzung verfügbar zu machen.
In der Konzeptstudie „Vernetzte Primärdaten-Infrastruktur für den Wissenschaftler-Arbeitsplatz in der Chemie" haben das FIZ Chemie, die Technische Informationsbibliothek (TIB) und der Arbeitskreis von Prof. Gregor Fels am Department Chemie der Universität Paderborn als Vertreter der Fachgruppe Chemie-Information-Computer (CIC) der Gesellschaft Deutscher Chemiker (GDCh) am Beispiel der Synthesechemie ein Jahr lang untersucht, welche Voraussetzungen geschaffen werden müssen, um diese Situation zu ändern. Nun haben die Projektpartner ihr Ergebnis vorgelegt. Die Studie wurde von der Deutschen Forschungsgemeinschaft (DFG) gefördert.

Primärdaten-Infrastruktur fehlt

Dr. Jost Bohlen, Leiter der Abteilung Produktentwicklung und Internet bei FIZ Chemie, erklärt dazu: „Das Prinzip der Nachnutzung von bereits existierenden Daten ist in der Chemie nicht sehr verbreitet. Bisher haben meistens nur die Mitglieder der Forschungsgruppe, die am jeweiligen Experiment arbeitet, Zugriff auf die Forschungsprimärdaten. Bei der Publikation der Arbeitsergebnisse von Synthesechemikern steht dann üblicherweise die Reproduzierbarkeit des beschriebenen Experiments an erster Stelle. Wenn man aber nicht nur ihre Ergebnisse, sondern auch die zugrunde liegenden Ausgangsdaten einer breiten wissenschaftlichen Öffentlichkeit zur Verfügung stellt, können Dritte auf dieser Datenbasis eigene Forschungsansätze und vielleicht ganz andere Ideen mit einem ganz anderen Ziel aufsetzen", so Bohlen.

In anderen Wissenschaften wie der Meteorologie oder den Erd- und Umweltwissenschaften sei das bereits ganz selbstverständlich. Dort könne eine breite wissenschaftliche Öffentlichkeit z.B. auf Unmengen an Wetterbeobachtungsdaten und Messdaten aus der Grundlagenforschung zugreifen. In der Chemie fehle bislang eine solche Infrastruktur.

Wichtige Voraussetzungen

Ausgehend von der Erfassung der Ist-Situation und der Analyse wissenschaftlicher Arbeitsprozesse gibt die Studie Antworten darauf, was organisatorisch und technisch berücksichtigt werden muss, um eine vernetzte Primärdaten-Infrastruktur für den wissenschaftlichen Arbeitsplatz in der Chemie zu schaffen.

Wichtige Voraussetzung für die Nach- und Weiternutzung von Primärdaten ist die Vergabe eines eindeutigen und dauerhaften Identifiers wie dem Digital Object Identifier (DOI) für einen Primärdatensatz, um diesen jederzeit referenzieren zu können. Die TIB ist die weltweit erste DOI-Registrierungsagentur für Primärdaten. „In einem Pilotprojekt mit dem Georg Thieme Verlag haben wir bereits wertvolle Erfahrungen mit der DOI Vergabe für Primärdaten in der Chemie sammeln können, die wir in der Erarbeitung dieser Konzeptstudie erfolgreich anwenden konnten", so Dr. Irina Sens, stellvertretende Direktorin der TIB.

So einfach wie möglich

Die Studie hat auch umfangreiche Informationen zur Bereitschaft der betroffenen Forscher erfasst, ihre Primärdaten der wissenschaftlichen Gemeinschaft zur Verfügung zu stellen. Um eine breite Akzeptenz zu bekommen, so eine wichtige Aussage der Studie, sei zur Gewinnung der Primärdaten eine weitgehende Automatisierung der Datenerfassung von grundlegender Bedeutung. Nur wenn es den forschenden Wissenschaftlern so einfach wie möglich gemacht werde, ihre Forschungsprimärdaten zu dokumentieren, könnten diese für eine breite Nutzung verfügbar gemacht werden. Hier sehen die Projektpartner große Chancen für Gerätehersteller und Anwendungsentwickler, ihre bereits jetzt hoch entwickelten technischen Systeme mit entsprechender Software nicht nur zur Messdatenerfassung, sondern auch zur Erfassung der Bedingungen, unter denen das Experiment ausgeführt wurde, auszurüsten und Schnittstellen für den Datenexport zu entwickeln.

Disziplinspezifische Ansätze

Da die Chemie keine homogene Wissenschaft ist, gehen die Projektpartner davon aus, dass es notwendig sein wird, für die Bereitstellung chemischer Primärdaten am wissenschaftlichen Arbeitsplatz disziplinspezifische Ansätze zu entwickeln, die auf den Bedarf und die Arbeitsweise der jeweiligen Fachrichtung bzw. des Fachbereiches ausgerichtet sind. Es werde, so eine zentrale Erkenntnis der Studie, nicht möglich sein, ein System oder einen Prozess zu entwickeln, der trivial auf alle Fachbereiche der Chemie übertragen werden könne. Manche Fachbereiche würden vergleichbar den Geowissenschaften eine zentrale Datenstruktur benötigen. Für andere würden unter Verwendung allgemeingültiger Standards individuelle Lösungen in Form von verteilten Datenrepositorien zu betreiben sein. Auch mit der Frage, wer diese zentralen Datenstrukturen und Repositorien betreiben könnte und wie die wissenschaftliche Wertschöpfungskette und die Zusammenarbeit der Partner gestaltet werden könnte, haben sich die Projektpartner befasst und dazu ein Pyramidenmodell skizziert. 

Kontakt

FIZ Chemie Berlin GmbH

Franklinstr. 11
10587 Berline
Deutschland

+49 30 39977 0
+49 30 39977 134