Studie über Forschungsdaten in der Chemie

Unzählige chemische Experimente sind in Datenbanken zugänglich. Dennoch sind diese Daten nicht gut genug, um mithilfe von künstlicher Intelligenz (KI) und maschinellem Lernen bei neuen Synthesen Produktausbeuten vorherzusagen, hat ein Forschungsteam herausgefunden.

Wie das Team in der bei Wiley-VCH erscheinenden GDCh-Zeitschrift Angewandte Chemie berichtet, liegt die schlechte Datenqualität vor allem auch an der Neigung der Wissenschaftlern, fehlgeschlagene Experimente nicht zu veröffentlichen.

Bei der Vorhersage von Molekülstrukturen und Materialeigenschaften leisten maschinelle Lernwerkzeuge bereits sehr viel. Geht es aber konkret um die Produktausbeute bei einer Synthese, liefern KI-basierte Modelle nur ungenaue Vorhersagen, stellten Forschende um Frank Glorius von der Westfälischen Wilhelms-Universität Münster fest.

Den Grund für das Scheitern identifizierten die Forschenden in der Qualität der Daten, auf die die KI zurückgreift. „Die Vorhersage von Reaktionsausbeuten, also der Reaktivität, ist viel herausfordernder als die Vorhersage von molekularen Eigenschaften. Ausgangsstoffe, Hilfsstoffe, Mengen, Bedingungen, Ausführung des Experiments – sie alle bestimmen die Ausbeute, was bedeutet, dass dieses Problem sehr datenintensiv wird,“ erklärt Frank Glorius, Korrespondenzautor der Studie. Trotz der riesigen Menge an verfügbarer Literatur reichten die Daten also nicht aus, um Ausbeuten korrekt vorherzusagen.

Das Problem liege dabei häufig nicht an zu wenig berichteten Experimenten, sondern an einer Datenschieflage. Drei mögliche Ursachen identifizierten die Forschenden: Zum einen unterliegen die Ergebnisse von chemischen Synthesen grundsätzlich experimentellen Fehlern. Zweitens treffen Wissenschaftler ihrer Reaktionsplanung mehr oder weniger bewusst eine Vorauswahl, die auf persönlicher Erfahrung und Vertrauen in etablierte Verfahren beruht. Und drittens melden sie fehlgeschlagene Reaktionen weniger häufig als erfolgreiche – vermeintlich führen nur Reaktionen mit einem positiven Ergebnis zu einem wissenschaftlichen Fortschritt.

Um herauszufinden, welcher der drei Faktoren den größten Einfluss hat, veränderten Glorius und sein Team den Datensatz für vier gängige (und daher datenreiche) organische Reaktionen. So erhöhten sie künstlich den experimentellen Fehler, reduzierten die Daten auf eine noch kleinere Vorauswahl, oder sie nahmen aus dem Datensatz negative Ergebnisse heraus. Am wenigsten Einfluss auf das Modell hatte der experimentelle Fehler, sehr groß war dagegen der Einfluss der negativen Ergebnisse, heißt es in der Studie.

Wissenschaftler sollten also unbedingt ermutigt werden, fehlgeschlagene Ergebnisse ebenfalls zu berichten, schreibt das Team. Damit verbessere sich die Datenlage, und KI-basierte maschinelle Lernmodelle können die Arbeit beschleunigen und effizienter machen. „Maschinelles Lernen wird die Effizienz in der (molekularen) Chemie dramatisch verbessern. Chemiker kommen mit weniger Reaktionen aus, um ein bestimmtes Ziel zu erreichen wie zum Beispiel optimale Ausbeuten. Dadurch werden chemische Prozesse – und die Welt – nachhaltiger,“ bekräftigt Glorius.

© Shutterstock 68093830
© Shutterstock 68093830

Anbieter

Logo:

Wiley-VCH GmbH

Boschstrasse 12
69469 Weinheim
Deutschland

Kontakt zum Anbieter







Meist gelesen

Photo
19.03.2025 • NewsTechnologie

Leuchttürme der Start-up-Szene – Teil 2: Ineratec

Der CHEManager Innovation Pitch, hat seit dem Launch 2019 mehr als 100 Start-ups aus über 15 Ländern die Möglichkeit geboten, innovativen Ideen, Produkte und Technologien einer breiten Zielgruppe zu präsentieren. Diesen Meilenstein nehmen wir zum Anlass, um auf einige der Gründerstories der vergangenen sechs Jahre zu blicken und deren Entwicklung aufzuzeigen.

Photo
14.03.2025 • NewsLogistik

Optimierung der Lieferkette:

Optimierte Lieferketten sind entscheidend für den Unternehmenserfolg. Doch was verbirgt sich hinter dem Begriff „Supply Chain Solutions“?

Photo
19.12.2024 • News

Covestro-Aktionäre stimmen Übernahme durch ADNOC zu

ADNOC International erhält insgesamt 91,3 % der Covestro-Aktien. Bereits nach Ende der regulären Annahmefrist am 27. November 2024 hatte das Übernahmeangebot die Mindestannahmequote mit rund 70 % deutlich überschritten.

Photo
14.11.2024 • News

BÜFA schafft Basis für künftiges Wachstum

Die chemische Industrie in Deutschland sieht sich zunehmend vor enormen Herausforderungen. Die aktuellen wirtschaftspolitischen Rahmenbedingungen erschweren es, die ökonomische Kraft im Inland voll auszuschöpfen. In diesem anspruchsvollen Umfeld agiert auch das Oldenburger Chemieunternehmen BÜFA und rüstet sich, seine Resilienz gegenüber möglichen komplexen und unvorhersehbaren Marktschwankungen im kommenden Jahr weiter zu stärken.