Chemische Strukturformeln geben Fachleuten einen schnellen Überblick zum Aufbau von Molekülen. Computer können mit den Zeichnungen jedoch nichts anfangen – bis jetzt. Denn eine neue KI erkennt Strukturformeln und übersetzt sie in eine maschinenlesbare Form. Das frei verfügbare Tool kann diese Informationen nun aus wissenschaftlichen Veröffentlichungen automatisiert in Datenbanken einspeisen.
Das Team um Prof. Dr. Christoph Steinbeck (r.) und Prof. Dr. Achim Zielesny hat das KI-Tool Decimer entwickelt, das Abbildungen von Strukturformeln in maschinenlesbare Daten übersetzt.
(Bild: Anne Günther (Universität Jena))
Es ist eine Frage, die sich Chemikern ständig stellt: Wie sind chemische Verbindungen aufgebaut? Also aus welchen Atomen bestehen sie und wie sind diese räumlich angeordnet und miteinander verbunden? Wenn eine Struktur aufgeklärt ist, wird sie in Form einer Strukturformel dargestellt. Daraus lässt sich unter anderem ableiten, welche Moleküle miteinander reagieren können und welche nicht, wie sich komplexe Verbindungen synthetisieren lassen oder welche Naturstoffe eine therapeutische Wirkung haben könnten, weil sie mit Zielmolekülen in Zellen zusammenpassen.
Die im 19. Jahrhundert entwickelte Darstellung von Molekülen als Strukturformeln wird bis heute in jedem Chemie-Lehrbuch genutzt. Doch was die chemische Welt für Menschen erfassbar macht, ist für eine Software nur eine Ansammlung schwarzer und weißer Pixel. „Um die Informationen aus Strukturformeln in Datenbanken nutzbar zu machen, die automatisiert durchforstet werden können, müssen sie in einen maschinenlesbaren Code übersetzt werden“, erläutert Christoph Steinbeck, Professor für Analytische Chemie, Chemieinformatik und Chemometrie der Uni Jena. Und genau das kann die künstliche Intelligenz „Decimer“, die das Team um Steinbeck und seinen Kollegen Prof. Achim Zielesny von der Westfälischen Hochschule entwickelt hat.
Der Name Decimer steht für „Deep Learning for Chemical Image Recognition“ und ist eine open-source Plattform, die im Internet frei verfügbar ist und in einem normalen Internetbrowser genutzt werden kann. Dort lassen sich wissenschaftliche Artikel, die chemische Strukturformeln enthalten, einfach per drag and drop hochladen und sofort beginnt die KI ihre Arbeit.
„Als erstes wird das gesamte Dokument nach Abbildungen durchsucht“, sagt Steinbeck. Dann identifiziert der Algorithmus die enthaltene Bildinformation und klassifiziert diese danach, ob es sich um eine chemische Strukturformel oder irgendein anderes Bild handelt. Die erkannten Strukturformeln werden schließlich in den chemischen Strukturcode übersetzt oder in einem Struktureditor dargestellt, sodass sie weiterbearbeitet werden können. „Dieser Schritt ist der Kern des Projektes und die eigentliche Leistung“, macht Steinbeck deutlich.
Auf diese Weise wird zum Beispiel aus der chemischen Strukturformel (s. Abbildung) für das Molekül Koffein der maschinenlesbare Strukturcode CN1C=NC2=C1C(=O)N(C(=O)N2C)C. Dieser lässt sich anschließend direkt in eine Datenbank hochladen und mit weiteren Informationen zum jeweiligen Molekül verknüpfen.
Inspiriert durch digitalen Go-Spieler
Für die Entwicklung von Decimer haben die Forschenden moderne KI-Methoden genutzt, die sich erst in jüngster Zeit etabliert haben und zum Beispiel auch in den aktuell viel diskutierten Large Language Models wie Chat-GPT verwendet werden. Um seine KI zu trainieren, hat das Team aus den heute bereits vorhandenen maschinenlesbaren Datenbanken Strukturformeln erzeugt und als Trainingsdaten genutzt – rund 450 Millionen bisher. Neben Forschenden nutzen bereits Firmen das KI-Tool, etwa um aus Patentschriften Strukturformeln in Datenbanken zu übertragen.
Auf die Idee, eine KI für die Dekodierung chemischer Abbildungen zu entwickeln, sind Steinbeck und Zielesny vor einigen Jahren gekommen. Die beiden Chemiker interessierten sich für die Entwicklung von KI-Methoden im Zusammenhang mit dem jahrtausendealten asiatischen Brettspiel Go. 2016 verfolgten sie gemeinsam mit Millionen Menschen weltweit das Turnier zwischen dem damals besten Go-Spieler der Welt, dem Südkoreaner Lee Sedol, und der Computersoftware „AlphaGo“, welches die Maschine 4:1 für sich entschied. „Das war ein Paukenschlag, der uns gezeigt hat, wie mächtig KI sein kann“, erinnert sich Steinbeck. Bis dahin galt es praktisch als undenkbar, dass es ein Algorithmus mit der menschlichen Kreativität und Intuition in diesem Spiel aufnehmen kann. „Als wenig später eine KI quasi übermenschliche Spielstärke entwickelte, indem sie nicht – wie noch AlphaGo – aufwendig mit unzähligen Verläufen von menschlichen Spielen trainiert wurde, sondern einfach dadurch, dass das System immer wieder gegen sich selbst spielte und dabei seine Spielweise optimierte, wurde uns klar, dass diese neuen Methoden mit genügend Trainingsdaten auch andere sehr komplexe Probleme lösen können. Das wollten wir für unseren Forschungsbereich nutzen.“
Steinbeck und sein Team hoffen, mit Decimer irgendwann sämtliche für sie interessante chemische Literatur, zurück bis in die 1950er Jahre, maschinell lesen und in offene Datenbanken übersetzen zu können. Denn das vorhandene Wissen nachhaltig zu sichern und der wissenschaftlichen Gemeinde weltweit zur Verfügung zu stellen, ist ein zentrales Anliegen von Steinbeck, der auch Sprecher der Nationalen Forschungsdateninfrastruktur für die Chemie ist.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel Communications Group GmbH & Co. KG, Max-Planckstr. 7-9, 97082 Würzburg einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von redaktionellen Newslettern nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung, Abschnitt Redaktionelle Newsletter.