Forschungsarbeit generiert häufig riesige Datenmengen, deren Auswertung aufwändig und fehleranfällig ist. Am Forschungszentrum Jülich haben Wissenschaftler jetzt eine Sprachmodell entwickelt, das dabei helfen soll, wissenschaftliche Daten auszuwerten. Die Forscher stellen ihre Arbeit als Open-Source-Projekt zur Verfügung.
Das von Jülicher Systemforschenden entwickelte Framework Quinex basiert auf Sprachmodellen und identifiziert automatisch Zahlenwerte in wissenschaftlichen Publikationen, ordnet sie passenden Einheiten zu und erkennt, was gemessen wurde, wann, wo und wie.
(Bild: 2026 Göpfert et al., The Innovation, Elsevier)
Ob in der Energie-, Klima- oder Materialforschung – wissenschaftliche Arbeiten sind voll von Zahlen – oder präziser, quantitativen Daten: Wirkungsgrade, Temperaturen, Kosten, Emissionen. Diese sind oft entscheidend, um Modelle zu verbessern oder Trends zu erkennen. Gleichzeitig nimmt die Anzahl wissenschaftlicher Publikationen stark zu. Für viele Forschungsfragen ist es heute kaum noch möglich, alle relevanten Veröffentlichungen manuell auszuwerten – der Aufwand an Zeit und Ressourcen wäre enorm.
Das von Jülicher Systemforschenden entwickelte Framework Quinex („Quantitative Information Extraction“) basiert auf Sprachmodellen und automatisiert diesen Prozess: Die künstliche Intelligenz identifiziert Zahlenwerte, ordnet sie passenden Einheiten zu und erkennt, was gemessen wurde, wann, wo und wie. So wird aus einem Satz wie „Für 2025 werden Wirkungsgrade von 63 bis 71 Prozent angenommen“ ein strukturierter Datensatz mit allen relevanten Kontextinformationen – vom Jahr über die Messmethode bis zur Quelle.
Quinex erreicht hohe Erkennungsgenauigkeit
Im Gegensatz zu vielen proprietären KI-Lösungen basiert Quinex vollständig auf offenen, relativ kleinen und damit effizienten Sprachmodellen. Diese wurden speziell darauf trainiert, quantitative Informationen in wissenschaftlichen Texten zu erkennen und einzuordnen. Im Vergleich zu ähnlichen Systemen liefert Quinex präzisere Ergebnisse, erfasst Kontextinformationen differenzierter und berücksichtigt auch implizite Eigenschaften.
Trotz seiner Kompaktheit erreicht Quinex eine Erkennungsgenauigkeit (F1-Maß) von rund 98 Prozent bei Zahlen und zugehörigen Einheiten sowie etwa 87 und 82 Prozent bei der Zuordnung der quantifizierten Eigenschaften und Entitäten. Erreicht wurden diese hohen Werte durch speziell erstellte Trainingsdatensätze und methodische Verbesserungen.
„Wir wollten ein Werkzeug entwickeln, das leistungsfähig, aber auch transparent und ressourcenschonend ist“, erklärt Dr. Jann Weinand, Leiter der Abteilung Integrierte Szenarien der Jülicher Systemanalyse. „Quinex macht Künstliche Intelligenz für die Datenauswertung in der Wissenschaft leichter zugänglich.“
Wissenschaftliche Abstracts aus unterschiedlichen Disziplinen untersucht
Um die Praxistauglichkeit von Quinex zu testen, wurde das System auf tausende wissenschaftliche Abstracts aus unterschiedlichen Fachgebieten angewendet. Dabei konnte es erfolgreich Daten zu Stromproduktionskosten verschiedener Energietechnologien, zur maximalen Sauerstoffaufnahme von Menschen, zu Erdbebenstärken und -orten sowie zu den Bandlücken von Photovoltaikmaterialien extrahieren.
Die automatisch gewonnenen Werte stimmten eng mit den jeweiligen Referenzdaten überein. Damit zeigt sich: Quinex eignet sich, um in verschiedensten Forschungsfeldern große Mengen an Fachliteratur auszuwerten und daraus verlässliche Trends abzuleiten.
„Sprachmodelle eröffnen neue Perspektiven für die Wissenschaft und helfen dabei, den Überblick über ganze Forschungsbereiche zu behalten“, sagt Hauptautor Jan Göpfert. „Sie ermöglichen automatisierte Literaturrecherchen, den Aufbau einheitlich strukturierter Forschungsdatenbanken und Trendanalysen, die Entwicklungen in Wissenschaft und Technik frühzeitig sichtbar machen.“
„Unser Ziel ist es, Forschende von Routinearbeit zu entlasten“, so Dr. Patrick Kuckertz, Leiter der Gruppe Forschungsdatenmanagement. „Quinex soll ihnen helfen, schneller zu Erkenntnissen zu gelangen und die wachsende Datenflut in der Wissenschaft zu beherrschen.“
Wo liegen aktuell noch Grenzen?
Ganz ohne Fehler arbeitet auch Quinex nicht – doch Transparenz ist Teil seines Designs.
„Zahlen und Einheiten erkennt das System sehr zuverlässig“, sagt Jan Göpfert. „Da sie direkt aus dem Text übernommen werden, können sie nicht ‚halluziniert‘ werden. Manchmal kommt es aber zu Fehlinterpretationen, etwa wenn sich wichtige Bezüge über den gesamten Text verteilen.“
Damit bleibt Quinex ein Werkzeug, das Menschen unterstützt, aber nicht ersetzt. „Wir empfehlen, Quinex dort einzusetzen, wo es Forschende informiert und entlastet – die Verantwortung für die Interpretation der Ergebnisse liegt aber weiterhin bei ihnen“, so Göpfert. Jede erkannte Zahl lässt sich bis zur Quelle zurückverfolgen und wird, wenn möglich, im Originaltext markiert.
Das Team arbeitet daran, Quinex mit zusätzlichen Fachdatensätzen und Modellen weiterzuentwickeln und noch effizienter zu machen und so flexibel an verschiedene Forschungsanforderungen anzupassen.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel Communications Group GmbH & Co. KG, Max-Planckstr. 7-9, 97082 Würzburg einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von redaktionellen Newslettern nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung, Abschnitt Redaktionelle Newsletter.
Das Forschungszentrum Jülich stellt Quinex als Open-Source-Projekt zur Verfügung. Damit sollen Forschende weltweit die Möglichkeit erhalten, das System zu testen, zu erweitern und an eigene Fachgebiete anzupassen – von der Energieforschung über die Chemie bis zur Biomedizin.