Pilz-Resistenzen, Samenzahl, Geschmack oder Fruchtfarbe: Neue Deep-Learning-Modelle können helfen, die Aktivität von Genen besser zu verstehen – und Nutzpflanzen entsprechend zu optimieren.
Form, Farbe und Robustheit und vieles mehr von Nutzpflanzen liegt in ihren genen begründet.
(Bild: dikana87 - stock.adobe.com)
Die Aufklärung der Beziehung zwischen Sequenzen von regulatorischen Elementen und ihren Zielgenen ist der Schlüssel für das Verständnis der Genregulation und ihrer Variation zwischen Pflanzenarten und Ökotypen. Ein Forschungsteam unter Führung des Leibniz-Institut für Pflanzengenetik und Kulturpflanzenforschung IPK und mit Beteiligung des Forschungszentrums Jülich hat jetzt „Deep-Learning“-Modelle entwickelt, die Gensequenzdaten mit der mRNA-Kopienzahl für mehrere Pflanzenarten verknüpfen und die regulatorische Wirkung von Gensequenzvariationen vorhersagen.
Korrelationen zwischen genetischen Varianten und Pflanzenmerkmalen
Mit der Sequenzierungstechnologie ist es heute möglich, jährlich Tausende neue Pflanzengenome zu entschlüsseln. Forscherinnen und Forscher verbinden diese genomischen Informationen mit Daten zu verschiedenen Pflanzenmerkmalen. Ziel ist es, Korrelationen zwischen genetischen Varianten und Pflanzenmerkmalen wie der Anzahl der Samen, der Resistenz gegen Pilzbefall, der Fruchtfarbe oder dem Geschmack zu ermitteln. Bisher fehlt allerdings das umfassende Verständnis dafür, wie genetische Variation die Genaktivität auf molekularer Ebene beeinflusst. Dies schränkt die Möglichkeiten ein, „intelligente Nutzpflanzen“ mit verbesserter Qualität und geringeren negativen Auswirkungen auf die Umwelt zu züchten.
Forschern des IPK Leibniz-Instituts und des Forschungszentrums Jülich (FZ) ist jetzt ein Durchbruch bei der Bewältigung dieser Herausforderung gelungen. Unter der Leitung von Dr. Jedrzej Jakub Szymanski trainierte das internationale Forscherteam interpretierbare „Deep-Learning“-Modelle, eine Untergruppe von KI-Algorithmen, auf einem riesigen Datensatz mit genomischen Informationen aus verschiedenen Pflanzenarten. „Diese Modelle waren nicht nur in der Lage, die Genaktivität anhand von Sequenzen genau vorherzusagen, sondern auch festzustellen, welche Sequenzteile diese Vorhersagen ermöglichen“, erklärt der Leiter der IPK-Arbeitsgruppe „Netzwerkanalyse und Modellierung“. Die von den Forschern angewandte KI-Technologie ist vergleichbar mit derjenigen, die im Bereich des Computersehens eingesetzt wird, wo es darum geht, Gesichtszüge in Bildern zu erkennen und auf Emotionen zu schließen.
Mathematische Modelle übertragbar auch auf andere Pflanzenarten
Im Gegensatz zu früheren Ansätzen, die auf statistischer Anreicherung beruhen, entwickelten die Forscher hier ein mathematisches Modell, das anhand von genomischen Sequenzmerkmalen die mRNA-Kopienzahl voraussagen kann. Das Modell berücksichtigt die Struktur des Genmodells und die Sequenzhomologie, also die Genevolution.
„Wir waren wirklich erstaunt über die Effektivität. Innerhalb weniger Tage Training haben wir viele bekannte regulatorische Sequenzen wiederentdeckt und festgestellt, dass etwa 50 Prozent der identifizierten Sequenzmerkmale völlig neu waren. Die Modelle ließen sich sogar hervorragend auf Pflanzenarten anwenden, für die sie nicht trainiert wurden. Das macht sie für die Analyse neu sequenzierter Genome so wertvoll“, sagt Dr. Jedrzej Jakub Szymanski.
„Wir haben speziell ihre Anwendung für verschiedene Tomatensorten mit sogenannten ‚Long-Read-Sequenzdaten‘ getestet. Dabei konnten wir spezifische regulatorische Sequenzvariationen identifizieren, die die beobachteten Unterschiede in der Genaktivität und folglich auch der Form, Farbe und Robustheit der Pflanzen erklären. Und dies ist eine bemerkenswerte Verbesserung gegenüber den klassischen statistischen Assoziationen von Einzelnukleotid-Polymorphismen, bei denen es nur um einzelne DNA-Basen geht.“
Modelle als Open Source zugänglich
Das Team hat seine Modelle öffentlich zugänglich gemacht und eine Webschnittstelle für die Nutzung bereitgestellt. „Um zu optimistische Ergebnisse zu vermeiden, die darauf zurückzuführen sind, dass die KI Abkürzungen findet, mussten wir tief in die Biologie der Genregulation eintauchen, um mögliche Verzerrungen zu beseitigen und Datenverluste und Überanpassungen zu reduzieren“, erläutert Fritz Forbang Peleke, leitender Forscher für maschinelles Lernen und Erstautor der Studie, die in der Zeitschrift „Nature Communications“ veröffentlicht wurde.
Dr. Simon Zumkeller, Mitautor und Evolutionsbiologe am FZ Jülich, sagt: „Die von uns vorgestellten Analyseansätze bieten Möglichkeiten, die Genregulation in Pflanzen besser und sogar auf evolutionärer Ebene zu untersuchen. Auch für die praktische Anwendung gibt es mit der von uns beschriebenen Methode eine neue Basis. Mit ihr nähern wir uns der routinemäßigen Identifizierung regulatorischer Genelemente in bekannten und neu sequenzierten Genomen, in verschiedenen Geweben und unter verschiedenen Umweltbedingungen.“
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel Communications Group GmbH & Co. KG, Max-Planckstr. 7-9, 97082 Würzburg einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von redaktionellen Newslettern nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung, Abschnitt Redaktionelle Newsletter.