English China

Maschinelles Lernen

Leukämie: Schnellere Diagnose mit künstlicher Intelligenz

Seite: 2/2

Firmen zum Thema

Unterschiedliche klinisch relevante Szenarien

Mit diesem großen Datensatz war es möglich, unterschiedliche klinisch relevante Szenarien durchzuspielen. So untersuchten sie, wie sich die Vorhersage verbessert, je mehr Proben dem Algorithmus zum Erlernen des Musters zur Verfügung gestellt werden. Grundsätzlich gilt: Je mehr Daten zum Training eines Klassifikationsalgorithmus verwendet werden, umso genauer ist in der Regel die Vorhersage von unbekannten Proben.

Gilt das aber auch für Fälle, in denen die Testdaten viel später, an anderen Orten, von anderen Personen oder mit anderen Technologien erstellt wurden? Das wäre gerade für die klinische Anwendung eines Klassifikationsalgorithmus interessant, der, einmal trainiert, auf eine Vielzahl von Patienten anwendbar sein sollte. Aufgrund der Größe des Datensatzes und der Vielzahl der enthaltenen, unterschiedlichen und unabhängigen Studien konnte auch dieses Szenario durchgespielt werden.

Bildergalerie

Es zeigte sich, dass dieses „cross-study“-Szenario zunächst schlechter abschneidet als bei einer zufälligen Einteilung der Daten in Trainings- und Testdaten, dass sich die Effizienz aber bei besonders großen Trainingsdatensätzen annähert. Im Falle von unterschiedlichen Technologien zur Erfassung des Bluttrans­kriptoms zeigte sich, dass mit einer relativ einfachen Normalisierungsstrategie, bei der die Genexpres­sionsdaten in Rangzahlen umgewandelt werden, Vorhersagen über Technologien hinweg problemlos möglich sind.

Es wurden auch unterschiedliche Klassifikationsalgorithmen getestet. Es zeigte sich, dass die Art des Algorithmus nicht von entscheidender Bedeutung für die Vorhersagegenauigkeit ist. Es gibt jedoch Unterschiede in der Interpretierbarkeit der Algorithmen. Im verwendeten „Lasso“-Algorithmus (least absolute shrinkage and selection operator) ist nachvollziehbar, welche Gene der Algorithmus letztlich kombiniert hat, um das Leukämie-„Muster“ zu definieren.

Ergänzung der klassischen Diagnosepipeline

Damit ist natürlich noch kein klinischer Test entwickelt, aber es wurde die Grundlage dazu gelegt. In keinem Falle sehen die Forscher ein Szenario, bei dem maschinelles Lernen den Arzt ersetzen sollte. Die Erwartungen an maschinelles Lernen in der Diagnostik wären vielmehr, dass Ärzten ergänzende Informationen zur Verfügung gestellt werden, die dabei helfen, Patienten schneller an den richtigen Experten zu vermitteln.

Zusammen mit den immer weiter fallenden Kosten für RNA-Sequenzierungen wäre dies auch ökonomisch sinnvoll. Transkriptommessungen könnten von Hausarztpraxen relativ einfach, ähnlich wie das klassische Blutbild, in Auftrag gegeben werden und prinzipiell nicht nur zur Vorhersage von Leukämie, sondern auch für andere Krankheiten verwendet werden – sofern für diese ein Klassifikationsalgorithmus mit ausreichend Daten trainiert und getestet wurde. Erste Ansätze hierfür gibt es bereits, beispielsweise bei Lungenkrebs oder Brustkrebs.

Voraussetzung hierfür wäre jedoch, dass solche Algorithmen mit großen Mengen an praxisnahen Daten immer weiterentwickelt und optimiert werden können – was nur mit einem massiven Ausbau der digitalen Vernetzung des Gesundheitssystems gelingen kann.

* S. Warnat-Herresthal & Prof. Dr. J. L. Schultze: Genomics & Immunoregulation, LIMES-Institut, 53115 Bonn

* *Prof. Dr. J. L. Schultze: PRECISE Plattform für Single Cell Genomics und Epigenomics, Deutsches Zentrum für Neurodegenerative Erkrankungen (DZNE) und Universität Bonn, 53127 Bonn

(ID:46371071)