Sie sind entzündungshemmend, können Krankheitskeime abwehren oder unterbinden sogar das Wachstum von Krebszellen – Wirkstoffe aus der Natur. Mehr als ein Drittel aller heute verfügbaren Medikamente basieren auf solchen sekundären Naturstoffen, wie sie in zahlreichen Pflanzen, Bakterien und Pilzen vorkommen.
Den reichhaltigen Medizinschrank der Natur nutzbar zu machen und neue Naturstoffe zu identifizieren, ist jedoch zeit-, kosten- und arbeitsintensiv. Ein Team der Bioinformatik an der Friedrich-Schiller-Universität Jena hat jetzt ein Verfahren entwickelt, mit dem sich kleine Wirkstoff-Moleküle sehr viel schneller und einfacher identifizieren lassen als bisher: Sie nennen es Confidence of Small Molecule Identifications oder kurz Cosmic.
Suche nach Wirkstoffen zwischen Millionen von unentschlüsselten Strukturdaten
Will man wissen, welche Substanzen eine biologische Probe wie etwa ein Pflanzenextrakt enthält, wird diese mittels Massenspektrometrie analysiert. Dabei werden die Moleküle in Fragmente zerlegt und deren Masse bestimmt. „Die von uns entwickelte Molekülsuchmaschine CSI:Finger-ID erlaubt es, gezielt nach Molekülstrukturen zu suchen, die zu diesen Fragmenten passen“, beschreibt Prof. Sebastian Böcker von der Universität Jena das Vorgehen. „Ob diese Suche erfolgreich ist – das Suchergebnis also die korrekte Struktur wiedergibt – können wir so nicht entscheiden“.
Genau hier kommt nun Cosmic zum Einsatz und ermöglicht, bei bisher unidentifizierten Moleküle automatisch Strukturen zu entschlüsseln. Denn mittlerweile liegen riesige Datensammlungen mit Milliarden von Massenspektrometriedaten aus Millionen von Analysen biologischer Proben vor. Der weitaus größte Teil der Moleküle ist in ihrer Struktur nicht identifiziert.
Maschinelles Lernen (KI) unterstützt die Suche nach Strukturen
„Dabei nutzen wir Verfahren des maschinellen Lernens“, erläutert Martin Hoffman von der Uni Jena. „Zunächst wird das Massenspektrum der untersuchten Probe mit den verfügbaren Strukturdaten abgeglichen.“ Als Ergebnis erhält man – wie in einer Google-Suche – eine mehr oder weniger umfangreiche Liste möglicher Treffer. „Unsere Methode gibt nun an, wie sicher es ist, dass der gefundene Treffer an erster Stelle tatsächlich die Struktur ist, nach der wir suchen“, veranschaulicht Hoffmann.
Cosmic biete laut Hoffmann die Chance, die Suche nach neuen interessanten Substanzen erheblich zu beschleunigen, da sich das Screening vollautomatisch, ohne personellen Aufwand und in kurzer Zeit durchführen lasse. Er erwartet, dass in den kommenden Jahren auf diese Weise Tausende neuer Molekülstrukturen aufgeklärt werden können.
Wissenschaftliche Ansprechpartner:
Prof. Sebastian Böcker
Institut für Informatik der Friedrich-Schiller-Universität Jena
Ernst-Abbe-Platz 2
07743 Jena
E-Mail: sebastian.boecker@uni-jena.de
https://doi.org/10.1038/s41587–021–01045–9