Die sogenannten Foundation Models sind eine neue Generation von KI-Modellen, die gezielt mit sehr großen Datenmengen trainiert werden und so eine breite Wissensbasis aufbauen. Im Gegensatz zu herkömmlichen KI-Modellen, die meist für einzelne Aufgaben entwickelt werden, sind Foundation Models flexibler einsetzbar. Mit generativer KI können Foundation Models komplexe Zusammenhänge auf Basis erlernter Muster verstehen, neue Zusammenhänge generieren sowie Vorhersagen erstellen. Dadurch sind sie vielseitiger sowie leistungsstärker und eröffnen große Möglichkeiten für die moderne, datengetriebene Wissenschaft.
Die Helmholtz Foundation Model Initiative fördert bereits vier Projekte in den Bereichen Wetter & Klima, CO2-Kreisläufe, Radiologie und Photovoltaikmaterialien. Ziel der Initiative ist es, innerhalb von drei Jahren voll funktionsfähige Foundation Models zu entwickeln, die neue Erkenntnisse in der Forschung ermöglichen. Die folgenden drei Projekte werden neu gefördert.
PROFOUND
Proteine sind die grundlegenden Moleküle des Lebens. Sie sind Baustoffe und steuern als chemische Werkzeuge die Prozesse im Inneren von Lebewesen. Es ist die Art und Weise, wie sie interagieren und funktionieren, die alle lebenden Systeme so komplex und faszinierend macht. Die Fähigkeit, Proteine zu entwerfen, hat enormes Potenzial, sowohl für die Grundlagenbiologie als auch für viele angewandte Bereiche und die Medizin. Der Chemie-Nobelpreis ging in diesem Jahr an Forscher, die in diesem Bereich Pionierarbeit geleistet haben. Heute ist es möglich, anhand einer Gen-Sequenz mit Hilfe von KI die dreidimensionale Struktur des Proteins, das die Sequenz codiert, vorherzusagen. PROFOUND wird das Proteindesign revolutionieren, indem es eine große Hürde überwindet, mit der aktuelle KI-Modelle wie AlphaFold konfrontiert sind: Sie sind auf statische Proteinstrukturen beschränkt. In Wirklichkeit sind Proteine wie Nanomaschinen, die ständig ihre Form verändern, um ihre biologische Arbeit zu verrichten. PROFOUND zielt darauf ab, diese Bewegungen zu erfassen. Dafür nutzen die Forschenden groß angelegte Molekulardynamikdaten, um ein KI-Modell zu erstellen, das diese dynamischen Verhaltensweisen vorhersagen kann. Dieser Ansatz wird es ermöglichen, Proteine zu entwickeln, die nicht nur bestimmte Aufgaben erfüllen, sondern sich auch im Laufe der Zeit anpassen. Die Forscher können sich Durchbrüche wie dynamische Enzyme und programmierbare molekulare Maschinen vorstellen, die zu Innovationen bei intelligenten Therapeutika, nachhaltigen Materialien und Biotechnologien der nächsten Generation führen könnten.
PROFOUND wird geleitet von Prof. Dr. Holger Gohlke vom Institut für Bioinformatik des Forschungszentrums Jülich in Zusammenarbeit mit den Kollegen Prof. Dr. Alexander Schug vom Jülich Supercomputing Centre (JSC) und Prof. Dr. Stefan Bauer vom Helmholtz-Zentrum München. Die Forschungsgruppe um Prof. Dr. Alexander Schug bringt ihre langjährige Erfahrung in der biomolekularen Modellierung und im Einsatz von KI auf Hochleistungsrechnern in das Projekt mit ein. Dies verspricht nicht nur verbesserte Lösungen im Proteindesign, sondern auch eine optimierte und nachhaltigere Nutzung von Rechenressourcen insbesondere auf dem Exascale-Supercomputer JUPITER, der derzeit in Jülich installiert wird. Weitere beteiligte Helmholtz-Zentren: das Helmholtz-Zentrum Berlin und das Helmholtz-Zentrum Dresden-Rossendorf.
AqQua
Das Leben im Wasser spielt eine entscheidende Rolle für das Klima der Erde. Besonders das Plankton bindet große Mengen an Kohlenstoff aus der Atmosphäre. Der Klimawandel verändert die Ökosysteme des Planktons und wirkt sich auf den Kohlenstoffexport und die Nahrungsressourcen im Meer aus. Trotz seiner enormen Bedeutung ist erstaunlich wenig über die Häufigkeit der meisten Planktonarten bekannt. Auch bei den Schätzungen des globalen marinen Kohlenstoffexports herrschen große Unsicherheiten. Jeden Tag nehmen Forschende rund um den Globus mit einer Vielzahl von Geräten Millionen von Planktonbilder auf. Die verteilte pelagische Bildgebung, die sich auf die Untersuchung offener Meeresbereiche fernab der Küste konzentriert, ermöglicht eine umfassende Beobachtung des aquatischen Lebens – also der gesamten Wasserlebewesen – bis hinunter auf den Grund der Tiefsee. AqQua wird Milliarden solcher Bilder kombinieren, um das erste grundlegende pelagische Bildgebungsmodell zu entwickeln, das für die globale Überwachung der Artenvielfalt des Planktons, der Gesundheit des Ökosystems und des Kohlenstoffflusses genutzt werden kann. Auf diese Weise wird die Entscheidungsfindung in Zeiten des globalen Wandels unterstützt, insbesondere im Hinblick auf neue Technologien zur Entfernung von Kohlendioxid aus der Atmosphäre.
AqQua wird vom Max Delbrück Center und dem Helmholtz-Zentrum für Ozeanforschung Kiel (GEOMAR) geleitet. Prof. Dr. Timo Dickscheid aus dem Jülicher Institut für strukturelle und funktionelle Organisation des Gehirns bringt mit seiner Arbeitsgruppe langjährige Expertise in der KI-basierten Analyse sehr großer Bilddaten auf den Supercomputern in das Projekt ein, die dort bereits für die Berechnung hochaufgelöster Hirnatlanten genutzt wird. Methodisch gibt es spannende Überschneidungen zwischen der topografischen Einbettung von Bilddaten in einen dreidimensionalen Raum, wie sie bereits im Jülicher Hirnatlas erfolgt, und dem geplanten Grundlagenmodell in AqQua. An diesem Projekt ist auch das Helmholtz-Zentrum HEREON beteiligt.
VirtualCell
Seit langem gibt es die Vision, die digitale Nachbildung einer Zelle – ähnlich einem digitalen Zwilling – zu erstellen. Dies würde nicht nur Einblicke in die Vielzahl komplexer zellulärer Prozesse ermöglichen, sondern auch dabei helfen, Auswirkungen bei Veränderungen wie Krankheiten oder Medikamenten vorherzusagen. Das VirtualCell-Projekt baut auf den jüngsten Fortschritten in der Hochdurchsatz-Genomsequenzierung auf, bei der der gesamte genetische Code eines Organismus schnell entschlüsselt wird. Hinzu kommt die Genombildgebung, die visuelle Darstellungen dieser genetischen Informationen ermöglicht. In Kombination mit generativer KI will das Forschungsteam im Projekt diese ehrgeizige Herausforderung angehen. Ziel ist es, ein multimodales Grundlagenmodell zu entwickeln, das auf einer großen Menge von Einzelzell-Multiomik-Daten trainiert wird – also Informationen darüber, welche Gene in einzelnen Zellen aktiv sind, welche Proteine sie herstellen und wie ihre Genaktivität reguliert wird. Zusätzlich werden räumliche Daten genutzt, die zeigen, wie Zellen im Gewebe verteilt sind und miteinander interagieren. So soll eine umfassende Darstellung der zellulären Zustände und Interaktionen von Zellen entstehen. Das Modell wird auf eine Reihe neuartiger klinischer Aufgaben angewendet, indem es an Krankheitsproben von biomedizinischen Partnern angepasst wird. Dank der Weiterentwicklung der zellulären Modellierung kann VirtualCell wichtige Fortschritte in der Erforschung von Krankheitsmechanismen, der Entwicklung neuer Medikamente und der gezielten Einteilung von Patient:innen in Behandlungsgruppen erzielen und damit die biomedizinische Forschung im Gesundheitswesen erheblich verbessern.
VirutalCell wird vom Helmholtz-Zentrum München federführend geleitet und vom Max Delbrück Center und Nvidia, einem Entwickler von Grafikprozessoren und Chipsätzen, unterstützt. Auch hier bringt Prof. Dr. Alexander Schug vom Jülich Supercomputing Center seine Expertise in biomolekularer Modellierung und seine Erfahrung mit KI und Recheninfrastrukturen in das Projekt mit ein.
Die Helmholtz-Gemeinschaft bringt alle Voraussetzungen mit, um solche zukunftsweisenden Anwendungen zu entwickeln: eine Fülle von Daten, leistungsstarke Supercomputer, auf denen die Modelle trainiert werden können, und eine tiefgreifende Expertise im Bereich der Künstlichen Intelligenz.