Cloud Computing, KI und verteiltes Rechnen Cloud: Sicher genug für die medizinische Forschung

Autor / Redakteur: Dr. Kai Martius* / Elke Witmer-Goßner

Lange Zeit galt Cloud Computing als kosteneffizient, aber potenziell unsicher. Wo besonders hohe Sicherheitsanforderungen herrschen, war die Cloud daher bislang keine Option. Das ändert sich nun – auch im Gesundheitswesen.

Firmen zum Thema

In bestimmten Bereichen wie der medizinischen Forschung ist es wichtig, dass Anwender auf Basis prüfbarer Software eigene Cloud-Infrastrukturen für sensible Daten aufbauen können.
In bestimmten Bereichen wie der medizinischen Forschung ist es wichtig, dass Anwender auf Basis prüfbarer Software eigene Cloud-Infrastrukturen für sensible Daten aufbauen können.
(Bild: © metamorworks – stock.adobe.com)

Künstliche Intelligenz (KI) wurde von Branchenkennern längst zum „Megathema“ ausgerufen, das die IT-Welt prägen und unsere Alltagswelt verändern wird. Eine große Rolle spielt dabei das adaptive und sich selbst ständig verbessernde maschinelle Lernen (ML). Seit einigen Jahren explodiert die Zahl der Anwendungsszenarien für ML. Eine dieser Einsatzmöglichkeiten ist die medizinische Forschung: Mittels maschinellen Lernens werden Patientendaten aggregiert und analysiert. So entstehen ML-Modelle, durch die die Forscher medizinische Erkenntnisse gewinnen können.

Das Problem dabei: Die benötigten Rohdaten müssen institutsübergreifend, also von anderen medizinischen Einrichtungen wie etwa Krankenhäusern, zusammengetragen werden. Da es sich um sensible Informationen handelt, sprechen häufig Datenschutzgründe dagegen. Somit droht die KI-gestützte Forschung oft an einem mangelnden Zugang zu Rohdaten zu scheitern. Die Lösung für dieses Problem liegt in einer Technologie, die schon seit vielen Jahren ein weiteres Megathema der IT-Welt darstellt – aber bis vor kurzem selbst noch als Unsicherheitsfaktor galt: Cloud Computing.

Kombiniert man zum Beispiel unser Cloud-Betriebssystem SecuStack mit Hardware-basierter Technologie von Intel und Scontain, lassen sich sichere Cloud-Anwendungen in den Bereichen ML und verteiltes Rechnen (Multi-Party Computing) realisieren. So können etwa ML-Modelle über die Cloud Zugriff auf verschlüsselte Daten beteiligter medizinischer Einrichtungen erhalten, während dies anderen Parteien, zum Beispiel dem Cloud-Provider, sicher verwehrt bleibt.

Wodurch wird die Cloud sicher?

Cloud Computing funktioniert bekanntermaßen nach dem „As-a-service“-Prinzip. Typischerweise bieten Cloud-Provider ihren Kunden Dienste und Anwendungsprogrammierschnittstellen (APIs), legen aber die Software und den Quellcode nicht offen. Wer Cloud-Dienste nutzt, muss daher dem Provider zu einem gewissen Grad vertrauen. Für öffentliche Institutionen und stark regulierte privatwirtschaftliche Unternehmen wie Energieversorger oder Gesundheitsdienstleister kommt das nicht in Frage. Ohne Transparenz und vollständige Kontrolle über die Daten war es für solche Organisationen bisher nahezu ausgeschlossen, auf Cloud-Dienste zurückzugreifen.

Um dies zu ändern, entwickelte ein Joint Venture der Unternehmen Secunet und Cloud & Heat das Cloud-Betriebssystem SecuStack, das auf der Open-Source-Software „OpenStack“ basiert. Das hohe Sicherheitsniveau erreicht SecuStack vor allem dadurch, dass die Daten durchgängig mit den gleichen Sicherheitsbausteinen verschlüsselt werden, die Secunet seit vielen Jahren im Hochsicherheitsbereich einsetzt. Diese kryptographischen Mechanismen sind transparent integriert.

Enklaven sorgen für zusätzliche Hardwaresicherheit

Für bestimmte Anwendungen ist es sinnvoll, die Cloud-Infrastruktur mit einer zusätzlichen, Hardware-seitigen Absicherung zu versehen, beispielsweise Intels Software Guard Extensions (SGX). Prozessoren, die mit dieser Technologie ausgestattet sind, können kritische Infrastrukturdienste innerhalb von vertrauenswürdigen, hardwaregeschützten Bereichen, sogenannten „Enklaven“, ausführen. Dadurch erhöht sich die Hürde für Angreifer enorm.

Mit den skalierbaren Intel Xeon Prozessoren der dritten Generation (Codename „Ice Lake“) ermöglicht es Intel, bis zu einem Terabyte an Code und Daten während der Nutzung in Enklaven zu schützen. Intel SGX wird in das gesamte Spektrum der Ice-Lake-Plattformen integriert. So können Partner auf Basis von Ice Lake eigene Lösungen entwickeln, die bestehende Risiken im Zusammenhang mit dem Datenschutz und der Einhaltung von Vorschriften in streng regulierten Bereichen – wie dem Gesundheitswesen – reduzieren.

Sicheres verteiltes Rechnen

Neben der Infrastruktur-Absicherung haben die Intel SGX-Enklaven, die auch SecuStack nutzt, noch einen weiteren Vorteil: Mit ihnen lassen sich neuartige Verfahren aus den Bereichen KI und ML umsetzen, bei denen es auf einen sicheren Datenaustausch ankommt – so wie in dem eingangs beschriebenen Anwendungsszenario aus der medizinischen Forschung. Das Verfahren, das dort zum Einsatz kommt, funktioniert so: Über das Cloud-Betriebssystem und abgesichert in Intel SGX-Enklaven werden Anwendungsdienste verteilt ausgeführt, d.h. über voneinander isolierte Ressourcen hinweg. Orchestriert, also zu einem Verbund kombiniert, werden die Dienste mit dem Open-Source-System Kubernetes. Auf diese Weise kann verteiltes Rechnen in einem sicheren Kontext stattfinden. Mit dem Verfahren können ML-Modelle krankenhausübergreifend mit Patientendaten trainiert werden, ohne dass die sensiblen Daten das Krankenhaus, zu dem sie gehören, verlassen müssen.

Der Ansatz nennt sich „Confidential Federated Machine Learning“ – vertrauliches maschinelles Lernen im Verbund. Dabei spielt eine alte Herausforderung des Cloud Computing keine Rolle mehr: Ob die beteiligten Anwender dem Cloud-Provider vertrauen oder nicht, ist unerheblich. Daten, Code und Modelle bleiben jederzeit vor dem Zugriff des Providers geschützt. Für den Datenschutz ist somit gesorgt, und die medizinische Forschung kann das Potenzial des maschinellen Lernens voll ausschöpfen. Im besten Fall entstehen dadurch Erkenntnisse, von denen alle profitieren.

* Der Autor Dr. Kai Martius ist Chief Technology Officer bei der Secunet Security Networks AG. Die Cloud-Plattform SecuStack ermöglicht maschinelles Lernen (ML) beispielsweise mit vertraulichen Patientendaten, die cloud-basiert und sicher über verschiedene Institutionen hinweg genutzt werden können. So lassen sich neue medizinische Erkenntnisse gewinnen, ohne den Datenschutz zu gefährden. Um solche Anwendungsszenarien zu realisieren, setzt SecuStack auf eine Zusammenarbeit mit Intel und Scontain.

(ID:47313551)