Datenbankspezialist Peter Baumann ist Projektleiter in dem von der NATONorth Atlantic Treaty Organization geförderten Vorhaben Data Cubes for Environment and Security, für das Anfang Mai in Brüssel der Startschuss fiel. Künftig soll der Zugriff von Bündnispartnern auf Umweltdaten erleichtert werden. Schlüssel zur Verarbeitung ist das Datenmanagementsystem RasdaMan.
Professor Peter Baumann forscht und lehrt an der privaten Jacobs University in Bremen im Fachbereich Informatik. Als Spezialist für Datenbanken im Bereich Wissenschaft und Technik wurde er Projektleiter in dem von der NATONorth Atlantic Treaty Organization geförderten Vorhaben Data Cubes for Environment and Security, an dem auch Experten der Universität von Tel Aviv (Israel) und dem Greenland Institute for Natural Resources (Grönland) mitarbeiten.
Hinter der Bezeichnung Data Cubes for Environment and Security (Cube4EnvSec) verbirgt sich ein ambitioniertes Projekt zur Darstellung von Geodaten, das von der NATONorth Atlantic Treaty Organization im Rahmen des Programms Science for Peace and Security (SPS) unterstützt wird. Weltweit generieren Sensoren wie Satelliten, Kameras oder Drohnen ständig neue Daten: 24 Stunden am Tag, sieben Tage die Woche. Gesammelt werden so Informationen, die potenziell wichtig für die globale Sicherheit oder auch den Klimaschutz sein können. Die große Herausforderung besteht darin, diese Informationen in ein leicht nutzbares Format zu bringen. Vereinfacht formuliert sollen die ungeheuren Datenmengen alltagstauglich werden.
Klima- und Wetterdaten, wie sie etwa der Deutsche Wetterdienst (DWD) zum Downloaden anbietet, nützen Durchschnittsnutzern eher wenig. Selbst gewiefte Informatikerinnen und -informatiker tun sich mit den aktuell gängigen Darstellungsformen schwer. Und das aus zwei Gründen: Zum einen kommen die Daten in Dateiformaten, die nicht für herkömmliche Endgeräte optimiert sind. Zum anderen würden die Nutzerinnen und Nutzer von der schieren Menge der Daten überfordert.
Mit dem Datenmanagementsystem Raster Data Manager, kurz RasdaMan, lassen sich Daten übersichtlich darstellen und nutzen. An der Entwicklung dieses Programms war Baumann maßgeblich beteiligt. Dank RasdaMan, sagt er, könnten allgemein genutzte Geoinformationssysteme etwas mit den gewonnenen Informationen anfangen und sie mit anderen Daten verknüpfen. Das Forschungszentrum Jülich etwa habe damit angefangen, mit RasdaMan aus den Daten des DWD einen Klimawürfel zu bauen und öffentlich anzubieten.
Im Klartext: Die Informationen dienen dann nicht mehr nur einem kleinen erlesenen Kreis von Fachleuten, sondern können universell genutzt werden. Und das, so Baumann, betreffe eben auch „für die NATONorth Atlantic Treaty Organization relevante Szenarien“. Der Schlüssel zur Alltagstauglichkeit sind Data Cubes, also Datenwürfel. Der Begriff ist weder leicht zu erklären noch leicht zu verstehen. Besonders für Menschen, die sich nicht mit Informatik befassen. Was auf die Mehrheit zutrifft. Somit bleibt nur, die Abstraktionen des Cyberraums in eine für Laien leichter erfassbare Dimension zu übersetzen. Geometrische Körper bieten diese Möglichkeit. Im Interview erläutert Baumann die Zusammenhänge:
Herr Professor, was kann man sich unter einem Datenwürfel vorstellen?
Datenwürfel sind Darstellungsformen, mit denen Nutzern die Daten so angeboten werden, wie es ihrer intuitiven Sicht entspricht. Nehmen wir zum Beispiel das Wetter um uns herum. Wir würden die Atmosphäre als etwas räumlich Ausgedehntes auffassen, wo es Sinn ergibt, über Länge, Breite und Höhe zu sprechen. Also etwas Dreidimensionales. Reden wir zusätzlich über zeitliche Veränderungen, haben wir einen vierdimensionalen Raum.
Lässt sich das mit Google Maps vergleichen?
Die Zusammenführung von Geodaten in eine übersichtliche Form wurde durch Google ab 2002 technisch umgesetzt. Google Maps homogenisiert eine Unzahl von Luft- und Satellitenbildern in einer einzigen Karte, über die wir frei navigieren können. Der Gedanke ist gut. Allerdings hatte man seinerzeit nur Länge und Breite im Blick, der Zeitfaktor wurde ignoriert. Die ganze große Karte ist aus Bildern aus völlig unterschiedlichen Zeiten zusammengesetzt und so gesehen ein großer Flickenteppich. Im Klartext: Wir wissen nicht, wann ein bestimmtes Areal aufgenommen worden ist.
Die Daten dürften also häufig veraltet sein ...
Genauso ist es. Und das ist für wissenschaftliche oder auch militärische Zwecke nicht sonderlich nützlich. Natürlich möchte man aktuelle Daten haben und man muss auch entlang der Zeitachse analysieren können. Das ist die Voraussetzung, um Entwicklungen zu verstehen und auf dieser Basis Prognosen zu treffen. Idealerweise muss sich der Benutzer in den Daten frei durch Raum und Zeit bewegen können. Aber dafür muss man heute noch Experte auf vielen exotischen technischen Gebieten sein, sonst sind solche Analysen nicht möglich. Und selbst für Experten ist es aufwendig und momentan nicht in Echtzeit machbar.
Und das wollen Sie mit dem Projekt Cube4EnvSec ändern?
Ja, das ist das Ziel der Datenwürfel, an denen wir arbeiten: vereinfachter Zugang zu raumzeitlichen Big Data. Und davon haben wir – nur um eine Größenordnung zu nennen – derzeit 140 Petabytes in der EarthServer-Föderation. Das sind unter anderem Datenwürfel über optische Satellitendaten, Radardaten, Klimazeitreihen, maritime Fragen und so weiter. Jeder der EarthServer-Partner steuert wertvolle Information bei, die über die Föderation frei verknüpft werden kann.
Ein Petabyte entspricht einer Billiarde Bytes. Das sind unvorstellbare Größenordnungen. Wie kommen solche Mengen zusammen?
Stimmt, das ist eine Million Milliarden Bytes. Und davon 140, Tendenz steigend. Wir haben heute eine ständig zunehmende Anzahl von Sensoren vom Boden bis ins Weltall, die eine kontinuierlich wachsende Datenflut liefern. Daten in allen Dimensionen, zu jedem Ort, in verschiedenen Höhen oder Tiefen im Meer und über lange Zeit hinweg. Alle diese Daten sind wertvoll, aber sie wollen erfasst, gespeichert und ausgewertet werden. Das ist in etwa so, als wollten wir aus einem voll aufgedrehten Feuerwehrschlauch trinken. Mittels der Organisation in raumzeitlichen Datenwürfeln sollen Struktur und Übersicht geschaffen werden.
Wie werden diese Daten erhoben?
Das ist unterschiedlich. Konventionell mit Radar, Kameras und anderen Sensoren. Häufig mit Satelliten, aber auch immer mehr mit Drohnen. Eine recht neue, vergleichsweise preisgünstige Möglichkeit bieten dabei die sehr kleinen Nanosatelliten. Die sind kaum größer als ein Brotlaib und werden in größerer Zahl mit einer Trägerrakete ins All gebracht, was Kosten spart. Zumeist dienen sie der Kommunikation wie das Star-Link-System. Das kann man sich wie eine Relaisstation vorstellen, eine Art WiFi-Router im Weltraum, der Signale weiterleitet. Der andere Typus sind Beobachtungssatelliten, die Daten zu Erdoberfläche und Atmosphäre aufnehmen und zur Erde transferieren.
Und auf die Beobachtungssatelliten setzen Sie?
Ja, wir nutzen diese Satelliten und arbeiten daran, sie via Datenwürfel intelligenter zu machen. So können sie Fragen beantworten, statt nur einen Datenstrom zu liefern. Allerdings erheben wir selbst keine Daten. Wir stellen die Software bereit, die dann von unseren Partnern in Rechenzentren oder auf Satelliten eingesetzt wird, um eine Datenwürfelsicht für den unkomplizierten Zugriff und die Analyse zu erzeugen.
Wie kommen die Nutzer an die gewünschten Informationen und Umweltdaten?
Über eine Datenwürfel-Anfragesprache lassen sich beliebige Anfragen jederzeit und ohne Programmierung erstellen. Also etwa: „Wie hat sich die Bewaldung Griechenlands in den letzten zehn Jahren verändert?“ Eine Vielzahl von existierenden Apps kann auf Basis offener Standards auf RasdaMan zugreifen, sodass die Benutzer in ihrer gewohnten Umgebung weiterarbeiten können. Weil alle Berechnungen im Server stattfinden, lassen sich sogar komplexe Analysen von kleinen Endgeräten wie Mobiltelefonen abrufen.
Wo liegen die spezifisch militärischen Verwendungsmöglichkeiten?
Der NATONorth Atlantic Treaty Organization sind vor allem zwei Dinge wichtig. Zum einen, dass die Verbündeten permanent über ein gemeinsames integriertes Lagebild verfügen. Dass also, bildlich gesprochen, alle Berechtigten auf derselben Karte arbeiten. Zum anderen, dass jegliche erforderliche Information genau dann zur Verfügung steht, wenn sie gebraucht wird. Und zwar überall. So können alle Berechtigten jederzeit auf derselben, umfassenden Datengrundlage arbeiten.
Können Sie ein Beispiel für die militärische Nutzung bilden?
Ein Beispiel ist die vernetzte Information. Eine mobile Einheit benötigt im Feld Lageinformationen, welche aus der verknüpften Analyse von Aufklärungs-, Gelände- und Wetterdaten besteht. Das mobile Endgerät fordert diese Analyse von einem der Föderationsknoten an. Dieser stellt die nötigen Datenquellen fest und verteilt die Anfragen an Geodatenarchive, Metoc-Dienste sowie einen Cubesat, welcher gerade das Missionsgebiet überquert. Jeder dieser Föderationsknoten trägt seinen Teil bei und am Ende wird ein kompaktes Ergebnis in Echtzeit an die mobile Einheit geliefert.
Ein weiteres Beispiel wäre die Flugplanung eines Transportflugzeuges. Die Besatzung braucht möglichst verlässliche, aktuelle Informationen zum Wetter entlang der Route. Dabei kann sie aber nicht gigabyteweise Daten nachladen. Das System errechnet auf Basis permanent aktualisierter Daten einen Korridor entlang der Flugstrecke und berücksichtigt dabei auf der Zeitschiene die meteorologischen Informationen. Wo ist das Gewitter zu dem Zeitpunkt, wo die Maschine im fraglichen Raum eintrifft? Das bringt Sicherheit und spart Sprit, weil das Umfliegen früher geplant werden kann.
Wie kann die NATONorth Atlantic Treaty Organization die Datenwürfel im Kontext des Klimawandels nutzen?
Je aktueller Informationen erhoben und geteilt werden, desto präziser sind die Schlussfolgerungen auf dieser Basis. Der Klimawandel und die damit verbundenen Wetterphänomene haben vielfältige Auswirkungen. Mit Blick auf das Abschmelzen des Polareises etwa werden verlässliche Prognosen möglich, wenn wir die vorhandenen Informationen zusammenführen und analysieren. Beispielsweise hat die Universität Anchorage auf Basis von RasdaMan einen Datenwürfel zur Eisbedeckung der nördlichen Polarkappe erstellt. Diese Daten reichen 170 Jahre in die Vergangenheit. Eine breite Datenbasis ermöglicht es der NATONorth Atlantic Treaty Organization, bestimmte Risiken für ihre Infrastruktur und Technik deutlicher und schneller als bisher zu erkennen. Damit kann das Bündnis besser auf solche Herausforderungen reagieren.
Inhalte teilen via