Wenn tiefe Netze zur Black Box werden
Chancen und Herausforderungen für die Mobilität der Zukunft
Christian Müller, iMotion Deutschland
Kurz und bündig:
Auf dem Weg zu einer KI-basierten Vernetzung des Verkehrs sind eine Vielzahl von Herausforderungen zu lösen. Dazu zählen wissenschaftlich-technische Fragestellungen sowie Lösungen, die die Integration und Interaktion von Lernenden Systemen über verschiedene Verkehrsträger und gemeinsame Datenplattformen hinweg ermöglichen. Gleichzeitig geht es um Ansprüche und Akzeptanz der Gesellschaft und des Individuums. Herausforderungen zeichnen sich hier insbesondere im Hinblick auf Sicherheit und Bedienbarkeit ab.
Die aktuellen Entwicklungen in der künstlichen Intelligenz (KI) leisten einen wichtigen Beitrag zur sicheren, flexiblen und kostengünstigeren Mobilität der Zukunft. Dabei ist Mobilität umfassend zu verstehen, nämlich im Sinne der Gesamtheit des Personen- oder Warenverkehrs von allen potenziellen Ausgangspunkten bis zu allen potenziellen Zielen. So stehen dann auch bei den anwendungsorientierten Forschungsprojekten von iMotion Deutschland hochautomatisierte Fahrzeuge, der Verkehr und die Menschen im Fokus.
Ein Mobilitätssystem besteht aus einer Infra-struktur, unterschiedlichen Verkehrsmitteln sowie den mobilen Teilnehmerinnen und Teil-nehmern. Der Mobilitätsraum umfasst alle möglichen Interaktionen und Beziehungen zwischen Verkehrsträgern, der jeweiligen Infra-struktur, deren Neu- und Ausbau, Betrieb, Wartung, Weiterentwicklung, Überwachung sowie deren Nutzung im Personen- und Güter-verkehr. Das DFKI mit dem Forschungsbereich Agenten und Simulierte Realität (ASR) von Prof. Slusallek, der einen Fokus auf die Erforschung autonomer Systeme im virtuellen Raum legt, und iMotion Deutschland, Tochter der chinesischen Firma I.Motion.ai, die Elemente für selbstfahrende Autos wie Radarsysteme, Frontkameras oder Sensoren, V2X Kommunikation, Optimierung von Neuronalen Netzen usw., entwickelt und baut, kooperieren in Projekten zum automatisierte Fahren, dem künftigen Straßenverkehr und dessen Akteuren. Die dabei im Zentrum stehenden Teilnehmer sind die hochautomatisierten Fahrzeuge, der anzunehmende Mischverkehr und die Menschen mit dem Fokus auf die Sicherheit leichtverletzlicher Verkehrsteilnehmer. So arbeiten wir bei iMotion unter anderem an der Frage, wie ein autonomes Auto rechtzeitig erkennt, was ein Fußgänger gerade vorhat. Speziell in Europa ist die Frage der Sicherheit ein zentraler Faktor für die Akzeptanz solcher Systeme. Alle erdenklichen Szenarien sollen vorher mit einem Motion Capture Anzug erfasst und in der späteren Simulation im virtuellen Raum umgesetzt werden, denn alle Daten im Realbetrieb durch selbstfahrende Autos zu sammeln, wäre unrealistisch. Die kritischen Verkehrssituationen sind einfach viel zu selten, als dass man sie draußen auf der Straße antreffen würde, und einige Situationen möchte man auch gar nicht antreffen, wie etwa die, dass ein Kind vor das Auto läuft. Grundlegend für die Entwicklung des autonomen Fahrens sind neben weiteren KI-Methoden sowie sogenannten Hybriden Systemen, insbesondere Technologien aus dem Themenkreis des Maschinellen Lernens (ML).Große Fortschritte erzielte die künstliche Intelligenz im vergangenen Jahrzehnt im Bereich tiefer künstlicher neuronaler Netze, auch unter dem Begriff Deep Learning bekannt. Dabei werden neuronale Netze, die grob von der Struktur des Gehirns inspiriert sind, künstlich auf dem Computer simuliert. Viele der jüngsten Erfolge, wie bei Handschrifterkennung, Spracherkennung, Gesichtserkennung, maschineller Übersetzung und automatisiertem Fahren, beruhen auf dieser Technik. Die Unterschiede zwischen konventionellem maschinellem Lernen und tiefem Lernen liegen vor allen Dingen in der Art und Weise, wie mit Merkmalen umgegangen wird. Beispielhaft kann hier ein Ansatz zur Erkennung des Alters und des Geschlechts in der Stimme beschrieben werden. Die darin verwendeten Merkmale basieren auf Erkenntnissen darüber, wie beispielsweise die Stimme durch die zunehmende Verknöcherung des Kehlkopfs altert. Auf Basis dieser Erkenntnisse wurden wissensbasiert (top-down) Merkmale entworfen (z.B. Mikro-variationen in der Stimmgrundfrequenz) und sogenannte Merkmalsextraktoren entwickelt, welche diese im akustischen Kanal messen konnten (z.B. Jitter, Shimmer). Anschließend wurden vorhandene Beispiele zum Training verwendet (z.B. für ein Multilayer Perceptron, also ein konventionelles künstliches neuronales Netz). Ein Domänen-Experte war also nötig, um eine Menge von Merkmalen zu bestimmen, auf Basis derer gelernt werden sollte. Tiefe neuronale Netze umgehen diesen Schritt. Sie erhalten in der Regel den Kanal an sich als Eingabe und finden beim Lernen heraus, welches die geeigneten Merkmale sind. Durch die End-to-End Optimierung sind tiefe Netze häufig sehr viel leistungsfähiger als konventionelle Netze. Allerdings geht auch die Basis für Erklärbarkeit verloren, da die gefundenen Merkmale keine Semantik mehr enthalten (Mikrovariation der Stimmgrundfrequenz), und keine Rückschlüsse auf ein Phänomen zulassen (Verknöcherung des Kehlkopfes). Tiefe Netze tragen maßgeblich dazu bei, Verkehrssysteme intelligenter und zukunftsfähig zu machen. Möglich wird dies durch das Zusammenspiel von Sensoren, Kameras sowie intelligenten Infrastrukturen und Plattformen, die gesammelte Daten aufnehmen, verwalten und teilen. Mit immer leistungsfähigeren Ver-fahren werden sie verarbeitet und daraus Aktio-nen abgeleitet, die entweder von Menschen oder von den Systemen selbst umgesetzt werden. Auf dem Weg zu einer KI-basierten Vernetzung des Verkehrs sind eine Vielzahl von Herausforderungen zu lösen. Dazu zählen erstens wissenschaftlichtechnische Fragestellungen sowie Lösungen, die die Integration und Interaktion von Lernenden Systemen über verschiedene Verkehrsträger und gemeinsame Datenplattformen hinweg ermöglichen. Gleichzeitig sollten sie alle diesbezüglichen Ansprüche der Gesellschaft und des Einzelnen erfüllen und gesellschaftlich akzeptiert sein. Herausforderungen zeichnen sich hier insbesondere im Hinblick auf Sicherheit und Bedienbarkeit ab.KI-Module, die Bestandteile von Fahrautomatisierungsfunktionen sind, werden häufig als „Black Boxes“ betrachtet. Damit ist gemeint, dass man sie zwar beobachten kann, welche Ausgaben sie bei welchen Eingabesignalen erzeugen, aber nicht hineinsehen kann, um nachvollziehen zu können, wie das Ergebnis zustande gekommen ist. Dies hat mehrere Gründe: zunächst ist es aufgrund der Zulieferbeziehungen im Automobilbau sehr unwahrscheinlich, dass die betreffende Funktion offengelegt wird. Des Weiteren fehlt es dem Automobilbauer möglicherweise auch an der Kompetenz, das komplexe Modul zu analysieren, das nicht im eigenen Haus entwickelt wurde. Die Hersteller sind noch immer dabei, ihre KI-Schlagkraft aufzubauen und haben dabei längst nicht das Niveau erreicht, welches die großen Internetkonzerne aufweisen. Schließlich weisen die heutigen KI-Ansätze gerade im Bereich der Erklärbarkeit Schwächen auf. Demgegenüber könnten wir uns dasselbe KI-Modul auch als „White Box“ vorstellen. Hier hätte der Automobilhersteller sowohl die Rechteals auch die Kompetenzen, die Entscheidungen des Moduls vollständig zu durchdringen und das Modul selbst würde die nötigen Informationen dazu vollständig bereitstellen können. Allerdings kann eine „White Box“ KI auf absehbare Zeit als eine wissenschaftliche Utopie betrachtet werden. Woran vielmehr geforscht und entwickelt wird, ist die „Grey Box“ KI, in der zwar mit einer wie auch immer gearteten Einschränkung der Einsicht in die Entscheidungsprozesse zu rechnen ist, jedoch genügend Informationen verfügbar sind, um eine Plausibilisierung der Entscheidungen durchführen zu können. Nicht zuletzt müssen der Gesetzgeber und die zuständigen Behörden das Themenfeld eingehend prüfen, die Zuständigkeit betreffender Rechtsgebiete (z.B. Privatrecht, Haftungsrecht, Datenschutz etc.) klären, teilweise ergänzen und letztlich die rechtlichen Regularien anpassen. Auch für solche Zwecke liefern wir die not-wendigen technischen Erläuterungen und geben entsprechende Handlungsempfehlungen. Diese Aspekte spielen gerade in einer Übergangszeit, von der mit an Sicherheit grenzender Wahrscheinlichkeit auszugehen ist, von der herkömmlichen zu einer komplett automati-sierten Mobilität eine Rolle. In einem komplexen Mischverkehr bewegen sich dann nicht-automatisierte und automatisierte Fahrzeuge ebenso wie Radfahrer und Fußgänger. Die vom DFKI und iMotion extrahierten Faktoren liefern wertvolle Hinweise für die Forschung und Entwicklung, Wirtschaft, Politik und Gesellschaft auf dem Weg zu einem sicheren, intelligenten Mobilitätsraum. Beispielsweisehaben sie sich unter dem Dach der Eclipse Foundation – die Plattform für offene Innovation und Zusammenarbeit – mit dem TÜV SÜD und weiteren Keyplayern zusammengeschlossen, um in der openGenesis-Arbeits-gruppe vor dem Einsatz auf öffentlichen Straßen zu gewährleisten, dass die künstliche Intelligenz (KI) nachweisbar sicher und fahrtüchtig ist. Unser derzeitiges Verständnis von KI-Zulassung und -Zertifizierung ist jedoch begrenzt, insbesondere in Bezug auf maschinelle Lernalgorithmen. Die openGENESIS-Arbeitsgruppe hat zum Ziel, Wissen, Methoden und Werk-zeuge für die Bewertung von KI in autonomen Fahranwendungen zu fördern, zu unterstützen und bereitzustellen. Führungskräfte aus Industrie, Forschung und Regulierung kommen zusammen, um gemeinsame Kriterien für die Qualität der KI zu entwickeln, indem sie das Wissen der openGENESIS-Mitglieder nutzen und Forschungsergebnisse in einem Open-Access-Bereich austauschen .Um das Ziel eines zukunftsfähigen und funktionierenden neuen Verkehrsraums zu etablieren, der auf KI basiert, ist es aber genauso dringend notwendig sich neben den skizzierten technischen Fragestellungen um die Lösung gesellschaftlicher und ethischer Aspekte zu kümmern. Ein Mobilitätsraum mit lernenden Systemen lässt sich nur dann erfolgreich umsetzen, wenn die Gesellschaft ihn akzeptiert und Vertrauen in neue, KI-basierte Mobilitäts-lösungen hat. Hierbei spielen insbesondere ethische Aspekte eine zentrale Rolle. Darüber hinaus müssen neue Mobilitätskonzepte auch die Bedürfnisse der Gesellschaft abdecken: sowohl im städtischen und ländlichen Verkehr als auch bei Individualreisen. Dies kann und wird einerseits durch politische unterstützte Maßnahmen, wie Berichte der Plattform Lernende Systeme, aber auch durch interdisziplinäre Forschung mit entsprechender, neuartiger Wissenschaftskommunikation vorangetrieben. So wurde z.B. die „High Level Expert Group on AI“ konstituiert, der auch Prof. Slusallek angehört, die die EU-Kommission bei der Formulierung einer europäischen KI-Strategie unterstützt und den Dialog mit relevanten Stakeholdern auf europäischer Ebene führt. In diesem Frühjahr veröffentlichten sie Ethik-Leit-linien, die für Europa eine führende Rolle in der Entwicklung von vertrauenswürdigen KI-Produkten und Services vorsehen. Gleich-zeitig thematisieren die Leitlinien aber auch kritische Aspekte, wie etwa den Verlust oder die Verlagerung von Arbeitsplätzen. Die Gestaltung einer vertrauenswürdigen KI ist ein zentrales Anliegen. Vertrauen und Akzeptanz können entstehen, wenn ethische Fragen frühzeitig in der Entwicklung und Anwendung Lernender Systeme – Stichwort “Ethics on Design” – berücksichtigt werden. Wir sind auf dem Weg zu einer europäischen Erneuerung des künftigen Verkehrs. Mit den innovativen Methoden der KI aber auch einer ethisch-gesellschaftlich Debatte, und unserem Wertesystem zum Nutzen der Sicherheit leichtverletzlicher Verkehrsteilnehmer bei gleichzeitiger Befeuerung unseres Wirtschaftsraums.