Die unvollendete Kreativität der Maschine
Ein Kommentar von Irmhild Plaetrich, Redakteurin IM+io
(Titelbild: Adobe Firefly)
Es wundert wohl niemanden, dass Künstliche Intelligenz, KI, unterdessen auch im kreativen Bereich eine große Rolle spielt – bei der Malerei, in der Literatur und auch in der Musik. Gerade letztere gilt als eine genuin menschliche Kunstform, die Emotionen wie kaum eine andere Kunstform reflektiert. Es stellt sich daher die Frage, was KI hier leisten kann.
Das Ergebnis des 2019 in Kooperation zwischen Ars Electronica und dem Brucknerorchester Linz entstandenen Projektes „Mahler Unfinished“ ist einerseits faszinierend, aber letztlich nicht verwunderlich: Das KI-System „MuseNet“ (von OpenAI) hat auf Basis des Themas Gustav Mahlers letzter, unvollendeter Sinfonie ein gefühlvolles Musikstück komponiert. Das Thema der Sinfonie beginnt düster, ohne Begleitung, und folgt einem speziellen Aufbau – eine Herausforderung für die KI. Mit MuseNet gelang es jedoch, diese düstere Stimmung aufzugreifen und die Sinfonie so zu vollenden.
Ein anderes Projekt wurde am Barbican Performing Arts Centre in London durchgeführt. Dieses zeigte, dass die Kreativität der KI (noch) an ihre Grenzen stößt: Die KI wurde mit sämtlichen Klavierstücken von Johann Sebastian Bach trainiert, mit Ausnahme der sechs sogenannten Englischen Suiten. Die Wissenschaftler löschten Teile dieser Cembalo-Suiten und übertrugen der KI die Aufgabe, diese Lücken zu füllen. Das Publikum war bei der Vorführung nicht in der Lage, zu erkennen, wo die KI eingesprungen war. Anders sah es bei den Musikern aus. Der Cembalist erkannte die Wechsel mühelos, denn die KI-generierten Teile waren sehr viel schwerer vorzutragen. Bach hatte als Musiker zum einen Stücke geschrieben, die auch für ihn angenehm zu spielen waren. Zum anderen hatte Bach bei den Konzertstücken versucht, Kadenzen der gesprochenen englischen Sprache auf die Tastatur zu übertragen. Über diese Hintergrundinformationen konnte die KI nicht verfügen und somit nicht in den kreativen Prozess einbeziehen.
Es lohnt sich also das komplexe Thema der Kreativität näher zu betrachten. Dabei nehme ich Anleihen bei der britischen Kognitionswissenschaftlerin Margaret A. Boden, die sich in ihrem Buch „The Creative Mind“ den Unterschieden zwischen menschlicher und maschineller Kreativität widmet. Sie unterscheidet drei Formen von Kreativität.
Kreativität kann bedeuten, die ungewohnte Kombination vertrauter Ideen herzustellen. Dies beherrschen Large Language Models, LLMs, denn sie können aus vorhandenem Datenmaterial Rekombinationen herstellen und dabei den in den Daten vorhandenen Mustern folgen.
Zum Zweiten spricht Boden von Explorativer Kreativität. Diese erforscht konzeptuelle Räume, wie etwa Genres in der Literatur. LLMs sind auch hier in der Lage, solche Möglichkeitsräume zu identifizieren und die entsprechenden charakteristischen Schemata zu wiederholen. Die dritte Form der Kreativität zielt laut Boden auf eine Transformation des konzeptuellen Raums ab. Die Regeln, die diesen Raum beschreiben, werden gesprengt und neue etabliert. Ein LLM ist dazu nicht in der Lage, da solche Modelle ihre eigene Aktivität nicht reflektieren und ihre Methodik darauf ausgerichtet ist, Muster zu identifizieren, (noch) nicht jedoch darauf, neue zu erschaffen. Hier trennen sich also menschliche und maschinelle Kreativität. Wie das Beispiel der englischen Suiten von Bach aufgezeigt, scheint der Ansatz, den bekannten Möglichkeitsraum zu verlassen, derzeit dem Menschen vorbehalten zu sein.
Die Ausgangsfrage, ob musikalische Kreativität von einer Maschine erfolgreich simuliert werden kann, ist wohl mit einem „Jein“ oder einem „es kommt darauf an“ zu beantworten. Technisch gesehen können LLMs nur die Statistik jener Daten lernen, mit denen sie trainiert worden sind. Ein KI-System wie MuseNet lernt ähnliche Daten zu erzeugen. Sie können von großer musikalischer Qualität sein und sogar emotional ansprechen. Die KI selbst kennt aber keine Emotionen und versteht diese auch nicht. Musikstücke werden nach vorhandenen Mustern, emotional unreflektiert, nachgebaut. Anders als ein Komponist will, beziehungsweise kann, die Maschine – zumindest auf der Basis heutiger Technologie – nichts aussagen. Es fehlt die übergreifende Intention. Gleichwohl sind wir Zeugen einer spannenden Entwicklung, die auch die Künstler selbst fasziniert und ihnen ganz neue Wege eines Schaffensprozesses im Rahmen einer Mensch-Maschine-Zusammenarbeit aufzeigt. Ich persönlich verfolge diese Entwicklungen jedenfalls mit ganz menschlichen Emotionen wie Neugierde und Sympathie.