Die Beschwörung der Musik und die Ästhetik der Verantwortung: Komposition im Zeitalter der generativen KI neu definiert

Essays

Podcast-Kommentar zu diesem Artikel (KI-Stimme)

Die Welt der Musikproduktion befindet sich an einem historischen Wendepunkt, symbolisiert durch „Suno“, eine KI, die Musik aus Texteingaben generiert. Diese KI ermöglicht es jedem, Musik mit dem unglaublich zugänglichen Mittel der natürlichen Sprache zu schaffen, ohne dass Fachwissen über Tonleitern und Harmonielehre oder die Beherrschung einer DAW erforderlich sind.

Aus der Perspektive der Demokratisierung des musikalischen Ausdrucks ist dieser Wandel eine der größten Errungenschaften der menschlichen Kulturgeschichte und verdient breite Anerkennung. Viele Menschen erleben nun das „Gefühl des Ausdrucks“, indem sie ihren eigenen Konzepten musikalische Form geben, und genießen die Freude am Schaffen.

Hinter diesen freudigen Stimmen sehe ich mich jedoch mit einer grundlegenden Frage konfrontiert: „Worin besteht der strukturelle Unterschied zwischen dem Generierungsakt durch eine KI und der Komposition in ihrer traditionellen Definition?“

Die Untersuchung dieser Frage ist kein Versuch, neue Technologien oder den Trend der Demokratisierung an sich zu leugnen. Vielmehr ist es ein konstruktiver Versuch, ihre Wunder anzuerkennen und anzunehmen und gleichzeitig den Kern dessen, was wir bisher als „Komposition“ bezeichnet haben, tiefer zu betrachten. Im Mittelpunkt dieser Untersuchung steht der Verdacht, dass „körperliches Engagement“ und „ethische Verantwortung“ durch den KI-Prozess strukturell umgangen werden.

Daher zielt dieser Artikel darauf ab, den Generierungsprozess von Suno anhand von zwei Hauptmotiven zu analysieren, um die Natur dieses strukturellen Unterschieds aufzudecken. Indem ich die Grenze zum traditionellen Kompositionsbegriff neu definiere, versuche ich, eine Metatheorie der Komposition zu konstruieren.

  • Körperlichkeit (direkte Intervention klanglicher Qualia)
  • Ethische Verantwortung (der Ort des ethischen Subjekts)

Darüber hinaus versuche ich, Suno als „Spiegel, der den Kompositionsbegriff zurückwirft“ zu betrachten, um eine neue Rolle für Komponisten und eine Ästhetik der Verantwortung im Zeitalter der generativen KI aufzuzeigen. Es geht hierbei nicht um die Frage, „ob KI die Komposition ersetzen kann“, sondern um den Versuch, Licht auf die grundlegende Frage zu werfen: „Was ist in der Komposition überhaupt unersetzlich?“

Kapitel 1: Die Körperlichkeit der Komposition – Ein Dialog in Form einer Feedbackschleife

Im Zeitalter der KI ist es bei der Neudefinition der Komposition notwendig, den Kompositionsakt als einen Prozess zu betrachten, nicht nur als eine Reihe spezifischer Elemente oder Bedingungen. Ich sehe den Kern des Kompositionsaktes in „einer aktiven Feedbackschleife, die den Schritt der Interaktion und des Austauschs mit musikalischen Materialien und Komponenten beinhaltet.“ Diese Schleife ist eine gemeinsame Struktur in den vielfältigen Methoden, die Komponisten anwenden, wie Notation, Aufführung und DAW-Bearbeitung.

Ein Komponist gibt beispielsweise eine Phrase in einer DAW ein, arrangiert und bearbeitet Sampling-Material oder spielt ein Riff auf der Gitarre. Dann „hört“ er sich das Ergebnis dieser „Handlung“ sofort an, fällt ein „ästhetisches Urteil“ und leitet daraus die nächste „Korrektur oder Operation“ ab. Dieser ständige „Dialog“ ist ein entscheidender Prozess, um kreative Absichten präzise umzusetzen. Diese Feedbackschleife ist kein bloßes Ausprobieren, sondern ein Vertiefungsprozess, der mit Verantwortung für die Textur und Struktur des Klangs verbunden ist. Ein Akt, dem dies fehlt, kann meiner Meinung nach nicht in die strenge Definition von „Komposition“ (dem in diesem Aufsatz neu definierten Begriff) einbezogen werden.

Damit diese Feedbackschleife zu einem kreativen Dialog und nicht zu einem mechanischen Versuch und Irrtum wird, ist die Intervention von „Körperlichkeit“ unerlässlich. In diesem Aufsatz nenne ich diese Anforderung „die Intervention des hörenden Körpers“. Um es klarzustellen: Die hier erwähnte „Körperlichkeit“ bezieht sich nicht auf das Ausmaß körperlicher Bewegung. Ihr Kern liegt in der Direktheit der Operation und der Auflösung des Feedbacks: „Wie direkt und mit welch feiner Auflösung man klangliche Qualia (die rohe Textur des Klangs und die dadurch hervorgerufenen Emotionen) manipulieren und unmittelbares Feedback auf das Ergebnis erhalten kann.“

Aus dieser Perspektive wird die wahre Natur von Mausoperationen in einer DAW, die auf den ersten Blick unmusikalisch und unkörperlich erscheinen, sichtbar. Ein Mausklick oder -zug ist zwar eine kleine körperliche Bewegung und sieht nicht wie eine musikalische Handlung aus, aber er ist die direkte Ausführung einer sehr spezifischen Absicht, die auf klanglichen Qualia basiert – zum Beispiel die Tonhöhe einer MIDI-Note um einen Halbton zu erhöhen, ein Akt des „diesen Ton so hoch zu machen“. Obwohl das Werkzeug (die Maus) indirekt ist, ist der Eingriff in das Objekt (den Klang) direkt.

Ähnlich verhält es sich bei einem Kompositionsstil, bei dem eine Phrase im Kopf direkt auf ein Notenblatt geschrieben und das Werk verfeinert wird. Das Objekt, das der Komponist manipuliert, sind die „imaginierten klanglichen Qualia selbst“. Das musikalische Denken simuliert den Klang selbst direkt und beurteilt seinen Nachhall in der Form von „wie würde es klingen, wenn nach diesem C ein As statt eines G käme?“ So sind das Klavierspielen, die Bedienung einer DAW und das Konstruieren von Klang im Kopf, obwohl sie unterschiedliche Schnittstellen haben, strukturell darin gemeinsam, dass ihre Feedbackschleifen direkt auf die „klanglichen Qualia“ abzielen.

Im Gegensatz dazu umgeht der Prozess von Suno diesen Punkt der „direkten Intervention in die klanglichen Qualia“ strukturell. Der Benutzer gibt Anweisungen in Sprache und erhält ein Ergebnis von der KI, wodurch er in einer indirekten Beteiligung verbleibt. Die Feedbackschleife des Benutzers bei Suno zielt auf „sprachliche Anweisungen“ und nicht auf „klangliche Qualia“, und hier liegt der entscheidende Unterschied. Diese musikalisch distanzierte Operation kann kein aktives Urteil über die feine Textur der Qualia und keine subjektive Verantwortung dafür begründen.

Zur Verdeutlichung: Dieses Prinzip der „Intervention des hörenden Körpers“ oder genauer gesagt der „direkten Intervention in die klanglichen Qualia“ soll keineswegs den Generierungsakt von Suno negieren. Es dient dazu, eine „logische Grenze“ zu ziehen, um die Reinheit und das historische Gewicht des Begriffs „Komposition“ zu respektieren. Im nächsten Kapitel werde ich auf der Grundlage dieses Prinzips den Prozess von Suno im Detail analysieren und das Konzept der „Beschwörung“ (Summoning) betrachten, das als neues kreatives Genre vorgeschlagen werden sollte.

Kapitel 2: Anatomie des Suno-Prozesses – Die „beschworene“ Musik

Im Lichte der Definition aus Kapitel 1 wäre die Musikgenerierung durch Suno im strengen Sinne nicht als Komposition zu bezeichnen. Der Grund dafür ist eine strukturelle Verschiebung des Objekts der Feedbackschleife. Bei der traditionellen Komposition ist das Objekt der Feedbackschleife das „klangliche Material oder die Komponente“ selbst, und der Komponist greift körperlich in die klanglichen Qualia ein.

Im Prozess von Suno ist die Operation des Benutzers jedoch auf ein konzeptionelles Medium beschränkt: „sprachliche Anweisungen (Prompts)“. Wenn ein Benutzer seine musikalische Absicht anpasst, geschieht dies durch „Modifikation des Prompts“, nicht durch „direkte Manipulation des generierten Klangmaterials“. Diese Struktur versetzt den Benutzer in eine passive Rolle als „Präsentator von Konzepten und Selektor von Ergebnissen“ anstatt als „Designer der Musik“. Der kritischste Schritt des kreativen Urteils – die Wertung und Entscheidung, „warum dieser Klang schön ist“ – wird an die statistische Blackbox des KI-Modells delegiert, was das kreative Subjekt aushöhlt.

Um diese Aushöhlung des kreativen Subjekts und die unkörperliche Natur des Prozesses treffend zu beschreiben, schlägt dieser Aufsatz vor, den Generierungsakt von Suno als „Beschwörung von Musik“ (Summoning) zu definieren und zu benennen. Während Komposition eine „absichtliche Konstruktion (Generation)“ durch den Dialog mit Materialien ist, bedeutet „Beschwörung“ „den Akt, durch einen Zauberspruch (Prompt) ein Wesen jenseits der eigenen Absicht herbeizurufen“.

Diese qualitative Trennung von „Beschwörung“ und „Komposition“ ist jedoch keineswegs eine Verneinung des kreativen Bestrebens, das der Beschwörung innewohnt. Vielmehr wird die Beschwörung als eine neue kreative Tätigkeit betrachtet, die nicht in das enge Konzept der traditionellen Komposition passt und das Potenzial für eine unvorhergesehene Zukunft birgt. Diese Definition von „Beschwörung“ beinhaltet zwei wichtige Elemente.

1. Ausdruck des Blackbox-Charakters
Generative KI erzeugt probabilistisch Klänge, die einem Prompt entsprechen, durch ein Modell, das auf riesigen Lernressourcen basiert, was manchmal zu Ergebnissen führt, die die Erwartungen des Benutzers übertreffen. Diesen Prozess als „Beschwörung“ zu bezeichnen, drückt den Blackbox-Charakter treffend aus, für dessen klangliche Struktur der Benutzer keine Verantwortung übernehmen kann.

2. Positive Annahme des Gefühls der indirekten Bedienung
Der Akt der „Beschwörung“ beinhaltet eine indirekte Operation (einen Zauberspruch). Dies leugnet nicht das „Gefühl, den Musikproduktionsprozess zu steuern, wenn auch indirekt“, das Suno-Benutzer genießen. Stattdessen akzeptiert es die „Operation durch Sprache“ positiv als neue Form der Schöpfung, während es gleichzeitig auf ihre wesentliche Grenze hinweist.

Übrigens ist der Begriff „Beschwörung“ keine originelle Neuschöpfung dieses Aufsatzes. Er entstand in den Anfängen der Bildgenerierungs-KI vor einigen Jahren, als viele Benutzer die Erfahrung, durch komplexe Prompts unbeabsichtigt hochwertige Ergebnisse zu erzielen, intuitiv als „Beschwörung“ bezeichneten. Dieser Aufsatz greift diese geteilte Metapher auf, nicht nur als Internetslang, sondern als Konzept zur Analyse der Struktur kreativer Akte. Mit anderen Worten, der Begriff „Beschwörung“ wird als Schlüssel verwendet, um das intuitive Gefühl des Benutzers, „nicht zu wissen, was herauskommt“, mit strukturelleren Problemen wie „Blackbox-Charakter“, „Nicht-Intervention in Qualia“ und „Abwesenheit eines ethischen Subjekts“ zu verbinden.

Zusätzlich ist Beschwörung „der Akt des Herbeirufens“, der die „Andersartigkeit“ und „Unvorhersehbarkeit“ eines Besuchers einschließt. In Bezug auf die Zeitstruktur impliziert das Wort Beschwörung auch das zeitliche Merkmal des „sofortigen Erscheinens“, was einen Kontrast zu anderen bestehenden Produktionsprozessen darstellt.

Selbstverständlich leugnet der Begriff „Beschwörung“ nicht die Kreativität der Benutzer, die sorgfältig Prompts erstellen und das Beste aus unzähligen Ergebnissen auswählen. Dieses Unterfangen ist ein unbestreitbares kreatives Urteil, ähnlich wie ein großer Filmregisseur die beste Einstellung wählt oder ein Kurator einer Ausstellung Leben einhaucht. Der Grund, es hier „Beschwörung“ zu nennen, ist, um zu verdeutlichen, dass diese Art von Kreativität qualitativ anders ist als die „Konstruktion“, die einen direkten Kampf mit Materialien beinhaltet. So wie ein Regisseur oder Kurator mit den „Schöpfungen anderer“ – der Leistung eines Schauspielers oder dem Werk eines Künstlers – arbeitet, so steht auch ein Suno-Benutzer einem „Besucher jenseits seiner eigenen Absicht“ gegenüber, der von der Blackbox der KI produziert wurde.

Indem man den Akt von Suno als „Beschwörung von Musik“ definiert, gewinnt er an Wert, nicht nur als „fortgeschrittene Auswahl“, sondern als „Konzeptdesign“. Damit beschworene Musik jedoch zur Komposition im strengen Sinne erhoben werden kann, muss der Benutzer aktiv in die klanglichen Qualia des beschworenen Klangs mit seinem eigenen „hörenden Körper“ und seinem „professionellen Wissen und seiner Erfahrung“ eingreifen und das statistische Urteil der KI durch eine „menschliche ethische Absicht“ überschreiben. Das nächste Kapitel wird untersuchen, wie sich diese Struktur von „Anweisung und Interpretation/Generierung“ bei der „Beschwörung“ von den grafischen Partituren der Musikgeschichte unterscheidet und Sunos Position in dieser Geschichte überprüfen.

Kapitel 3: Einordnung in den historischen Kontext – Ein Vergleich mit grafischen Partituren

Die im Prozess von Suno zu beobachtende Struktur, bei der ein „Medium“ zwischen Anweisung in natürlicher Sprache und klanglicher Realisierung platziert wird, ist in der Musikgeschichte nicht gänzlich ohne Vorbild. In der zeitgenössischen Musik der Mitte des 20. Jahrhunderts wurde mit der Methode der grafischen Partitur diese „Trennung von Anweisung und Interpretation“ versucht, indem die Absicht des Komponisten abstrakten Formen und Symbolen anvertraut wurde.

Die Pioniere dieses Ansatzes waren Earle Brown und John Cage. Earle Browns „December 1952“ besteht aus Linien und Punkten, die an ein abstraktes Gemälde von Mondrian erinnern. Der Interpret übersetzte (interpretierte) diese visuellen Informationen subjektiv in Tonhöhe, Dauer, Dynamik usw. und traf vor Ort aktive Entscheidungen. Browns Absicht war es, dem Interpreten „subjektive Interpretation“ und „strukturelle Verantwortung“ zu geben. John Cage zeigte mit seiner „Fontana Mix“ einen ähnlichen Ansatz und führte in vielen anderen Werken Zufallsoperationen ein, um das Ego des Komponisten konsequent zu eliminieren und die Unbestimmtheit der Aufführung zu erhöhen.

Die Struktur dieser grafischen Partituren mag auf den ersten Blick dem Fluss „Prompt → KI → Klang“ bei Suno ähneln, aber das Vorhandensein oder Fehlen eines „menschlichen Körpers“ dazwischen macht einen wesentlichen Unterschied aus. Dieser Unterschied mag wie ein Unterschied in der Schnittstelle erscheinen, aber sein Wesen liegt darin, ob der Interpret/Ausführende ein „ethischer, verantwortlicher Körper“ ist oder nicht.

Die Struktur der grafischen Partitur basierte auf der Prämisse, dass „ein menschlicher Interpret“ die abstrakten Anweisungen des Komponisten mit seiner Körperlichkeit interpretieren und realisieren würde. Wenn ein Interpret beispielsweise eine von Brown erstellte Partitur liest, ist damit ein aktives kreatives Urteil verbunden: „Wie werde ich diese Form mit meiner Technik und meiner körperlichen Wahrnehmung und mit welchen klanglichen Qualia als Hintergrund verantwortungsvoll realisieren?“ Der Interpret war ein stellvertretendes kreatives Subjekt, das professionelle Verantwortung für seine Interpretation trug. Cage mag manchmal sogar darauf abgezielt haben, genau diese Kette der Verantwortung zu zerstören. Doch selbst in seiner radikalen Praxis bleibt die Tatsache bestehen, dass am letzten Tor, an dem zufällige Anweisungen letztendlich als Klang zum Leben erweckt wurden, immer die körperliche Interpretation eines „lebenden Interpreten“ stand, der ethische Verantwortung trug.

In dieser Hinsicht erweiterten grafische Partituren die Möglichkeiten der menschlichen kreativen Interpretation. Es war aber auch ein gefährlicher Versuch, bei dem der Komponist selbst vom Kern der Komposition zurücktrat. Dennoch blieb der Akt der Komposition lebensfähig, weil sein Kernprinzip – „direkte Intervention in die klanglichen Qualia“ – kaum aufrechterhalten wurde, indem es an ein anderes menschliches Subjekt, den Interpreten, delegiert wurde.

Im Fall von Suno wurde dieses „interpretierende Subjekt mit einem menschlichen Körper“ jedoch durch „probabilistische statistische Verarbeitung auf der Grundlage von Trainingsdaten“ ersetzt. Die KI generiert mechanisch die wahrscheinlichste Kombination aus ihrem erlernten Modell vergangener Klangmuster, um das angewiesene Konzept zu erreichen. Es gibt kein körperliches Engagement für die Qualia, kein Gefühl dafür, „warum dieser Klang schön ist“.

Während also grafische Partituren die „Möglichkeiten der menschlichen kreativen Interpretation“ erweiterten und das Prinzip der „direkten Intervention in die klanglichen Qualia“ in der Komposition aufrechterhielten, indem sie es an den Interpreten delegierten, hat Suno die eigentliche „Notwendigkeit der körperlichen und ethischen Interpretation“ durch Technologie ersetzt. Hier können wir einen strukturellen Bruch zwischen den beiden erkennen.

Die Perspektive, KI als eine „neue Art von Interpret“ zu behandeln, erscheint auf den ersten Blick verlockend. Der wesentliche Unterschied liegt hier jedoch im „Vorhandensein oder Fehlen von Rechenschaftspflicht“. Ein menschlicher Interpret ist ein ethisches Subjekt, das auf die Frage „Warum haben Sie diese Interpretation gewählt?“ auf der Grundlage seiner eigenen musikalischen Ansichten und Ästhetik (Qualia) antworten kann. Im Gegensatz dazu trägt die KI keine ethische Verantwortung für ihre Ausgabe. Ihre Entscheidungskriterien sind rein statistische Wahrscheinlichkeit, ohne „ästhetische Überzeugung“. Diese „Abwesenheit eines ethischen Subjekts“ ist der entscheidende Grund, warum KI nicht in einem Atemzug mit einem menschlichen Interpreten genannt werden kann, und sie ist die Grundlage für die Behauptung, dass Suno nicht in der Fortsetzung der Kompositionsgeschichte steht, sondern an einem „Bruchpunkt“.

Als Ergebnis dieser vergleichenden Analyse kann Suno nicht als eine Weiterentwicklung in der Verlängerung der Kompositionsgeschichte betrachtet werden, die grafische Partituren in Bezug auf die „Freiheit der Anweisung“ eröffneten, sondern als an einem qualitativ anderen Punkt stehend, der den kreativen Kern der „menschlichen Interpretation“ umgangen hat. Während grafische Partituren die Kette der Verantwortung aufrechterhielten, indem sie den Ort des aktiven menschlichen Engagements vom Komponisten zum Interpreten verlagerten, fehlt Suno strukturell das wichtigste Glied in dieser Kette: der „Interpret mit einem Körper“.

Daher wird ein tiefes Verständnis dieses strukturellen Merkmals – der „Abwesenheit eines ethischen Subjekts“ – zum Ausgangspunkt für die Betrachtung der grundlegenden Frage der „Berufsethik eines Komponisten“, die im nächsten Kapitel diskutiert wird. Dies ist natürlich eine prinzipielle Diskussion, die auf einer Strukturanalyse des kreativen Prozesses basiert, und leugnet nicht, dass zeitgenössische Schöpfer in ihrer Praxis fließend zwischen den Akten der „Beschwörung“ und der „Komposition“ hin- und herwechseln können. Es ist bemerkenswert, dass die Technologie selbst sich schnell entwickelt, um diesen prinzipiellen Bruch auf praktischer Ebene zu überbrücken, wie die MIDI-Export- und Part-Separations-/Bearbeitungsfunktionen der neuesten Version von Suno zeigen.

Kapitel 4: Komposition als „soziale Handlung“ – Die Wahl des kreativen Engagements

In den vorangegangenen Kapiteln haben wir die inneren Prozesse des Kompositionsaktes, nämlich „Körperlichkeit“ und „Verantwortung“, untersucht. Der Akt der Komposition ist jedoch nichts, was ausschließlich im Inneren des Individuums vollendet wird. Er ist im Wesentlichen eine „soziale Handlung“, die in Beziehungen zur Gesellschaft und zu anderen funktioniert.

Auf der fundamentalsten Ebene ist bereits der bloße Wille einer Person, Musik zu schaffen und sie anderen (Hörern) zu vermitteln, ein sozialer Akt. Es ist eine Form der Kommunikation, ein Versuch, die eigene innere Welt mit anderen zu teilen und auf irgendeine Weise ihre Herzen zu beeinflussen. Die Natur der Komposition als soziale Handlung wird in den vielfältigen kreativen Formen von heute konkreter. Zum Beispiel Kollaborationen zwischen Musikern oder mit Kreativen aus anderen Genres über das Internet.

Diese Natur tritt am deutlichsten in der Welt der Gesamtkunstwerke wie Film- und Bühnenmusik hervor. Hier müssen Komponisten eng mit Regisseuren, Produzenten, Schauspielern und verschiedenen anderen Kreativen zusammenarbeiten und die Verantwortung für den Gesamterfolg des Werkes teilen. Aus dieser kollaborativen Perspektive ist die Schaffung von Musik nicht nur die „präzise Realisierung einer Absicht“, sondern auch das „Teilen von kreativem Engagement“ mit allen Beteiligten. Es ist dieses Engagement, das im Zeitalter der KI zu einem entscheidenden Wert für den Beruf des Komponisten werden könnte.

Um zu verstehen, wie sich der Musikschaffensprozess von Suno strukturell vom traditionellen Kompositionsprozess unterscheidet, betrachten wir nun die Rolle eines Architekten als Analogie. Nachdem ein Architekt ein Konzept (Kundenwunsch) erhalten hat, widmet er sich der akribischen Arbeit des „Designs“. Er beschäftigt sich aktiv mit jeder Struktur und jedem Material und nutzt sein eigenes Wissen und seine Erfahrung.

Wendet man diese Analogie an, so liefert ein Suno-Benutzer zunächst als „Auftraggeber“ ein Konzept an die KI. Er trifft dann die „Wahl“, den nachfolgenden „Design“-Schritt der KI zu überlassen. Das heißt, durch die Entscheidung, das Design an die KI zu delegieren, genießt der Benutzer den Komfort, „ein Konzept sofort in Klang umzusetzen“, aber im Gegenzug wird die Verantwortung für die „aktive Festlegung aller klanglichen Strukturen“ an die Blackbox der KI delegiert. Wenn er sich stattdessen für die Rolle eines Komponisten entscheidet, bedeutet dies, sich selbst ein aktives Engagement für das „Design“ aufzuerlegen.

Diese Perspektive der „Wahl, sich am Design zu beteiligen“ ist ein Vorschlag, die Freude an der Schöpfung noch tiefer zu verfolgen. Es bedeutet, die von der KI bereitgestellte „Fähigkeit zur Konzeptrealisierung“ voll auszunutzen und gleichzeitig aktiv in das generierte Produkt mit dem eigenen körperlichen Feedback (Instrumente, DAW-Bedienung, musikalisches Wissen und Erfahrung) einzugreifen, um das statistische Urteil der KI in eine menschliche ethische Absicht zu sublimieren. Dies könnte der Weg für Schöpfer im KI-Zeitalter sein, ihre kreative Verpflichtung zu erfüllen, „Verantwortung für jeden Ton zu übernehmen“ und gleichzeitig die Früchte der Demokratisierung zu nutzen.

Suno hat den Weg zur Schöpfung erstaunlich verkürzt, aber ich glaube, dass jeder weitere kreative Sprung von dort aus immer durch die eigenen Hände und Ohren erfolgen wird. Im letzten Kapitel werde ich den bisherigen Inhalt zusammenfassen und die „Ästhetik der Verantwortung“ erörtern.

Schlusskapitel: Neudefinition der Komposition und die „Ästhetik der Verantwortung“

In diesem Aufsatz habe ich versucht, die Grenzen des kreativen Aktes der Komposition neu zu definieren, indem ich die Erweiterung des Kompositionsbegriffs, die durch musikgenerierende KIs wie Suno hervorgerufen wurde, strukturell analysiert habe. Ich bin zu dem Schluss gekommen, dass Komposition nicht nur die Erzeugung von Klang ist, sondern ein Akt, der von einer aktiven Feedbackschleife und ethischer Verantwortung begleitet wird.

Fasst man diese Punkte zusammen, so lautet eine neue Definition der Komposition im Zeitalter der KI wie folgt:

„Komposition ist eine soziale Handlung, die körperliches Feedback beinhaltet, bei der man die ethische Verantwortung als Designer für die endgültige Festlegung des Klangs trägt.“

Im Lichte dieser Definition zeichnet sich die Musikgenerierung durch KI durch zwei strukturelle Merkmale aus: die „Nichtverwendung von körperlichem Feedback“ und die „Delegation der Designverantwortung“. Daher erscheint es angemessen, diesen kreativen Akt als ein neues kreatives Genre, die „Beschwörung von Musik“, zu positionieren, unabhängig vom Bereich des strengen Kompositionsbegriffs, wie er in diesem Aufsatz definiert wurde.

In gewisser Weise kann dieses neue Unterfangen nicht mehr im engen, menschlich begrenzten Bereich der Komposition enthalten sein. Unterstützt durch KI-Technologie und das noch ungesehene Potenzial der Zukunft umfassend, kann es positiv als ein riesigeres, neueres kreatives Genre positioniert werden.

Betrachtet man erneut die Unterschiede in der Schöpfung zwischen Menschen und KI, so gehört die KI zur Welt des „Sagbaren“ (Sprache, Daten, Muster), während die menschliche Schöpfung sich in den Bereich des „Unsagbaren“ erstreckt. Dies schließt die Feinheiten von Emotionen ein, die niemals durch Worte erfasst werden können, die Textur der Welt und das Geheimnis der Existenz. Komposition, glaube ich, ist ein endloser Prozess der Erforschung, bei dem der Komponist mit seinem eigenen Körper und seiner Sensibilität in diesen Bereich des „Unsagbaren“ eindringt, ihn auskostet und schließlich durch die nonverbale Ordnung des Klangs versucht, seine Konturen zu skizzieren. Man kann einer KI anweisen, „traurige Musik“ zu schaffen, aber der existenzielle Kampf, sich der Textur (Qualia) der eigenen „unbenennbaren Traurigkeit“ eins zu eins durch Klang zu stellen, ist etwas, das nur ein Mensch kann.

Durch die Zusammenfassung des bisherigen Inhalts ergibt sich die Antwort auf die zu Beginn dieses Aufsatzes gestellte Frage – „Was ist in der Komposition unersetzlich?“ – von selbst. Das heißt, die Komposition durch den Menschen umfasst eine Dreieinigkeit aus dem Dialog mit Qualia durch den Körper, der Übernahme ethischer Verantwortung und der Erforschung des Unsagbaren. Dies sind im Wesentlichen Dinge, die die KI nicht ersetzen kann.

Suno hat den Wunsch der Menschen, „Konzepte in Klang umzusetzen“, demokratisch erfüllt, indem es die hohe Hürde des Kompositionsprozesses auf die Anfangsphase des Konzeptdesigns gesenkt hat. Dies ist eine buchstäbliche „Demokratisierung des musikalischen Ausdrucks“ und eine wunderbare Leistung, die hoch gelobt werden sollte. Und eine wichtige, wenn auch weniger sichtbare Rolle von Suno, die ich hervorheben möchte, ist seine Funktion als „Spiegel, der den Kompositionsbegriff zurückwirft“. Die Offenlegung des unkörperlichen Prozesses der KI hat paradoxerweise zu einer neuen Anerkennung der Bedeutung und des Wertes der „körperlichen Anstrengung“, der „Verantwortung für den Klang“ und des „Kampfes mit dem Material“ geführt, die menschliche Komponisten unbewusst unternommen haben.

In Anbetracht dieser Punkte könnte sich der Schwerpunkt der Rolle des Komponisten im Zeitalter der KI von „technischer Überlegenheit“ auf „ethische Ausführung“ verlagern. Dies ist eine Zunahme der Bedeutung eines Wertesystems, das man als „Ästhetik der Verantwortung“ bezeichnen könnte. Die Ästhetik der Verantwortung lässt sich wie folgt ausdrücken: „Die Schönheit eines Werkes liegt nicht nur in der Perfektion des klanglichen Ergebnisses, sondern auch in der Tatsache selbst, dass der Autor mit körperlicher Anstrengung und kreativen Entscheidungen die Verantwortung für jede Ecke dieses Klangs übernommen hat.“

Und an diejenigen, die die Beschwörung durch Suno genießen, möchte ich die folgende „Einladung“ als Partner bei der Erforschung der Freude an der Schöpfung senden. Das ist der Vorschlag, die von der KI bereitgestellte Fähigkeit zur Konzepterstellung voll auszunutzen und aktiv in das generierte Produkt mit dem eigenen körperlichen Feedback (Instrumente, DAW-Bedienung, musikalisches Wissen und Erfahrung usw.) einzugreifen und das statistische Urteil der KI mit menschlicher ethischer Absicht zu überschreiben. Dieser Weg der „KI-vermittelten Hybridkomposition“ könnte ein neuer Wert für Schöpfer im Zeitalter der KI sein, den es zu erforschen gilt, einer, der die „Ästhetik der Verantwortung“ verkörpert und gleichzeitig die Früchte der Demokratisierung der Schöpfung voll genießt.

Zuvor, in Kapitel 3, erwähnte ich einen „prinzipiellen Bruch“ zwischen Suno und der Geschichte der Komposition. Das bedeutete keine hoffnungslose Klippe. Vielmehr war es eine genaue Karte, die uns zeigte, wo wir eine Brücke bauen sollten. Und erfreulicherweise wird diese Brücke bereits gebaut. Die neueste Version von Suno (Suno Studio), die im September 2025 veröffentlicht wurde, hat Bearbeitungsfunktionen implementiert, die bisher nur in professionellen DAWs möglich waren, wie die „Trennung und individuelle Erzeugung von Parts“ und die „Umwandlung von Parts in MIDI-Daten“. Dies hat es Suno-Benutzern ermöglicht, die Ergebnisse der KI-Beschwörung nicht nur als Blackbox zu akzeptieren, sondern sie auf ihre eigene DAW-Werkbank zu legen und sie in den Prozess der Komposition zu bringen, wo sie die Verantwortung für den Klang übernehmen. Der Weg für jeden, vom „fortgeschrittenen Kurator“ zum „verantwortlichen Schöpfer“ zu wechseln, wurde durch die Technologie eröffnet.

Mit der KI zusammenarbeiten – es ist ein einfacher Satz, aber wie besprochen, ist er mit verschiedenen Situationen und Gedanken überlagert. Indem wir auf der Theorie der Komposition aufbauen, zu der wir durch diese Überlegungen gelangt sind, wird diese Zusammenarbeit beginnen, sich vor unseren Augen als eine „Möglichkeit mit tiefen Farben“ zu entfalten.

Zum Abschluss dieses Aufsatzes lassen Sie mich zwei Fragen stellen. Wenn Sie von der Freude der Beschwörung erfüllt sind, in welchem Moment strahlt diese Magie am hellsten? Ist es, wenn Sie den perfekten Zauberspruch finden, oder wenn Sie auf einen unerwarteten Schatz stoßen? Und wenn Sie den Weg der Komposition einschlagen, wann fühlen Sie: „Ich bin für diesen Klang verantwortlich“?

Die Antworten auf beide Fragen sollten Ihre eigene unersetzliche kreative Subjektivität im Zeitalter der KI enthalten.

Anhang: Zum Umfang und zu den Problemen dieses Aufsatzes

1. Bei dieser Analyse besteht die Möglichkeit, dass ich die „Körperlichkeit“ der traditionellen Komposition idealisiert habe, indem ich sie betont habe. Auch meine Vorsicht gegenüber der Beschleunigung der KI-Technologie könnte meine Vorstellungskraft bezüglich der „unvorhergesehenen kreativen Möglichkeiten“, die die KI mit sich bringen wird, eingeschränkt haben.

2. Bezüglich der ethischen Verantwortung habe ich mich hauptsächlich auf das „interne Engagement des Komponisten“ konzentriert, wodurch breitere externe Themen wie soziale und rechtliche Verantwortung als wichtige Themen für die Zukunft verbleiben. Ich möchte hier hinzufügen, dass die in diesem Aufsatz vorgestellte „Ästhetik der Verantwortung“ zum jetzigen Zeitpunkt ein begrenztes Konzept ist, das aus meiner persönlichen Praxis abgeleitet wurde.

3. Der Grund, warum dieser Aufsatz Suno als „Bruchpunkt“ in der Geschichte der Komposition positioniert, ist ausschließlich, um auf den Bruch in der prinzipiellen Kette der menschlichen körperlichen Interpretation hinzuweisen. Andererseits können in der kreativen Praxis einzelner zeitgenössischer Schöpfer die Akte der „Beschwörung“ und der „Komposition“ ein fließendes Spektrum bilden, und das Wort „Bruch“ bedeutet keine ausschließliche Trennung zwischen den beiden. Tatsächlich zeigen die Bearbeitungsfunktionen und die MIDI-Exportfunktion von Suno Studio, dass jeder dieses Spektrum von der Beschwörung zur Komposition erleben kann.

4. Ich möchte nochmals betonen, dass dieser Aufsatz keinerlei Absicht hat, die Freude derer zu leugnen oder geringzuschätzen, die die Früchte der Demokratisierung des musikalischen Ausdrucks genießen.

5. Ob es diesem Aufsatz gelungen ist, einen Bezugspunkt zu schaffen, indem er Licht auf die Frage wirft, „was an der Komposition nicht ersetzt werden kann“, möchte ich Ihnen, dem Leser, überlassen.

Verwandte Artikel

Ein weiterer Blick auf die Komposition: Warum ist Empathie durch Musik möglich?
(Ursprünglich veröffentlicht am 12. November 1999)In einer früheren Kolumne, „Blick auf die Komp...
Blick auf die Komposition: Ein hypothetisches Modell zum Verständnis des Kompositionsaktes
(Ursprünglich veröffentlicht am 21. Oktober 1999)Der Akt des Komponierens wird oft, sowohl von d...
Essays
Profil      
Masaharu

Japanischer Komponist. Auf der Grundlage von Jazz und Klassik komponiert er experimentelle Crossover-Musik. Gestützt auf seine Erfahrung in der Komposition für Theater und Spiele, strebt er Musik mit erzählerischer und konstruktiver Schönheit an.