音楽制作の世界は今、歴史的な転換点に立っています。その象徴的存在が、テキスト入力だけで楽曲を生成するAI『Suno』です。
このAIは、音階や和声といった専門的な音楽知識、あるいはDAW操作の習熟を必要とせず、誰もが持つ「自然言語」という極めて敷居の低い手段で、音楽を制作することが可能になりました。
この変化は、音楽表現の民主化という観点から見れば、人類の創作史において最大の果実の一つであり、その価値は広く承認されるべきものです。多くの人々が、自身のコンセプトを音楽として具現化する「表現の感覚」を味わい、創作の喜びを享受しています。
さて、このような歓喜の声の背後で、私は一つの構造的な問いを抱くと共に、そこから生じる、専門家としての違和感に直面しています。
それは、AIによる生成行為と、従来の定義における「作曲」との間に横たわる、構造的なズレから生じる違和感です。
この違和感の正体を探ることは、新しい技術や民主化の流れそのものを否定するためではありません。むしろ、それらを肯定的に受け入れた上で、私がこれまで『作曲』と呼んできた行為の核心をより深く見つめ直すための、建設的な試みとなり得るものだと思います。
そして、その問いの核心には、「身体的なコミットメント」と「倫理的な責任」が、AIのプロセスによって構造的にバイパスされているのではないかという疑問が横たわっています。
この記事では、この「違和感」について、それをSunoへの批判としてではなく、創造的行為の構造的な転換点として考察することを試みます。
ここでは、以下の二つのモチーフを主軸として、Sunoの生成プロセスを解剖することを通じ、従来の作曲概念との境界線を再定義することで、メタな作曲論の構築を目指します。
- 音楽的クオリアの直接的介在(身体性)
- 職能倫理としての倫理的責任(意図の所在)
そしてこの考察を通じて、Sunoが持つ「コンセプトの具現化能力」の素晴らしさを認めた上で、真の創造的喜びが「能動的なコミットメントを回復した先」にあることを示し、ユーザーが「高度なキュレーター」から「責任を負うクリエイター」へと進化していくための道筋を提示できればと思っています。
更には、Sunoを「作曲概念を逆照射する鏡」として捉えることで、生成AI時代における作曲家の新たな役割と責任の美学を提示することも試みます。
本論は言うなれば、「AIは作曲を代替できるか」を問おうとするのではなく、「作曲とは、そもそも何を代替し得ない行為なのか」という根源的な問題に光を当てようとする試みです。
第1章:作曲の身体性~フィードバックループという対話
このAI時代において、「作曲」の定義に立ち返る際には、作曲行為を特定の要素や条件だけから見るのではなく、プロセスとして捉える必要があるでしょう。
作曲行為の核心は、「音楽的素材や構成要素との交流・交感というステップを含む、能動的なフィードバックループ」にあると私は捉えています。このループは、記譜、演奏、DAW制作といった、作曲家が用いる多様な手法に共通する構造です。
例えば、DAW上でフレーズを打ち込む、サンプリング素材を配置・編集する、あるいはギターでリフを弾いてみる。そして、その「行為」の結果を耳で即座に「聴取」し、「感性的な判断」を下し、その判断に基づいて次の「修正・操作」へと繋げる。こうした絶え間ない「対話」こそが、創造的な意図を精密に実現するための重要なプロセスです。
このフィードバックループは、単なる試行錯誤ではなく、音響の質感や構造に対する責任を伴う深化のプロセスであり、これを欠く行為は厳密な意味での『作曲』(本論が再定義する概念)には、組み入れられないと考えます。
そして、このフィードバックループが、単なる機械的な試行錯誤ではなく創造的な対話となるためには、「身体性」の介在が不可欠となります。本論では、この要件を「聴取する身体の介在」と呼びます。
明確にしておきたいのは、ここで述べる「身体性」とは、運動量の大小を問題にしているのではないということです。その核心は、『音響クオリア(音の生々しい質感や感情)を、どれだけ直接的かつ微細な解像度で操作し、その結果を即座にフィードバックできるか』という、操作の直接性とフィードバックの解像度にあります。
この視点に立つと、一見すると非音楽的・非身体的に見えるDAWのマウス操作も、その本質が見えてきます。
マウスのクリックやドラッグは、物理的な運動こそ小さく音楽的動作にも見えないですが、あるMIDIノートのピッチを半音上げるという行為は、音響クオリアに基づいて「この音を、この高さにする」という、極めて具体的な意図の直接的な実行です。道具(マウス)は間接的でも、対象(音)への介入は直接的です。
同様に、頭の中にあるフレーズをそのまま楽譜に書き記し、作品を推敲していく作曲スタイルにおいても、作曲家が操作している対象は「イメージ上の音響クオリアそのもの」です。「このCの音の次にGではなくA♭が鳴ったらどう響くか」という形で、音楽的思考は音そのものを直接シミュレートし、その響きを判断しています。
このように、ピアノを弾くこと、DAWを操作すること、そして脳内で音を組み立てること。これらの行為はインターフェースこそ異なりますが、いずれもフィードバックループが「音響クオリア」そのものを対象としている点で、構造的に共通しています。
それに対して、Sunoのプロセスでは、この「音響クオリアへの直接介入」という点が構造的にバイパスされています。ユーザーは言語で音楽概念を指示し、AIから結果を受け取るという、間接的な関与に留まります。
Sunoにおけるユーザーのフィードバックループは、「音響クオリア」ではなく「言語的指示」を対象としており、ここに決定的な断絶があります。この隔靴掻痒的な操作だと、クオリアの繊細な質感に対する能動的な判断と、それに対する主体的な責任とが成立し得ないのです。
この「聴取する身体の介在」、より厳密に言えば「音響クオリアへの直接介入」という原則は、決してSunoによる生成行為を否定するためのものではなく、「作曲」という概念の純粋性と歴史的重みを尊重するための「論理的な境界線」を引くためのものです。
次の章では、この原則に基づき、Sunoのプロセスを詳細に解剖し、新たな創作ジャンルとして提唱すべき「召喚(Summoning)」という概念について論じます。
第2章:Sunoプロセスの解剖~「召喚」される音楽
第1章の定義に照らすと、Sunoによる音楽生成は、厳密な意味では「作曲」ではないと判断されることになるでしょう。その理由は、構造的に見るとフィードバックループの対象が転換している、という点にあります。
従来の作曲では、フィードバックループの対象は「音響素材や構成要素」そのものであり、作曲家は音響のクオリアに対して身体的に介入します。
しかし、Sunoのプロセスでは、ユーザーの操作は「言語的指示(プロンプト)」という概念的媒介に限定されます。ユーザーによって音楽的な意図を調整する際に行われるのは、「生成された音響素材の直接操作」ではなく、「プロンプトの修正」です。
この構造は、ユーザーを「音楽の設計者」から「コンセプトの提示者および結果の選別者」という受動的な立場に留まらせます。
最も重要な創造的判断のステップである「なぜこの音が美しいのか」という音響構造の判断と決定権は、AIモデルという統計的ブラックボックスに委ねられているため、創造主体が空洞化していると言えます。
この創造主体の空洞化と、プロセスの非身体性を適切に表現する概念として、本論ではSunoによる生成行為を「音楽の召喚(Summoning)」と名付け定義することにします。
「作曲」が、素材との対話を通じた「意図的に構築する生成(Generation)」であるのに対し、「召喚」は、「呪文(プロンプト)によって、自らの意図を超えた存在を呼び出す行為」を意味します。
この「召喚」という定義には、以下の二つの重要な要素が込められています。
1. ブラックボックス性の表現
生成AIは、学習データという膨大な過去の資産から、プロンプトに合致する音響を確率的に引き出してくるため、ユーザーの予測を超えた結果が出力されることがあります。
このプロセスを「召喚」と呼ぶことで、ユーザーが音響の構造に責任を負えないブラックボックス性を的確に表現できます。
2. 間接的な操作感の肯定的な受容
「召喚」という行為は、間接的な操作(呪文)を伴うものです。
これは、Sunoユーザーが享受する「間接的とはいえ、音楽制作のプロセスを操作している感覚」を否定せず、むしろ「言語による操作」という新しい創作形態として肯定的に受け入れつつ、同時にその本質的な限界を示唆します。
ちなみに、この「召喚」という言葉は、本論における独自の造語ではありません。
この言葉は、画像生成AIの黎明期において、複雑なプロンプト(呪文)によって意図せぬ高品質な結果が得られる体験を、多くのユーザーが直感的に「召喚」と呼び表したことに端を発します。
本論では、この多くのユーザーが共有する的確な比喩表現を借りつつ、それを単なるインターネットスラングに留めず、創造行為の構造を分析するための概念として再定義しています。
すなわち、ユーザーの直感が捉えた「何が出てくるかわからない」という感覚を、「ブラックボックス性」や「クオリアへの非介入」、そして「倫理的主体の不在」といった、より構造的な問題へと接続するための鍵として、この「召喚」という言葉を用いています。
補足すると、召喚とは「呼び出す行為」であり、そこには来訪者という「他者性」と「予測不可能性」が含まれています。また時間構造の面でも、召喚という言葉には「一瞬で出現する」という時間的特徴が込められており、既存の制作過程との対比を包含しています。
言うまでもないことですが、この「召喚」という言葉は、プロンプトを高度に練り上げ、数多の出力から最良の一つを選び出すという、ユーザーの創造性を否定するものではありません。その営みは、優れた映画監督が最高のテイクを選び出す行為や、キュレーターが展示に魂を吹き込む行為にも似た、紛れもない創造的判断です。
ここで敢えて「召喚」と呼ぶのは、その創造性の種類が、素材と直接格闘する「構築」とは質的に異なることを明確にするためです。
監督やキュレーターが、俳優の演技やアーティストの作品という「他者の創造物」に対して働きかけるように、Sunoユーザーもまた、AIというブラックボックスが生み出した「自らの意図を超えた来訪者」と向き合っていると言えるでしょう。
Sunoの行為を「音楽の召喚」と定義することで、それは単なる「高度な選別」に留まらず、「コンセプトのデザイン」という価値を持つことになります。
しかし、「召喚」された音楽が厳密な意味で「作曲」へと昇華するためには、ユーザーは召喚後の音響に対し、自身の「聴取する身体」と「職能的な知識」をもって能動的に音響クオリアに介入し、AIの統計的な判断を「人間の倫理的な意図」へと上書きする必要があるでしょう。
次章では、この「召喚と解釈」という構造が、過去の音楽史におけるグラフィック・スコア(図形楽譜)とどのように異なり、Sunoが歴史のどの位置に立つのかを検証します。
第3章:歴史の文脈に置く~グラフィック・スコア(図形楽譜)との比較
Sunoのプロセスに見られるような、自然言語による指示と音響の具現化の間に「媒介」を置くという構造は、音楽史においてまったく前例がないわけではありません。
20世紀中期の現代音楽では、グラフィック・スコア(図形楽譜)という手法によって、作曲家の意図を抽象的な図形や記号に委ねる形で、この「指示と解釈の分離」が試みられました。
このアプローチの旗手であったのが、アール・ブラウンとジョン・ケージです。
アール・ブラウンの『1952年12月(December 1952)』は、モンドリアンの抽象画を思わせる線と点で構成されています。演奏家は、この視覚情報を音高、長さ、強弱などに主体的に翻訳(解釈)し、その場で能動的な判断を下しました。ブラウンの意図は、演奏家に「解釈の主体性」と「構造的な責任」を与えることにありました。
ジョン・ケージの多くの作品(例『フォンタナ・ミックス』)では、偶然性の操作を導入し、作曲家のエゴを排除しながら、演奏の不確定性を高めました。
このグラフィック・スコアの構造は、一見すると、Sunoの「プロンプト→ AI→ 音響」という流れに似ていますが、その間に存在する「人間の身体」の有無が、本質的な差異となります。
グラフィック・スコアとSunoの間の決定的な相違点は、一見するとインターフェースの違いのように見えますが、その本質は、解釈・実行者が「倫理的な責任を負う身体」であるか否か、という点にあります。
グラフィック・スコアの構造は、作曲家の抽象的な指示を、「演奏家という人間」が身体性を伴って解釈し、具現化することを前提としていました。
例えば、ブラウンが制作した楽譜を演奏家が読み解くとき、そこには「この図形を、私の技術と身体的知覚をもって、どのような音響クオリアを背景に責任を持って実現するか」という能動的な創造的判断が伴います。演奏家とは、その解釈に職能的な責任を負う、代行的な創造主体でした。
一方、Sunoにおいては、この「人間の身体を伴う解釈主体」を、「学習データに基づく確率的な統計処理」に置き換えました。そこにおいてAIは、指示された概念を達成するために、過去の音響パターンの最も可能性の高い組み合わせを無機質に生成しているに過ぎません。
ここには、「なぜこの音が美しいのか」というクオリアに対する現象学的・身体的なコミットメントは存在しないわけです。
つまり、グラフィック・スコアが「人間の創造的解釈の可能性」を拡張しつつ、作曲における「音響クオリアへの直接介入」という原則を、演奏家に委譲することで維持していたのに対し、Sunoでは、その「身体的・倫理的な解釈の必要性」そのものをテクノロジーによって代替したということであり、そこに両者間の構造的な断絶を認めることができます。
ここでAIを「新しいタイプの演奏家」と捉えて扱う視点も、一見すると魅力的に思えます。しかし、ここでの本質的な違いは「責任の所在の有無」にあります。人間の演奏家は、自らの解釈に対して「なぜこの演奏を選んだのか」を問われた時には、自身の音楽観や美意識(クオリア)に基づいて答えられる、倫理的な主体です。
それに対してAIは、その出力への倫理的な説明責任を負うことはありません。その判断基準はあくまで統計的な確率論にあり、そこに「美的信条」は介在しません。この「倫理的主体の不在」こそが、AIを人間の演奏家と同列に語れない決定的な理由であり、Sunoが歴史の延長線上ではなく「断絶点」に立つと結論づける根拠となります。
この比較検証の結果、Sunoは、グラフィック・スコアが拓いた「指示の自由度」という歴史の延長線上にある進化形ではなく、「人間的解釈」という創造の核心をバイパスした、質的に異なる断絶点に立っているものとして捉えることができます。
グラフィック・スコアは、人間の能動的関与の場を作曲家から演奏家へと移動させることで、責任の維持と連鎖を保っています。しかしSunoは、その連鎖の最も重要な環である「身体を伴う解釈者」を欠落させています。
この構造的な課題こそが、次章で取り上げる「作曲家の職能倫理」という問題の根源となります。
第4章:「社会的アクション」としての作曲~創造的コミットメントの選択
これまでの章で、作曲行為の内面的なプロセス、すなわち「身体性」や「責任」について深く見てきました。
しかし作曲という行為は、決して個人の内側だけで完結するものではありません。それは本質的に、社会や他者との関係性の中で機能する「社会的アクション」であると言えます。
まず、最も根源的なレベルにおいて、一人の人間が音楽を創造し、それを他者(聴き手)に届けようとする意志そのものが、既に社会的な行為と言えます。
それは、自らの内なる世界を他者と分かち合い、その心に何らかの影響を与えようとする、一つのコミュニケーションだからです。
作曲行為がもつ、この「社会的アクション」としての性質は、現代の多様な創作形態において、より具体的な形で現れています。
例えば、インターネットを介した、ミュージシャン同士や他ジャンルのクリエイターとのコラボレーションが挙げられます。
そして、この性質が最も先鋭化するもののひとつが、映画音楽や舞台音楽といった総合芸術の世界です。ここでは、作曲家は監督や演出家、俳優、スタッフ陣といった多様なクリエイターたちと深く協働し、作品全体の成功に向けて共同で責任を負うことが求められます。
この協働の視点から見ると、音楽の創作は「意図の精密な実現」であると同時に、関わる全ての人との「創造的コミットメントの共有」でもあるのです。このコミットメントこそが、AI時代に作曲家という職能が持つべき、重要な価値となるのではないでしょうか。
では次に、Sunoによる言語作曲のプロセスが、従来の作曲プロセスと構造的に異なる点を理解するために、建築家のアナロジーを用いてその役割を考察してみましょう。
建築家は、クライアントからのコンセプト(依頼条件)を受け取った後、「デザインと設計」という緻密な作業を行います。彼らは、自らの知識と経験を用いて、全ての構造と素材に能動的に関与します。
このアナロジーを適用すると、まず、Sunoのユーザーは「依頼主」としてコンセプトをAIに提供します。そして、続く「設計」のステップをAIに委ねるという「選択」を行うことになります。
すなわち、AIに設計を委ねるという選択によって、ユーザーは「コンセプトを瞬時に音響化する」という利便性を享受できますが、その代わりに、「全ての音響構造を能動的に決定する」という緻密な責任は、AIのブラックボックスに委ねられることになります。
もしここで委任せずに、作曲家としての役割を選ぶ場合、それはこの設計への能動的なコミットメントを自らに課すことを意味します。
この「設計への関与の選択」という視点は、創造の喜びをさらに深く追求するための提案となるものです。
つまり、AIが提供する「コンセプトの具現化能力」を最大限に活用しつつ、その生成物に対し、自身の身体的フィードバック(楽器やDAW操作、音楽知識・経験)をもって能動的に介入し、AIの統計的判断を人間の倫理的意図へと昇華させることです。
これこそが、AI時代におけるクリエイターが、民主化の果実を活かしつつ、「全ての音に責任を負う」という創造的コミットメントを果たす道となるのではないでしょうか。
Sunoは、創作への道筋を驚くほど短くしてくれましたが、「責任の美学」を伴った創造的飛躍は、常に自らの手と耳を介在してなされるものだと思います。
最後の章では、この「責任の美学」について見ていきます。
終章:作曲の再定義と「責任の美学」
本論では、Sunoに代表される「言語作曲」がもたらした「作曲概念の拡張」に対し、専門家としての違和感を構造的に分析することで、作曲という創造行為の境界線を再定義することを試みました。
そして、作曲とは単に音響を生成することではなく、能動的なフィードバックループと倫理的責任を伴う行為であるという結論に至りました。これらを集約し、AI時代における「作曲」の新たな定義を試みるならば、以下のようになるでしょう。
この定義に照らすと、AIによる言語作曲は「身体的フィードバックの欠如」と「設計責任の委任・委託」という二つの構造的特性を持つことから、厳密な作曲概念の領域からは独立した、「音楽の召喚」という新しい創造ジャンルとして位置づけることが相応しいと思われます。
AIは「語り得るもの」(言語、データ、パターン)の世界に属します。しかし、人間の創造は「語り得ないもの」の領域にも及びます。言葉では決してすくい取れない感情の機微、世界の質感、存在の神秘などです。
作曲とは、この「語り得ないもの」の領域に、作曲家が自らの身体と感性で分け入り、それをじっくりと味わい、最終的に音という、もう一つの非言語的な秩序をもって、その輪郭を指し示そうとする、終わりなき探求のプロセスだと思います。
AIに「悲しい音楽」と指示することはできますが、自分自身の内なる「名付けようのない悲しみ」の質感(クオリア)と、音を通じて一対一で向き合うという、この実存的な格闘は、人間にしかできません。
ここまでの内容を総括することで、本論の冒頭で提示した「作曲とは、そもそも何を代替し得ない行為なのか」という問いへの回答も、自ずと導き出されることになります。
つまり、人間による作曲とは、身体を通じたクオリアとの対話、倫理的な責任の引き受け、そして語り得ないものへの探求という三位一体の営みを内包するものであり、これらは本質的にAIに代替することが出来ないものである──と言い表せるでしょう。
Sunoは、作曲プロセスの敷居の高さをコンセプトデザインの初期段階にまで下げることで、「コンセプトを音響化したい」という人々の欲求を民主的に満たしました。文字通り「音楽表現の民主化」が達成されたのであり、これはどれほど賞賛しても足りないくらい素晴らしい功績です。
また、もうひとつ、Sunoの一見すると見えづらい重要な機能として注目したいのは、「作曲概念を逆照射する鏡」となる機能です。
AIの非身体的なプロセスが明らかになったことで、逆説的に、人間の作曲家がこれまで無意識に行ってきた「身体的な努力」「一音への責任」「素材との格闘」といった行為の意味と価値が再認識されたと言えるのです。
これらを鑑みると、AI時代における作曲家の役割の重点は、「技術の優劣」から「倫理の遂行」へと移行するのではないでしょうか。言うなれば「責任の美学」と呼ぶべき価値観の重要性の高まりです。
「責任の美学」とは──『作品の真の美しさは、単なる音響的な結果の完成度だけにあるのではなく、「作者がその音響の隅々にまで、身体的な努力と知的な決断をもって責任を負っている」という事実そのものにも宿る』──という表現で言い表せるでしょう。
そして、Sunoによる「召喚」を楽しんでいる人々へは、創造の喜びを探求するパートナーとして、次のような「創造的進化への招待状」を送りたいと思います。
すなわち、AIが提供するコンセプト生成能力を最大限に活用し、その生成物に対し、自身の身体的フィードバック(楽器やDAW操作、音楽知識と経験など)をもって能動的に介入し、AIの統計的判断を人間の倫理的意図へと上書きしていく──という提案です。
この「AI媒介型ハイブリッド作曲」の道筋こそが、創作の民主化の果実を最大限に享受しつつ「責任の美学」を体現する、AI時代のクリエイターが探求すべき、ひとつの新しい価値となるのではないでしょうか。
AIと共創していく──言葉にすると、ただそれだけのことですが、ここまで述べてきたように、その背景には様々な状況や思いが連なり、折り重なっています。それらを経て辿り着いた作曲論を踏まえることで、その共創は「深い彩りをもった可能性」として眼前に広がり始めることでしょう。
そして既に、その道筋は生まれ始めています。2025年9月に公開されたSunoのバージョン5においては、「パートごとの分離および個別生成」や「パートのMIDIデータ化」といった編集機能が実装されました。これを受け、そう望むのであれば、責任をもった創造主体として創作に関われるようになってきています。
最後に質問ですが、これを読むあなたの創作活動において、「その音への責任」を負う最も能動的な瞬間は、どのようなところにあると思われますか?──この問いへの答えこそが、AI時代におけるあなたの「創造主体性」を証明する鍵となることでしょう。
付記:本論の射程と課題について
今回の考察では、伝統的作曲の「身体性」を強調するあまり、それを理想化している可能性は否めません。また、AI技術の加速に対する警戒心によって、AIがもたらすであろう「まだ見ぬ創造的な可能性」への想像力を限定してしまっているかもしれません。
倫理的責任についても、主に「作曲家の内部コミットメント」に焦点を当てたため、より広範な外部、すなわち社会的責任や法的責任といった論点については、今後の重要な課題として残されています。本論で提示した「責任の美学」が、現時点では一個人の実践から導かれた限定的なものであることを、ここに付記しておきます。
また本論には、音楽表現の民主化の果実を楽しむ人々の喜びを否定したり、軽視したりする意図は一切ないことを、改めて明記しておきます。
本論が、「作曲とは、そもそも何を代替し得ない行為なのか」という問いに光を当てることによって、現在のひとつの参照点を作り出すことに成功したかどうかは、これをご覧の読者の皆様へ委ねたいと思います。