Le monde de la production musicale se trouve à un tournant historique, symbolisé par « Suno », une IA qui génère de la musique à partir de commandes textuelles. Cette IA permet à quiconque de créer de la musique en utilisant le moyen incroyablement accessible du langage naturel, éliminant le besoin de connaissances spécialisées en gammes et en harmonie, ou de maîtrise des logiciels de MAO.
Du point de vue de la démocratisation de l’expression musicale, ce changement est l’une des plus grandes réussites de l’histoire culturelle de l’humanité et mérite une large reconnaissance. De nombreuses personnes expérimentent désormais la « sensation de l’expression » en donnant une forme musicale à leurs propres concepts et jouissent du plaisir de la création.
Cependant, derrière ces voix joyeuses, je me trouve confronté à une question fondamentale : « Quelle est la différence structurelle entre l’acte de génération par l’IA et la composition dans sa définition traditionnelle ? »
Explorer cette question n’est pas une tentative de nier les nouvelles technologies ou la tendance à la démocratisation. Il s’agit plutôt d’un effort constructif pour reconnaître et embrasser leurs merveilles tout en examinant plus profondément le cœur de ce que nous avons appelé la « composition ». Au centre de cette interrogation se trouve le soupçon que l’« engagement corporel » et la « responsabilité éthique » sont structurellement contournés par le processus de l’IA.
Par conséquent, cet article vise à disséquer le processus de génération de Suno en se concentrant sur deux motifs principaux pour découvrir la nature de cette différence structurelle. En redéfinissant la frontière avec le concept traditionnel de composition, j’essaierai de construire une méta-théorie de la composition.
- La corporéité (l’intervention directe des qualia musicaux)
- La responsabilité éthique (le lieu du sujet éthique)
De plus, en considérant Suno comme un « miroir qui réfléchit le concept de composition », j’essaierai également de présenter un nouveau rôle pour les compositeurs et une esthétique de la responsabilité à l’ère de l’IA générative. Il ne s’agit pas de se demander si « l’IA peut remplacer la composition », mais de tenter d’éclairer la question fondamentale de « ce qui est irremplaçable dans la composition ».
- Chapitre 1 : La Corporéité de la Composition – Un Dialogue de Boucles de Rétroaction
- Chapitre 2 : Dissection du Processus Suno – La Musique « Invoquée »
- Chapitre 3 : Placer dans le Contexte Historique – Une Comparaison avec les Partitions Graphiques
- Chapitre 4 : La Composition comme « Action Sociale » – Le Choix de l’Engagement Créatif
- Chapitre Final : Redéfinir la Composition et l’« Esthétique de la Responsabilité »
- Articles Connexes
Chapitre 1 : La Corporéité de la Composition – Un Dialogue de Boucles de Rétroaction
À l’ère de l’IA, lorsqu’on reconsidère la définition de la composition, il est nécessaire de voir l’acte de composer comme un processus plutôt qu’un ensemble d’éléments ou de conditions spécifiques. Je considère que le cœur de l’acte de composition est « une boucle de rétroaction active qui inclut l’étape d’interaction et de communion avec les matériaux et les composants musicaux ». Cette boucle est une structure commune aux diverses méthodes utilisées par les compositeurs, telles que la notation, l’interprétation et l’édition en MAO.
Par exemple, un compositeur peut entrer une phrase dans une MAO, arranger et éditer un échantillon, ou jouer un riff à la guitare. Il « écoute » alors immédiatement le résultat de cet « acte », porte un « jugement esthétique », et enchaîne avec la « correction ou opération » suivante. Ce « dialogue » constant est un processus crucial pour réaliser précisément l’intention créative. Cette boucle de rétroaction n’est pas un simple tâtonnement, mais un processus d’approfondissement qui implique une responsabilité quant à la texture et à la structure du son. Un acte dépourvu de ce processus ne peut, à mon sens, être inclus dans la définition stricte de la « composition » (le concept redéfini dans cet essai).
Pour que cette boucle de rétroaction devienne un dialogue créatif plutôt qu’un essai-erreur mécanique, l’intervention de la « corporéité » est essentielle. Dans cet article, j’appellerai cette exigence « l’intervention du corps qui écoute ». Pour être clair, la « corporéité » mentionnée ici ne concerne pas la quantité de mouvement physique. Son cœur réside dans la directivité de l’opération et la résolution de la rétroaction : « avec quelle directivité et quelle finesse de résolution peut-on manipuler les qualia sonores (la texture brute du son et les émotions qu’elle évoque) et recevoir un retour immédiat sur le résultat. »
De ce point de vue, la nature des opérations à la souris dans une MAO, qui semblent à première vue non musicales et non corporelles, devient claire. Un clic ou un glissement de souris, bien que petit en mouvement physique et n’apparaissant pas comme une action musicale, est l’exécution directe d’une intention très spécifique basée sur les qualia sonores — par exemple, augmenter la hauteur d’une note MIDI d’un demi-ton, un acte de « rendre ce son aussi haut ». Bien que l’outil (la souris) soit indirect, l’intervention sur l’objet (le son) est directe.
De même, dans un style de composition où une phrase dans l’esprit est transcrite directement sur une partition et l’œuvre est affinée, l’objet que le compositeur manipule sont les « qualia sonores imaginés eux-mêmes ». La pensée musicale simule directement le son lui-même, jugeant sa résonance sous la forme de « comment cela sonnerait-il si un la bémol, et non un sol, suivait ce do ? » Ainsi, jouer du piano, utiliser une MAO et construire le son dans son esprit, bien que différant par leurs interfaces, sont structurellement communs en ce que leurs boucles de rétroaction ciblent directement les « qualia sonores ».
En revanche, le processus de Suno contourne structurellement cette « intervention directe dans les qualia sonores ». L’utilisateur donne des instructions avec le langage et reçoit un résultat de l’IA, restant dans un état d’implication indirecte. La boucle de rétroaction de l’utilisateur dans Suno cible les « instructions linguistiques » plutôt que les « qualia sonores », et c’est là la différence cruciale. Cette opération musicalement distante ne peut établir un jugement actif sur la texture délicate des qualia, ni la responsabilité subjective qui en découle.
Pour être clair, ce principe de « l’intervention du corps qui écoute », ou plus strictement, de « l’intervention directe dans les qualia sonores », n’est pas destiné à nier l’acte de génération par Suno. Il vise à tracer une « frontière logique » pour respecter la pureté et le poids historique du concept de « composition ». Dans le chapitre suivant, sur la base de ce principe, j’analyserai en détail le processus de Suno et considérerai le concept d’« Invocation », qui devrait être proposé comme un nouveau genre créatif.
Chapitre 2 : Dissection du Processus Suno – La Musique « Invoquée »
À la lumière de la définition du chapitre 1, la génération de musique par Suno ne serait pas considérée comme de la composition au sens strict. La raison en est un déplacement structurel de l’objet de la boucle de rétroaction. Dans la composition traditionnelle, l’objet de la boucle de rétroaction est le « matériau ou composant sonore » lui-même, et le compositeur intervient physiquement sur les qualia sonores.
Dans le processus de Suno, cependant, l’opération de l’utilisateur est limitée à un médium conceptuel : les « instructions linguistiques (prompts) ». Lorsqu’un utilisateur ajuste son intention musicale, il le fait en « modifiant le prompt », et non en « manipulant directement le matériau sonore généré ». Cette structure place l’utilisateur dans un rôle passif de « présentateur de concepts et de sélecteur de résultats », plutôt que de « concepteur de la musique ». L’étape la plus critique du jugement créatif — le jugement de valeur et la décision de « pourquoi ce son est beau » — est déléguée à la boîte noire statistique du modèle d’IA, vidant ainsi le sujet créatif de sa substance.
Pour décrire de manière appropriée ce vidage du sujet créatif et la nature non corporelle du processus, cet essai propose de définir et de nommer l’acte de génération par Suno comme « l’Invocation de la musique ». Alors que la composition est une « construction intentionnelle (Génération) » par le dialogue avec les matériaux, l’« Invocation » signifie « l’acte d’appeler un être au-delà de sa propre intention avec un sortilège (prompt) ».
Cependant, séparer qualitativement l’« Invocation » de la « composition » n’est en aucun cas une négation de l’effort créatif inhérent à l’invocation. L’invocation est plutôt considérée comme une nouvelle activité créative qui ne rentre pas dans le concept étroit de la composition traditionnelle et qui contient le potentiel d’un avenir imprévu. Cette définition de l’« Invocation » incarne deux éléments importants.
1. Expression de la nature de boîte noire
L’IA générative produit de manière probabiliste des sons qui correspondent à un prompt à travers un modèle basé sur de vastes actifs d’apprentissage, ce qui donne parfois des résultats qui dépassent les attentes de l’utilisateur. Appeler ce processus « Invocation » exprime avec précision la nature de boîte noire pour laquelle l’utilisateur ne peut être tenu responsable de la structure sonore.
2. Acceptation positive du sentiment d’opération indirecte
L’acte d’« Invocation » implique une opération indirecte (un sortilège). Cela ne nie pas le « sentiment de manipuler le processus de production musicale, bien qu’indirectement » que les utilisateurs de Suno apprécient. Au contraire, il accepte positivement l’« opération par le langage » comme une nouvelle forme de création, tout en suggérant simultanément sa frontière essentielle.
Incidemment, le terme « Invocation » n’est pas un néologisme original de cet essai. Il est né aux débuts de l’IA de génération d’images il y a quelques années, lorsque de nombreux utilisateurs ont intuitivement décrit l’expérience d’obtenir des résultats inattendus de haute qualité à partir de prompts complexes comme une « invocation ». Cet essai emprunte cette métaphore partagée, non pas simplement comme de l’argot Internet, mais comme un concept pour analyser la structure des actes créatifs. En d’autres termes, le terme « Invocation » est utilisé comme une clé pour connecter le sentiment intuitif de l’utilisateur de « ne pas savoir ce qui va sortir » à des questions plus structurelles telles que la « nature de boîte noire », la « non-intervention dans les qualia » et « l’absence d’un sujet éthique ».
Pour ajouter, l’invocation est « l’acte d’appeler », qui inclut l’« altérité » et l’« imprévisibilité » d’un visiteur. En termes de structure temporelle, le mot invocation implique également la caractéristique temporelle d’« apparaître en un instant », englobant un contraste avec d’autres processus de production existants.
Il va sans dire que le terme « Invocation » ne nie pas la créativité des utilisateurs qui élaborent méticuleusement des prompts et sélectionnent le meilleur parmi d’innombrables résultats. Cet effort est un jugement créatif indéniable, semblable à un grand réalisateur de film choisissant la meilleure prise ou à un conservateur insufflant la vie à une exposition. La raison de l’appeler « Invocation » ici est de clarifier que ce type de créativité est qualitativement différent de la « construction », qui implique une lutte directe avec les matériaux. Tout comme un réalisateur ou un conservateur travaille avec les « créations d’autrui » — la performance d’un acteur ou l’œuvre d’un artiste — un utilisateur de Suno est également confronté à un « visiteur au-delà de sa propre intention », produit par la boîte noire de l’IA.
En définissant l’acte de Suno comme « l’Invocation de la musique », il acquiert une valeur non seulement en tant que « sélection avancée », mais aussi en tant que « conception de concept ». Cependant, pour que la musique invoquée soit élevée au rang de composition au sens strict, l’utilisateur doit intervenir activement dans les qualia sonores du son invoqué avec son propre « corps écoutant » et ses « connaissances et expériences professionnelles », en superposant l’« intention éthique humaine » au jugement statistique de l’IA. Le chapitre suivant examinera comment cette structure d’« instruction et d’interprétation/génération » dans l’« Invocation » diffère des partitions graphiques de l’histoire de la musique passée et vérifiera la position de Suno au sein de cette histoire.
Chapitre 3 : Placer dans le Contexte Historique – Une Comparaison avec les Partitions Graphiques
La structure observée dans le processus de Suno, où un « médium » est placé entre l’instruction en langage naturel et la réalisation sonore, n’est pas entièrement sans précédent dans l’histoire de la musique. Dans la musique contemporaine du milieu du XXe siècle, la méthode de la partition graphique a tenté cette « séparation de l’instruction et de l’interprétation » en confiant l’intention du compositeur à des formes et des symboles abstraits.
Les pionniers de cette approche étaient Earle Brown et John Cage. « December 1952 » d’Earle Brown est composé de lignes et de points rappelant une peinture abstraite de Mondrian. L’interprète traduisait (interprétait) subjectivement cette information visuelle en hauteur, durée, dynamique, etc., prenant des décisions actives sur le moment. L’intention de Brown était de donner à l’interprète une « interprétation subjective » et une « responsabilité structurelle ». John Cage a démontré une approche similaire avec son « Fontana Mix » et, dans de nombreuses autres œuvres, a introduit des opérations de hasard pour éliminer complètement l’ego du compositeur et augmenter l’indétermination de l’interprétation.
La structure de ces partitions graphiques peut à première vue sembler similaire au flux « prompt → IA → son » de Suno, mais la présence ou l’absence d’un « corps humain » entre les deux constitue une différence essentielle. Cette différence peut apparaître comme une différence d’interface, mais son essence réside dans le fait que l’interprète/exécuteur soit ou non un « corps éthique et responsable ».
La structure de la partition graphique était basée sur la prémisse qu’« un interprète humain » interpréterait et réaliserait les instructions abstraites du compositeur avec sa corporéité. Par exemple, lorsqu’un interprète lit une partition créée par Brown, cela implique un jugement créatif actif : « Comment, avec ma technique et ma perception physique, et avec quels qualia sonores en arrière-plan, vais-je réaliser cette forme de manière responsable ? » L’interprète était un sujet créatif par procuration, portant une responsabilité professionnelle pour son interprétation. Cage a peut-être même parfois cherché à détruire cette chaîne de responsabilité elle-même. Cependant, même dans sa pratique radicale, le fait demeure qu’à la porte finale, où les instructions aléatoires prenaient finalement vie en tant que son, il y avait toujours l’interprétation physique d’un « interprète en chair et en os » portant une responsabilité éthique.
À cet égard, les partitions graphiques ont élargi les possibilités de l’interprétation créative humaine. Mais c’était aussi une tentative périlleuse dans laquelle le compositeur lui-même se retirait du cœur de la composition. Néanmoins, l’acte de composition est resté viable car son principe fondamental — « l’intervention directe dans les qualia sonores » — était à peine maintenu en étant délégué à un autre sujet humain, l’interprète.
Dans le cas de Suno, cependant, ce « sujet interprète avec un corps humain » a été remplacé par un « traitement statistique probabiliste basé sur des données d’entraînement ». L’IA génère mécaniquement la combinaison la plus probable à partir de son modèle appris de motifs sonores passés pour atteindre le concept instruit. Il n’y a pas d’engagement physique envers les qualia, pas de sens de « pourquoi ce son est beau ».
Ainsi, alors que les partitions graphiques ont élargi les « possibilités de l’interprétation créative humaine » et ont maintenu le principe de « l’intervention directe dans les qualia sonores » dans la composition en le déléguant à l’interprète, Suno a remplacé la « nécessité même de l’interprétation physique et éthique » par la technologie. C’est ici que nous pouvons reconnaître une rupture structurelle entre les deux.
La perspective de traiter l’IA comme un « nouveau type d’interprète » semble attrayante à première vue. Cependant, la différence essentielle ici est la « présence ou l’absence de responsabilité ». Un interprète humain est un sujet éthique qui, lorsqu’on lui demande « pourquoi avez-vous choisi cette interprétation ? », peut répondre en se basant sur ses propres opinions musicales et son esthétique (qualia). En revanche, l’IA ne porte aucune responsabilité éthique pour sa sortie. Ses critères de décision sont purement des probabilités statistiques, sans aucune « conviction esthétique ». Cette « absence de sujet éthique » est la raison définitive pour laquelle l’IA ne peut être mise sur le même plan qu’un interprète humain, et c’est la base pour affirmer que Suno ne se situe pas dans le prolongement de l’histoire de la composition, mais à un « point de rupture ».
À la suite de cette analyse comparative, Suno peut être considéré non pas comme une évolution dans le prolongement de l’histoire de la composition que les partitions graphiques ont ouverte en termes de « liberté d’instruction », mais comme se situant à un point qualitativement différent, ayant contourné le cœur créatif de l’« interprétation humaine ». Alors que les partitions graphiques ont maintenu la chaîne de responsabilité en déplaçant le lieu de l’implication humaine active du compositeur à l’interprète, Suno manque structurellement du maillon le plus crucial de cette chaîne : l’« interprète avec un corps ».
Par conséquent, une compréhension profonde de cette caractéristique structurelle — l’« absence de sujet éthique » — devient le point de départ pour considérer la question fondamentale de l’« éthique professionnelle d’un compositeur », qui sera discutée dans le prochain chapitre. Bien sûr, il s’agit d’une discussion de principe basée sur une analyse structurelle du processus de création et ne nie pas que les créateurs contemporains peuvent passer fluidement de l’acte d’« Invocation » à celui de « composition » dans leur pratique. Il est à noter que la technologie elle-même évolue rapidement pour combler cette rupture de principe au niveau pratique, comme en témoignent les fonctionnalités d’exportation MIDI et de séparation/édition des parties de la dernière version de Suno.
Chapitre 4 : La Composition comme « Action Sociale » – Le Choix de l’Engagement Créatif
Dans les chapitres précédents, nous avons examiné les processus internes de l’acte de composition, à savoir la « corporéité » et la « responsabilité ». Cependant, l’acte de composition n’est pas quelque chose qui s’accomplit uniquement à l’intérieur de l’individu. C’est essentiellement une « action sociale » qui fonctionne au sein des relations avec la société et les autres.
Au niveau le plus fondamental, la volonté même d’une personne de créer de la musique et de la transmettre à d’autres (auditeurs) est déjà un acte social. C’est une forme de communication, une tentative de partager son monde intérieur avec les autres et d’avoir une sorte d’influence sur leurs cœurs. La nature de la composition en tant qu’action sociale devient plus concrète dans les diverses formes créatives d’aujourd’hui. Par exemple, les collaborations entre musiciens ou avec des créateurs d’autres genres via Internet.
Cette nature est la plus prononcée dans le monde des arts composites, tels que la musique de film et de scène. Ici, les compositeurs doivent collaborer profondément avec les réalisateurs, les metteurs en scène, les acteurs et divers autres créateurs, partageant la responsabilité du succès global de l’œuvre. De ce point de vue collaboratif, la création de musique n’est pas seulement la « réalisation précise de l’intention », mais aussi le « partage de l’engagement créatif » avec toutes les personnes impliquées. C’est cet engagement qui pourrait devenir une valeur cruciale pour la profession de compositeur à l’ère de l’IA.
Maintenant, pour comprendre en quoi le processus de création musicale de Suno diffère structurellement du processus de composition traditionnel, considérons le rôle d’un architecte en utilisant une analogie. Après avoir reçu un concept (demande du client), un architecte s’engage dans le travail méticuleux de la « conception ». Il s’engage activement avec chaque structure et chaque matériau, en utilisant ses propres connaissances et son expérience.
En appliquant cette analogie, un utilisateur de Suno fournit d’abord un concept à l’IA en tant que « client ». Il fait ensuite le « choix » de confier l’étape suivante de la « conception » à l’IA. C’est-à-dire qu’en choisissant de déléguer la conception à l’IA, l’utilisateur profite de la commodité de « transformer instantanément un concept en son », mais en retour, la responsabilité de « déterminer activement toutes les structures sonores » est déléguée à la boîte noire de l’IA. Si, au lieu de cela, il choisit le rôle de compositeur, cela signifie s’imposer un engagement actif envers la « conception ».
Cette perspective du « choix de s’engager dans la conception » est une proposition pour poursuivre encore plus profondément la joie de la création. Cela signifie utiliser pleinement la « capacité de réalisation de concept » fournie par l’IA, tout en intervenant activement dans sa production générée avec sa propre rétroaction physique (instruments, opérations de MAO, connaissances et expérience musicales) pour sublimer le jugement statistique de l’IA en une intention éthique humaine. C’est peut-être la voie pour les créateurs de l’ère de l’IA pour remplir leur engagement créatif de « prendre la responsabilité de chaque son » tout en bénéficiant des fruits de la démocratisation.
Suno a rendu le chemin vers la création étonnamment court, mais je crois que tout autre saut créatif à partir de là se fera toujours par ses propres mains et oreilles. Dans le dernier chapitre, je résumerai le contenu jusqu’à présent et discuterai de l’« esthétique de la responsabilité ».
Chapitre Final : Redéfinir la Composition et l’« Esthétique de la Responsabilité »
Dans cet essai, j’ai tenté de redéfinir les frontières de l’acte créatif de la composition en analysant structurellement l’expansion du concept de composition apportée par les IA génératrices de musique comme Suno. J’ai conclu que la composition n’est pas simplement la génération de son, mais un acte accompagné d’une boucle de rétroaction active et d’une responsabilité éthique.
En synthétisant ces points, une nouvelle définition de la composition à l’ère de l’IA serait la suivante :
À la lumière de cette définition, la génération de musique par l’IA se caractérise par deux traits structurels : la « non-utilisation de la rétroaction corporelle » et la « délégation de la responsabilité de conception ». Par conséquent, il semble approprié de positionner cet acte créatif comme un nouveau genre créatif, « l’Invocation de la musique », indépendant du domaine du concept strict de composition tel que défini dans cet essai.
D’une certaine manière, cette nouvelle entreprise ne peut plus être contenue dans le domaine étroit et humainement contraint de la composition. Soutenue par la technologie de l’IA et englobant le potentiel encore invisible de l’avenir, elle peut être positivement positionnée comme un genre créatif plus vaste et plus nouveau.
En examinant à nouveau les différences de création entre les humains et l’IA, l’IA appartient au monde du « dicible » (langage, données, modèles), tandis que la création humaine s’étend au domaine de l’« indicible ». Cela inclut les subtilités de l’émotion qui ne peuvent jamais être capturées par les mots, la texture du monde et le mystère de l’existence. La composition, je crois, est un processus d’exploration sans fin où le compositeur entre dans ce domaine de l’« indicible » avec son propre corps et sa sensibilité, le savoure, et finalement, à travers l’ordre non verbal du son, tente d’en esquisser les contours. On peut demander à une IA de créer de la « musique triste », mais la lutte existentielle pour faire face à la texture (qualia) de sa propre « tristesse innommable » en tête-à-tête à travers le son est quelque chose que seul un humain peut faire.
En résumant le contenu jusqu’à présent, la réponse à la question posée au début de cet essai — « qu’est-ce qui est irremplaçable dans la composition ? » — émerge naturellement. C’est-à-dire que la composition par les humains englobe une trinité de dialogue avec les qualia à travers le corps, l’acceptation de la responsabilité éthique et l’exploration de l’indicible. Ce sont, par essence, des choses que l’IA ne peut pas remplacer.
Suno a démocratiquement satisfait le désir des gens de « transformer les concepts en son » en abaissant la barrière élevée du processus de composition au stade initial de la conception du concept. C’est une « démocratisation de l’expression musicale » littérale et une merveilleuse réalisation qui doit être hautement louée. Et un rôle important, bien que moins visible, de Suno que je veux souligner est sa fonction de « miroir qui réfléchit le concept de composition ». La révélation du processus non corporel de l’IA a, paradoxalement, conduit à une nouvelle reconnaissance de la signification et de la valeur de l’« effort physique », de la « responsabilité du son » et de la « lutte avec les matériaux » que les compositeurs humains ont inconsciemment entrepris.
Compte tenu de ces points, l’accent du rôle du compositeur à l’ère de l’IA pourrait passer de la « supériorité technique » à l’« exécution éthique ». C’est une montée en importance d’un système de valeurs que l’on pourrait appeler l’« esthétique de la responsabilité ». L’esthétique de la responsabilité peut être exprimée comme suit : « La beauté d’une œuvre ne réside pas seulement dans la perfection du résultat sonore, mais aussi dans le fait même que l’auteur a pris la responsabilité de chaque recoin de ce son avec un effort physique et des décisions créatives. »
Et à ceux qui apprécient l’invocation par Suno, j’aimerais envoyer l’« invitation » suivante en tant que partenaire dans l’exploration de la joie de la création. C’est la proposition d’utiliser pleinement la capacité de génération de concepts fournie par l’IA et d’intervenir activement dans sa production générée avec sa propre rétroaction physique (instruments, opérations de MAO, connaissances et expérience musicales, etc.), en superposant l’intention éthique humaine au jugement statistique de l’IA. Cette voie de la « composition hybride médiée par l’IA » pourrait être une nouvelle valeur à explorer pour les créateurs de l’ère de l’IA, une valeur qui incarne l’« esthétique de la responsabilité » tout en profitant pleinement des fruits de la démocratisation de la création.
Plus tôt, au chapitre 3, j’ai mentionné une « rupture de principe » entre Suno et l’histoire de la composition. Cela ne signifiait pas une falaise désespérée. C’était plutôt une carte précise nous montrant où nous devrions construire un pont. Et heureusement, ce pont est déjà en construction. La dernière version de Suno (Suno Studio), sortie en septembre 2025, a mis en œuvre des fonctions d’édition qui n’étaient auparavant possibles que dans les MAO professionnelles, telles que la « séparation et la génération individuelle des parties » et la « conversion des parties en données MIDI ». Cela a permis aux utilisateurs de Suno non seulement d’accepter les résultats de l’invocation de l’IA comme une boîte noire, mais de les placer sur leur propre établi de MAO et de les intégrer dans le processus de composition, où ils prennent la responsabilité du son. La voie pour que quiconque passe de « conservateur avancé » à « créateur responsable » a été ouverte par la technologie.
Co-créer avec l’IA — c’est une simple phrase, mais comme nous l’avons vu, elle est superposée de diverses situations et pensées. En s’appuyant sur la théorie de la composition à laquelle nous sommes parvenus à travers ces réflexions, cette co-création commencera à se déployer sous nos yeux comme une « possibilité aux couleurs profondes ».
Pour conclure cet essai, permettez-moi de poser deux questions. Si vous êtes rempli de la joie de l’invocation, à quel moment cette magie brille-t-elle le plus ? Est-ce lorsque vous pensez au sortilège parfait, ou lorsque vous rencontrez un trésor inattendu ? Et si vous vous engagez sur la voie de la composition, quand sentez-vous : « Je suis responsable de ce son » ?
Les réponses aux deux questions devraient contenir votre propre subjectivité créative irremplaçable à l’ère de l’IA.
Addendum : Sur la Portée et les Enjeux de cet Essai
1. Dans cette analyse, il est possible que j’aie idéalisé la « corporéité » de la composition traditionnelle en l’accentuant. De plus, ma prudence à l’égard de l’accélération de la technologie de l’IA a peut-être limité mon imagination concernant les « possibilités créatives imprévues » que l’IA apportera.
2. Concernant la responsabilité éthique, je me suis principalement concentré sur l’« engagement interne du compositeur », laissant des questions externes plus larges, telles que la responsabilité sociale et légale, comme des sujets importants pour l’avenir. Je voudrais ajouter ici que l’« esthétique de la responsabilité » présentée dans cet essai est, à ce stade, un concept limité dérivé de ma pratique personnelle.
3. La raison pour laquelle cet essai positionne Suno comme un « point de rupture » dans l’histoire de la composition est uniquement pour souligner la rupture dans la chaîne de principe de l’interprétation physique humaine. D’un autre côté, dans la pratique créative des créateurs contemporains individuels, les actes d’« Invocation » et de « composition » peuvent former un spectre fluide, et le mot « rupture » n’implique pas une déconnexion exclusive entre les deux. En effet, les fonctionnalités d’édition et la fonction d’exportation MIDI de Suno Studio montrent que tout le monde peut expérimenter ce spectre de l’invocation à la composition.
4. Je voudrais réaffirmer que cet essai n’a aucune intention de nier ou de manquer de respect à la joie de ceux qui profitent des fruits de la démocratisation de l’expression musicale.
5. Quant à savoir si cet essai a réussi à créer un point de référence en éclairant la question « qu’est-ce qui, dans la composition, ne peut être remplacé ? », c’est quelque chose que je voudrais laisser à vous, le lecteur.
Articles Connexes

