Par Olivier Bown, UNSW Sydney
En mars, nous avons assisté au lancement d’un «ChatGPT pour la musique » appelé soleil, qui utilise l’IA générative pour produire des chansons réalistes à la demande à partir de courtes invites textuelles. Quelques semaines plus tard, un concurrent similaire – Partager – arrivé sur les lieux.
Je travaille avec divers outils informatiques créatifs depuis 15 ans, à la fois en tant que chercheur et producteur, et le rythme récent des changements m’a stupéfié. Comme je l’ai argumenté ailleursl’idée selon laquelle les systèmes d’IA ne produiront jamais de « vraie » musique comme le font les humains doit être comprise davantage comme une affirmation concernant le contexte social que comme une capacité technique.
L’argument « bien sûr, elle peut créer une musique expressive, à structure complexe, au son naturel, virtuose et originale qui peut susciter des émotions humaines, mais l’IA ne peut pas faire approprié « musique » peut facilement commencer à ressembler à quelque chose d’un sketch des Monty Python.
Après avoir joué avec Suno et Udio, j’ai réfléchi à ce qu’ils changent exactement – et à ce qu’ils pourraient signifier non seulement sur la façon dont les professionnels et les artistes amateurs créent de la musique, mais aussi sur la façon dont nous la consommons tous.
Exprimer une émotion sans la ressentir
Générer de l’audio à partir d’invites de texte en soi est rien de nouveau. Cependant, Suno et Udio ont réalisé un développement évident : à partir d’une simple invite de texte, ils génèrent des paroles de chansons (à l’aide d’un générateur de texte de type ChatGPT), les introduisent dans un modèle vocal génératif et intègrent les « voix » à la musique générée pour produire un segment de chanson cohérent.
Cette intégration est un exploit petit mais remarquable. Les systèmes sont très bons pour composer des chansons cohérentes qui sonnent de manière expressive « chantée » (je vais là, anthropomorphisante).
L’effet peut être étrange. Je sais que c’est l’IA, mais la voix peut toujours avoir un impact émotionnel. Lorsque la musique exécute une pirouette de fin de mesure parfaitement exécutée dans une nouvelle section, mon cerveau reçoit certaines de ces petites étincelles de joie de traitement de motifs que je pourrais ressentir en écoutant un bon groupe.
Pour moi, cela met en évidence quelque chose parfois manqué sur l’expression musicale : l’IA n’a pas besoin de le faire expérience émotions et événements de la vie pour réussir exprimer dans une musique qui résonne avec les gens.
La musique comme langage de tous les jours
Comme d’autres produits d’IA générative, Suno et Udio ont été formés sur de vastes quantités de travaux existants par de vrais humains – et il y a beaucoup de débats sur l’efficacité de ces humains. droits de propriété intellectuelle.
Néanmoins, ces outils pourraient marquer l’aube de la culture musicale dominante de l’IA. Ils offrent de nouvelles formes d’engagement musical que les gens voudront simplement utiliser, explorer, jouer et écouter pour leur propre plaisir.
L’IA capable de créer de la musique « de bout en bout » n’est sans doute pas une technologie destinée aux créateurs de musique, mais à celle des consommateurs de musique. Pour l’instant, on ne sait pas vraiment si les utilisateurs d’Udio et Suno sont des créateurs ou des consommateurs – ou si la distinction est même utile.
Un phénomène observé depuis longtemps dans les technologies créatives est que, à mesure qu’un objet devient plus facile et moins coûteux à produire, il est utilisé pour une expression plus informelle. En conséquence, le médium passe d’une forme d’art exclusive à un langage plutôt quotidien – pensez à ce que les smartphones ont fait à la photographie.
Imaginez donc que vous puissiez envoyer à votre père une chanson produite par des professionnels et consacrée à lui pour son anniversaire, avec un coût et un effort minimes, dans le style de sa préférence : une carte d’anniversaire moderne. Les chercheurs envisagent depuis longtemps cette éventualité, et nous pouvons désormais le faire. Joyeux anniversaire Papa!
Peut-on créer sans contrôle ?
Quoi que ces systèmes aient accompli et pourraient accomplir dans un avenir proche, ils se heurtent à une limite flagrante : le manque de contrôle.
Les invites textuelles ne sont souvent pas très utiles en tant qu’instructions précises, notamment en musique. Ces outils sont donc adaptés à une recherche aveugle – une sorte d’errance dans l’espace des possibles – mais pas à un contrôle précis. (Cela ne veut pas diminuer leur valeur. La recherche aveugle peut être une puissante force créatrice.)
En considérant ces outils en tant que producteur de musique en exercice, les choses semblent très différentes. Bien qu’Udio à propos de la page dit « n’importe qui avec une mélodie, des paroles ou une idée amusante peut désormais s’exprimer en musique », je ne sens pas avoir assez de contrôle pour exprimer moi-même avec ces outils.
Je peux les voir utiles pour semer des matières premières à manipuler, un peu comme les échantillons et les enregistrements sur le terrain. Mais quand je cherche à exprimer moi-mêmej’ai besoin de contrôle.
En utilisant Suno, je me suis amusé à trouver les grooves techno les plus sombres que j’ai pu en tirer. Le résultat était quelque chose que j’utiliserais absolument dans un morceau.
Mais j’ai découvert que je pouvais aussi simplement écouter avec plaisir. Je n’ai ressenti aucune obligation d’ajouter quoi que ce soit ou de manipuler le résultat pour ajouter ma note.
Et de nombreuses juridictions ont déclaré que vous ne recevrez pas de droits d’auteur pour quelque chose simplement parce que vous l’avez incité à exister avec l’IA.
Pour commencer, le résultat dépend tout autant de tout ce qui entre dans l’IA – y compris le travail créatif de millions d’autres artistes. Discutablement, toi n’a pas fait le travail de création. Vous l’avez simplement demandé.
De nouvelles expériences musicales dans le no man’s land entre production et consommation
La déclaration d’Udio selon laquelle tout le monde peut s’exprimer par la musique est donc une provocation intéressante. Les personnes qui utilisent des outils comme Suno et Udio peuvent être considérées comme davantage de consommateurs d’IA musicale. expériences que les créateurs d’IA musicale travauxou comme pour de nombreux impacts technologiques, nous devrons peut-être proposer de nouveaux concepts pour ce qu’ils font.
Un passage à la musique générative pourrait détourner l’attention des formes actuelles de culture musicale, tout comme l’ère de la musique enregistrée a vu le déclin (mais pas la mort) de la musique orchestrale, qui était autrefois le seul moyen d’entendre une musique complexe, riche en timbres et forte. . Si l’engagement dans ces nouveaux types de culture et d’échanges musicaux explose, nous pourrions assister à une réduction de l’engagement dans la consommation musicale traditionnelle des artistes, des groupes, des radios et des playlists.
Même s’il est trop tôt pour dire quel en sera l’impact, nous devons être attentifs. L’effort visant à défendre les protections existantes en matière de propriété intellectuelle des créateurs, une question importante en matière de droits moraux, fait partie de cette équation.
Mais même si cela réussit, je pense que cela ne répondra pas fondamentalement à ce changement culturel potentiellement explosif, et les affirmations selon lesquelles une telle musique pourrait être inférieure n’ont également eu que peu d’effet pour arrêter le changement culturel historiquement, comme avec la techno ou même le jazz, il y a longtemps. Les politiques gouvernementales en matière d’IA devront peut-être aller au-delà de ces questions pour comprendre comment la musique fonctionne socialement et garantir que nos cultures musicales sont dynamiques, durables, enrichissantes et significatives tant pour les individus que pour les communautés.
Olivier BownProfesseur agrégé, UNSW Sydney
Cet article est republié à partir de La conversation sous licence Creative Commons. Lis le article original.
La conversation
est une source indépendante d’informations et d’opinions, provenant de la communauté universitaire et de la recherche et diffusée directement au public.
The Conversation est une source indépendante d’informations et d’opinions, provenant de la communauté universitaire et de la recherche et diffusée directement au public.