Search
  • Nouvelles
  • Apprentissage automatique, apprentissage biologique

Les algorithmes trouvent un nouveau professeur de musique

by Juanita Bawagan déc. 15 / 16
MusicNEt-1280x430

Les ordinateurs ont un nouveau professeur de musique pour les aider à maîtriser les œuvres de Johann Sebastian Bach et Wolfgang Amadeus Mozart – à commencer par les notions de base.

Leur professeur, MusicNet, est le premier ensemble de données de musique classique du genre destiné aux algorithmes d’apprentissage automatique. Les algorithmes ont besoin de centaines d’heures d’enregistrements étiquetés pour apprendre les caractéristiques de la musique, mais jusqu’à présent les données étaient souvent trop spécifiques ou utilisaient des chansons qui n’étaient pas accessibles au public. Cette collection compte 330 enregistrements libres d’accès avec plus d’un million d’étiquettes indiquant chaque note et chaque instrument qui les jouent.

Le Boursier associé Zaid Harchaoui (Université de Washington) a lancé MusicNet, le 30 novembre dernier, pour aider ses collègues chercheurs à faire avancer l’intelligence artificielle axée sur la musique.

« Si nous maîtrisons les ensembles de données musicales, nous pouvons concevoir des caractéristiques plus expressives qui mèneraient à de meilleures interprétations », dit Harchaoui, qui participait à la réunion du programme Apprentissage automatique, apprentissage biologique, tenue à Barcelone.

Jusqu’à maintenant, l’équipe MusicNet a mis à l’essai sa capacité à enseigner à un algorithme comment prédire une note manquante. Selon Harchaoui, MusicNet est un premier pas vers des modèles qui pourraient générer de la nouvelle musique. Il existe des programmes qui sont codés en dur pour compléter de la musique, mais ils n’ont pas appris les caractéristiques et ne « comprennent » pas la musique qu’ils créent.

« Pendant mon doctorat à Paris, alors que je faisais de l’analyse musicale, je cherchais des professeurs de musique, se rappelle Harchaoui. Les ensembles de données étaient très judicieux et sophistiqués, mais ils étaient très spécifiques et adaptés à un instrument et à une situation. »

Par exemple, un ensemble de données pourrait enseigner à un algorithme à devenir un pianiste de calibre mondial, mais il serait incapable de lire la musique pour une trompette. La majeure partie des ensembles de données précédents mettaient aussi l’accent sur la musique populaire, ce qui est moins utile pour les chercheurs, car il s’agit d’œuvres musicales protégées par le droit d’auteur et conçues pour des fonctions supérieures sur des plateformes commerciales, comme des recommandations de chansons.

MusicNet a été inspiré par un appel à l’action de Yann Lecun (Université de New York), codirecteur du programme. « Les architectures profondes requièrent souvent une grande quantité de données étiquetées pour un apprentissage supervisé, un luxe dont l’informatique musicale n’a jamais vraiment pu profiter », a écrit Lecun dans un article de 2012. Depuis lors, il y a eu des percées en génération d’images à partir des ensembles de données d’ImageNet et des avancées similaires dans la reconnaissance des sons, de la vidéo et de la voix.

« L’apprentissage supervisé avec de très grands ensembles de données explique en bonne partie l’intérêt observé dans les cinq dernières années pour l’intelligence artificielle. Toutefois, il s’est révélé difficile d’étiqueter la musique », a dit l’auteur principal John Thickstun, doctorant d’Harchaoui, à UW Today.

« Il faut pouvoir dire que de trois secondes et 50 millisecondes jusqu’à trois secondes et 78 millisecondes, cet instrument joue un la. Mais il est difficile, voire impossible, même pour un musicien aguerri, de suivre la musique avec un tel degré d’exactitude. »

Plutôt que d’analyser minutieusement des heures de Beethoven, de Mozart et de Bach, les chercheurs ont synchronisé des enregistrements et des partitions en ayant recours à la déformation temporelle dynamique. Il s’agit d’une méthode où des séries temporelles d’analyse peuvent synchroniser des choses qui se produisent à des vitesses différentes. Dans le cas du quatuor à cordes « Serioso » de Beethoven, le programme produit une version synthétisée de la partition et la fait concorder avec l’enregistrement pour que l’algorithme reconnaisse la durée et le type précis des notes jouées par chaque instrument.

Cette méthode génère des données d’une grande précision, mais Harchaoui a quand même régulièrement vérifié des heures des versions synthétisées. Heureusement, il aime la musique.

« Je joue du piano et j’aime écouter de la musique. Analyser les données est donc plus facile pour moi. »

L’article « Learning Features of Music from Scratch » a été publié le 29 novembre et fait actuellement l’objet d’un examen en vue d’une présentation à ICLR 2017.