THESE DE DOCTORAT DE L’UNIVERSITE PARIS VI Spécialité : Informatique Option : Intelligence Artificielle présentée par Geber Lisboa Ramalho pour obtenir le grade de Docteur de l’Université Paris VI Sujet de la thèse : CONSTRUCTION D’UN AGENT RATIONNEL JOUANT DU JAZZ Soutenue le 13 janvier 1997 Devant le jury composé de MM : Denis BAGGI rapporteur Claude CADOZ examinateur Jean-Gabriel GANASCIA directeur Jean-Paul HATON examinateur François PACHET examinateur Gerhard WIDMER rapporteur i A Lisiane et mes enfants Luís Felipe et Tales ii There is a Japanese visual art in which the artist is forced to be spontaneous. He must paint on a thin stretched parchment with a special brush and black water paint in such a way that an unnatural or interrupted stroke will destroy the line or break through the parchment. Erasures or changes are impossible. These artists must practice a particular discipline that of allowing the idea to express itself in communication with their hands in such a direct way that deliberation cannot interfere. The resulting pictures lack the complex composition and textures of ordinary painting, but it is said that those who see well find something captured that escapes explanation. This conviction that direct deed is the most meaningful reflection, I believe, has prompted the evolution of the extremely severe and unique disciplines of the jazz or improvising musician. Bill Evans dans la pochette de “Kind of Blue” (Davis, 1962) iii REMERCIEMENTS Mes remerciements vont d’abord à mon directeur de thèse Jean-Gabriel Ganascia par son ouverture d’esprit, en acceptant guider une thèse sur la musique, lui n’étant pas musicien. Je le remercie aussi pour toutes les suggestions et, en général, pour tout ce qu’il m’a appris sur la science, sur l’IA, sur comment écrire des articles et faire des présentations. Ce sont des enseignements très précieux que je garde pour le reste de ma vie. J’exprime mon énorme gratitude à François Pachet, excellent musicien, chercheur en IA et grand programmeur Smalltalk, qui a joué un role indispensable dans le dévellopement de ma thèse. Nos discussions ont été toujours fructueuses et nos soirées musicales intéressantes. Je remercie sincèrement Gerhard Widmer et Denis Baggi qui ont fait l’honneur d’être rapporteurs de cette thèse, en faisant plusiers commentaires utiles, feconds et éclairés sur mon travail. Je remercie aussi Jean-Paul Haton pour ces remarques et questions qui m’ont aidé à mieux comprendre ce que j’avais fait. Je remercie, enfin, Claude Cadoz, le président du jury qui a fait la gentillesse de bien vouloir lire les manuscrit en laissant plein de remarques très pertinentes qui m’ont données des idées pour la suite. Quelques musiciens, en particulier Eriberto Paredes, Antoine Espagno et Paul Hodgson, m’ont beuacoup aider à comprendre la nature des connaissances musicales et les processus de création. Je les suis très reconnaissant. Je remercie tous les thésards et maîtres de conférences du LAFORIA, en particulier les membres de l’équipe ACASA, avec qui j’ai pu échanger des idées, scientifiques et autres pendant plus de quatre ans. Il a été pour moi un grand privilège de pouvoir les côtoyer. Ils m’ont appris beaucoup sur la civilisation et la culture française, ils m’ont fait des suggestions et remarques fondamentales pour mon travail et ils ont même relu des parties du texte de ma thèse. Très particulièrement, je tiens à remercier Vincent Corruble, Jean-Daniel Zucker, Stephan Grolimund et Pierre-Yves Roland. Je pense aussi à Christophe Meyer, Bernard Leroux, Jérôme Thomas, Raphaël Rispoli, Herculano Caetano, Jean-Philippe Jacquet, Zahia Guessoum, Pierre Vinant et Cédric Thiénot. iv Un remerciement particulier à Rosalind Greenstein, qui a corrigé et nettement amélioré mon article au AAAI qui a été une percée décisive dans ma thèse, et à et Hélène Giroire, qui a relu la dernière version du manuscrit de thèse en faisant, avec beaucoup de précision, des corrections très opportunes. Mes remerciements aussi à Fabrice Toledano qui a "numérisé" les lignes de basse de Ron Carter qui ont servi de base pour mon système. Il ne faut pas que j’oublie de remercier tous les amis qui pendant mon séjour en France ont donné à moi et ma famille un soutient matériel et spirituel très essentiel. Ma femme Lisa mérite tous mes remerciements les plus chaleureux, sincères et profonds. Elle a courageusement et généreusement venu avec moi en France en fonctions de mes intérêts mais elle n’a jamais me fait ressenti les difficultés de son choix. Tout au contraire, elle m’a toujours soutenu, encouragé et aidé dans la maison, dans le travail et partout ailleurs. Un merci infinit !! J’oublie certainement des noms car, heureusement, nombreuses sont les personnes qui, d’une façon ou d’une autre, m’ont aidé dans le parcours que je viens d’achevé. Je les remercie à tous. Enfin, je remercie le Ministère de l’Education du gouvernement brésilien à travers la CAPES pour m’avoir accordé le financement de ce projet de recherche et d’avoir toujours cru, à son aboutissement. v RESUME La recherche en intelligence artificielle a déjà produit des programmes ayant une bonne expertise pour des tâches comme la classification et la prédiction. Les tâches de conception et de création, dont les artistiques, semblent poser plus de problèmes. C’est dans ce contexte, que nous avons entrepris un travail visant étudier la possibilité des techniques actuelles de l’Intelligence Artificielle de modéliser la connaissance nécessaire pour construire une machine capable de créer et jouer, en temps réel, des lignes de basse de jazz. En faisant appel à la notion d’agent rationnel, nous avons conçu un modèle de résolution de problèmes original qui intègre divers types de connaissances et, en particulier, des raisonnements à partir de cas et de règles. Selon ce modèle, la tache d’un agent jazzman se déroule en trois étapes qui se succèdent continuellement. Premièrement, à travers une analyse harmonique particulière, l’agent établit le "segment" de la grille pour lequel il va créer une phrase musicale. Deuxièmement, en fonction de ses données perceptives (la grille d’accords, et ce que lui et les autres musiciens viennent de jouer), l’agent active un ensemble d’actions potentielles (PACTs), comme "jouer peu dissonant" et "jouer beaucoup de notes". Ces PACTs peuvent être vues comme des "consignes musicales" portant sur plusieurs "traits musicaux" (par exemple, dissonance et densité) de la phrase mélodique devant être jouée. Troisièmement, l’agent récupère de sa "Mémoire Musicale" (une base de cas contenant des fragments de lignes de basse jouées par un bassiste humain) le fragment qui respecte le mieux les PACTs activées. Nous avons implanté le système ImPact, contenant 267 cas et plus de 80 règles de production, et les résultats musicaux obtenus sont aussi bons que ceux des deux "meilleurs" programmes actuels pouvant générer des lignes de basse (Band-in-box et NeurSwing). En outre, notre modèle a pour principal avantage de rendre facile l’ajout de nouvelles connaissances. vi ABSTRACT Artificial intelligence programs have reached a certain success in performing some classes of tasks such as classification and prediction. However, the design and creation tasks, particularly the artistic ones, seem to be more problematic. In this context, our work has been devoted to the study of the strengths and limitations of current AI techniques in modelling the knowledge necessary to build a machine capable of creating and playing jazz bass lines in real time. Based on the notion of rational agent, we have proposed a original problem solving model that integrates different kinds of knowledge and reasoning, in particular case and rule based ones. According to our model, the task of a jazz player agent can be divided into three main steps, which occur continuously. First, by means of a particular harmonic analysis, the agent establishes the "temporal segment" within which a melodic phrase must be created and played. Second, the agent activates an ensemble of “Potential ACTions” (PACTs), such as "play with high dissonance" and “play a lot of notes”. These PACTs can be seen as musical instructions concerning different musical facets (e.g. dissonance and density) of the melodic phrase to be created and played. Third, the agent uses its "Musical Memory" (a case base containing melodic previously played by human musicians), to retrieve the fragment that fits the best the activated PACTs. To validate our model, we have implemented the system ImPact, containing 267 cases and more than 80 production rules. The musical results have been as good as those of the two “best” current programs which can generate bass lines (Band-in-a-box and NeurSwing). The main advantage of our model is that additional knowledge can be easily incorporated to improve the system’s musical performance. vii TABLES DES MATIERES AVANT-PROPOS: UNE VERSION DU TEST DE TURING POUR LE JAZZ? INTRODUCTION.................................................................................................................1 A - Recherches dans les domaines artistiques : les enjeux pour l’IA...................1 a) La démarche d’IA en tant que science expérimentale...................................1 b) Motivations pour l’IA de la modélisation des activités artistiques...............4 c) Quelques difficultés posées par les activités artistiques................................6 B - Cadre de la thèse.................................................................................................9 a) De l’art au bassiste de jazz............................................................................9 b) Approche, hypothèses de travail et objectifs...............................................12 C - Notre contribution............................................................................................16 a) Brève description de la tâche du bassiste de jazz........................................16 b) Description de notre modèle.......................................................................17 1. CARACTERISATION DE LA TACHE D’UN AGENT JAZZMAN......................................33 1.1. La notion d’agent rationnel..........................................................................34 1.1.1. Comportement et structure...................................................................34 1.1.2. Environnement.....................................................................................35 1.2. L’agent jazzman............................................................................................37 1.2.1. Données perceptives............................................................................37 1.2.2. Environnement.....................................................................................39 1.2.3. Le fonctionnement global....................................................................40 1.2.4. Une formalisation de la tâche..............................................................42 1.2.5. Quelques problèmes posés...................................................................44 2. CONNAISSANCES ET RAISONNEMENT CHEZ LES JAZZMEN......................................47 2.1. Habileté instrumentale (skill).......................................................................48 2.2. Écoute.............................................................................................................49 2.2.1. Dans l’apprentissage............................................................................49 2.2.2. Structures et multiples traits.................................................................49 2.2.3. Anticipation et évaluation dynamique.................................................51 2.3. Fondements en théorie musicale..................................................................52 viii 2.3.1. La grille d’accords...............................................................................53 2.3.2. La construction même de l’improvisation...........................................55 2.4. Au-delà du “note par note” et du “la note à cause de la note”..................57 2.4.1. Patterns.................................................................................................57 2.4.2. Traits musicaux....................................................................................59 2.5. Pratique et apprentissage..............................................................................61 2.6. Conclusions....................................................................................................63 3. CONNAISSANCES ET RAISONNEMENT DANS LES PROGRAMMES JOUANT DU JAZZ..........................................................................................................................67 3.1. Panorama des programmes..........................................................................68 3.1.1. Tâches..................................................................................................68 3.1.2. Approches............................................................................................69 3.2. Données perceptives et environnement.......................................................71 3.2.1. Problèmes de l’écoute..........................................................................71 3.2.2. Données auditives effectivement incorporées.....................................72 3.2.3. Prise en compte globale de l’environnement.......................................73 3.3. Action .............................................................................................................74 3.4. Raisonnement.................................................................................................75 3.4.1. Fondements en théorie musicale..........................................................75 3.4.2. Granularité du raisonnement................................................................76 3.4.3. Structures.............................................................................................79 3.4.4. Traits musicaux....................................................................................80 3.4.5. Réutilisation de patterns.......................................................................84 3.5. Résultats.........................................................................................................86 3.6. Conclusions....................................................................................................87 4. VUE D’ENSEMBLE DE NOTRE MODELE.....................................................................89 4.1. Perception.......................................................................................................89 4.1.1. La grille................................................................................................90 4.1.2. La notion de Scénario..........................................................................90 4.1.3. Le module de perception......................................................................93 4.2. Exécution........................................................................................................93
Description: