Ce volume thématique regroupe un ensemble de contributions portant sur la description et la modélisation de la prosodie en français. Ces articles ont été choisis afin de proposer un panorama assez large des travaux menés actuellement dans ce domaine.Footnote 1
Ce numéro fait suite à une journée d'étude organisée à Paris le 27 mars 2009 dans le cadre de l'association CONSCILA (‘CONfrontation dans les SCIences du Langage’). Il a été élaboré dans le même état d'esprit et avec le même désir: rassembler des chercheurs travaillant dans le domaine de la prosodie, bien que selon des approches méthodologiques et dans des paradigmes théoriques différents, l'objectif étant de voir comment les apports de ces approches et de ces modèles peuvent se nourrir mutuellement. Pour faciliter les échanges, un corpus commun a été élaboré et partagé entre les participants de la Journée CONSCILA et les contributeurs de ce volume (voir § 2 pour une description du corpus).
1. CADRE ET PROBLEMATIQUE: LA PROSODIE, UN OBJET COMPLEXE AUX MULTIPLES INTERFACES
Les recherches sur la prosodie du français ont connu un essor important depuis le début des années 80, et ce domaine suscite un intérêt considérable qui dépasse le cadre de la phonétique et de la phonologie (cf. Di Cristo, Reference Di Cristo2000; Lacheret-Dujour, Reference Lacheret-Dujour2007):
– des spécialistes en traitement automatique de la parole mènent des travaux sur la prosodie afin (i) d'aider à la segmentation de la parole continue dans les systèmes de reconnaissance automatique (cf. pour une revue, Vaissière, Reference Vaissière1999), ou (ii) d'améliorer la qualité et le naturel des voix artificielles en synthèse de la parole (cf., entre autres, Aubergé, Reference Aubergé1991; Mertens et al., Reference Mertens, Beaugendre, d'Alessandro, van Santen, Sproat, Olive and Hirshberg1996, et plus récemment Audibert et al., Reference Audibert, Aubergé and Rilliard2006 et Beller et al., Reference Beller, Veaux, Degottex, Obin, Lanchantin and Rodet2008);
– dans bon nombre de recherches en psycholinguistique, la prosodie est considérée comme jouant un rôle central en acquisition et en perception, notamment dans la segmentation de la parole continue et dans l'accès au lexique (cf., entre autres, Melher et Christophe, Reference Mehler, Christophe, Tohkura, Vatikiotis-Bateson and Sagisaka1992; Christophe, Reference Christophe2001; Christophe et al., Reference Christophe, Gout, Peperkamp and Morgan2003; Nazzi, Reference Nazzi2008)
– des travaux récents en syntaxe, en sémantique et en analyse du discours donnent une place importante à la prosodie, notamment (i) pour définir les domaines de portée (cf., par exemple, Bonami et Godard, Reference Bonami and Godard2007; Beyssade et al., Reference Beyssade, Maradin and Portes2008), (ii) pour classer des contructions grammaticales (cf., entre autres, Rialland et al., Reference Rialland, Doetjes and Rebuschi2002; Delais-Roussarie et al., Reference Delais-Roussarie, Doetjes, Sleeman, Corblin and de Swart2004; Mertens, Reference Mertens2008; Mouret et al., Reference Mouret, Abeillé, Delais-Roussarie, Marandin and Yoo2008; Avanzi, à par. a et b), (iii) pour évaluer le poids des paramètres prosodiques dans l'interprétation des particules de discours (cf., entre autres, Chanet, Reference Chanet2004; Bertrand et Chanet, Reference Bertrand and Chanet2005), ou des énoncés en contexte (cf., entre autres, Beyssade et al., Reference Beyssade, Marandin, Rialland and Nunez-Cedeno2003; Auchlin et al., Reference Auchlin, Filliettaz, Grobet and Simon2004).
Ce regain d'intérêt s'explique par le rôle charnière que joue la prosodie à l'interface entre parole et grammaire. De fait, la structuration prosodique – qui se manifeste grâce à la présence de phénomènes accentuels ou intonatifs – est la voie d'accès nécessaire à la reconstruction des structures syntaxique, sémantique et pragmatique associées aux énoncés, et donc à leur interprétation.
Ce statut spécifique de la prosodie permet de l'appréhender selon deux angles très différents. D'un côté apparaissent les travaux menés hors du cadre de la phonétique ou de la phonologie (comme ceux qui viennent d'être mentionnés). Ils ont souvent un point commun: les faits prosodiques y sont vus comme contribuant à répondre à des questions de recherche qui leur sont externes, l'objectif n'est donc pas d'en proposer des modélisations, mais davantage d'évaluer leur poids dans la problématique ou le point de recherche étudié. Cette façon d'appréhender la prosodie a donné naissance à des travaux intéressants, mais dont la portée reste limitée, notamment pour proposer une modélisation des faits prosodiques. Pourquoi? Parce qu'on sait depuis un demi-siècle au moins qu'il n'existe pas de lien un à un entre une manifestation prosodique (comme la présence d'un accent ou la réalisation de tel ou tel contour mélodique) et une fonction linguistique ou discursive particulière (cf., entre autres, Bolinger, Reference Bolinger1965 et Reference Bolinger1989).
D'un autre côté, il existe un nombre considérable de travaux qui appréhendent la prosodie pour elle-même, c'est-à-dire afin de comprendre comment elle fonctionne et de proposer des modélisations pour rendre compte des découpages prosodiques, de l'accentuation ou de l'intonation.Footnote 2 Ils sont généralement menés dans le domaine de la phonétique et de la phonologie. Ils peuvent être classés selon deux critères: la dimension prosodique étudiée (accentuation, intonation et structure prosodique), et la méthode utilisée. Pour le français, on peut citer parmi les travaux consacrés à l'intonation ceux de Delattre, Reference Delattre1966, de Vaissière, Reference Vaissière1974 et Reference Vaissière1975, de Martin, Reference Martin1981 et Reference Martin1987, de Rossi, Reference Rossi and Callamand1987 et Reference Rossi1999, de Di Cristo, Reference Di Cristo, Hirst and Di Cristo1998, de Mertens, Reference Mertens1987, de Jun & Fougeron, Reference Jun, Fougeron and Botinis2000 ou de Post, Reference Post2000. Sur l'accentuation, un nombre considérable de recherches a également été mené (cf., entre autres, Fonagy, Reference Fonagy1980; Dell, Reference Dell, Dell, Hirst and Vergnaud1984; Di Cristo, Reference Cristo1999; Delais-Roussarie, Reference Di Cristo2000; Astesano, Reference Astésano2001). En ce qui concerne la modélisation de la structuration prosodique, il existe, là aussi, des travaux très diversifiés. Certains partent sur des phénomènes accentuels ou intonatifs pour définir les constituants (cf. entre autres, Rossi, Reference Rossi and Callamand1987; Hirst et Di Cristo, Reference Hirst and Di Cristo1996; Di Cristo et Hirst, Reference Di Cristo and Hirst1996; Jun et Fougeron, Reference Jun, Fougeron and Botinis2000); d'autres intègrent également des informations d'ordre sémantique, syntaxique ou discursif (cf., Delais-Roussarie, Reference Delais-Roussarie, Nespor and Smith1996; Simon, Reference Simon2004; Mertens, Reference Mertens2008; Delais-Roussarie et Post, Reference Delais-Roussarie and Post2008; Di Cristo et al., Reference Di Cristo, Auran, Bertrand, Chanet, Portes and Régnier2004; Lacheret-Dujour et al., Reference Lacheret-Dujour, Victorri and Avanzi2007).
D'une façon générale, une distinction peut être établie sur le plan méthodologique entre les approches ‘basées sur la substance’ et les approches ‘à modèles’ (cf. Ladd et Cutler, Reference Ladd, Cutler, Cutler and Ladd1983:1):
There are two broad traditions in the study of prosody that may be characterized - or caricatured - by their methodological preferences for one or the other of the scientific activities mentionned in the title: making measurements and constructing models. On the one side of the dichotomy stand instrumental and experimental studies that seek to quantify acoustic features and investigate perceptual responses. On the other are descriptive and theoretical studies of prosodic structure and its relation to other aspects of grammar and phonology. [. . .] The two traditions are based on fundamentally different assumptions about what constitutes empirical work. [. . .] the measurers and the model-builders have fundamentally different assumptions not primarily about methodology, but about function and representation of prosody. These assumptions can be explicitly stated and carefully examined: the issues are potentially empirical ones that can be tested in ways that will satisfy a range of methodological preferences. In particular, it seems to us that two of the main points of substantive disagreement implicit in the differences of methodology have to do with abstractness of prosodic representation and the directness of the link between prosodic function and prosodic form.
Cette dichotomie a considérablement pesé dans la structuration du champ et est encore valable, sous certains aspects, dans les travaux actuels. Elle s'explique en partie par le statut accordé à la prosodie par la phonologie structurale française. Cette dernière a en effet considéré les faits suprasegmentaux comme hors de son champ (cf., Martinet, Reference Martinet1956 et Reference Martinet1961, et, pour une revue, Lacheret-Dujour, à par.). Cela a d'ailleurs eu des conséquences sur l'appréhension de certains phénomènes prosodiques du français comme l'accentuation (cf. Di Cristo, Reference Cristo1999 pour une revue sur le statut de l'accent en français).
Au vu de la multitude et de la diversité des travaux, on pourrait avoir l'impression que la discipline est éclatée. Ce n'est vraisemblablement pas le cas, d'autant que plusieurs évolutions théoriques et méthodologiques contribuent actuellement à faire ‘bouger les lignes’. Sur le plan théorique, de nouveaux paradigmes de recherche laissent penser que (i) la grammaire émerge des régularités structurelles présentes dans les données observables, cela en dépit d'une importante variation (cf., entre autres, Bybee, Reference Bybee2001; Blevins, Reference Blevins2004); et que (ii) les relations entre gradience et catégorie ne sont pas si simples, des détails phonétiques fins de nature segmentale (comme le renforcement articulatoire) ou suprasegmentale (comme l'alignement temporel des cibles tonales) interviennent dans les catégorisations phonologiques et prosodiques (cf., entre autres, Fougeron et Keating, Reference Fougeron and Keating1997; D'Imperio et Cangemi, Reference D'Imperio, Cangemi, Frota, Elordieta and Prieto2010; Hawkins, à par.). Ces deux éléments contribuent donc à dépasser en quelques sortes les oppositions entre approche abstraite et approche basée sur la substance.
Sur le plan méthodologique, (i) le développement d'outils d'édition et d'analyse du signal de parole facilite le traitement et l'analyse des données (Mertens, Reference Mertens2004; Martin, Reference Martin2000; Goldman, Reference Goldman2008; Avanzi et al., Reference Avanzi, Lacheret-Dujour and Victorri2008, Reference Avanzi, Lacheret-Dujour and Victorri2010); et (ii) les avancées techniques ont permis la constitution et le stockage de données sonores toujours plus importantes. Aussi les chercheurs peuvent-ils travailler sur autre chose que des énoncés lus en chambre sourde (Lacheret-Dujour, Reference Lacheret-Dujour2003; Simon, Reference Simon2004; Cresti et Moneglia, Reference Cresti and Moneglia2005; Delais-Roussarie, Reference Delais-Roussarie2008; Bertrand et al., Reference Bertrand, Blache, Espesser, Ferré, Meunier, Priego-valverder and Rauzy2008).
Notre souci sera donc, on l'aura compris, de présenter dans ce volume plusieurs approches de la prosodie qui tiennent compte de ces différences et de ces développements. Les contributions choisies permettent d'appréhender la prosodie dans toute sa complexité dans la mesure où:
– d'une part, elles se distinguent les unes des autres quant à la façon dont elles appréhendent la face sonore du langage, la prosodie pouvant aussi bien être étudiée dans une perspective phonologique (approche orientée par des hypothèses théoriques, approche dite hypothético-déductive) que dans une perspective phonétique (approche guidée par les données, approche dite inductive). Certaines contributions partent en effet de catégories linguistiques ou phonologiques pour construire les analyses, comme par exemple celles de Philippe Martin ou d'Albert Di Cristo, mais d'autres tentent de construire des analyses en partant des régularités observées dans la substance sonore, comme le font par exemple Mathieu Avanzi, Anne Lacheret-Dujour, Nicolas Obin et Bernard Victorri. Quant à celle d'Elisabeth Delais-Roussarie et de Hi-Yon Yoo, elle propose, à partir d'une réflexion sur les systèmes de représentation des faits prosodiques, de s'interroger sur la façon dont les deux perspectives pourraient être intégrées.
– d'autre part, les différents domaines de la prosodie, à savoir l'accentuation, l'intonation et la structuration prosodique, sont abordés. La contribution de Philippe Martin présente un modèle de l'intonation du français reposant essentiellement sur la définition de contours phonologiques dont la distribution est contrainte par les relations de dépendance entre constituants. Les articles d'Albert Di Cristo et de Mathieu Avanzi, Anne Lacheret-Dujour, Nicolas Obin et Bernard Victorri traitent de l'accentuation en français. Pour finir, la contribution de Roxane Bertrand et de Cristel Portes propose un inventaire des constituants prosodiques de base qui reste identique quel que soit le type de données pris en considération (lecture, parole spontanée, etc.).
Pour tenter de mieux faire ressortir les points qui font consensus dans les descriptions prosodiques du français, cela malgré les différences d'approche, les auteurs ont travaillé sur une même base de données.
2. DESCRIPTION DU CORPUS
Un corpus, appelé PROSO_FR, a été mis à disposition de tous les contributeurs et est accessible à l'adresse suivante: http://makino.linguist.univ-paris-diderot.fr/jfls. Il a été élaboré afin de faciliter la discussion et d'aider à mettre en relation les approches de chacun pour mieux comprendre la spécificité des points de vue, mais aussi les points de convergence ou de divergence.
Ce corpus regroupe des textes appartenant à quatre styles de parole distincts (i.e relevant de situations de communication différentes). Généralement, ces usages spécifiques de la langue donnent naissance à des productions sonores ayant des caractéristiques propres qui permettent de réfléchir sur la pertinence et la limite des modèles développés. Le corpus comprend deux extraits de parole formelle, en entendant par là une parole répondant à des exigences relativement conventionnelles:
– un extrait de lecture oralisée appelé For-Lec. Il s'agit d'un texte journalistique lu par un locuteur méridional;
– un dialogue, appelé For-Dia. Il met en scène un enfant, sa mère et une boulangère, la mère faisant des courses à la boulangerie. Cet extrait a été enregistré en studio à des fins pédagogiques, et diffère donc, sous certains aspects, d'une parole authentique.
A côté de ces extraits, PROSO_FR est composé de deux textes (ou extraits) produits dans des situations de communication non préparées (ou, en tous cas, moins préparées et moins conventionalisées).
– un monologue qui constitue la réponse à une demande d'itinéraire dans la ville de Grenoble. Le fichier est nommé Infor-Iti;
– une conversation à bâtons rompus entre deux femmes. Ce texte est nommé Infor-Dia et est extrait du CID (Bertrand et al., Reference Bertrand, Blache, Espesser, Ferré, Meunier, Priego-valverder and Rauzy2008).
La totalité des enregistrements a été segmentée sur plusieurs tires en phonèmes,Footnote 3 en syllabes, en mots graphiques et en énoncés (orthographe standard). Ces segmentations ont été alignées sur le signal à l'aide du script EasyAlign (Goldman, Reference Goldman2008) implémenté sous Praat (Boersma & Weenink, Reference Boersma and Weenink2010), les frontières posées automatiquement ayant ensuite été vérifiées manuellement. Un exemple de segmentation est représenté sous (1), à titre indicatif.
(1) Et ben euh – tu prends le boulevard euh (extrait de Infor-Iti)
Dans les représentations, les silences sont notés par le symbole ‘_’.
Pour chaque extrait ou texte de PROSO_FR sont fournis un fichier de transcription au format TextGrid (c'est-à-dire lisible sous PRAAT) et un fichier sonore au format wav.

Figure 1. Segmentation et alignement obtenus pour l'extrait de Infor-Iti.
Pour les dialogues, les tours de parole sont indiqués différemment dans les deux textes. Dans For-Dia, une tire « speakers » a été ajoutée dans le fichier de transcription et indique qui est le locuteur. Dans Infor-Dia, extrait du CID, les locuteurs ont été enregistrés sur deux pistes séparées (Infor-Dia_left et Infor-Dia_right), auxquelles sont liées deux fichiers de transcription. Cela est représenté dans les fig 2a et 2b, où les deux pistes ont été au préalable regroupées dans un seul fichier audio, alors que la transcription est toujours dans deux fichiers distincts (textgrid).
(2) – c’ est vrai que les les les héritages c’ est source de
– . . .
– hein
– de gros conflits de et même de sépa enfin
– des gens qui ouais qui se
etc.

Figure 2a. Représentation de l'exemple (2) extrait de Infor-Dia, liée à la transcription donnée dans Infor-Dia_left.

Figure 2b. Représentation de l'exemple (2) extrait de Infor-Dia, lié à la transcription donnée dans Infor-Dia_right.
3. CONTENU DU VOLUME
Le présent recueil regroupe cinq contributions, qui traitent respectivement (i) de la représentation des phénomènes prosodiques à différents niveaux d'analyse, (ii) de la modélisation des phénomènes intonatifs, (iii), de la question de l'accentuation du français (iv) des unités de différents rangs pertinentes pour décrire la structure prosodique.
L'article de Elisabeth Delais-Roussarie et de Hiyon Yoo propose une réflexion sur la façon de représenter dans un même système de transcription les faits accentuels et intonatifs impliqués dans la formation d'unités prosodiques de taille et de portée différentes. Dans leur contribution, les auteurs partent du constat qu'il n'existe à l'heure actuelle aucun système de transcription prosodique qui soit comparable à l'API et qui permette (i) de représenter symboliquement le continuum sonore; (ii) de le faire au niveau phonétique et/ou phonologique; (iii) de proposer des représentations sans faire d'importants présupposés théoriques. Or, selon les auteurs, l'existence d'un tel système est cruciale pour échanger et analyser des données. Après une présentation de différents systèmes (INTSINT, PROSOGRAMME, etc.), elles explorent plusieurs voies afin de saisir comment pourraient être transcrits les découpages prosodiques et les phénomènes accentuels et intonatifs.
Dans la contribution suivante, Philippe Martin propose un modèle de l'intonation du français dans lequel le profil mélodique associé à un énoncé découle d'un mécanisme spécifique, l'inversion de pente mélodique à droite. Ce mécanisme assure l'indication de l'appartenance d'une unité prosodique à une unité plus grande par un contour mélodique de pente inverse par rapport à celui qui, à sa droite, termine l'unité en question. Ce modèle, bien que phonologique dans son essence, est original et se distingue, sous de nombreux aspects, des approches hypothético-déductives formelles, telles que développées dans le cadre de la théorie métrique-autosegmentale.
Viennent ensuite deux articles consacrés à l'accentuation en français. Celui proposé par Mathieu Avanzi, Anne Lacheret-Dujour, Nicolas Obin et Bernard Victorri rend compte d'une approche expérimentale basée sur la substance. Les auteurs proposent de repérer de manière semi-automatique, sur des bases acoustiques, les proéminences syllabiques, souvent perçues comme piliers dans la construction des analyses et des représentations prosodiques. Ils s'appuient ensuite sur cette détection automatique pour construire la représentation prosodique et accentuelle des énoncés, et ils confrontent le résultat obtenu avec ce que proposent des approches phonologiques formelles. Cela leur permet de rendre compte, de façon plus précise que l'on ne le fait d'ordinaire, des paramètres phonétiques effectivement impliqués dans la perception d'un accent (variations de hauteur, de durée, présence de pauses).
Dans sa contribution, Albert Di Cristo présente les fondements théoriques et les implications factuelles de son approche des relations entre accentuation et phrasé prosodique en français. Celle-ci s'inscrit dans une double perspective: elle se veut ‘intégrative’ d'une part, elle décrit les effets de ces relations en termes de constructions « probabilitaires », non assujetties à des règles figées, d'autre part. A partir de ce travail, l'auteur propose une classification et une analyse des accents du français dans laquelle il distingue les accents métriques des accents pragmatiques. Il montre clairement que cette typologie accentuelle est renforcée par une étude de la structuration prosodique: la réalisation de tel ou tel type d'accent est en effet contrainte par sa fonction et sa localisation.
Pour clore ce volume, Cristel Portes et Roxane Bertrand proposent une contribution originale dans laquelle elles s'interrogent sur l'adéquation des unités prosodiques existantes pour décrire le discours. A travers l'examen des différents extraits proposés, elles abordent les points suivants: dans quelle mesure les unités traditionnelles de l'analyse phonologique sont-elles représentées et quelles sont alors les modalités de leurs variations, notamment dans les corpus les moins contrôlés tels que les conversations? Quels facteurs sont impliqués dans la variation, et quelle place doit-on accorder aux phénomènes prosodiques orthogonaux? Elles s'interrogent également sur la pertinence d'autres unités, définies en termes strictement prosodiques (comme le paraton par exemple), à rendre compte des données. Enfin, elles terminent par une discussion sur l'influence des autres niveaux de l'analyse (morpho-syntaxe d'une part, discours et interaction d'autre part).
REMERCIEMENTS
Nous tenons à remercier les contributeurs, mais également les personnes qui ont accepté de relire des articles ou qui nous ont aidés dans l'élaboration de ce volume: Corine Astésano, Antoine Auchlin, Philippe Boula de Mareuil, Mathilde Dargnat, Jacques Durand, Cédric Gendrot, David Le Gac, Jean-Marie Marandin, Piet Mertens, Frédéric Sabio, Lisa Selkirk, Anne-Catherine Simon, Caroline Smith, Jacqueline Vaissière, Douglas Walker et Pauline Welby. Mathieu Avanzi tient à remercier également le Fond National Suisse de la recherche scientifique pour le soutien apporté à cette recherche (subsides n° PBNEP1–127788 et n°100012–126745, Université de Neuchâtel).