Hostname: page-component-745bb68f8f-grxwn Total loading time: 0 Render date: 2025-02-06T09:04:30.521Z Has data issue: false hasContentIssue false

Validation de stimuli prosodiques émotionnels chez les Franco-québécois de 50 à 80 ans*

Published online by Cambridge University Press:  25 April 2014

Flore Morneau-Sévigny
Affiliation:
École de psychologie, Université Laval, Québec, Canada
Joannie Pouliot
Affiliation:
École de psychologie, Université Laval, Québec, Canada
Sophie Presseau
Affiliation:
École de psychologie, Université Laval, Québec, Canada
Marie-Hélène Ratté
Affiliation:
École de psychologie, Université Laval, Québec, Canada
Marie-Pier Tremblay
Affiliation:
École de psychologie, Université Laval, Québec, Canada
Joël Macoir
Affiliation:
Centre de recherche de l’Institut universitaire en santé mentale de Québec, Québec, Canada Département de réadaptation, Université Laval, Québec, Canada
Carol Hudon*
Affiliation:
École de psychologie, Université Laval, Québec, Canada Centre de recherche de l’Institut universitaire en santé mentale de Québec, Québec, Canada
*
La correspondance et les demandes de tirés-à-part doivent être adressées à : / Correspondence and requests for offprints should be sent to: Carol Hudon, Ph.D. 2325, rue des Bibliothèques Pavillon Félix-Antoine-Savard (local 1546) Québec, QC G1V 0A6 (Carol.Hudon@psy.ulaval.ca)
Rights & Permissions [Opens in a new window]

Abstract

Few batteries of prosodic stimuli testing have been validated for Quebec-French people. Such validation is necessary to develop auditory-verbal tasks in this population. The objective of this study was to validate a battery of emotional prosodic stimuli for French-Québec aging subjects. The battery of 195 stimuli, which was elaborated by Maurage et al. (2007), is composed of 195 prosodic stimuli and was administrated to 50 healthy Quebecers aged 50-to-80 years. The percentages of good responses were calculated for each stimulus. For each emotion, Cronbach’s alphas were calculated to evaluate the internal consistency of the stimuli. Results showed that among the 195 stimuli, 40 were correctly recognized by at least 80 per cent of the subjects. Anger was the emotion that was most correctly identified by the participants, while recognition of disgust was the least recognised. Overall, this study provides data that will guide the selection of prosodic stimuli in evaluating French-Québécois.

Résumé

Peu de banques de stimuli prosodiques ont été validées chez les Québécois francophones. La validation de ce type de banques est nécessaire pour développer des tâches auditivo-verbales chez cette population. L’objectif de cette étude est de valider une banque de stimuli prosodiques émotionnels auprès de Franco-québécois vieillissants. La banque de 195 stimuli (Maurage, Joassin, Philippot & Campanella, 2007) a été administrée à 50 Québécois sains âgés de 50 à 80 ans. Les pourcentages de bonnes réponses pour chaque stimulus ont été calculés. Pour chaque émotion, des alphas de Cronbach ont été calculés pour évaluer la cohérence interne des stimuli. Quarante des 195 stimuli ont été reconnus correctement par au moins 80 pour cent des participants. L’émotion la mieux reconnue était la colère; le dégoût était la moins bien reconnue. Cette étude fournit des données qui guideront le choix de stimuli prosodiques viables à des fins d’évaluation auprès de Franco-québécois.

Type
Articles
Copyright
Copyright © Canadian Association on Gerontology 2014 

Validation de stimuli prosodiques émotionnels chez les Franco-québécois de 50 à 80 ans

Une émotion constitue une « réaction affective transitoire d’assez grande intensité, habituellement provoquée par une stimulation venue de l’environnement » (Larousse, Reference Larousse, Legrain and Garnier2012, p. 362). La reconnaissance des émotions est une habileté essentielle à la régulation des relations interpersonnelles (Ekman, Reference Ekman1992a; Erickson & Schulkin, Reference Erickson and Schulkin2003; Rankin, Kramer & Miller, Reference Rankin, Kramer and Miller2005). En effet, cette habileté permet à l’individu d’adopter des réactions et des comportements appropriés au contexte social (Rankin, Kramer & Miller, Reference Rankin, Kramer and Miller2005). À ce jour, plusieurs tests visant à évaluer la reconnaissance des émotions en modalité visuelle ont été développés (p. ex. : The Ekman 60 emotion recognition test; Ekman & Friesen, Reference Ekman and Friesen1971; Japanese and Caucasian Facial Expressions of Emotion: JACFEE; Biehl et al., Reference Biehl, Matsumoto, Ekman, Hearn, Heider and Kudoh1997). Les batteries en modalité auditive sont cependant plus rares (p.ex. The Multimodal Emotion Recognition Test; Bänziger, Grandjean & Scherer, Reference Bänziger, Grandjean and Scherer2009). Plusieurs batteries de stimuli émotionnels sont également disponibles et incluent des items visant à évaluer la reconnaissance des émotions exprimées par des images de scènes émotionnelles (banque IAPS, [Lang, Bradley, & Cuthbert, Reference Lang, Bradley and Cuthbert1997]), des expressions faciales animées (Simon, Craig, Gosselin, Belin, & Rainville, Reference Simon, Craig, Gosselin, Belin and Rainville2008), des mots (Bonin, Peereman, Malardier, Méot & Chalard, Reference Bonin, Peereman, Malardier, Méot and Chalard2003; Bradley & Lang, Reference Bradley and Lang1999) et des stimuli musicaux (Peretz, Gagnon, & Bouchard, Reference Peretz, Gagnon and Bouchard1998). Cependant, la plupart des stimuli utilisés dans ces batteries impliquent la modalité visuelle, alors que peu de banques de stimuli sont disponibles pour la modalité auditive.

Un élément important de la modalité auditive est la prosodie, qui correspond à « la composante non-lexicale du discours » (Adolphs, Damasio & Tranel, Reference Adolphs, Damasio and Tranel2002, p. 23, traduction libre). La plupart des tâches évaluant la reconnaissance de la prosodie émotionnelle, soit la transmission d’une émotion par l’intonation et le rythme de la voix, évalue quatre des six émotions de base de la conception d’Ekman (Reference Ekman, Dalgleish and Power1999) : la colère, la peur, la tristesse et la joie (Juslin & Laukka, Reference Juslin and Laukka2003; Thompson, Schellenberg & Husain, Reference Thompson, Schellenberg and Husain2004). Ces émotions sont dites de base, car elles sont universelles (Ekman, Reference Ekman1992a) et transcendent l’évolution (Ekman, Reference Ekman1992b).

Il n’existe actuellement aucune banque de stimuli évaluant la prosodie émotionnelle et validée auprès d’une population franco-québécoise vieillissante. Afin de faciliter le développement de tâches de reconnaissance des émotions utilisées auprès des Franco-Québécois, il est essentiel de développer des banques de stimuli valides pour cette population, car la culture peut influencer la reconnaissance d’une émotion exprimée par la prosodie (Juslin & Laukka, Reference Juslin and Laukka2003; Scherer, Banse, & Wallbott, Reference Scherer, Banse and Wallbott2001; Weathers, Frank & Spell, Reference Weathers, Frank and Spell2002). Puisque l’âge est également un facteur qui est associé aux capacités de reconnaissance des émotions (Mitchell, Kingston, & Barbosa Bouças, 2011; Ruffman, Henry, Livingstone & Phillips, Reference Ruffman, Henry, Livingstone and Phillips2008), il est important de valider des stimuli émotionnels en tenant compte de cette caractéristique personnelle. La banque de stimuli prosodiques développée par Maurage et coll. (2007) est composée d’un mot (« papier») et d’une interjection (« ah »), prononcés vocalement par un acteur avec diverses intonations ou bien de façon neutre. Les intonations correspondent au dégoût, à la joie, à la tristesse, à la colère ou à la peur. Cette banque comprend 195 stimuli validés pour la correspondance entre les extraits et les émotions auprès de 70 jeunes adultes franco-belges.

Selon les recherches portant sur la reconnaissance des émotions véhiculées par la prosodie, la peur et la surprise sont plus difficiles à reconnaître que d’autres émotions de base telles que la tristesse et la colère (Banse & Scherer, Reference Banse and Scherer1996; Johnstone & Scherer, Reference Johnstone, Scherer, Lewis and Haviland2000). La joie, pour sa part, est bien reconnue (Thompson et al., Reference Thompson, Schellenberg and Husain2004). La tristesse serait également bien reconnue à cause de son profil prosodique (le contour mélodique associé aux syllabes) qui se distingue bien des autres émotions (Johnstone & Scherer, Reference Johnstone, Scherer, Lewis and Haviland2000). L’effet de la familiarité peut expliquer la meilleure performance pour la reconnaissance de la joie et de la tristesse ; les individus seraient plus souvent exposés à des stimuli prosodiques joyeux et tristes (Thompson et al., Reference Thompson, Schellenberg and Husain2004). Enfin, en prosodie, le dégoût serait l’émotion la moins bien reconnue, car les individus sont plus rarement exposés à des stimuli vocaux traduisant le dégoût lors d’interactions sociales (Scherer, Banse, Wallbott & Goldbeck, Reference Scherer, Banse, Wallbott and Goldbeck1991).

La banque de Maurage et coll. (2007) est l’une des rares composée de stimuli francophones. Cependant, ceux-ci n’ont pas été validés auprès des personnes plus âgées ni chez des individus francophones hors Belgique, ce qui est nécessaire afin de pouvoir utiliser la banque à des fins d’évaluation chez cette population. L’objectif principal de cette étude consiste à valider, auprès de Franco-québécois âgés de 50 à 80 ans, cette banque de stimuli émotionnels prosodiques. L’objectif secondaire vise à caractériser le patron de reconnaissance des émotions chez ces participants. Il est attendu que la reconnaissance de l’expression prosodique de la joie, de la colère et de la tristesse soit meilleure que pour la peur. Il est aussi attendu que la reconnaissance du dégoût soit moins bonne comparativement aux autres émotions.

Méthode

Participants

Cinquante participants ont été recrutés à partir d’une banque de sujets volontaires du Centre de recherche de l’Institut universitaire en santé mentale de Québec. Les participants sont des Franco-québécois âgés entre 50 et 80 ans (M = 65.35, ET = 8.15), répartis dans trois tranches d’âge (50-59 ans [M = 55.88, ET = 3.07, n= 16], 60-69 ans [M = 65.28, ET = 2.67, n = 18], 70-80 ans [M = 74.88, ET = 2.60, n = 16]) comprenant chacune autant d’hommes que de femmes. Les participants ont complété un nombre moyen d’années de scolarité de 15,82 ans (ET = 3.24), et ce niveau de scolarité était similaire entre les trois groupes d’âge (50-59 ans [M = 16.18, ET = 2.71], 60-69 ans [M = 15.66, ET = 2.82], 70-80 ans [M = 15.63, ET = 4.28, n = 16]).

Pour être éligibles, les sujets ne devaient présenter aucun trouble cognitif et donc présenter une performance normale à la Mini Mental State Examination (MMSE > 26, M = 29.16, ET = 1.07; Folstein, Folstein, & Mchugh, Reference Folstein, Folstein and McHugh1975). Ils ne devaient non plus présenter de symptômes dépressifs significatifs tel qu’établi avec la version française du Geriatric Depression Scale (GDS < 11, M = 2.34, ET = 2.43; Yesavage et al., Reference Yesavage, Brink, Rose, Lum, Huang and Adey1983). Les participants n’avaient aucun problème visuel ou auditif non corrigé. Ceux n’ayant pas atteint le niveau de scolarité primaire ont été exclus de l’étude. Chaque participant a reçu une compensation financière de 10$ afin de rembourser ses frais de déplacement. Tous les participants ont signé un formulaire de consentement libre et éclairé avant de participer à cette étude.

Matériel

La banque de stimuli élaborée par Maurage et coll. (2007) est composée de 195 stimuli prosodiques d’une durée de 700 ms chacun, calibrés pour la qualité sonore. Ces stimuli ont été présélectionnés par trois experts, c’est-à-dire des chercheurs en prosodie émotionnelle, parmi 480 stimuli. Pour chaque stimulus, un acteur dont la langue maternelle est le français, exprime vocalement le mot sémantiquement neutre « papier » ou l’interjection « ah », de manière à exprimer cinq des six émotions de base (joie [27 stimuli], colère [32 stimuli], peur [34 stimuli], tristesse [34 stimuli], dégoût [30 stimuli]), ainsi que la neutralité (38 stimuli); seule la surprise n’est pas présentée, car elle serait plus difficile à reconnaître que d’autres émotions dans la prosodie (Banse & Scherer, Reference Banse and Scherer1996; Johnstone & Scherer, Reference Johnstone, Scherer, Lewis and Haviland2000). Dans le cadre de la présente étude, les stimuli ont été présentés aux participants avec le logiciel E-prime (Psychology Software Tools, Sharpsburg, PA) à partir d’un ordinateur portable Hewlett-Packard (HP) muni d’un écran de 38.10 centimètres.

Procédure

Les participants ont été invités à se présenter à une rencontre d’expérimentation d’une durée moyenne de 45 minutes. Ceux-ci ont été évalués dans une pièce insonorisée. Durant la première partie de cette rencontre, ils ont rempli un questionnaire de cueillette d’informations sociodémographiques. Ensuite, le MMSE et la GDS ont été administrés pour évaluer le fonctionnement cognitif et les symptômes dépressifs. Finalement, la tâche de reconnaissance des stimuli prosodiques leur a été présentée.

Dans cette tâche, un essai d’entraînement a d’abord été présenté à chaque participant pour chacune des émotions afin de valider sa compréhension et de le familiariser avec les termes utilisés. Lors de cette période d’entraînement, le volume sonore a été ajusté aux capacités auditives de chaque participant. La présentation des stimuli était binaurale, mais sans casque d’écoute. L’ordre de présentation des stimuli était aléatoire, et pour chaque item, le participant devait répondre à la question : « À quelle émotion pouvez-vous associer cet extrait ? ». Une fois le stimulus présenté, le participant devait sélectionner, à l’aide du clavier (touches 1 à 6), l’émotion qu’il jugeait avoir reconnue. Les six choix de réponse suivants étaient présentés à l’écran: 1) joie, 2) colère, 3) tristesse, 4) peur, 5) dégoût et 6) neutre. Une seule émotion pouvait être choisie pour chaque stimulus. Les stimuli ne pouvaient être entendus qu’une seule fois. Aucune limite de temps n’était indiquée, mais le participant devait absolument répondre afin de passer à l’extrait suivant. Après que le participant ait donné sa réponse, une croix de fixation apparaissait au centre de l’écran et le participant appuyait sur la barre d’espacement pour passer à l’extrait suivant. Cette procédure permettait de s’assurer que l’attention était dirigée vers la tâche.

Analyses statistiques

Selon une procédure comparable à celle de Maurage et coll. (2007), des pourcentages de bonnes réponses ont été calculés pour l’ensemble des stimuli afin d’identifier ceux qui sont les mieux et les moins bien reconnus. Un critère de 80 pour cent de réussite ou plus, identique à celui utilisé par Maurage et ses collaborateurs (2007), a également été utilisé pour déterminer qu’un stimulus est bien reconnu au sein de la population de référence.

Une ANOVA Groupe d’âge (50-59 ans, 60-69 ans, 70-79 ans) x Émotion (joie, colère, peur, tristesse, dégoût, neutralité) x Type de stimulus (mot, interjection) a été effectuée sur les pourcentages de bonnes réponses. Une ANOVA a également été effectuée séparément sur les stimuli dont le pourcentage de bonnes réponses était supérieur ou égal à 50% afin d’exclure la possibilité d’un biais lié à des données aberrantes. Étant donné que le temps de réponse a été mesuré comme second indicateur de la capacité à reconnaître l’émotion, une ANOVA Groupe d’âge (50-59 ans, 60-69 ans, 70-79 ans) x Émotion (joie, colère, peur, tristesse, dégoût, neutralité) x Type de Stimulus (« papier », « ah ») a également été effectuée sur cette mesure. Une ANOVA Sexe du participant (homme, femme) x Sexe de l’acteur (homme, femme) a été effectuée pour évaluer l’impact de cette variable sur la performance. Les postulats de normalité et d’homogénéité des variances ou des covariances ont été vérifiés et une correction de Greenhouse-Geisser a été appliquée si nécessaire. Des analyses d’effets simples ont par la suite été réalisées pour décomposer l’interaction entre les facteurs de l’ANOVA. Une corrélation entre l’âge et le pourcentage de bonnes réponses a également été réalisée pour clarifier l’effet de cette variable. Des alphas de Cronbach ont aussi été calculés afin d’évaluer la cohérence interne des extraits pour chacune des émotions. Dans toutes les analyses, un seuil alpha de 5 pour cent a été appliqué.

Résultats

Une ANOVA Groupe d’âge x Émotion x Type de stimulus a été appliquée pour comparer le pourcentage de bonnes réponses des participants selon les trois facteurs de l’analyse. Les résultats indiquent que le pourcentage de bonnes réponses variait selon le Groupe d’âge F (2. 47) = 4.262, p < .020 , η2 = .154, les 50-59 ans étant meilleurs que les 60-69 ans (p = .043) et que les 70-79 ans (p = .044). De même, le pourcentage de bonnes réponses variait selon l’émotion, F (3.988, 187.439) = 19.468, p < .001, η2 = .293. En effet, la colère et la neutralité étaient les émotions les mieux reconnues, alors que les pourcentages de bonnes réponses les plus faibles correspondaient au dégoût. Le pourcentage de bonnes réponses variait également selon le type de stimulus, F (1. 47) = 16.136, p < .001 , η2 = .256, la performance étant meilleure lorsque le stimulus était un mot (p < .001).

L’interaction entre le groupe d’âge et l’émotion (p = .144), de même que celle entre le groupe d’âge et le type de stimulus (p = .191), ne sont pas significatives. L’interaction entre le type de stimulus et l’émotion l’est toutefois F (3.856, 181.243) = 21.104, p < .001, η2 = .310. En effet, les résultats des analyses d’effets simples révèlent que la performance diffère significativement selon le type de stimulus pour chaque émotion sauf la peur (p = .729). La joie (p = .001), la colère (p < .001) et la neutralité (p < .001) sont mieux reconnues avec les extraits correspondant au mot « papier » qu’avec ceux correspondant à l’interjection « ah », alors que l’inverse se produit pour la tristesse (p = .022) et le dégoût (p < .001). Pour le mot « papier », la colère est significativement mieux reconnue que toutes les autres émotions (p < .01), mais pas que la neutralité (p = .950). Par ailleurs, pour le mot « papier », le dégoût est l’émotion la moins bien reconnue (p < .001); la neutralité est significativement mieux reconnue que la peur (p < .001) et la tristesse (p < .001), mais elle ne diffère pas significativement de la joie (p = .058). La joie exprimée dans le mot « papier » est quant à elle mieux reconnue que la peur (p = .019) et la tristesse (p < .001), et la peur est mieux reconnue que la tristesse (p = .039). Lorsque le stimulus est l’interjection « ah », la différence de performance entre les émotions n’est pas significative (p > .05) dans tous les cas, sauf pour la colère, qui est mieux reconnue que le dégoût (p = .049). Enfin, l’interaction entre le groupe d’âge, l’émotion et le type de stimulus n’est pas significative, F (7.712, 88) = 1.876, p = .069, η2 = .074.

L’ANOVA Groupe d’âge x Émotion x Type de stimulus a ensuite été effectuée sur les données des stimuli ayant obtenu un pourcentage de bonnes réponses supérieur ou égal à 50%. Les résultats sont très similaires à ceux obtenus lorsque les analyses sont effectuées sur l’ensemble des données. Les résultats indiquent que le pourcentage de bonnes réponses varie selon le groupe d’âge, F (2, 47) = 3.312, p = .045, η2 = .124, les 50-59 ans étant meilleurs que les 60-69 ans et les 70-79 ans. Le pourcentage de bonnes réponses varie aussi selon le type de stimulus, F (1, 47) = 29.245, p < .001, η2 = .384, la performance étant meilleure lorsque le stimulus est le mot « papier ». Le pourcentage de bonnes réponses varie également selon l’émotion, F (4.228, 198.733) = 4.048, p = .003, η2 = .079, la colère et la neutralité étant les émotions les mieux reconnues. Les résultats quant aux interactions sont identiques à ceux obtenus pour l’ensemble des données ; seule l’interaction entre le type de stimulus et l’émotion est significative, F (3.882, 182.467) = 5.418, p < .001, η2 = .103. Les émotions les mieux reconnues avec le mot « papier» sont les mêmes que pour l’ensemble des données. Lorsque le stimulus est un mot, la peur et la tristesse sont moins bien reconnues que la joie (respectivement p = .002 et p < .001), la colère (p < .001 dans les deux cas) et la neutralité (p < .001 dans les deux cas). La colère est la seule émotion mieux reconnue que le dégoût (p = .022). Lorsque le stimulus est une interjection, il n’y a aucune différence significative entre les émotions (p > .05). Enfin, l’interaction entre le groupe d’âge, le type de stimulus et l’émotion est significative, F (7.765, 88) = 2.295, p = .024, η2 = .089. Le patron observé suit celui présenté jusqu’ici, sauf que les 60-69 ans et les 70-79 ans n’ont pas obtenu un pourcentage de bonnes réponses significativement plus faible pour le dégoût (p > .05) lorsque le stimulus est un mot. Les 70-79 ans ont, par contre, obtenu des pourcentages de bonnes réponses plus faibles pour la colère que pour la tristesse (p = .011), le dégoût (p = .022) et la neutralité (p = .033) lorsque le stimulus était une interjection.

L’ANOVA Sexe de l’acteur x Sexe du participant indique un effet du sexe de l’acteur, F (1, 48) = 120.821, p < .001 η2 = .716, mais pas du sexe du participant F (1, 48) = 2.412, p = .127 η2 = .048. Le pourcentage de bonnes réponses est significativement plus grand lorsque la voix de l’acteur prononçant le stimulus est celle d’une femme (p < .001). De plus, l’interaction entre ces deux facteurs n’est pas significative F (1, 48) = .731, p = .397, η2 = .015.

Le Tableau 1 présente les pourcentages de bonnes réponses obtenus par les participants (stratifiés selon l’âge : 50-59, 60-69 et 70 à 80) selon le type de stimulus et l’émotion associée. Dans l’ensemble, 40 des 195 stimuli (joie : 8, colère : 14, peur : 2, tristesse : 1, dégoût : 4, neutralité : 11) ont été correctement reconnus par au moins 80 pour cent des participants; 29 stimuli (joie : 3, colère : 5, peur : 5, tristesse : 5, dégoût : 3, neutralité : 8) ont été reconnus par 70 à 79% des participants ; et 44 stimuli (joie : 4, colère : 3, peur : 12, tristesse : 10, dégoût : 4, neutralité : 11) ont été reconnus par 60 à 69 pour cent des participants. Le Tableau 2 présente les pourcentages moyens de bonnes réponses obtenus par les participants selon le groupe d’âge, le type de stimulus et l’émotion.

Tableau 1: Pourcentages moyens de bonnes réponses pour chaque stimulus prosodique

* Extraits correctement reconnus par au moins 80% des participants.

Tableau 2: Pourcentage moyen de bonnes réponses selon le groupe d’âge, le type de stimulus et l’émotion.

Une ANOVA Groupe d’âge x Émotion x Type de Stimulus a été appliquée également pour comparer les temps de réponse des participants. Les résultats indiquent que le temps pris par les participants pour sélectionner leur réponse ne variait pas selon leur groupe d’âge, F (2, 47) = .324, p = .725, η2 = .014, mais selon le type de stimulus, F (1, 47) = 7.968, p = .007, η2 = .145, le temps de réaction étant plus court pour les stimuli « papier » que « ah ». Le temps de réponse variait aussi selon l’émotion, F (4.179, 196.435) = 15.528, p < .001, η2 = .248, les temps de réaction les plus courts correspondant à la colère et la neutralité. L’interaction entre l’émotion et le groupe d’âge n’est pas significative, F (8.359, 88) = 1.033, p = .414, η2 = .042. L’interaction entre le type de stimulus et le groupe d’âge est significative, F (2, 47) = 3.353, p = .044, η2 = .125, révélant que les 50-59 ont répondu plus rapidement lorsque le stimulus était un mot que lorsqu’il s’agissait d’une interjection (p = .001). L’interaction entre le type de stimulus et l’émotion est également significative, F (3.772, 177,275) = 20.034, p < .001, η2 = .299. Les analyses d’effets simples indiquent que, pour les stimuli évoquant la joie (p = .002) et la neutralité (p < .001), le temps de réponse était plus court quand le stimulus était un mot. Le phénomène inverse s’est produit pour les stimuli évoquant le dégoût (p < .001). De plus, parmi les stimuli utilisant le mot « papier », le temps de réponse était plus long pour les extraits de dégoût que pour toutes les autres émotions (p < .001). À l’inverse, le temps de réponse pour la neutralité était plus court que pour les autres émotions (p < .001), sauf la colère (p = .087). Le temps de réponse pour les stimuli évoquant la colère était quant à lui plus court que celui pour la peur (p = .002). Lorsque le stimulus était un mot, le temps de réponse pour la tristesse était plus long que celui des autres émotions (p > .05) sauf la peur (p = .143) et le dégoût, dont le temps de réponse était plus long que toutes les autres émotions (p < .001). Enfin, les temps de réponse moyens étaient similaires entre les émotions évoquées par l’interjection « ah » (p > .05), sauf pour la colère, où le temps de réponse était plus court que celui des autres émotions (p < .001). Enfin, la triple interaction entre le groupe d’âge, le type de stimulus et l’émotion n’est pas significative, F (7.544, 88) = .776, p = .617, η2 = .032.

La corrélation de Pearson réalisée entre l’âge et le pourcentage de bonnes réponses est modérée et significative, r(50) = - .378, p = .007. Ainsi, les participants plus âgés ont obtenu significativement moins de bonnes réponses que les participants plus jeunes.

Enfin, la cohérence interne est élevée pour toutes les émotions : la joie (α de Cronbach = .736), la colère (α de Cronbach = .857), la peur (α de Cronbach = .849), la tristesse (α de Cronbach = .827), le dégoût (α de Cronbach = .775) et la neutralité (α de Cronbach = .935).

Discussion

L’objectif principal de cette étude était de valider, auprès de Franco-québécois âgés de 50 à 80 ans, une banque de stimuli émotionnels prosodiques élaborée par Maurage et coll. (2007). L’objectif secondaire visait à caractériser le patron de reconnaissance des émotions chez les participants. Les résultats ont révélé que parmi les 195 stimuli, 82 ont été bien reconnus par moins de 60 pour cent des participants, 44 par 60 à 69 pour cent des participants, 29 par 70 à 79 pour cent des participants, et que 40 d’entre eux seulement ont été bien reconnus par au moins 80 pour cent des sujets. La colère et la neutralité ont été les mieux reconnues, et l’ont été le plus rapidement lorsque le stimulus était un mot, alors que la performance de reconnaissance était similaire entre les émotions exprimées avec une interjection. La performance des participants âgés de 50 à 59 ans était meilleure que celle des participants de 60 à 69 ans et de ceux de 70 à 79 ans. De plus, les participants étaient meilleurs lorsque les stimuli émotionnels prosodiques étaient énoncés par une femme. Enfin, la cohérence interne des stimuli était élevée pour toutes les émotions.

Les résultats de la présente étude indiquent que les taux de bonnes réponses diffèrent en fonction du type de stimulus («papier» vs «ah»). Il est possible de poser l’hypothèse que le nombre de syllabes contenues dans l’extrait favorise la reconnaissance de certaines émotions (Johnstone & Scherer, Reference Johnstone, Scherer, Lewis and Haviland2000). Selon celle-ci, il pourrait en effet être plus difficile de reconnaître les émotions dans un extrait contenant moins de syllabes. C’est ce qui pourrait ainsi expliquer l’absence de différence dans la reconnaissance des émotions lorsque celles-ci étaient évoquées par une interjection comparativement aux extraits présentés en utilisant le mot «papier».

Les résultats ont révélé une différence de performance entre les six émotions exprimées dans la prosodie du mot « papier ». Le dégoût était l’émotion la moins bien reconnue par les participants, ce qui concorde avec les données de plusieurs études (p. ex.: Banse & Scherer, Reference Banse and Scherer1996; Johnstone & Scherer, Reference Johnstone, Scherer, Lewis and Haviland2000). Cette émotion est généralement plus difficile à reconnaître avec un matériel auditivo-verbal qu’avec des stimuli visuels (Banse & Scherer, Reference Banse and Scherer1996). Par ailleurs, la colère exprimée dans le mot « papier » a été l’émotion la mieux reconnue, mais cette reconnaissance ne différait pas des stimuli neutres. Il est possible que les stimuli neutres aient été bien reconnus pour des raisons de distinctivité. En effet, comparativement aux autres stimuli pour lesquels le locuteur transmet un état émotionnel, les stimuli neutres se distinguent par l’absence de contenu émotionnel. Cette absence d’état pourrait ainsi amoindrir la confusion des stimuli neutres comparativement aux autres. Par ailleurs, selon Johnstone et Scherer (2000) de même que selon Banse et Scherer (1996), dans la prosodie, la colère est décodée de façon plus fiable que la peur et la joie.

Les résultats indiquent aussi un effet de l’âge, avec une performance des 50–59 ans meilleure que celle des 60–69 ans et des 70–79 ans. En fait, l’effet de l’âge a été généralisé dans cette étude et s’est manifesté dans toutes les analyses effectuées sur la variable Correction. Les participants plus jeunes ont obtenu une performance supérieure aux plus âgés peu importe le stimulus considéré. D’autres chercheurs ont obtenu des résultats similaires. Mitchell et ses collaborateurs (2011) ont constaté une vulnérabilité générale caractérisant les adultes plus âgés en ce qui concerne l’identification des émotions prosodiques. De plus, les résultats d’une méta-analyse de Ruffman et coll. (2008) ont révélé un effet de l’âge sur la reconnaissance des émotions dans la prosodie. La reconnaissance de certaines émotions, soit la colère, la tristesse et la joie, serait affectée par vieillissement (Ruffman et al., Reference Ruffman, Henry, Livingstone and Phillips2008).

L’analyse effectuée séparément sur les stimuli pour lesquels l’émotion a été bien reconnue par au moins 50 pour cent des participants fournit globalement les mêmes résultats que celle effectuée sur tous les stimuli. Cela tend à montrer que les effets énoncés ci-haut ne découlent pas d’un biais de certains stimuli particulièrement difficiles à reconnaître. Le résultat indiquant que le dégoût n’est pas moins bien reconnu que toutes les émotions (contrairement à ce qui ressortait de l’analyse sur toutes les données) pourrait s’expliquer par le fait que cette émotion est tellement moins bien reconnue que les autres que très peu de stimuli exprimant le dégoût (n = 16) ont été conservés dans l’analyse limitée aux stimuli ayant un pourcentage de bonnes réponses de 50 pour cent et plus.

L’analyse des temps de réponse a permis de constater que l’émotion de colère et les stimuli neutres étaient les mieux reconnus et étaient aussi ceux reconnus le plus rapidement. De même, les émotions les moins bien reconnues sont aussi celles qui ont nécessité les temps de réponse les plus longs. Cela suggère que les émotions les moins bien reconnues ont nécessité une analyse décisionnelle plus longue chez les participants, et ce, peu importe leur âge. Par ailleurs, les temps de réponse étaient plus courts lorsque le stimulus était un mot, ce qui suggère que des indices émotionnels plus clairs sont véhiculés par les mots comparativement aux interjections.

Dans le cadre d’une tâche utilisant des stimuli prosodiques émotionnels et des mots cibles, Schirmer, Kotz et Friederici (2005) ont constaté un traitement plus lent des stimuli prosodiques émotionnels chez les hommes. Les résultats de la présente étude ne confirment pas ce constat, mais montrent néanmoins que la performance des hommes est moins bonne que celle des femmes lorsque les stimuli émotionnels prosodiques étaient prononcés par des hommes. Le résultat de cette étude et ceux de Schirmer et coll. (2005) suggèrent que la reconnaissance des émotions véhiculées par des stimuli prosodiques est modulée par le sexe du locuteur et de l’interlocuteur.

Les résultats indiquent que les sujets Franco-québécois âgés reconnaissent moins de stimuli (40 stimuli) de la banque de Maurage et al (2007) que les jeunes adultes belges (195 stimuli). Cette différence pourrait être expliquée par le fait que le mode de réponse proposé était catégoriel (choix parmi six réponses) dans la présente étude, alors que dans le cadre de l’étude de Maurage et coll. (2007), les participants devaient répondre à la question suivante : « Est-ce que cette émotion est exprimée dans ce son ? » à partir d’une échelle de Likert allant de 0 à 8, soit de « pas du tout » à « totalement ». Une réponse correcte correspondait au fait que l’émotion cible était associée à un score plus élevé sur l’échelle de Likert en comparaison avec les autres émotions. Dans une recherche future, il pourrait être pertinent de confirmer que la procédure adoptée dans l’étude actuelle fait en sorte qu’il est effectivement plus difficile de reconnaître les stimuli prosodiques que dans la procédure utilisée par Maurage et coll. (2007). Malgré des taux de reconnaissance correcte relativement faibles, la cohérence interne des items demeure bonne quand elle est examinée séparément pour chaque émotion. L’homogénéité des stimuli est donc bonne pour chaque émotion. Ces données suggèrent que les stimuli prosodiques utilisés mesurent bien ce qu’ils sont supposés mesurer.

Les résultats de cette étude contribuent à caractériser la reconnaissance des émotions véhiculées par des stimuli prosodiques chez les Franco-québécois âgés de 50 à 80 ans. Ils permettront ainsi de faciliter la sélection des stimuli dans les études destinées à évaluer la reconnaissance émotionnelle auprès de populations âgées normales ou pathologiques (ex. : dans les démences). Par ailleurs, la validation de la banque de stimuli prosodiques de Maurage et coll. (2007) auprès d’une population Franco-québécoise permet son utilisation, dans la forme décrite dans l’étude actuelle, à plus grande échelle dans la communauté francophone.

La principale limite de cette étude est l’utilisation d’une échelle catégorielle restreignant les possibilités de comparaison entre les résultats obtenus et ceux de Maurage et coll. (2007). De plus, un échantillon de plus grande taille aurait accru la validité externe de l’étude. Les différences dans les résultats de la présente étude comparativement à celle de Maurage et coll. (2007) pourraient s’expliquer par le petit nombre de participants.

Il existe également quelques limites méthodologiques. Les touches réponse étaient identiques pour tous les participants et aucun contrebalancement n’a été effectué. Considérant l’hypothèse de spécialisation hémisphérique pour le traitement émotionnel (Borod, Andelman, Obler, Tweedy & Welkowitz, Reference Borod, Andelman, Obler, Tweedy and Welkowitz1992), il est possible que le pourcentage de bonnes réponses de certains participants ait été affecté par cette absence de contrebalancement. De plus, puisque les participants devaient absolument répondre à chaque essai, il est possible qu’un biais de réponse ait contaminé les résultats. En effet, certains participants pourraient avoir sélectionné la même émotion à chaque fois qu’ils doutaient de leur réponse. Pour pallier ce biais, il aurait été pertinent d’utiliser une seconde échelle demandant aux participants leur degré de confiance envers leur réponse.

Pour les études futures, il serait intéressant de valider la banque de stimuli auprès de Franco-québécois plus jeunes ou auprès d’individus provenant d’autres cultures francophones pour mieux explorer l’effet de l’âge et de la culture sur la reconnaissance des émotions. De plus, afin de vérifier si la longueur des stimuli (en syllabes) favorise la reconnaissance des émotions, il faudrait avoir une tâche dans laquelle la longueur de ceux-ci est contrôlée. Aussi, le fait de valider la banque auprès de cultures non-francophones permettrait d’isoler l’effet de la culture et ainsi de tester l’universalité de la banque. Il serait également intéressant de valider la banque de stimuli auprès de plus grands échantillons, ce qui permettrait d’accroître la généralisation des résultats et de possiblement examiner l’effet d’autres facteurs, tels le sexe ou le niveau de scolarité sur la reconnaissance de stimuli prosodiques.

Footnotes

*

Les quatre premiers auteurs ont contribué également à cet article.

References

Références

Adolphs, R., Damasio, H., & Tranel, D. (2002). Neural systems for recognition of emotional prosody: A 3-D lesion study. Emotion, 2(1), 2351. doi: 10.1037//1528-3542.2.1.23.Google Scholar
Banse, R., & Scherer, K. R. (1996). Acoustic profiles in vocal emotion expression. Journal of Personality and Social Psychology, 70(3), 614636. doi: 10.1037/0022-3514.70.3.614.CrossRefGoogle ScholarPubMed
Bänziger, T., Grandjean, D., & Scherer, K. R. (2009). Emotion recognition from expressions in face, voice, and body: The Multimodal Emotion Recognition Test (MERT). Emotion, 9(5), 691704. doi: 10.1037/a0017088.Google Scholar
Biehl, M., Matsumoto, D., Ekman, P., Hearn, V., Heider, K., Kudoh, T., et al. (1997). Matsumoto and Ekman’s Japanese and Caucasian facial expressions of emotion (JACFEE): Reliability data and cross-national differences. Journal of Nonverbal Behavior, 21(1), 321. doi: 10.1023/A:1024902500935.CrossRefGoogle Scholar
Bonin, P., Peereman, R., Malardier, N., Méot, A., & Chalard, M. (2003). A new set of 299 pictures for psycholinguistic studies: French norms for name agreement, image agreement, conceptual familiarity, visual complexity, image variability, age of acquisition, and naming latencies. Behavior Research Methods, Instruments & Computers, 35(1), 158167. doi: 10.3758/BF03195507.Google Scholar
Borod, J. C., Andelman, F., Obler, L. K., Tweedy, J. R., & Welkowitz, J. (1992). Right hemisphere specialization for the identification of emotional words and sentences: Evidence from stroke patients. Neuropsychologia, 30(9), 827844. doi: 10.1016/0028-3932(92)90086-2.CrossRefGoogle ScholarPubMed
Bradley, M. M., & Lang, P. J. (1999). Affective Norms for English words (ANEW): Instruction manual and affective ratings. Technical Report C-1, The Center for Research in Psychophysiology, University of Florida.Google Scholar
Ekman, P. (1992a). Are there basic emotions? Psychological Review, 99(3), 550553.CrossRefGoogle ScholarPubMed
Ekman, P. (1992b). An argument for basic emotions. Cognition and Emotion, 6(3/4), 169200.CrossRefGoogle Scholar
Ekman, P. (1999). Basic emotions. In Dalgleish, T. & Power, T. (Eds.) The handbook of cognition and emotion (pp. 4560). Sussex, UK: John Wiley & Sons, Ltd.CrossRefGoogle Scholar
Ekman, P. & Friesen, W. V. (1971). Constants across cultures in the face and emotion. Journal of Personality and Social Psychology, 17(2), 124129. doi: 10.1037/h0030377.CrossRefGoogle ScholarPubMed
Erickson, K., & Schulkin, J. (2003). Facial expressions of emotion: A cognitive neuroscience perspective. Brain and Cognition, 52(1), 5260. doi: 10.1016/S0278-2626(03)00008-3.CrossRefGoogle ScholarPubMed
Folstein, M. F., Folstein, S. E., & McHugh, P. R. (1975). Mini-mental state. A practical method for grading the cognitive state of patients for the clinician. Journal of Psychiatric Research, 12(3), 189198. doi: 10.1016/0022-3956(75)90026-6.Google Scholar
Johnstone, T., & Scherer, K. R. (2000). Vocal communication of emotion. In Lewis, M. & Haviland, J. (Eds.), The handbook of emotion, 2nd ed. (pp. 220235). New York: Guilford.Google Scholar
Juslin, P. N., & Laukka, P. (2003). Communication of emotions in vocal expression and music performance: Different channels, same code? Psychological Bulletin, 129(5), 770814. doi: 10.1037/0033-2909.129.5.770.CrossRefGoogle ScholarPubMed
Lang, P. J., Bradley, M. M., & Cuthbert, B. N. (1997). International Affective Picture System (IAPS): Technical Manual and Affective Ratings. NIMH Center for the Study of Emotion and Attention.Google Scholar
Larousse, P. (2012). Émotion. In Legrain, D. M. & Garnier, Y. (Eds.), Le Petit Larousse Illustré. Paris: Author.Google Scholar
Maurage, P., Joassin, F., Philippot, P., & Campanella, S. (2007). A validated battery of vocal emotional expressions. Neuropsychological Trends, 2, 6374.Google Scholar
Mitchell, R. L. C., Kingston, R. A., & Barbosa Bouças, S. L. (2011). The specificity of age-related decline in interpretation of emotion cues from prosody. Psychology and aging, 26(2), 406414. doi: 10.1037/a0021861.Google Scholar
Peretz, I., Gagnon, L., & Bouchard, B. (1998). Music and emotion: Perceptual determinants, immediacy, and isolation after brain damage. Cognition, 68(2), 111141. doi: 10.1016/S0010-0277(98)00043-2.CrossRefGoogle ScholarPubMed
Rankin, K. P., Kramer, J. H., & Miller, B. L. (2005). Patterns of cognitive and emotional empathy in frontotemporal lobar degeneration. Cognitive and Behavioral Neurology, 18(1), 2836.Google Scholar
Ruffman, T., Henry, J. D., Livingstone, V., & Phillips, L. H. (2008). A meta-analytic review of emotion recognition and aging: Implications for neuropsychological models of aging. Neuroscience and Biobehavioral Reviews, 32(4), 863881. doi: 10.1016/j.neubiorev.2008.01.001.Google Scholar
Scherer, K. R., Banse, R., Wallbott, H. G., & Goldbeck, T. (1991). Vocal cues in emotion encoding and decoding. Motivation and Emotion, 15(2), 123148. doi: 10.1007/BF00995674.Google Scholar
Scherer, K. R., Banse, R., & Wallbott, H. G. (2001). Emotion inferences from vocal expression correlate across languages and cultures. Journal of Cross-Cultural Psychology, 32(1), 7692. doi: 10.1177/0022022101032001009.CrossRefGoogle Scholar
Schirmer, A., Kotz, S. A., & Friederici, A. D. (2005). On the role of attention for the processing of emotions in speech: Sex differences revisited. Cognitive Brain Research, 24, 442452.Google Scholar
Simon, D., Craig, K. D., Gosselin, F., Belin, P., & Rainville, P. (2008). Recognition and discrimination of prototypical dynamic expressions of pain and emotions. Pain, 135(1–2), 5564.Google Scholar
Thompson, W. F., Schellenberg, E. G., & Husain, G. (2004). Decoding speech prosody: Do music lessons help? Emotion, 4(1), 4664. doi: 10.1037/1528-3542.4.1.46.CrossRefGoogle ScholarPubMed
Weathers, M. D., Frank, E. M., & Spell, L. A. (2002). Differences in the communication of affect: Members of the same race versus members of a different race. Journal of Black Psychology, 28(1), 6677. doi: 10.1177/0095798402028001005.CrossRefGoogle Scholar
Yesavage, J. A., Brink, T. L., Rose, T. L., Lum, O., Huang, V., Adey, M., et al. (1983). Development and validation of a geriatric depression screening scale: A preliminary report. Journal of Psychiatric Research, 17, 3749.Google Scholar
Figure 0

Tableau 1: Pourcentages moyens de bonnes réponses pour chaque stimulus prosodique

Figure 1

Tableau 2: Pourcentage moyen de bonnes réponses selon le groupe d’âge, le type de stimulus et l’émotion.