1. INTRODUCTIONFootnote 1
Quel que soit leur modèle théorique de référence, tous les linguistes admettront aujourd'hui qu'il est impossible de supposer qu'une langue L donnée est générée, à une époque donnée, par un seul système de règles constant d'un locuteur à l'autre et/ou d'un discours à l'autre. Notion centrale de la sociolinguistique intronisée aux Etats-Unis par Labov au tournant des années soixante-dix (cf. Labov, Reference Labov1969, Reference Labov1972), le concept de variation a pénétré aujourd'hui la syntaxe générative (cf. Poletto, Reference Poletto2000, Vinet, Reference Vinet2001, Obenauer, Reference Obenauer, Lohnstein and Trissler2004, par exemple) ainsi que la didactique du français L2 (Valdman, Reference Valdman2000) et L1, comme l'atteste la présentation des phrases interrogatives dans un ouvrage récent destiné aux écoliers francophones de 8–9 ans:
(1) “Une phrase interrogative sert à poser une question.
Est-ce que tu sais jouer au Belvédère ? – Sais-tu jouer au
Belvédère ? – Tu sais jouer au Belvédère ? (. . .)”
[Mitterrand, Reference Mitterrand2008: 13; typographie de l'auteur]
Un débat reste cependant ouvert concernant la notion même de variation, sa typologie, et la meilleure façon de l'intégrer formellement aux descriptions linguistiques. Ainsi les questions soulevées par Gadet (Reference Gadet1996) et Hornsby (1998) méritent toujours qu'on y réfléchisse. Après avoir rappelé les différents axes sur lesquels peut se repérer une variation: diachronique (temps), diatopique (aire géographique), diastratique (groupe social), diaphasique (style ou situation), diamésique (oral/écrit), Gadet (Reference Gadet1996) souligne notamment la difficulté à distinguer l'une de l'autre les dimensions diastratique et diaphasique, difficulté illustrée en linguistique française par l'emploi alterné des deux termes familier et populaire en référence aux mêmes formes que l'un caractérise par la situation d’énonciation (situation familière > variation diaphasique) et l'autre par l'appartenance sociale du locuteur (classe populaire > variation diastratique). Hornsby (1998) rappelle les termes de la confrontation, existant depuis les années soixante-dix, entre deux théories divergentes de la variation: le modèle quantitatif impulsé par Labov (Reference Labov1969, Reference Labov1972), qui pose que la variation est inhérente à toute grammaire et que toute grammaire est hétérogène, et le modèle dynamique, typiquement représenté par Bickerton (Reference Bickerton1971, Reference Bickerton1973) et DeCamp (Reference DeCamp1971), mais par ailleurs en phase avec la vision chomskyenne qui suppose la cohérence (“l'homogénéité”) fondamentale de toute grammaire et cherche donc à dériver la variation de l'existence de grammaires ou sous-grammaires distinctes (lectes selon DeCamp et Bickerton) caractérisées chacune par les valeurs corrélées d'une série de variables (de paramètres, selon Chomsky, Reference Chomsky1981).
Je me propose ici de plaider la cause d'un modèle diglossique de description du français, qui ne prétend pas se substituer aux modèles de variation disponibles ou envisageables, mais aspire plutôt à les compléter et à en permettre une certaine simplification.Footnote 2 Je tenterai de montrer que le terme diglossie, tel que l'a classiquement défini FergusonFootnote 3 (Reference Ferguson1959) (cf. (2), complété par (3)), s'applique à la situation actuelle du français:
(2) ‘DIGLOSSIA is a relatively stable language situation in which, in addition to the primary dialects of the language [. . .] there is a very divergent, highly codified [. . .] superposed variety, the vehicle of a large and respected body of written literature [. . .], which is learned largely by formal education and is used for most written and formal spoken purposes but is not used by any sector of the community for ordinary conversation’ (Ferguson, Reference Ferguson1959: 336).
(3) Diglossia (diglossic). A term used in sociolinguistics to refer to a situation where two very different varieties of a language co-occur throughout a speech community, each with a distinct range of social function. Both varieties are standardised to some degree, are felt to be alternatives by native-speakers and usually have special names. Sociolinguists usually talk in terms of a high (H) variety and a low (L) variety, corresponding broadly to a difference in formality: the high variety is learned in school, tends to be used in church, on radio programmes, in serious literature, etc., and as a consequence it has greater social prestige; the low variety in family conversations, and other relatively informal settings. Diglossic situations may be found in Greek (High: Katharevousa; Low: Dhimotiki), Arabic (High: classical; Low: colloquial), and some varieties of German (H: Hochdeutsch; L: Schweizerdeutsch, in Switzerland) [. . .] (Crystal, Reference Crystal1991: 104).
En bref, l'hypothèse défendue ici reviendra à établir un parallèle entre la situation actuelle du français et celles de l'allemand, et surtout de l'arabe, mentionnées dans les textes de référence comme illustrations du schéma diglossique. La diglossie définie en (2) et (3) implique crucialement une opposition bipolaire entre une grammaire normée et standardisée, étiquetée ‘haute’ (anglais H(igh)), et associée à certaines situations dites formelles, et une grammaire ‘basse’ (anglais L(ow)), portant des noms variables d'une langue à l'autre, associée à des situations dites informelles.Footnote 4 Comme l'atteste la formulation de Ferguson (the primary dialects, au pluriel), la situation diglossique n'exclut pas a prori la variation, quoique celle-ci ne justifie sans doute pas le même traitement pour les grammaires H et L (j'y reviendrai). Dans l'optique développée ici, la principale différence entre la situation du français et celles de l'allemand et de l'arabe se réduit au fait que le français hexagonal commun tend à ne pas se considérer lui-même comme une variété régionale de français (contrairement aux français de Bretagne, de Picardie, de Belgique, de Suisse, du Québec, etc.). Je tenterai de montrer que la dichotomie introduite par le modèle diglossique est souhaitable d'un point de vue théorique, méthodologique et didactique, qu'il n'est pas incompatible avec une conception aménagée de la notion de variation, et que l'articulation des deux concepts de diglossie, et de variation, peut conduire à certaines clarifications utiles.
Je commencerai (section 2) par montrer que la situation actuelle du français, toutes zones confondues, vérifie les propriétés retenues par Ferguson (Reference Ferguson1959) comme caractéristiques de la diglossie. J'introduirai ensuite (section 3) le modèle diglossique que je propose, en montrant comment il prédit les propriétés discutées dans la section 2, et j'en examinerai quelques implications pour l’étude de la variation et pour la didactique du français. Je consacrerai ensuite une section séparée (section 4) aux implications du schéma diglossique pour la méthodologie de la description linguistique. La section 5 récapitulera mes principales hypothèses et conclusions.
2. LA DIGLOSSIE FRANCOPHONE
En passant en revue les ingrédients de la définition de Ferguson (2) légèrement remaniée par Crystal (3), je montrerai que la notion de diglossie identifiée par ces auteurs est illustrée par la situation actuelle du français. J’épouserai généralement, dans mes formulations, la conception générativiste de la relation grammaire-langue (Chomsky passim), selon laquelle toute langue L (ensemble infini d’énoncés reconnus comme “du L”) est générée par un algorithme fini nommé grammaire de L.
2.1. Standardisation
La définition (2) oppose une variété standardisée (a highly codified variety) d'une langue L, à une pluralité de “variétés dialectales” (the primary dialects of the language). La standardisation implique l'identification conventionnelle d'une grammaire à finalité centralisatrice – une grammaire standard (GS), fixée par des dictionnaires, traités et manuels. La notion de grammaire standardisée est typiquement illustrée par l'arabe dit standard, grammaire de référence internationale pour les arabophones. Une situation analogue est illustrée par la grammaire du français standard hexagonal,Footnote 5 dont les règles, fixées par des décisions institutionnelles (Académie française, Conseil Supérieur de la Langue Française) et véhiculées par des manuels et dictionnaires, incarnent à la fois la norme pour l'Hegaxone et la norme internationale pour la Francophonie (cf. Valdman, Reference Valdman2000).
La définition (3) semble s’écarter de (2) en stipulant que les deux variétés, haute (H) et basse (L), distinguées dans la situation diglossique, présentent l'une et l'autre un certain degré de standardisation (both (. . .) are standardised to some degree). Cette remarque ne s'applique cependant pas à égalité aux trois situations diglossiques citées par Crystal: en remplaçant officiellement la katharévousa en 1975, le grec démotique est devenu la grammaire standard du grec moderne; le suisse allemand et l'arabe dialectal, en revanche, bien que clairement perçus par leurs locuteurs comme des variétés spécifiques de l'allemand et de l'arabe, ne sont pas standardisés au même titre que les grammaires normées officielles, le Hochdeutsch et l'arabe standard, toujours exclusivement utilisées, par exemple, dans les écrits scientifiques. Ce que semblent donc indiquer les exemples choisis par Crystal, c'est qu'une situation de diglossie n'est pas, diachroniquement, figée, et qu'une variété dialectale (L) peut, dans certaines conditions externes, accéder à une reconnaissance officielle et donc, au statut H (c'est le cas du grec démotique aujourd'hui), allant de pair avec une “standardisation”.
La reconnaissance d'une grammaire standard a pour contrepartie l'identification de certaines formes comme non standard, c'est-à-dire comme mal formées au regard de GS. Ce type de jugement d'acceptabilité est fourni de façon parfaitement objective par la norme externe de la grammaire standard. Ainsi, les questions directe (4a) et indirecte (4b) sont mal formées au regard de la GS du français; mais puisqu'elles sont produites par divers francophones, c'est qu'elles sont générées par une (ou des) grammaire(s) distincte(s) de GS que j'appelle dialectale(s),Footnote 6 en étendant au français la terminologie admise pour l'arabe:
- (4)
a. Où que tu vas ?
b. Marie m'a demandé où ((est-)ce) que tu vas.
Le tableau (5) illustre quelques-unes des nombreuses propriétés phonologiques, morphologiques, syntaxiques et lexicales qu'on peut identifier comme distinguant les grammaires dialectales de la grammaire standard, puisqu'elles s'observent couramment dans des corpus attestés sans toutefois être validées par GS:
(5) Grammaire standard vs. grammaires dialectales (échantillon)Footnote 7


2.2. Situations de communication
La définition (2) corrèle la distinction diglossique à différentes situations d'utilisation du langage. L'activation de GS, qui implique de la part du locuteur une vérification de la conformité du discours qu'il produit à la norme standard, est socialement attendue dans divers types d'activités passant souvent, quoique pas nécessairement,Footnote 9 par l’écriture: lettres professionnelles, articles et ouvrages scientifiques, techniques ou journalistiques, sermons, discours politiques, conférences, scripts d’émissions radiophoniques ou télévisuelles à caractère politique, culturel ou documentaire, etc., toutes situations couramment qualifiées de formelles. Une grammaire dialectaleFootnote 10 est, en revanche, activée dans toute situation où le locuteur ne cherche pas à se conformer à la norme – soit parce qu'il est, pour une raison ou une autre, incapable de le faire (trop jeune et/ou trop peu éduqué), soit parce qu'il se sent autorisé à ne pas le faire par la nature non protocolaire (informelle) de la situation communicative (typiquement: conversation privée, cf. ordinary conversation [Ferguson], voir note 4).
Ces corrélations entre grammaires (GS/GD) et situations de communication (formelles/informelles) sont bien vérifiées dans l'aire francophone: l'activation de GS est attendue chez les adultes en situation formelle, et celle de GD chez les enfants trop jeunes pour maîtriser GS, les enfants de tous âges communiquant entre eux (type d’échange exempté de formalité), et les adultes en situation “informelle”.Footnote 11
2.3. Prestige
La situation diglossique définie en (2) et (3) est caractérisée par une relation hiérarchique entre les grammaires standard (H) et dialectale(s) (L). La grammaire standard doit son prestige au respect inspiré par la littérature écrite qu'elle sous-tend (Ferguson), et aux institutions par lesquelles elle est propagée (école, université, églises, administration, médias) (Crystal). Le faible prestige des grammaires dialectales est, parallèlement, corrélé à leur non validation par les canaux officiels du pouvoir. Le critère du prestige invite, comme celui de la standardisation, à distinguer les uns des autres les trois exemples de situations diglossiques cités par Crystal: le grec démotique a acquis pleinement le statut de variété standard (H) dès lors qu'il a officiellement remplacé la katharévousa en 1975 comme langue officielle de la Grèce moderne; en revanche, le Schweizerdeutsch et l'arabe dialectal sont des variétés L de l'allemand et de l'arabe, ayant pour contreparties H l'arabe standard et le Hochdeutsch.
Les grammaires standard et dialectales du français sont unies par la relation hiérarchique retenue en (2) et (3) comme caractéristique de la situation diglossique. La grammaire standard doit son prestige à la tradition littéraire dont elle émane, à l'institution scolaire qui la transmet, aux canaux du pouvoir qui la propagent. Les traits dialectaux –non validés par la grammaire standard, comme ceux illustrés en (5), colonne 5 – sont épinglés comme “fautifs” par l’école (Leeman-Bouix Reference Leeman-Bouix1994) et suscitent des jugements diaphasiques ou diastratiques de type L (“relâché”, “familier”, “populaire”).
2.4. Acquisition
Les grammaires H et L unies par la relation diglossique sont distinguées par leur mode d'acquisition: selon les définitions (2) et (3), la grammaire standard (H) est crucialement apprise à l’école (learned largely by formal education: Ferguson; learned in school: Crystal). Les grammaires L sont en revanche intériorisées par le processus naturel d'acquisition du langage, caractéristique de l'espèce humaine et opérant sans guidance externe. A cette propriété peut être relié le fait, souligné par Kwary (n.d.), qu'en situation diglossique, c'est typiquement la grammaire L qui est activée par les enfants parlant entre eux. Concernant la grammaire standard, il convient par ailleurs de distinguer (ce que ne font pas Ferguson et Crystal) l'acquisition des compétences passive et active: dans le cas de l'arabe, par exemple, on peut supposer que tous les arabophones d'aujourd'hui qui ont accès aux médias ont naturellement acquis par cette voie une compétence passive de l'arabe standard leur permettant de comprendre les chansons, films, émissions documentaires ou discours politiques générés par cette grammaire. L’école n'intervient que dans la transmission de la compétence active, celle qui permet aux locuteurs d'utiliser eux-mêmes créativement la grammaire standard comme outil d'expression oral ou écrit, les rendant ainsi activement diglosses. Si l’école ne parvient pas à rendre tous les élèves activement diglosses, la diglossie active reste un indicateur socialement sélectif (connotation “diastratique”).
Ces distinctions concernant les processus d'acquisition sont parfaitement illustrées dans la Francophonie d'aujourd'hui. L'acquisition préscolaire du français implique les seules grammaires dialectales, celles qui génèrent notamment les formes de (4) et (5). Les membres de la communauté francophone acquièrent tous, indépendamment de l’école, une compétence passive de GS (des deux GS, régionale et internationale, en ce qui concerne les Québécois), transmise par les médias. L'accession à la diglossie active suppose en revanche un travail d'apprentissage contrôlé portant sur GS, et dont l’école devrait être le principal agent.Footnote 12
2.5. Variation
Bien qu'elle ne soit pas mentionnée dans les définitions (2) et (3), la notion de variation n'est pas incompatible avec la situation diglossique telle qu'elle est caractérisée plus haut. Le caractère institutionnel de GS, et sa fonction centralisatrice, contrastant avec le caractère non institutionnel de GD, laissent toutefois attendre une variation plus limitée dans un cas que dans l'autre. Ainsi peut-on opposer l'unité du grec démotique (standard moderne) à la diversité des grecs régionaux (cappadocien, crétois, chypriote, etc.), l'unité de l'allemand standard à la diversité des allemands dialectaux (suisse allemand, luxembourgeois, alsacien, bavarois, berlinois, saxois, etc.), l'unité de l'arabe standard à la diversité des arabes dialectaux (syro-libanais, égyptien, marocain, algérien, etc.). On peut de même opposer l'unité du français standard hexagonal (grammaire de référence pour toute la Francophonie) à la diversité des français régionaux (cf. Baronian et Martineau (dir.), Reference Baronian and Martineau2008). Ces contrastes sont corrélés au fait que ce sont les grammaires dialectales, activées en situation informelle, qui sont frappées par les réaménagements constituant le changement linguistique.
La variation n'est toutefois pas incompatible avec la notion de grammaire standard. D'une part, en effet, une norme peut être fixée de façon externe pour une aire géographique limitée – cas bien illustré par les deux grammaires standard, régionale (français standard québécois) et internationale (français standard hexagonal), de la francophonie canadienne (cf. Valdman, Reference Valdman2000). D'autre part, une même grammaire peut générer plusieurs formes ayant des fonctions communicatives analogues – ainsi, les questions partielles en est-ce que (6a) et à enclitique (6b), ou les coordinations avec (7a) et sans (7b) répétition du clitique sujet (cf. Miller, Reference Miller1991; Godard, Reference Godard1992), sont toutes générées par la grammaire du français standard:
- (6)
a. Est-ce que le train est parti ?
b. Le train est-il parti ?
- (7)
a. Je vois Marie et j’écoute Paul.
b. Je vois Marie et écoute Paul.
Les notions de diglossie et de variation doivent donc être soigneusement séparées: la diglossie est une distinction binaire entre standard et non standard, solidaire d'une norme dont la fixation est imposée aux locuteurs de façon externe; la variation veut désigner, indépendamment de toute norme, la compétition entre deux ou plusieurs formes qui sont associées à des interprétations ou à des effets communicatifs perçus comme semblables.
3. LE SCHÉMA DIGLOSSIQUE ET SES IMPLICATIONS – THÉORIQUES ET DIDACTIQUES
Dans une optique générative de la grammaire, la GS du français doit être décrite comme un algorithme qui ne produit pas les formes de la colonne 5 du tableau (5), et la GD (ou l'ensemble des GD), comme un (ou plusieurs) algorithme(s) qui les produi(sen)t. Un problème est de déterminer la relation entre ces deux algorithmes.Footnote 13 Il existe d'abord des formes, comme celles de la colonne 5 du tableau (5), qui ne sont générées que par GD, à l'exclusion de GS. Notons toutefois qu'un locuteur qui active GD (par exemple, un enfant s'adressant à un congénère) et qui produit les (ou certaines des) formes susmentionnées, produit aussi, dans les mêmes conditions informelles, des formes telles que (8), qui sont par ailleurs validées par GS:
- (8)
a. La voiture a explosé.
b. Elle ressemble à un chien.
c. Il faut les changer.
Les formes de (8) sont validées par GS, mais elles ne sont pas générées par GS dans la situation envisagée, étant donné que le jeune locuteur de (8) est ignorant de GS (cf. (2)-(3) et section 2.4). Même dans l'hypothèse où ce locuteur particulier aurait commencé son apprentissage de GS, la situation de communication informelle (allocutaire enfant) appelle a priori l'activation de sa GD. Il faut donc supposer que certaines formes générées par GD sont validées par GS. Par ailleurs, toute forme validée par GS peut par définition être générée par GS: ainsi les formes de (8), attribuées plus haut à un jeune locuteur en situation informelle, pourraient aussi être légitimement produites par un adulte en situation formelle, par exemple dans un texte écrit et révisé en vue d'une publication dans un journal sérieux. En d'autres termes, des formes comme celles de (8) peuvent être générées soit par GD, soit par GS. Il existe enfin des formes qui ne sont générées que par GS, à l'exclusion de GD: ainsi les questions à enclitique (6b), le passé simple (9a), les relatives non prépositionnelles introduites par lequel (9b), les coordinations de noms nus (9c), sont absentes du discours d'un enfant francophone (hexagonal) s'adressant à des congénères:Footnote 14
- (9)
a. On le mit dans une école privée.
b. C'est pour la nouvelle directrice, laquelle est en vacances.
c. Dans cette classe, garçons et filles sont intelligents.Footnote 15
Fondé sur l'articulation de la notion de grammaire interne (générative) et de la dichotomie standard/non standard (diglossie), le raisonnement qui précède conduit donc à supposer que la compétence linguistique d'un francophone met en jeu deux grammaires en intersection – GS et GD – ce schéma délimitant trois “zones” respectivement numérotées 1, 2 et 3:
(10) La diglossie francophone: hypothèse
L'existence de l'intersection rend crucialement compte du fait que GS et GD sont perçues comme générant la même langue: “le français”. Selon la conception générative de la grammaire (interne) adoptée ici, GS et GD sont distinctes mais non disjointes, et génèrent donc deux langues (e-languages, au sens de Chomsky, Reference Chomsky1995) – deux ensembles de formes différents, les formes de Z2 pouvant être générées soit par GS, soit par GD. Les formes générées par GS sont celles qui sont validées par la norme standard, la maîtrise active de Z1 devant faire l'objet d'un apprentissage contrôlé (section 2.4). L'activation de GD n'implique, inversement, pas de mise en conformité avec la norme standard et résulte du processus d'acquisition naturel – inconscient et extra-institutionnel. Cette distinction de GS et GD, fondée sur la standardisation externe (ou son absence) et sur la nature (contrôlée ou non) du processus d'acquisition de la compétence active, suffit à prédire les effets “diaphasiques” et “diastratiques” distingués, non sans une certaine difficulté comme le souligne Gadet (Reference Gadet1996), par la sociolinguistique. Tout effet stylistique H (“soutenu”, “châtié”) ou L (“familier”, “relâché”) peut être directement dérivé de la nature de la grammaire (GS ou GD) activée dans la situation considérée: plus un discours (oral ou écrit) contient de traits générés en Z3, plus il confirme l'activation de GD, et plus il est donc perçu comme stylistiquement (diaphasiquement) “relâché”. Tout jugement diastratique sur une production linguistique P résulte par ailleurs d'une hypothèse concernant la diglossie active du locuteur de P – sa maîtrise active de GS: plus un discours fournit de preuves que son émetteur est activement diglosse, plus ce locuteur est perçu comme “diastratiquement H” (“cultivé”, selon une terminologie des niveaux de langue), et inversement. En vertu du diagramme (10), les indicateurs les plus clairement H sont les traits produits en Z1: un locuteur (adulte) dont la performance linguistique globale inclut beaucoup de traits Z3 et aucun trait Z1 est donc identifié comme “socialement L”. La relation entre formes linguistiques et propriétés sociales est toutefois indirecte: les formes linguistiques ne sont que des indicateurs de diglossie, corrélés ensuite par inférence à des facteurs sociaux (diglossie active > éducation > groupe social H). L'analyse proposée ici conduit à reformuler l'hypothèse que Bell (Reference Bell1984) et Gadet (Reference Gadet1996) énoncent dans l'optique d'une théorie de la variation: toute variable diaphasique serait aussi, selon ces auteurs, une variable diastratique, l'inverse n’étant pas vrai. Dans l'optique du modèle diglossique proposé en (10), on peut supposer que les effets diaphasiques et diastratiques ont tous pour origine les mêmes ensembles de traits – les traits des deux zones périphériques, Z1 (effets H) et Z3 (effets L). Tous les traits Z1 et Z3 produisent des effets diaphasiques – “soutenus” (H) pour Z1, “relâchés” (L) pour Z3; mais ils n'ont de connotations sociales (diastratiques) que par les inférences qu'ils conduisent à faire sur la compétence linguistique de celui qui les émet. Ainsi, les traits Z1, qui attestent directement d'une maîtrise active de GS par leur émetteur, produisent un effet diastratique H; en revanche, les traits Z3 n'ont de connotation diastratique L que s'ils sont interprétés comme des indicateurs d'une non-maîtrise de GS (j'y reviendrai plus loin).
Le schéma diglossique proposé en (10) concerne par hypothèse l'ensemble des francophones adultes, quel que soit leur degré de maîtrise active de GS: tous les francophones (adultes) ont en effet, par hypothèse, au moins une maîtrise passive d'un ensemble de traits Z1. Dans la mesure où le diagramme (10) vise à représenter la compétence linguistique d'un locuteur particulier, la distribution des traits dans les trois zones Z1, Z2 et Z3 peut différer d'un locuteur à l'autre: un même trait peut être produit en Z2 par certains locuteurs, en Z1 par d'autres – situation couramment corrélée, par exemple, aux écarts de génération (cf. les questions à enclitique, la forme des exclamatives, voir section 4.4).
Le schéma diglossique ne s'oppose pas a priori à l'existence de phénomènes d'alternance codique (code-switching), c'est-à-dire d'activation alternée des deux grammaires internes au sein d'un même discours, comme on en observe dans les situations de bilinguisme (cf. Poplack, Reference Poplack1980). Les très intéressants exemples présentés par Blanche-Benveniste et Bilger (Reference Blanche-Benveniste and Bilger1999) pour illustrer des “changements de registre” dans les discours oraux, suggèrent en effet que le passage de “très familier” à “soutenu” correspond à un changement de grammaire (GD>GS), impliquant simultanément plusieurs traits corrélés: “Quand le locuteur s'exprime dans un registre “soutenu”, cela se manifeste (. . .) par un choix simultané de certaines formes grammaticales et lexicales, et c'est cet ensemble de formes qui produit l'effet de “langue soutenue” “(op. cit., section 3.2). Le travail d'analyse de Massot (Reference Massot2008) portant sur un discours continu semble également appuyer le schéma diglossique en montrant que les changements de grammaire (GD>GS ou inversement), caractérisés par des corrélats de propriétés, ne s'opèrent pas en deçà d'un certain domaine structural (peut-être la phrase simple).
Le schéma diglossique doit être articulé avec le traitement de la variation qui, selon l'hypothèse adoptée, doit en être distingué. En ce qui concerne GS, le diagramme (10) laisse de côté le problème de la singularité ou de la dualité/pluralité de la norme (par exemple québécoise ou internationale, pour les Québécois) – GS est traitée par convention comme singulière dans son opposition à GD. Le problème de la variation interne à chaque grammaire nous ramène à des questions qui dépassent la présente étude – typologie de la variation (phonologie ≠ syntaxe), la variation syntaxique existe-t-elle vraiment (Gadet, passim) ? Si oui, comment la traiter (cf. Bickerton, Reference Bickerton1971, Reference Bickerton1973, Coetzee, Reference Coetzee2006, Coveney, Reference Coveney1997, DeCamp, Reference DeCamp1971, Hornsby, 1998, Labov, Reference Labov1969, Reference Labov1972, etc.) ? Le schéma diglossique permet a priori de rendre compte de l'apparente irrégularité de certains traits dans la performance d'un même locuteur: ainsi des phrases négatives de même type avec et sans ne pourront-elles coexister – respectivement en Z2 et Z3 – dans la performance d'un locuteur dont la GD produit cet élément.Footnote 16 Cette situation témoigne simplement de l'instabilité inhérente à toute grammaire dialectale, ferment du changement linguistique.
Dans l'optique du diagramme (10), tous les effets H et L (tant diaphasiques que diastratiques) sont dérivables de la diglossie, non de la variation: les jugements H sont corrélés à la maîtrise active de GS (diastrasie) et à l'activation de Z1 (diaphasie), les jugements L à la non-maîtrise de GS (diastrasie) et à l'activation de Z3 (diaphasie). Ainsi, l'alternance entre questions à enclitique (Vient-il?) et en est-ce que (Est-ce qu'il vient ?) n'a pas de connotation diastratique en français commun hexagonal, puisque les deux variables considérées sont validées par GS; mais elle a une connotation diaphasique puisque l'enclise relève de Z1 et est-ce que de Z2. Symétriquement, deux formes générées par GD ont des connotations diaphasiques si elles ressortissent respectivement à Z2 et Z3: ainsi la question Qui est-ce qui vient ?, générée en Z2, c'est-à-dire validée par GS, n'a pas l'effet diaphasique L de Qui c'est qui vient ?, non validée par GS (donc produite en Z3); mais les questions Qui c'est qui vient? et C'est qui qui vient ? ne diffèrent pas dans leurs connotations diaphasiques – toutes deux étant produites en Z3. Certaines paires de formes générées en Z3 semblent toutefois – intuitivement – corrélées à des effets diastratiques différents: ainsi la question Qui c'est que c'est qui vient? sonne intuitivement “plus populaire” que Qui c'est qui vient ?. Ces intuitions peuvent être éclairées par le schéma diglossique: le locuteur de Qui c'est que c'est qui vient? est supposé ne pas être activement diglosse (> effet diastratique L), mais cette supposition n'est pas nécessairement faite à propos du locuteur de Qui c'est qui vient?. Ces suppositions différentes s'appuient sur un calcul implicite de corrélations: l’émetteur des jugements diastratiques a enregistré que ceux qui produisent Qui c'est que c'est qui vient? produisent généralement peu ou pas de traits Z1 (ils ne sont donc pas activement diglosses); mais que certains locuteurs qui produisent Qui c'est qui vient? produisent par ailleurs des traits Z1 en situation formelle (et sont donc activement diglosses). La forme de question Qui c'est qui vient? ne justifie donc pas pour lui une stigmatisation diastratique. Selon ce raisonnement, un trait Z3 repéré comme couramment produit par des locuteurs activement diglosses n'est pas socialement stigmatisant: ainsi, la troncation du [l] de il(s) devant consonne [ifojale], l'omission de ne (Il est pas là), diverses suites d'enclitiques non standard (débarrasse-moi-z-en), etc., sont perçus comme diastratiquement neutres (bien que diaphasiquement L, puisque Z3).
Le schéma diglossique a des implications didactiques qui rejoignent certaines conclusions atteintes par Valdman (Reference Valdman2000) pour l'enseignement du FLE, mais qu'on peut chercher à compléter pour l'enseignement du français L1. Sur la base des relevés statistiques de Behnsted (Reference Behnsted1973) concernant les types de questions, Valdman (Reference Valdman2000) propose de commencer l'enseignement des interrogatives par les formes à Mouvement-wh, sans et avec est-ce que: Où (est-ce que) tu vas?; d'aborder dans la deuxième phase les questions à enclitique, donnant accès aux textes; et de réserver pour la fin le survol des formes strictement dialectales, donnant aux élèves anglophones une idée du français dans sa réalité quotidienne et sa diversité régionale. Ces propositions sont parfaitement en phase avec le diagramme (10), puisque les formes associées par Valdman aux trois étapes d'apprentissage ressortissent respectivement à Z2 (zone médiane), puis Z1 et Z3 (zones périphériques): le projet didactique de Valdman revient à transmettre aux élèves non francophones d'abord (étapes 1 et 2) la maîtrise active de GS, en commençant par les formes également produites par GD (Z2), donc disponibles en toute situation (formelle et informelle), puis (étape 3) une maîtrise passive des formes Z3 (d'un intérêt culturel et sociologique). Une progression analogue, commençant crucialement par les traits Z2, pourrait être envisagée pour l'enseignement du français L1, à une importante différence près: le traitement des formes Z3, que les élèves francophones (contrairement aux élèves anglophones de Valdman) maîtrisent activement préalablement à leur entrée à l’école. Un objectif des enseignants du français L1 devrait être d'expliciter au moins les traits Z3 les plus saillants, pour amener les élèves à distinguer clairement et systématiquement GS de GD et à devenir par ce biais des diglosses actifs.
4. CONSÉQUENCES POUR LA DESCRIPTION LINGUISTIQUE
J'explorerai maintenant les conséquences du modèle diglossique pour la description des données linguistiques, en montrant que le schéma (10) permet de préciser des catégories classificatoires au contenu incertain, et invite à un meilleur contrôle des exemples forgés.
4.1. Diglossie et variation
Le schéma diglossique invite à redéfinir en les précisant les distinctions tracées par la sociolinguistique entre différents types de variation (cf. Gadet, Reference Gadet1996).
Revenons par exemple sur le système de classification utilisé par Vinet (Reference Vinet2001), distinguant le français parlé familier européen (FPFE), le français québécois (FQ), et le français populaire européen (FPE):
(II)
Les étiquettes français parlé familier européen et français populaire européen combinent chacune deux critères classificatoires: diaphasique (familier) et diatopique (européen), diastratique (populaire) et diatopique (européen); français québécois n'implique en revanche qu'un seul critère – diatopique.
L'hypothèse diglossique invite à distinguer en premier lieu les formes générées par une grammaire standard de celles qui le sont par une grammaire dialectale: les formes européennes de (11a,b,c) sont dialectales, puisqu'elles ne sont pas validées par la GS hexagonale; pour les formes québécoises de (11b,d), il reste à spécifier si elles sont validées ou non par la grammaire standard du québécois (cf. Valdman, Reference Valdman2000): si elles le sont, elles sont générées par la GSQ, sinon, par une GDQ. Cette séparation des formes standard et non standard est évidemment de première importance pour la didactique du français – les élèves doivent savoir quelles formes ils sont autorisés à produire en situation formelle. Sur ce point, la classification de Vinet demande à être complétée: telles qu'elles sont présentées en (11), les données suggèrent que tout ce qui est “québécois” est “non standard”, hypothèse en conflit avec l'existence d'une norme standard québécoise (Valdman, Reference Valdman2000).
Les connotations diaphasiques et diastratiques doivent par ailleurs pouvoir se dériver de la distinction GS/GD et de la distribution des formes dans les trois zones Z1/Z2/Z3 du diagramme (10). L'effet (diaphasique) familier est produit par tout trait généré en Z3 et l'effet (diastratique) populaire, par tout trait Z3 dont l’émission est interprétée comme un indicateur négatif de diglossie active. Selon cette analyse, si Vinet étiquette la forme (11c) (produite en Z3) comme populaire, c'est en supposant implicitement que le locuteur de (11c) a de fortes chances de ne pas être activement diglosse (ceci résultant des inférences: déficience GS > carence éducative > milieu social défavorisé). Le jugement diastratique repose donc sur une statistique implicite – l'hypothèse que la majorité des locuteurs qui produisent (11c) ont une maîtrise déficiente de GS – autrement dit ne produisent pas de traits Z1, même en situation formelle.Footnote 17
4.2. Diglossie et alternance codique
Le schéma diglossique invite à distinguer des exemples tels que (12), forgés par Ruwet (Reference Ruwet1982) et Kayne (Reference Kayne1975), d'un exemple comme (13), recueilli par Blanche-Benveniste et Bilger (Reference Blanche-Benveniste and Bilger1999):
- (12)
a. Ce foutu médecin m'a charcuté la jambe, le salaud.
(Ruwet, Reference Ruwet1982: 272)
b. Ce tyran de Staline terrorisait la Russie, le salaud.
(Ruwet, Reference Ruwet1982: 273)
c. Il a fait casser la croûte à sa famille. (Kayne, Reference Kayne1975: 225)
(13) le lac pourrait représenter une pile quoi – laquelle on charge au maximum.
[Ingénieur, cité par Blanche-Benveniste et Bilger, op. cit., section 3]
Les exemples (12) et (13) partagent la propriété de sembler mélanger des traits relevant de “registres” différents: les phrases de Ruwet combinent du lexique argotique avec une syntaxe standard; le fragment cité en (13) contient dans sa première partie un trait à connotation “très familière” (quoi), et dans sa deuxième un autre à connotation “soutenue” (laquelle). Le diagramme (10) invite toutefois à séparer les deux cas.
Du fait de leur lexique argotique, les exemples (12) doivent être générés par GD; tous leurs traits syntaxiques sont cependant validés par GS, comme le confirme l'acceptabilité standard des phrases de (14), qui ne diffèrent de leurs contreparties en (12) que par leur lexique:
- (14)
a. Ce stupide médecin m'a coupé la jambe, le monstre.
b. Ce tyran de Staline terrorisait la Russie, le fourbe.
c. Il a fait {prendre le large/faire la fête} à sa famille.
Dans l'optique du diagramme (10), ces propriétés indiquent que les phrases (12) sont générées par GD, avec tous leurs traits syntaxiques produits en Z2, et certains de leurs traits lexicaux en Z3. Il n'y a donc pas mélange de grammaires (GS/GD), mais seulement mélange de zones (Z2/Z3), les deux zones combinées participant d'une même grammaire.
L'exemple (13) implique en revanche un changement de grammaire (GD>GS) à l'endroit marqué d'un tiret: la première partie de l’énoncé est générée par GD puisqu'elle contient le connecteur quoi (non validé par GS: Z3); et la deuxième est générée par GS puisqu'elle contient le relatif laquelle généré en Z1. Cet exemple – et d'autres du même type cités par Blanche-Benveniste & Bilger (Reference Blanche-Benveniste and Bilger1999) – suggèrent donc un phénomène d'alternance codique impliquant un changement de grammaire en cours d’énoncé, comparable à l'alternance codique observée chez certains bilingues (cf. Poplack, Reference Poplack1980).
4.3. Diglossie et situation énonciative
Dans l'optique de l'hypothèse diglossique, l'acceptabilité d'une phrase ne peut pas s'apprécier sans prendre en compte les conditions de l’énonciation, et ce y compris pour un exemple forgé. Considérons par exemple la phrase (15), donnée comme acceptable par Kayne et Pollock (Reference Kayne, Pollock, Hulk and Pollock2001):
(15) Qu'ait téléphoné ton ami me surprend.
Le modèle diglossique nous oblige à déterminer, avant d’évaluer l'acceptabilité de cette phrase, par quelle grammaire (GS ou GD) elle est générée. Mais cet exemple forgé contient deux types de traits qui semblent pousser à des réponses contradictoires: d'une part le choix du tutoiement et la situation décrite (coup de téléphone d'un ami) suggèrent une situation appelant l'activation de GD (dialogue entre deux copains, un père et son fils, etc.); d'autre part, la complétive sujet non introduite par le fait, et l'ordre VS, sont des traits caractéristiques de Z1 (cette phrase n'a aucune chance d’être émise par un enfant ou un adolescent s'adressant à un congénère). La phrase (15) ne peut donc être produite que dans une situation d’énonciation très spécifique, où GS est activée en dépit de la proximité symbolique des locuteurs – par exemple, dans un échange épistolaire entre deux hauts fonctionnaires (GS) amis de longue date (tutoiement).
La phrase (16), citée comme acceptable par Obenauer (Reference Obenauer1994: 406), appelle des précisions semblables:
(16) Quelle communication veux-tu qu'il ait ratée ?
Le choix lexical du verbe (rater), et surtout le scénario évoqué par la phrase (dialogue entre deux collègues-linguistes dans les coulisses d'un colloque) suggèrent que la grammaire activée est GD. Mais cette hypothèse est contredite par la question à enclitique (veux-tu), qui relève aujourd'hui de Z1 pour un très grand nombre de francophones hexagonaux.Footnote 18 La phrase (16) ne peut donc être produite (et évaluable quant à son acceptabilité) que dans des conditions externes très précises, analogues à celles prévalant pour (15).
4.4. Diglossie et changement linguistique
Les exemples du type (17) sont étudiés par Obenauer (Reference Obenauer1994):
- (17)
a. Quand diable comprendra-t-il?
(Obenauer, Reference Obenauer1994: 300)
b. Où diable as-tu trouvé ça?
(Obenauer, Reference Obenauer1994: 300)
Ces phrases sont conçues par l'auteur comme des analogues français des questions wh- the hell de l'anglais américain:
- (18)
a. When the hell will he understand?
b. Where the hell did you find this?
Toutefois, alors que les questions de (18) sont en effet générées par une GD de l'américain moderne, l'expression diable des questions (17) n'est plus générée aujourd'hui par les GD du français – en tout cas plus par celles de l'hexagonal commun. Les questions diable sont couramment attestées dans les pièces de Molière, et sont encore mentionnées dans le Petit Robert (édition 1993):
- (19)
a. Que diable allait-il faire dans cette galère?
(Molière, Fourberies de Scapin)
b. Où diable est-il caché? (Robert, entrée diable)
Il n'est donc pas accidentel que les questions diable contiennent toujours l'enclise du pronom sujet – propriété qui, pour un francophone hexagonal de la génération 1980, relève de Z1 (voir note 18); diable se combine très peu naturellement avec la syntaxe interrogative est-ce que (20a), et pas du tout avec un sujet proclitique (20b), ou avec la syntaxe interrogative in situ (20c) – comme le note d'ailleurs Obenauer lui-même:
- (20)
a. ??Où diable est-ce qu'il est caché ?
b. *Où diable il est caché ?
c. *Il est caché où diable ?
Mais bien qu'il observe que diable ne se combine pas avec wh in situ, Obenauer ne dit pas explicitement que les questions diable et in situ sont générées par deux grammaires distinctes. Les locuteurs de l'hexagonal commun nés en 1980 ne produisent jamais de questions diable et ricanent quand on les leur soumet. L'auteur de ces lignes n'en produit pas non plus, bien qu'elles apparaissent, par la force des choses, moins archaïques aux oreilles de la génération 1950 qu’à celles des générations suivantes. En somme, les questions diable sont aujourd'hui, dans l'Hexagone, générées en Z1, si bien que beaucoup de francophones n'en ont qu'une maîtrise passive. Ce point conduit à une situation paradoxale, puisque diable est censé suggérer des conditions d’énonciation informelles, un langage familier, insolent, non contrôlé. Il n'en est pas moins vrai que, dans la pratique didactique, les questions diable doivent être enseignées en Z1, et non en Z3.
Parmi les rubriques de la syntaxe qui semblent particulièrement frappées par la variation diatopique et le changement linguistique, on peut également citer le cas des exclamatives. Bien que la syntaxe exclamative doive a priori permettre de produire des énoncés spontanés en situation informelle, on constate que les formes d'exclamatives proposées par les grammaires françaises relèvent bien souvent uniquement de Z1. Tel est le cas des exclamatives en quel citées par Jones (2003: 467–68):
- (21)
a. Quel bruit les voisins ont fait!
b. Quel bruit ont fait les voisins!
c. Quelle chance Pierre a eue!
d. Quelle chance a eue Pierre!
Malgré les situations informelles évoquées par ces exemples, les phrases (21) ont peu de chances d’être effectivement produites aujourd'hui par un francophone hexagonal activant sa GD. Les exclamatives de (21) doivent être générées par GS, et par conséquent s'insérer dans un texte écrit ou un discours contrôlé. Comme toutes les formes fortement chargées d'affectivité (voir aussi les superlatifs), les exclamatives semblent très sujettes au changement diachronique et à la variation régionale. Les formes citées en (22) m'ont été proposées comme “normales en situation informelle” par des francophones variant quant à l’âge (générations 1920, 1950 et 1980) et à la région (Toulouse, Paris, Québec):
- (22)
a. Comme elle est gentille!
(Toulouse, 1920)
b. (C'est fou) ce qu'elle {est/peut être} gentille!
(Paris, 1920)
c. Elle est follement gentille!
(Paris, 1920)
d. Qu'est-ce qu'elle {est/peut être} gentille/sympa!
(Paris, 1950)
e. Elle est vachement sympa!
(Paris, 1950)
f. Elle est TROP sympa/cool!
(Paris, 1980)
g. Elle est donc fine!
(Québec, 1950)
h. Elle est-tu fine !
(Québec, 1950)
L'informateur toulousain qui produit (22a) ne reconnaît comme sienne aucune des autres formes; celui qui produit (22b,c) valide aussi (22a) mais rejette (22d-h); celui qui produit (22d,e) valide aussi (22b,c) mais ne produit ni (22a), ni (22f-h); celui qui produit (22f) ne reconnaît comme sienne aucune des autres formes de (22); et aucun des informateurs toulousain et franciliens ne valide (22g,h): au moins cinq GD différentes sont illustrées par cette série d'exemples. Sur les six formes hexagonales, seules les trois les plus archaïques (22a-c) sont également validées par GS.
4.5. Diglossie et cohérence descriptive
Dans l'analyse des interrogatives proposée par Obenauer (Reference Obenauer1994) on trouve côte à côte:
– des formes qui sont générées à la fois par GS et par GD, c'est-à-dire en Z2, comme (23):
- (23)
a. C(el)a a beaucoup embarrassé les responsables.
(adapté d’Obenauer, Reference Obenauer1994:119)
b. Je lui ai indiqué quoi mettre sur la plaie.
(Obenauer, Reference Obenauer1994: 228)
c. Ce garçon, Marie lui a tout appris.
(Obenauer, Reference Obenauer1994: 234)
d. La réparation de la voiture m'a coûté très peu.
(Obenauer, Reference Obenauer1994: 247)
e. Ce serait dommage de partir maintenant.
(Obenauer, Reference Obenauer1994: 386)
– des formes qui ne sont générées que par GS (Z1), comme (24);
- (24)
a. Combien de chefs d'Etat sont-ils attendus à la conférence?
(Obenauer, Reference Obenauer1994:182)
b. Pourquoi rien n'est-il si simple?
(Obenauer, Reference Obenauer1994:185)
– des formes qui ne sont générées que par GD (Z3), comme (25):
- (25)
a. On va asseoir qui à côté de qui?
(Obenauer, Reference Obenauer1994: 294)
b. Bon, et ton fils a trouvé ça où?
(Obenauer, Reference Obenauer1994: 293)
Les phrases (26) sont des traductions possibles de (24) en Z2 (hexagonal commun):
- (26)
a. Combien de chefs d'Etat sont attendus à la conférence ?
b. Il y a combien de chefs d'Etat qui sont attendus à la conférence ?
c. Pourquoi (est-ce que) rien n'est aussi simple?
Les phrases (27) sont des traductions possibles de (25) en Z1 – pouvant par exemple trouver leur place dans une lettre:
- (27)
a. Qui allons-nous asseoir l'un à côté de l'autre?
b. Où ton fils a-t-il trouvé cela?
Le problème pour la description est que tous les exemples considérés ne sont pas produits par une même grammaire du français. La grammaire qui génère (24) (GS) ne génère par (26), et inversement. Les propriétés observées ne coexistent pas au sein d'un même système:
(28)
Les conséquences négatives de la non-distinction GS/GD sont évidentes: l'auteur suggère qu'une seule grammaire du français génère les questions à enclitique de (24) et le pronom on inclusif de (25a), les questions diable de (17) et les questions in situ de (25). Selon l'hypothèse diglossique défendue ici, une telle grammaire n'existe pas.
5. CONCLUSION
Cet article est un plaidoyer en faveur d'une approche diglossique de la description du français, proclamant la nécessité d'une distinction primordiale entre grammaire(s) standard et non standard, préalable à toute réflexion sur la variation en français. Le diagramme proposé en (10) représente la compétence linguistique de tout locuteur du français comme l'union de deux grammaires respectivement corrélées aux traits H et L identifiés par Ferguson (Reference Ferguson1959) dans sa définition classique de la diglossie. GS est la grammaire avalisée par une norme standard, et dont la maîtrise active produit globalement des effets H. GD est la grammaire intériorisée au terme du processus naturel d'acquisition du langage, et dont la maîtrise active n'implique pas de mise en conformité avec la norme standard. GD est, corrélativement, le vecteur du changement linguistique. Au cœur de l'hypothèse diglossique telle qu'elle est formalisée en (10) est l'idée que ces deux grammaires internes sont en intersection, ceci rendant compte de l'intuition qu'il s'agit de deux grammaires de “la même langue”. Le schéma diglossique proposé en (10) conduit à associer toute production linguistique à l'une des trois zones définies par l'intersection. J'ai tenté de montrer que ce schéma diglossique n'est pas incompatible avec une réflexion sur la variation, mais conduit à préciser et restreindre la notion de variation. La variation diatopique peut concerner la grammaire standard ou une grammaire dialectale. La variation interne à une même grammaire peut se réduire à la coexistence de mécanismes différents associés à des effets énonciatifs semblables (par exemple, la coexistence de deux ou plusieurs algorithmes générateurs de questions partielles). Les variations diaphasique et diastratique sont analysées ici comme des effets du schéma diglossique: les effets diaphasiques sont attachés aux traits Z1 (effets “soutenus”) et Z3 (effets “relâchés”), et les effets diastratiques résultent de ce que certains traits Z3 sont interprétés – sur la base de corrélations statistiques implicites – comme des indicateurs négatifs de diglossie active. La variation diamésique (oral/écrit) se réduit à une alternance de médium, dont Blanche-Benveniste et Bilger (Reference Blanche-Benveniste and Bilger1999) soulignent à juste titre qu'elle ne peut pas être directement corrélée aux effets diasphasiques (l'oral n'est pas toujours généré par GD, ni l’écrit par GS). J'ai montré que le schéma diglossique conduit à choisir des attitudes didactiques qui rejoignent, pour le FLE, celle que défend Valdman (Reference Valdman2000) sur la base d'un raisonnement indépendant. En ce qui concerne la didactique du français L1, la prise en compte systématique du schéma diglossique me semble un pré-requis indispensable si l'on veut que l’école puisse espérer permettre à tous les francophones de devenir activement diglosses. Enfin, j'ai montré que le schéma diglossique est méthodologiquement contraignant pour la description linguistique, puisqu'il nous oblige à distinguer les traits générés par les deux grammaires sécantes et à prendre en compte systématiquement les conditions de l’énonciation pour évaluer l'acceptabilité de chaque exemple forgé.