(To read this article in French, please turn to page 20.)
1. Introduction
The purpose of this article is to put to the test one central aspect of the Sign Theory of Language as elaborated by Denis Bouchard in The nature and origin of language (Bouchard Reference Bouchard2013) and earlier work.Footnote 1 Specifically, I will examine the claim that “Language is the way it is because the conceptual and perceptual substances are the way they are” (Bouchard Reference Bouchard2005: 1694). I argue here that such a claim is too strong. That is, there are profound morphosyntactic generalizations that are formulated independently of concepts and percepts. I need to stress, however, that what follows is not to be considered either as an introduction to nor an evaluation of Bouchard's work as a whole. As to the former, I assume that the article by Bouchard himself in this issue sketches out the fundamentals of his approach for those who have not read The nature and origin of language and his other publications. In any event, I lack the space here to introduce the workings of the theory. As to the latter (and to dispel the conclusion that my evaluation of the Sign Theory of Language is in general a negative one), it is important for me to point out that both in print and in public lectures I have praised many aspects of the theory. For example, in Newmeyer (Reference Newmeyer2005: 77–78) I argue that Bouchard's critique of the Principles-and-Parameters approach to (parametric) variation is right on the mark and that his alternatives to that approach represent a very promising direction. And in Newmeyer (Reference Newmeyer2014), I compared favourably Bouchard's treatment of the lexicon-syntax interface, of so-called “meaningless elements”, long-distance dependencies, and other aspects of grammar, to treatments of these same phenomena in other versions of contemporary linguistics.
The article is organized as follows. Section 2 situates the Sign Theory of Language within the current resurgence of interest in Saussurean approaches to grammar. Sections 3 and 4, respectively, discuss two classes of phenomena that challenge Bouchard's theory: morphosyntactic generalizations that are not sign-based, and non-sign-based, external pressures on grammars. Section 5 speculates on why, to a significant degree, grammatical patterning is not sign-based. Section 6 is a brief conclusion.
2. The Saussurean turn in recent linguistics
There are many indications that, more than one hundred years after his death, the ideas of Ferdinand de Saussure are coming back into vogue. Several currently-practised approaches to linguistics proudly assert their “Saussureanism”. The following are quotations to that effect from advocates of Cognitive Grammar, Construction Grammar, Head-driven Phrase Structure Grammar, and a version of Functional Linguistics, respectively:
Saussure's proposal was that the distinctively linguistic study of language had to treat language as a semiotic system. The proper object of linguistic inquiry is therefore the “linguistic sign” the symbolic association of a signifier (an “acoustic image”) and a signified (a “concept”). Cognitive Grammar is strongly committed to the symbolic nature of language, and in this respect is profoundly Saussurian in spirit
(Taylor Reference Taylor, Blank and Peter1999: 18–19).Footnote 2One of the central concepts of linguistics is the Saussurean notion of the linguistic sign as an arbitrary and conventional pairing of form (or sound pattern/signifiant) and meaning (or mental concept/signifié; cf., e.g., de Saussure, Reference de Saussure, Bally and Séchehaye2006 [1916]: 65–70). Over seventy years after Saussure's death, several linguists then explicitly started to explore the idea that arbitrary form-meaning pairings might not only be a useful concept for describing words or morphemes but that perhaps all levels of grammatical description involve such conventionalized form-meaning pairings. This extended notion of the Saussurean sign has become known as a “construction” (which includes morphemes, words, idioms, and abstract phrasal patterns) and the various linguistic approaches exploring this idea were labeled Construction Grammar
(Hoffmann and Trousdale Reference Hoffmann, Trousdale, Hoffmann and Trousdale2013: 1).This completes our sketch of how we can modify our framework to embrace Saussure's conception of language as a system of signs
(Sag and Wasow Reference Sag and Wasow1999: 382).This article argues that William Diver's signal-meaning pair is Saussure's signe linguistique in all basic respects, and that Diver's innovation of a grammatical system is the functional equivalent of Saussure's langue. Thus Columbia School [functional] linguistics rests squarely on a Saussurean foundation
(Reid Reference Reid, Davis, Gorup and Stern2006: 17–40).Even Chomsky's two recent references to de Saussure have been quite positive. For example, he notes that, since the pared-down genetically-determined initial state of the human language faculty “permits only a restricted variety of I-languages to develop”, it follows that “variation of I-languages may reduce to Saussurean arbitrariness (an association of concepts with abstract representations of sound) and parts of the sound system, relatively accessible and, hence, ‘learnable’ (to use a term with misleading connotations)” (Chomsky Reference Chomsky2000: 27). Later in the book, Chomsky becomes even more explicitly Saussurean, remarking that “[…] language variation appears to reside in the lexicon. One aspect is ‘Saussurean arbitrariness’, the arbitrary links between concepts and sounds” (Chomsky Reference Chomsky2000: 120).
One of Chomsky's recent goals has been to attribute as much as possible to “third-factor explanations”, that is, those not specific to the faculty of language. The idea is that the more that can be attributed to external faculties, the more stripped down and minimalist the language faculty itself. The historically most prominent of such explanatory devices are the various economy principles, which have undergone development since around 1990. Surprisingly perhaps, Chomsky cites de Saussure as the inspiration for such principles:
Much work in the structuralist tradition already suggested that the organization of linguistic inventories obeys certain economy principles (see Williams Reference Williams1997 for a recent discussion in terms of the Blocking Principle of the Saussurean idea that “dans la langue il n'y a que des différences” [in langue there are only differences]).
(Chomsky Reference Chomsky2002: 31)The Blocking Principle (whose generative origins are in Aronoff Reference Aronoff1976) prohibits certain lexical formations if another of equivalent meaning exists (glory blocks *gloriosity, for example) as well as a wide range of possible anaphoric dependencies. Interestingly, Williams appeals to de Saussure's notion of “value” as the inspiration for the Blocking Principle, which is one of the few instances of this notion ever having been cited by a generative grammarian, and certainly the only highly positive instance.
By far the most ambitious and comprehensive attempt to further develop de Saussure's ideas is found in Denis Bouchard's book The nature and origin of language (NOL) (Bouchard Reference Bouchard2013), where the Sign Theory of Language is proposed and developed. In the author's opinion, “The neo-Saussurean approach based on the perceptual and conceptual substances of signs provides a principled account of linguistic properties such as words/signs, recursion, and locality” (Bouchard Reference Bouchard2013: 333). NOL differs from most other updatings of de Saussure's ideas in that it provides dozens of pages of reinterpretations of the results of Principles-and-Parameters syntax, recasting them in a Saussurean mould. Bouchard himself is uniquely placed to carry out such a program. He received a Ph.D. from MIT in 1982 with Noam Chomsky as his advisor and, as a professor at the Université du Québec à Montréal, has remained in a milieu where generative grammar is very much the dominant paradigm. One can see the first glimmerings of a Saussurean approach in his doctoral dissertation, published as Bouchard (Reference Bouchard1983), where he argued that no principles of grammar apply exclusively to empty categories. His succeeding books (Bouchard Reference Bouchard1995 and Reference Bouchard2002) further develop grammar in a more sign-based direction. By 2005, he had arrived at a fully ripened Saussurean position, claiming, as noted above, that “language is the way it is because the conceptual and perceptual substances are the way they are” (Bouchard Reference Bouchard2005: 1694).
The principal challenge for any neo-Saussurean approach is to provide a sign-based account of syntactic patterning; de Saussure himself had little to say about syntax, and his remarks on the topic appear to lack consistency. The bulk of NOL is devoted to developing the theory of syntax that de Saussure might have developed if he had had the inclination to do so. In NOL, syntax is defined as the processes by which signs are combined:
Syntax does not combine just signifiants or just signifiés, it combines relations between signifiants and signifiés, i.e. signs. Since signifié and signifiant are irreducibly united, any operation applying to one is reflected in the other.
(Bouchard Reference Bouchard2013: 84).The key to implementing such an idea is to think of juxtaposition as a possible signifiant of a combinatorial sign. Once that step is taken, Bouchard argues, it follows that there must be an iconic relation between form and meaning, or, in his words “[e]very syntactic combination reflects a semantic combination” (Bouchard Reference Bouchard2013: 247).Footnote 3 Armed with this idea, he provides accounts of a great many phenomena that have formed the data base of generative syntactic theorizing. These include long-distance dependencies, anaphora, asymmetrical c-command relations, raising constructions, and much more. For example, he argues that the c-command relation “is actually just an artifact of the semantic analysis of the data” (Bouchard Reference Bouchard2013: 260) and that most apparent mismatches between form and meaning prove not to be mismatches at all, given a proper semantic analysis of the elements involved.Footnote 4
The epistemological centrepiece of NOL is the Substantive Hypothesis (SH): “The most explanatory linguistic theory is one that minimizes the elements (ideally to zero) that do not have an external motivation in the prior properties of the perceptual and conceptual substances of language” (Bouchard Reference Bouchard2013: 83).Footnote 5 Indeed, for Bouchard “there is no independent level of syntax. Syntax is just a set of combinatorial signs, with their signifiés determined by general properties of the Conceptual-Intentional (CI) component, and their signifiants determined by general properties of the Sensory-Motoric (SM) component” (Bouchard Reference Bouchard2013: 83). To be fair, Bouchard nowhere rejects tout court the idea that there might exist non-sign-based generalizations; rather, the “ideal” (most explanatory) theory lacks such generalizations. The purpose of this article is to demonstrate that Bouchard's “ideal” theory lacks empirical support. My strategy is to elaborate in the following sections on two classes of phenomena that challenge the strong form of the SH: morphosyntactic generalizations that are not sign-based, and non-sign-based external pressures on grammars.
3. Non sign-based morphosyntactic generalizations
There appear to be many sorts of morphosyntactic generalizations that are not sign-based. The following subsections outline three general types of such generalizations: first, the existence of broad architectural constraints on how grammatical components interact (3.1); second, the existence of purely structural crosslinguistic constraints (3.2); and third, the existence of purely structural generalizations within a language (3.3).
3.1 The existence of broad architectural constraints on how grammatical components interact
In a series of publications written by Geoffrey Pullum and Arnold Zwicky (Zwicky and Pullum Reference Zwicky and Pullum1983, Reference Zwicky and Pullum1986; Miller et al. Reference Miller, Pullum and Zwicky1997), the following principle is defended:
(1) The Principle of Phonology-Free Syntax (PPFS):
In the grammar of a natural language, rules of syntax make no reference to phonology.
Clearly, PPFS is not a sign-based generalization, since we have a case where a syntactic combination does not reflect a semantic combination. Is the PPFS correct? In my view, it is too strong. There are syntactic rules that seem to refer to suprasegmental aspects of phonology, including syllable structure, phonological weight, and aspects of stress and intonation. Two examples are given below in 3.3. However, a weaker version of PPFS does appear to be viable:
(2) The Principle of Segmental Phonology-Free Syntax (PSPFS): In the grammar of a natural language, rules of syntax make no reference to segmental phonology.
According to PSPFS, there is no language where the process forming, say, passives, or displaced question elements, or inverted auxiliaries, pays attention to the phonological shape of any or all of the segments in one of the elements undergoing the process. There are no languages in which only verbs containing front vowels passivize or in which the word order of two adjoining constituents is determined by the relative sonority of their initial consonants. This constraint is surprising, given the widespread agreement that phonological rules have access to syntactic information (see Selkirk Reference Selkirk1972, Kaisse Reference Kaisse1985). There is no (logically) necessary reason why language should incorporate this non-sign-based architectural feature, nor is there any obvious functional explanation for this interesting fact. The existence of this principle poses a prima facie counterexample to the SH.Footnote 6
My other example of a broad architectural constraint on how grammatical components interact is a bit more complex. It has to do with the interaction of case assignment and displacement phenomena and is relevant only to those languages that have productive case-marking of subjects and direct objects, displaced arguments in argument position (passive and/or raising, in derivational terms), and displaced arguments in non-argument position (wh-movement, in derivational terms). In every language with which I am familiar, there is a feeding relationship between these phenomena, as follows:
(3) Passive/raising feeds case assignment, which in turn feeds wh-movement.
Consider an example from English (in a dialect where who and whom are strictly distinguished):
(4)
a. She/*Her was seen by him.
b. * Who/Whom did you see?
The passive subject is in the nominative case and the displaced wh-phrase is in the objective case, in accord with (3). I know of no language in which wh-movement systematically feeds case assignment, which in turn systematically feeds passive/raising. In such a language, wh-displaced arguments would not be case marked, while passive-moved arguments would keep their direct object case-marking.Footnote 7 In early transformational grammar, this state of affairs was described by brute-force rule ordering (see, for example, Akmajian and Heny Reference Akmajian and Heny1975). Since the 1980s, the generalization has fallen out from architecture of the grammar itself. Examples include a principled distinction between NP and wh-traces (Chomsky Reference Chomsky1981), a level of NP-structure (van Riemsdijk and Williams Reference van Riemsdijk and Williams1981), and, in lexicalist models, the base-generation of passives and raised arguments, along with a feature-transmission mechanism for elements base-generated in non-argument position (Gazdar et al. Reference Gazdar, Klein, Pullum and Sag1985, Bresnan Reference Bresnan2001). None of these solutions seem compatible with the SH, since in each one, there are syntactic combinations that do not reflect semantic combinations.
3.2 The existence of purely structural crosslinguistic constraints
The SH seems to preclude the existence of what appear to be purely structural crosslinguistic constraints. Let me give an example from Mark C. Baker (Reference Baker1988), based on earlier work by Mithun (Reference Mithun1984, Reference Mithun1986). There is a universal constraint that, in transitive clauses, the direct object may be incorporated into the verb, but not the subject. So complex incorporated verbs like (5a) are possible, but no null-subject language has a construction like (5b):
(5)
a. The baby house-likes.
b. *e [Vbaby-likes] the house.
Note that there is nothing semantically or pragmatically deviant about (5b). One could imagine an interpretation along the lines of ‘the/a baby likes the house’. Baker's explanation is a purely structural one. A principle of UG (the Empty Category Principle) blocks movement of a subject “downward” towards the verb.
Another example can be supplied by the Coordinate Structure Constraint. This constraint was formulated by Ross (Reference Ross1967), as in (6):
(6) Coordinate Structure Constraint (CSC):
In a coordinate structure, no conjunct may be moved, nor may any element contained in a conjunct be moved out of that conjunct.
Note that there are two clauses to the CSC. Ross illustrated the first with the following examples:
(7)
a. *What sofa will the chair be put between some table and?
b. *What table will the chair be put between and some sofa?
And he illustrated the second clause of the CSC as follows:
(8)
a. *What did John eat hamburgers and Bill drink ___?
b. *What did John eat ___ and Bill drank milk?
As it turns out, there are many counterexamples to the second clause of the CSC:
(9)
a. What did John go to the store and buy ___? (Ross Reference Ross1967)
b. How much can you drink ___ and still stay sober? (Goldsmith Reference Goldsmith1985)
c. What did he go to the store, buy ___, load ___ in his car, drive home, and unload ___? (Lakoff Reference Lakoff, Farley, Farley and McCullough1986)
However, the first clause of the CSC, as far as I know, is universal and exceptionless. In other words, we have what appears to be an example of a purely structural crosslinguistic constraint. One might hypothesize that CSC violations like (7a–b) pose parsing difficulties, resulting in their unacceptability. While even structure-based parsing violations are problematic for a strict version of the SH (see section 4 below), not all CSC violations are difficult to parse. Consider the following:
(10)
a. John ate beans and rice.
b. *What did John eat beans and?
Not only is (10b) readily interpretable and of unquestioned unacceptability, it contrasts minimally with the following sentence:
(11) What did John eat beans with?
The only difference between (10b) and (11) is that the former violates a universal structural constraint, while the latter does not. It is hard for me to see how such a generalization could be compatible with the predictions of the Sign Theory of Language.
3.3 The existence of purely structural generalizations within a language
Let us turn now to purely structural generalizations within a language. Starting with the simplest cases, we have known about cranberry morphs since the 1940s. These are examples of morpheme-like stretches of phonetic content not linked to any obvious semantic content. Words like cranberry, mulberry, twilight, and cobweb are pretty clearly bimorphemic, since berry, light, and web have something close to their standard meanings (i.e., they are signs). However, cran, mul, twi, and cob are not signs, since no independent meanings can be linked to their phonetic content. The same can be said of the English formative -ceive. It must be a morpheme, since it combines with several prefixes (per-, con-, re-, trans-, and de-) to form words. Yet it has no independent meaning.
Several pages of NOL are devoted to arguing that the supposedly meaningless expletives in English there and it are meaningful, as demanded by the SH. It is less clear, however, that such a move could be made with the complementizer that. In what way, if any, do the following sentences differ in meaning?:
(12)
a. Mary thinks that it's time to leave.
b. Mary thinks it's time to leave.
In fact, a dozen factors seem to interact to determine the probability in discourse of the complementizer (Bolinger Reference Bolinger1972, Quirk et al. Reference Quirk, Greenbaum, Leech and Svartvik1985, Thompson and Mulac Reference Thompson and Mulac1991, Biber et al. Reference Biber, Johansson, Leech, Conrad and Finegan1999, Ferreira and Dell Reference Ferreira and Dell2000, Hawkins Reference Hawkins2001, Yaguchi Reference Yaguchi2001, Dor Reference Dor2005, Kaltenböck Reference Kaltenböck2006, Kearns Reference Kearns2007, Dehé and Wichmann Reference Dehé and Wichmann2010, Jaeger Reference Jaeger2010). Among such factors we find:
(13)
a. the type and frequency of the matrix verb;
b. the type of the matrix clause subject (pronominal vs. full noun phrase);
c. the choice of the matrix clause pronoun;
d. the length, type, and reference of the embedded subject;
e. the position and function of the embedded clause;
f. the voice of the main clause (active vs. passive);
g. ambiguity avoidance;
h. the linear adjacency or not of the matrix verb and that;
i. the speech register;
j. the “truth claim” (Dor Reference Dor2005) to the proposition of the embedded clause;
k. the rhythmic pattern of the utterance;
l. the state of knowledge and belief of the speaker;
m. the information density of the utterance.
Several of these have nothing to do with meaning, no matter how broadly “meaning” is interpreted.
There have been numerous claims that morpheme order is semantically based, as seems entailed by a sign-based theory. To take one important example, consider a typical agglutinative language like Turkish, where a series of affixes follows the root:
(14) ev-ler-i-den
house-pl-poss-abl
‘from their house’
The order of morphemes appears to be based at least in part on notions like scope, relevance, and so on (see Tesnière Reference Tesnière1939, Bybee Reference Bybee1985, Butler Reference Butler2006). But Larry Hyman, in a number of articles (see, for example, Hyman Reference Hyman, Booij and van Marle2002), has argued that four of the Bantu valency-changing suffixes are subject to an ordering template by virtue of their morphological identity alone. And Hargus and Tuttle (Reference Hargus and Tuttle1997) discuss the placement of the negative prefix s- in Witsuwit'en, an Athabaskan language spoken in British Columbia. In some cases, s- occurs inside the Tense/Asp (T/A) prefix. With “inner” subjects, the s- prefix occurs outside the T/A prefix. Hargus and Tuttle's analysis is that the normal order of the prefixes is Neg-T/A, but the order changes so that s- can be a coda, except where this would create a complex coda. Such a condition on morpheme ordering is not sign-based.
Let us now consider cases where there is a one-many relationship between the form of a particular morpheme and its meanings. Tagalog reduplication and German umlaut are good examples. Each has varied and numerous semantic effects:
(15)
a. Tagalog reduplication: gerunds, plural comparative adjectives, occupational nouns, aspect, causative adjectives, moderative verbs, intensive verbs, …
b. German umlaut: some plurals, some abstract nouns, diminutives, some derived feminine nouns, agentive and instrumental nouns, some derived adjectives, …
The strong form of the SH would disallow any reference to reduplication and umlaut processes per se, since these processes are not in and of themselves sign-based (they are stated in morphophonemic terms). Rather, the SH would demand for Tagalog a separate reduplication-gerund sign, a separate reduplication-plural comparative adjective sign, a separate reduplication-occupational noun sign, etc. These multiple form-meaning structures would render opaque the morphological generalization.
Next, let us ask if there are syntactic generalizations that are not sign-based. Another way of putting the question is to ask whether syntax is to some degree autonomous. There do indeed seem to be syntactic patterns that have a “reality” independently of the meanings with which they are associated. Consider the adjective with infinitival complement structure in English:
(16) noun – copula – adjective – infinitive
There are six logically possible ways that the NP subject can relate (in terms of understood semantic relations) to the adjective and the verb. All six occur:
(17) Relation of NP subject to Adj to V
a. Mary is eager to please. subject subject
b. Mary is easy to please. none object
c. Mary is liable to be offended. none subject
d. Guns are cheap to buy. subject object
e. It is useless to try. none none
f. It is too dark to see. subject none
Clearly there is something “real” about that pattern itself, whatever meanings or uses it might manifest. In other words, the formal patterns themselves have an autonomy, not derivable from meaning or use.
We have seen examples of phonologically-determined morpheme order. There are also examples of phonologically-determined word order. For example, Chinese compounds can be V-O-Head or O-V-Head (Duanmu Reference Duanmu1997):
(18) V-O-Head:
qui cai dao
cut vegetable knife
‘vegetable-cutting knife’
(19) O-V-Head
luobo jiagong dao
turnip process knife
‘turnip-processing knife’
Word order is determined phonologically: When V and O are both monosyllabic, V-O-Head is the only possible word order. When V and O are both disyllabic, O-V-Head is the only possible word order.
English word order also shows non-sign-based generalizations. Consider the shifting of phonologically or structurally “heavy” elements to the right:
(20)
a. ? I met the twenty-three people who I had taken Astronomy 201 with last semester in the park.
b. I met in the park the twenty-three people who I had taken Astronomy 201 with last semester.
Some have claimed that the rightward shift has a focusing (and therefore sign-based) function. But this is not necessarily true, as the following sentences illustrate:
(21)
a. To whom did you give all your books on the phonetic foundations of conventional implicature?
b. I gave [to Mary] [all of my books on that topic].
To Mary is the focused element, not all of my books on that topic.
Any morphosyntactic process that privileges syntactic position over the semantic content of the element occupying that position is problematic for a strict sign-based theory. Consider, for example, Wackernagel's Law, which states (using a number of Indo-European languages as data) that second position is reserved for clitics, whatever their semantic content happens to be. A similar point could be made about V2 languages, where essentially any element can occur initially, as long as the tensed verb is in second position.
Crosslinguistically, we also find phenomena that seem to challenge the SH. Consider sentential negation. Presumably the semantics of negation is essentially the same from language to language. Yet the morphosyntactic realization of negation varies wildly across languages. For example, in some languages, such as Tongan, negation is encoded by a complement-taking verb. ‘Ikai behaves like a verb in the seem class (we know there is a complement because ke occurs only in embedded clauses):
(22)
a. Na'e ‘alu ‘a Siale.
asp go abs Charlie
‘Charlie went.’
b. Na'e ‘ikai [S ke ‘alu ‘a Siale].
asp neg asp go abs Charlie
‘Charlie did not go.’ Tongan (Churchward Reference Churchward1953: 56, Payne Reference Payne and Shopen1985: 208)
Other languages treat the negative marker as an auxiliary verb. In Ladakhi, a Tibetic language spoken in India, the auxiliaries yin and yod together mark present continuous tense, but in the negative the latter is replaced by its negative form med. The negative med replaces yod in the negative of all tense-aspect-modality categories where this form of the copula occurs:
(23)
a. pəlldənni ʂpečhə ɖi-yin-yot.
Paldan.erg book.abs write-aux-aux
‘Paldan is writing a book.’
b. pəlldənni ʂpečhə ɖi-yin-met.
Paldan.erg book.abs write-aux-neg.aux
‘Paldan is not writing a book.’ Ladakhi (Koshal Reference Koshal1979, Miestamo Reference Miestamo2005)
In many – possibly most – languages, negation is represented by a derivational affix. This situation can be illustrated with an example from Turkish, where the negative morpheme is one in a series of such affixes:
(24) acı-n-dır-ıl-ma-dı-k.
grieve-refl-caus-pass-neg-pst-1.pl
‘We were not made to grieve.’ Turkish (Payne Reference Payne and Shopen1985: 227)
In Evenki, formerly known as Tungus, one negative element, a#cin, belongs to the class of nouns. Consider the following:
(25)
a. Nuηan a#cin.
he absence
‘He is not here.’
b. Nuηartin a#cir.
they absence
‘They are not here.’
c. Nuηartin a#cir-du-tin.
they absence-loc-their
‘in their absence’ Evenki (Payne Reference Payne and Shopen1985: 228)
Example (25c) shows that a#cin has a plural form and takes case endings like ordinary nouns. And in English, the word not is an adverb in the same class as never, always, just, and barely (Jackendoff Reference Jackendoff1972, Baker Reference Baker1991, Ernst Reference Ernst1992, Kim Reference Kim2000, Newmeyer Reference Newmeyer, Birner and Ward2006). In other words, negation supports the idea that there are morphosyntactic generalizations not tied directly to semantic ones.
4. Non-sign-based external pressures on grammar
In the strongest interpretation of the SH, all morphosyntactic generalizations are sign-based. As a corollary, it would seem, grammars should not be subject to non-sign-based external pressures, that is, those not grounded in somehow optimizing form-meaning pairings (i.e., in increasing the degree of form-meaning iconicity). But in fact, many non-sign-based external pressures are attested, two of which are discussed in Haspelmath (Reference Haspelmath, MacWhinney, Malchukov and Moravcsik2014):
(26)
a. Frequency-based form minimization (“economy”)
More frequent forms tend to be shorter than rarer forms.
b. Class-based grammatical coding (“system pressure”)
Rules of grammar generally target large classes of items, rather than individual expressions or small classes.
So, in accord with (26a), singulars tend to be shorter than plurals, present tense forms tend to be shorter than future tense forms, inalienable possessives tend to be shorter than alienable possessives, etc. It is not clear how the SH is compatible with such generalizations. In accord with (26b), in most languages plural marking is used for all nouns, not just those that occur more frequently in the singular. The text count for eyes and trees is higher than for eye and tree, yet system pressure dictates the standard -s plural suffix. Along the same lines, the power of system pressure is even stronger with verbal person marking than with number marking. Haspelmath is not aware of a single language with zero marking of the third person with action verbs like work or drink, but with zero marking of the first person and overt marking of the third with experiential verbs like want, feel, and hope.
Structural-systemic pressure on grammatical change can also be illustrated by reference to the history of preposition-stranding in English, that is, sentences like the following:
(27)
a. Who did you talk to?
b. Mary was talked to.
Despite the crosslinguistic rarity of stranding, it has existed since Old English. But interestingly, its domain of application has changed over the years and, for the most part, has expanded:
(28) Chronology of preposition-stranding in English
a. Old English period (it could apply with all wh-movement type operations without an overt wh-pronoun; topicalization)
b. Early Middle English (with overt wh-movement)
c. Later Middle English (with passives)
d. Modern English (over a direct object; e.g., Who did they take advantage of?; Mary was taken advantage of.) (Allen Reference Allen1980, van Kemenade Reference van Kemenade1987)
So what is going on here? What we have is a classic case of an existing grammatical process expanding its domain. Speakers have the pattern and seem to love it and to use it in more and more contexts. I would speculate that what is behind the story is the existence, from very early stages of English, of other sentence types with P-like final elements:
(29)
a. Phrasal verbs with postposed particles:
i. I looked the answer up.
ii. Let's check it out.
b. Final P-like directional particles:
i. I found this lying around.
ii. She's coming up (e.g., the stairs).
In other words, P-stranding has been reinforced by the existence of similar (but analytically independent) constructions in the language. But once one talks about existing patterns exerting pressure on a particular construction, one has necessarily moved away from a strictly sign-based theory.
Another testing ground for the SH involves the pressures helping to determine the linear ordering of the major constituents of the sentence. NOL proposes a sign-based generalization (Bouchard Reference Bouchard2013: 93):
(30) Linearization Option: The predicator precedes/follows the element it applies to.
An alternative theory appeals to structural relations and processing pressure as the determining factor influencing linear order. Along these lines, Dryer (Reference Dryer1992) proposed what he called Branching-Direction Theory: For pairs of associated elements, one phrasal and one non-phrasal (i.e., lexical), the phrasal node consistently precedes or consistently follows the non-phrasal node. In other words, the non-semantic generalization is that languages tend to be either consistently right-branching or consistently left-branching. Hawkins (Reference Hawkins1994, Reference Hawkins2004) showed that Branching-Direction Theory follows directly from his theory of parsing and its influence on grammatical structure. The central insight of this theory is that it is in the interest of the hearer to recognize the syntactic groupings in a sentence as rapidly as possible. This interest is manifested in both language use and in grammatical structure. As to the former, when speakers have a choice, they will generally follow the parser's preference. As to the latter, typological facts about grammars will generally reflect parsing preferences. His central principle is Minimize Domains:
(31) Minimize Domains (MD):
The hearer (and therefore the parsing mechanism) prefers orderings of elements that lead to the most rapid recognition possible of the structure of the sentence.
Consider some typological predictions of MD. In a VO language like English, heads typically precede complements:
(32) V-NP, P-NP, A-of-NP, N-of-NP
In each case a “lighter” head precedes a “heavier” complement; putting the heavier phrasal complement after the lighter lexical head allows for a quicker recognition of all of the constituents of the dominating phrase. In fact, the light-before-heavy tendency in the grammar involves far more than the head-complement relation. For example, the canonical order of VP constituents is relentlessly lighter-to-heavier:
(33) VP[V-NP-PP-CP] (convince my students with well-chosen examples that all grammars leak)
Also notice that single adjectives and participles can appear in pre-head position in English:
(34)
a. a silly proposal
b. the ticking clock
But if these adjectives and participles themselves have complements, the complements have to appear in post-head position:
(35)
a. * a sillier than any I've ever seen proposal
b. a proposal sillier than any I've ever seen
(36)
a. * the ticking away the hours clock
b. the clock ticking away the hours
MD predicts straightforwardly that a VO language should be prepositional and that an OV language should be postpositional. And indeed, such is generally the case. As is shown in Dryer (Reference Dryer1992), 94% of OV languages are postpositional and 85% of VO languages are prepositional.Footnote 8 The exceptional nature of a prepositional OV language (like Amharic) and a postpositional VO language (like Finnish) follows directly. To illustrate, consider the four logical possibilities, illustrated in (37a-d): VO and prepositional (37a); OV and postpositional (37b); VO and postpositional (37c); and OV and prepositional (37d):
(37)
Let us assume, with Hawkins, that grammars are organized in such a way that users can recognize the major constituents of a phrase as rapidly as possible. In the two common structures, (37a) and (37b), the recognition domain for the VP is just the distance between V and P, crossing over the object NP. But in (37c) and (37d), the uncommon structures, the recognition domain is longer, in that it involves the object of the preposition as well. So both regularity and exceptionality follow naturally in this approach. The exceptional cases are simply those that fail to be in accord with the principle of Minimize Domains.
The evidence for a performance basis, rather than for a UG basis for the light-before-heavy tendency relies on the fact that, when speakers have a choice, in a VO-type language, they tend to put shorter before longer constituents. So, except for cases in which there is a strong lexical relation between V and P, PPs can typically occur in any order after the verb:
(38)
a. Mary talked to John about Sue.
b. Mary talked about Sue to John.
But all other things being equal, the greater the length differential between the two PPs, the more likely speakers will be to put the shorter one first (Hawkins Reference Hawkins1994).Footnote 9 Interestingly, Hawkins's approach makes precisely the opposite length and ordering predictions for head-final languages. And to be sure, there is a heavy-before-light effect in those languages, both in language use and in the grammar itself. For example, in Japanese, long complements are more likely to be preposed than extraposed. Again, there is nothing “sign-based” about the generalization that we find here.
The structurally-based generalization (MD) is preferable to the sign-based Linearization Option because it is more general. Consider the Greenbergian correlation pairs reported in Dryer (Reference Dryer1992). The most robust are listed in (39):
(39) VO correlate OV correlate
adposition – NP NP – adposition
copula verb – predicate predicate – copula verb
want – VP VP – want
tense/aspect auxiliary verb – VP VP – tense/aspect auxiliary verb
negative auxiliary – VP VP – negative auxiliary
complementizer – S S – complementizer
question particle – S S – question particle
adverbial subordinator – S S – adverbial subordinator
article – Nʹ Nʹ – article
plural word – Nʹ Nʹ – plural word
noun – genitive genitive – noun
noun – relative clause relative clause – noun
adjective – standard of comparison standard of comparison – adjective
verb – PP PP – verb
verb – manner adverb manner adverb – verb
The Dryer-Hawkins approach is more general than the Linearization Option, because not all of the pairs involve predicators and elements that they apply to. For example, a complementizer is not a “predicator” with respect to a sentence, nor is an article a “predicator” with respect to an Nʹ. Yet, the former elements are shorter than the latter and hence they pattern with the (lexical) verb, not the (phrasal) object.
The acid test for deciding between the two approaches is based on the fact that there is no robust correlation between N-Adj order and VO order (Dryer Reference Dryer1988):
(40) #Languages #Families
OV & Adj-N 64 22
OV & N-Adj 94 21
VO & Adj-N 38 17
VO & N-Adj 91 22
Since adjectives and nouns are both lexical, a parsing-based approach correctly predicts that there will be no correlation in Adj-N ordering with respect to V-NP, P-NP, etc. ordering.
5. Some speculative remarks on the non-sign-based nature of grammarFootnote 10
We have seen that the neo-Saussurean Substantive Hypothesis of Bouchard (Reference Bouchard2013) is too strong. Not all morphosyntactic generalizations, nor external pressures that help to shape these generalizations, “have an external motivation in the prior properties of the perceptual and conceptual substances of language” (Bouchard Reference Bouchard2013: 83). These concluding remarks will attempt to pinpoint why the form-meaning match-up in language is less than perfect.
First, and least interesting, we can point to pure historical accident. Consider the fact that most disyllabic adjectives in English beginning with unstressed a- do not occur prenominally:
(41) *the asleep baby, *the aslant window, *the ajar door, *the atilt picture, etc.
No semantic generalization is at work here, since the following phrases are well-formed:
(42) the sleeping baby, the slanted window, the open door, the tilted picture
The generalization is not phonological either:
(43) the abrupt remark, the acerb comment, the astute recommendation
The reason for the ungrammaticality of the phrases in (41) is historical accident. Most of the adjectives that do not occur prenominally are historically grammaticalizations of PPs:
(44) asleep < on sleep; awake < on wake; ajar < at jar
They do not occur prenominally because PPs do not occur prenominally. Abrupt, acerb, and astute, on the other hand, have different histories:
(45) abrupt (< Lat. abruptus); acerb (< acerbity < Fr. acerbité); astute (< Lat. astutus)
Given their history, there was never an impediment to abrupt, acerb, and astute occurring prenominally.
Second, as we have seen, grammars are, to a considerable degree, “built for speed”. The advantage to parsing rapidly is hardly controversial. Every word has to be picked out from an ensemble of 50,000, identified in one-third of a second, and put in the right structure. Inevitably, the demands of rapid processing will take priority in numerous instances over the SH.
Third, we can point to real-time constraints imposed by the vocal channel (see especially Chafe Reference Chafe1967). The linear nature of vocal speech means that many semantic distinctions need to be collapsed into one position. In most languages there are many more thematic roles expressible than there are structural means to express them. So, as in the following examples, a single grammatical relation encodes more than one role, with the resultant loss of iconicity:
(46)
a. Mary threw the ball. [Mary is the Agent of the action]
b. Mary saw the play. [Mary is the Experiencer of an event]
c. Mary received a letter. [Mary is the Goal/Recipient of transfer]
d. Mary went from Chicago to Detroit. [Mary is an Object undergoing transfer of position]
Fourth, grammars serve many functions and are thus subject to many, often conflicting, pressures (Martinet Reference Martinet1962), even conflicting sign-based pressures. Fronting an object as in (47a) and (47b) focuses the fronted element. The price paid, however, is the breaking up of a semantic unit, namely the verb and its direct object:
(47)
a. What did you eat?
b. Raw potatoes, I would never eat.
I close with some highly speculative remarks. Language serves many functions, which pull on it in many different directions. For this reason, there can be no consistently simple relationship between form and meaning. However, two forces do seem powerful enough to have “left their mark” on grammar. One is the force pushing form and meaning into alignment, as is stressed in neo-Saussurean theories, and the other is the force favouring the identification of the structure of the sentence as rapidly as possible, that is to say, parsing pressure. Even these two pressures can conflict with each other, however, in some cases dramatically. Two examples are cases where there is parsing pressure to postpose the proper subpart of some semantic unit, or where preference for topic before predication conflicts with pressure to have long-before-short, as in Japanese.Footnote 11 The evolutionary problem, then, is to provide grammar with the degree of stability rendering it immune to the constant push-pull of conflicting forces. A natural solution to the problem is to provide language with a relatively stable core, immune to the immanent pressure coming from all sides. That is, a natural solution is to embody language with a structural system at its core. Put another way, a syntactic component that is not wholly sign-based is a clever design solution to the problem of how to make language both learnable and usable. This system allows language to be nonarbitrary enough to facilitate acquisition and use and yet stable enough not be pushed this way and that by conflicting forces. In short, there are good functional reasons why grammars are not wholly sign-based.
6. Conclusion
This article has examined a key feature of Denis Bouchard's Sign Theory of Language, namely the Substantive Hypothesis, the idea that “the most explanatory linguistic theory is one that minimizes the elements (ideally to zero) that do not have an external motivation in the prior properties of the perceptual and conceptual substances of language” (Bouchard Reference Bouchard2013: 83). We have seen that language contains many systematic phenomena that seemingly have no perceptual or semantic motivation. This state of affairs arises, I would speculate, from the interplay of a number of factors: historical accident, pressure for rapid production and comprehension, real-time constraints imposed by the vocal channel, and the fact that language serves multiple functions, which pull on it in different directions. The result is a purely structural system, which interfaces with phonetics and semantics, but which cannot be characterized in solely phonetic or semantic terms.
Résumé
Cet article porte sur une composante clé de la Théorie du langage basée sur le signe de Denis Bouchard, à savoir l’Hypothèse substantive (HS), selon laquelle « the most explanatory linguistic theory is one that minimizes the elements (ideally to zero) that do not have an external motivation in the prior properties of the perceptual and conceptual substances of language ». [la théorie linguistique qui a le plus grand pouvoir explicatif est celle qui réduit (idéalement à zéro) les éléments qui ne sont pas motivés indépendamment des propriétés antérieures des substances perceptuelles et conceptuelles du langage.] L'article soutient que deux classes de phénomènes très répandus représentent un défi pour les tenants de la version la plus forte de l'HS : les généralisations morphosyntaxiques non basées sur le signe et les pressions externes et indépendantes du signe qui pèsent sur les grammaires. L'article se conclut avec quelques remarques spéculatives concernant ce qui pourrait expliquer pourquoi, dans une grande mesure, les schémas grammaticaux ne sont pas basés sur le signe.
Abstract
This article examines a key feature of Denis Bouchard's Sign Theory of Language, namely the Substantive Hypothesis (SH), the idea that “the most explanatory linguistic theory is one that minimizes the elements (ideally to zero) that do not have an external motivation in the prior properties of the perceptual and conceptual substances of language”. The article argues that the strongest form of the SH is challenged by two widespread classes of phenomena: morphosyntactic generalizations that are not sign-based, and non-sign-based external pressures on grammars. It concludes with some speculative remarks on why, to a significant degree, grammatical patterning is not sign-based.
Mots clés
autonomie de la syntaxe
iconicité
exigences de parsage
de Saussure
Théorie du langage basée sur le signe
Keywords
autonomy of syntax
iconicity
parsing pressure
de Saussure
Sign Theory of Language
1. Introduction
Cet article a pour objet de mettre à l’épreuve un aspect central de la Théorie du langage basée sur le signe développée par Denis Bouchard dans The nature and origin of language (Bouchard Reference Bouchard2013) et d'autres publications antérieures à ce livreFootnote 1. Plus spécifiquement, je m'intéresserai à son affirmation que « [l]anguage is the way it is because the conceptual and perceptual substances are the way they are » [le langage a les propriétés qu'il a parce les substances perceptuelles et conceptuelles sont telles qu'elles le sont] (Bouchard Reference Bouchard2005 : 1694) et soutiendrai qu'une telle affirmation est trop forte, car il existe des généralisations morphosyntaxiques enracinées qui sont formulées indépendamment de concepts et de percepts. Je veux toutefois souligner que cet article ne doit être considéré ni comme une introduction aux travaux de Bouchard, ni comme une évaluation de ceux-ci dans leur ensemble. D'abord, j'estime que l'article de Bouchard lui-même dans le présent numéro offre déjà un exposé des éléments fondamentaux de son approche pour ceux qui n'ont pas lu The nature and origin of language (NOL) et ses autres publications; je ne dispose d'ailleurs pas de l'espace requis pour présenter le fonctionnement de sa théorie. En second lieu (et pour dissiper toute impression que mon évaluation globale de la Théorie du langage basée sur le signe est généralement négative), je tiens à souligner que j'ai déjà fait l’éloge de plusieurs aspects de cette théorie, tant dans des publications que lors de conférences. Par exemple, dans Newmeyer (Reference Newmeyer2005 : 77–78), je soutiens que la critique de Bouchard concernant l'approche de la variation (paramétrique) basée sur la Théorie des principes et des paramètres est juste et que ses solutions de rechange offrent une voie très prometteuse. Et dans Newmeyer (Reference Newmeyer2014), j'ai comparé favorablement son traitement de l'interface lexique-syntaxe, des dépendances à distance des soi-disant « catégories vides » (dépourvues de sens) et d'autres aspects de la grammaire avec les traitements des mêmes phénomènes proposés dans d'autres cadres linguistiques contemporains.
L'article est organisé comme suit : la section 2 situe la Théorie du langage basée sur le signe par rapport à l'actuel regain d'intérêt pour les approches saussuriennes de la grammaire. Les sections 3 et 4 portent sur deux classes de phénomènes qui posent un défi pour la théorie de Bouchard : les généralisations morphosyntaxiques non basées sur le signe et les pressions externes non basées sur le signe qui pèsent sur les grammaires. Dans la section 5, je tente d'expliquer pourquoi, dans une large mesure, les schémas grammaticaux ne sont pas basés sur le signe. La section 6 consiste en une brève conclusion.
2. Le tournant saussurien dans les approches récentes en linguistique
Il y a plusieurs indications que, plus de 100 ans après sa mort, les idées de Ferdinand de Saussure reviennent en vogue. Les tenants de plusieurs approches actuelles de la linguistique affichent fièrement leur « saussurianisme ». Les citations suivantes à cet effet sont respectivement celles de partisans de la Grammaire cognitive, de la Grammaire de construction, de la Grammaire syntagmatique guidée par les têtes et d'une des approches fonctionnelles de la grammaire :
Saussure's proposal was that the distinctively linguistic study of language had to treat language as a semiotic system. The proper object of linguistic inquiry is therefore the “linguistic sign” the symbolic association of a signifier (an “acoustic image”) and a signified (a “concept”). Cognitive Grammar is strongly committed to the symbolic nature of language, and in this respect is profoundly Saussurian in spirit [La proposition de [Ferdinand] de Saussure était que l’étude du langage purement linguistique devait traiter le langage comme un système sémiotique. L'objet propre de toute étude linguistique est alors le « signe linguistique », l'association symbolique d'un signifiant (une « image acoustique ») et un signifié (un « concept »). La Grammaire cognitive est très attachée à la nature symbolique du langage et dans ce sens est profondément saussurienne en esprit.]
(Taylor Reference Taylor, Blank and Peter1999 : 18–19)Footnote 2.One of the central concepts of linguistics is the Saussurean notion of the linguistic sign as an arbitrary and conventional pairing of form (or sound pattern/signifiant) and meaning (or mental concept/signifié; cf., e.g., de Saussure, Reference de Saussure, Bally and Séchehaye2006[1916]: 65–70). Over seventy years after Saussure's death, several linguists then explicitly started to explore the idea that arbitrary form-meaning pairings might not only be a useful concept for describing words or morphemes but that perhaps all levels of grammatical description involve such conventionalized form-meaning pairings. This extended notion of the Saussurean sign has become known as a “construction” (which includes morphemes, words, idioms, and abstract phrasal patterns) and the various linguistic approaches exploring this idea were labeled Construction Grammar [Un des concepts centraux de la linguistique est la notion saussurienne du signe linguistique envisagé comme une association conventionnelle et arbitraire d'une forme (ou d'une forme sonore/signifiant) et d'un sens (concept mental/signifié, voir par exemple de Saussure, Reference de Saussure, Bally and Séchehaye2006 [2016] : 65–70). Plus de soixante-dix ans après la mort de [Ferdinand] de Saussure, plusieurs linguistes ont alors réellement commencé à explorer l'idée que les associations forme-sens soient non seulement un concept utile pour décrire les mots et les morphèmes, mais également que peut-être tous les niveaux de la description grammaticale impliquent de telles associations forme-sens. Cette notion étendue du signe saussurien est devenue connue comme une « construction » (qui inclut les morphèmes, les mots, les expressions et les configurations syntagmatiques abstraits) et les diverses approches linguistiques explorant cette idée étaient connues sous le nom de Grammaire de construction.]
(Hoffmann et Trousdale Reference Hoffmann, Trousdale, Hoffmann and Trousdale2013 : 1).This completes our sketch of how we can modify our framework to embrace Saussure's conception of language as a system of signs [Ceci complète notre aperçu qui servait à décrire comment nous pouvons modifier notre approche pour inclure la conception du langage comme système de signes de [Ferdinand] de Saussure.]
(Sag et Wasow Reference Sag and Wasow1999 : 382).This article argues that William Diver's signal-meaning pair is Saussure's signe linguistique in all basic respects, and that Diver's innovation of a grammatical system is the functional equivalent of Saussure's langue. Thus Columbia School [functional] linguistics rests squarely on a Saussurean foundation. [Cet article argumente que l'association signal-sens de William Diver correspond à tous égards importants au signe linguistique de [Ferdinand] de Saussure et que l'aspect original du système grammatical de Diver est l’équivalent fonctionnel de langue chez de Saussure. Ainsi la Columbia School of Linguistics [la linguistique fonctionnelle] se base directement sur des idées saussuriennes.] (Reid Reference Reid, Davis, Gorup and Stern2006 : 17–40).
Même deux récentes références à de Saussure faites par Chomsky ont été passablement positives. Par exemple, il note que, puisque l’état initial restreint de la faculté de langage qui est génétiquement déterminé et réduit à sa forme la plus simple « permits only a restricted variety of I-languages to develop » [permet que seulement un nombre limité de langues-I [langues internes] différentes se développent], il s'ensuit que « variation of I-languages may reduce to Saussurean arbitrariness (an association of concepts with abstract representations of sound) and parts of the sound system, relatively accessible and, hence, ‘learnable’ (to use a term with misleading connotations) » [la variation des langues-I peut être réduite à l'arbitraire du signe de [Ferdinand] de Saussure (une association de concepts et de représentations abstraites de sons) et à une partie du système des sons, qui est relativement accessible, donc qui est « apprenable » (pour utiliser un terme porteur de connotations pouvant porter à confusion).] (Chomsky Reference Chomsky2000 : 27). Plus loin dans le livre, Chomsky devient davantage explicite dans son adoption des idées de Ferdinand de Saussure, en remarquant que « […] language variation appears to reside in the lexicon. One aspect is ‘Saussurean arbitrariness’, the arbitrary links between concepts and sounds » [la variation entre les langues semble se retrouver dans le lexique. Un aspect est l’« arbitraire saussurien », les liens arbitraires entre les concepts et les sons.] (Chomsky Reference Chomsky2000 : 120).
L'un des objectifs récents de Chomsky a été d'attribuer le plus de place possible à des explications basées sur des facteurs non spécifiques à la faculté de langage, ce qu'il appelle « third-factor explanations » [des explications basées sur trois facteurs [non spécifiques à la faculté du langage]]. L'idée est que, plus on peut attribuer à des facultés externes, plus simple et minimaliste devient la faculté de langage elle-même. Historiquement, les outils explicatifs les plus privilégiés à cet effet sont les divers principes d’économie, qui sont développés depuis les années 1990 environ. On peut peut-être s’étonner du fait que Chomsky cite de Saussure en tant que source d'inspiration de tels principes :
Much work in the structuralist tradition already suggested that the organization of linguistic inventories obeys certain economy principles (see Williams Reference Williams1997 for a recent discussion in terms of the Blocking Principle of the Saussurean idea that “dans la langue il n'y a que des différences”…). [Beaucoup de travaux dans la tradition structuraliste ont déjà suggéré que l'organisation des inventaires linguistiques obéit à certains principes d’économie (voir Williams Reference Williams1997 pour une discussion récente, en termes du Principe de blocage, de l'idée saussurienne selon laquelle « dans la langue il n'y a que des différences »]
(Chomsky Reference Chomsky2002 : 31)Le Principe de blocage (dont les origines dans l'approche générative remontent à Aronoff Reference Aronoff1976) interdit certaines formations lexicales si un élément de sens équivalent existe déjà (glory ‘gloire’ bloque *gloriosity ‘*gloriosité’, par exemple) de même qu'il empêche un large éventail de dépendances anaphoriques. Fait intéressant, Williams (Reference Williams1997) affirme que c'est la notion de « valeur » formulée par de Saussure qui a été l'inspiration du Principe de blocage; c'est un des rares cas où cette notion a été citée par un générativiste, et certainement le seul cas à teneur hautement positive.
La tentative de loin la plus ambitieuse et complète pour relancer les idées de Ferdinand de Saussure réside dans le livre The nature and origin of language de Denis Bouchard (Reference Bouchard2013). L'auteur y propose et développe sa Théorie du langage basée sur le signe (TLS). Selon lui, « The neo-Saussurean approach based on the perceptual and conceptual substances of signs provides a principled account of linguistic properties such as words/signs, recursion, and locality » [L'approche néo-saussurienne basée sur les substances conceptuelles et perceptuelles des signes rend compte de façon solide des propriétés linguistiques telles que les mots/signes, la récursivité et la localité] (Bouchard Reference Bouchard2013 : 333). NOL diffère de la plupart des autres actualisations des idées de Ferdinand de Saussure en ce sens que des douzaines de pages y sont consacrées à la réinterprétation de résultats de la « syntaxe des principes et paramètres », qui se veut conforme aux idées de Ferdinand de Saussure. Bouchard lui-même est exceptionnellement bien placé pour mener à bien un tel programme. Il a obtenu un Ph.D. du MIT en 1982 sous la direction de Noam Chomsky et, à titre de professeur à l'Université du Québec à Montréal, il a poursuivi sa carrière dans un milieu où la grammaire générative est de loin le paradigme dominant. On peut déjà discerner les premiers signes de son « inclination » saussurienne dans sa thèse doctorale, publiée comme Bouchard (Reference Bouchard1983), dans laquelle il soutient qu'il n'existe pas de principes de grammaire qui s'appliquent exclusivement à des catégories vides. Dans ses livres subséquents (Bouchard Reference Bouchard1995 et Reference Bouchard2002), il poursuit l’élaboration d'une grammaire plus étroitement basée sur le signe. En 2005, il était parvenu à exposer une position saussurienne pleinement mature, soutenant, tel que noté ci-dessus, que « language is the way it is because the conceptual and perceptual substances are the way they are » [le langage a les propriétés qu'il a parce les substances perceptuelles et conceptuelles sont telles qu'elles le sont] (Bouchard Reference Bouchard2005 : 1694).
Le principal défi posé par toute approche néo-saussurienne est d'offrir une explication des schémas syntaxiques basés sur le signe. Ferdinand de Saussure lui-même avait peu à dire à propos de la syntaxe, et ses observations en ce domaine manquent de cohérence. NOL est essentiellement consacré à l’élaboration de la théorie syntaxique que de Saussure aurait pu développer si tel avait été son désir. Dans NOL, la syntaxe est définie comme le processus par lequel les signes se combinent :
Syntax does not combine just signifiants or just signifiés, it combines relations between signifiants and signifiés, i.e., signs. Since signifié and signifiant are irreducibly united, any operation applying to one is reflected in the other. [La syntaxe ne combine pas seulement des signifiants et des signifiés; elle combine des relations entre les signifiants et les signifiés, c'est-à-dire les signes. Vu que le signifié et le signifiant sont irréductiblement unis, toute opération s'appliquant à l'un s'applique aussi à l'autre]
(Bouchard Reference Bouchard2013 : 84)La clé de la mise en œuvre d'une telle idée consiste à considérer la juxtaposition comme étant le possible signifiant d'un signe combinatoire. Selon Bouchard, une fois cette étape franchie, il s'ensuit qu'il doit exister une relation iconique entre forme et sens, ou, dans ses propres mots, « [e]very syntactic combination reflects a semantic combination » [chaque combinaison syntaxique reflète une combinaison sémantique] (Bouchard Reference Bouchard2013 : 247)Footnote 3. Fort de cette idée, Bouchard offre des explications pour un grand nombre de phénomènes qui ont constitué la base de données sur laquelle se fondent les théoriciens de la syntaxe générative. Ces phénomènes incluent les dépendances à distance, les anaphores, les relations de c-commande asymétriques, les constructions à montée et bien d'autres. Par exemple, l'auteur soutient que la relation de c-commande « is actually just an artifact of the semantic analysis of the data » [est en fait simplement un artéfact de l'analyse sémantique des données] (Bouchard Reference Bouchard2013 : 260) et que la plupart des supposées non-concordances entre la forme et le sens ne sont en réalité qu'apparentes, comme peut le démontrer une analyse sémantique appropriée des éléments en jeuFootnote 4.
Sur le plan épistémologique, la pièce de résistance de NOL est l'Hypothèse substantive (HS) : « [T]he most explanatory linguistic theory is one that minimizes the elements (ideally to zero) that do not have an external motivation in the prior properties of the perceptual and conceptual substances of language » [La théorie linguistique qui a le plus grand pouvoir explicatif est celle qui réduit (idéalement à zéro) les éléments qui ne sont pas motivés indépendamment des propriétés antérieures des substances perceptuelles et conceptuelles du langage.] (Bouchard Reference Bouchard2013 : 83)Footnote 5. En effet, selon Bouchard, « there is no independent level of syntax. Syntax is just a set of combinatorial signs, with their signifiés determined by general properties of the Conceptual-Intentional (CI) component, and their signifiants determined by general properties of the Sensory-Motoric (SM) component » [il n'y a pas de niveau indépendant de la syntaxe. La syntaxe est simplement un ensemble de signes combinatoires, avec leurs signifiés qui sont déterminés par les propriétés générales de la composante conceptuelle-intentionnelle (CI) et les signifiants déterminés par les propriétés générales de la composante sensori-motrice] (Bouchard Reference Bouchard2013 : 83). Par souci d’équité, je dois signaler que, nulle part, Bouchard ne rejette catégoriquement l'existence possible de généralisations non basées sur le signe; il soutient plutôt que la théorie « idéale » (la plus explicative) serait exempte de telles généralisations. L'objet du présent article est de démontrer que la théorie « idéale » de Bouchard manque d'appui empirique. Dans les sections suivantes, ma stratégie consistera à discuter de deux classes de phénomènes problématiques en regard de la version forte de l'HS : les généralisations morphosyntaxiques non basées sur le signe et les pressions externes et indépendantes du signe sur les grammaires.
3. Généralisations morphosyntaxiques non basées sur le signe
Il semble exister plusieurs types de généralisations morphosyntaxiques qui ne sont pas basées sur le signe. Les prochaines sous-sections en exposent trois grands types : premièrement, l'existence de contraintes architecturales générales sur les interactions entre les composantes grammaticales (3.1); deuxièmement, l'existence de contraintes purement structurales dans les langues (3.2); et troisièmement, l'existence de généralisations purement syntaxiques dans des langues données (3.3).
3.1 L'existence de contraintes architecturales générales sur l'interaction entre les composantes grammaticales
Dans une série de publications de Geoffrey Pullum et Arnold Zwicky (Zwicky et Pullum Reference Zwicky and Pullum1983, Reference Zwicky and Pullum1986; Miller et al. Reference Miller, Pullum and Zwicky1997), le principe suivant est défendu :
(1) Principe d'inaccessibilité de la phonologie à la syntaxe (PIPS) :
Dans la grammaire d'une langue naturelle, les règles syntaxiques ne font aucune référence à la phonologie.
Il est clair que le PIPS n'est pas une généralisation basée sur le signe, puisque nous avons là un cas où une combinaison syntaxique ne reflète pas une combinaison sémantique. Le PIPS est-il valide? À mon avis, cette hypothèse est trop forte, car il existe des règles syntaxiques qui semblent faire référence à des aspects suprasegmentaux de la phonologie, incluant la structure syllabique, le poids phonologique et certains aspects de l'accentuation et de l'intonation. J'en donne deux exemples en 3.3 ci-dessous. Toutefois, une version moins forte du PIPS semble viable :
(2) Principe d'inaccessibilité de la phonologie segmentale à la syntaxe (PIPSS) :
Dans la grammaire d'une langue naturelle, les règles syntaxiques ne font aucune référence à la phonologie segmentale.
Selon le PIPSS, il n'y a pas de langues dans lesquelles le processus de formation des passifs, des déplacements d’éléments Qu ou de l'inversion d'auxiliaires fait référence à la configuration phonologique d'un nombre quelconque de segments à l'intérieur d'un des éléments soumis au processus. Il n'existe pas de langues dans lesquelles seuls les verbes contenant des voyelles antérieures admettent le passif ou dans lesquelles l'ordre des mots de deux constituants contigus est déterminé par la sonorité relative de leurs consonnes initiales. Cette contrainte est étonnante, étant donné qu'on s'entend généralement pour dire que les règles phonologiques sont accessibles à l'information syntaxique (voir Selkirk Reference Selkirk1972 et Kaisse Reference Kaisse1985). Il n'y a pas de raison (logiquement) nécessaire pour que le langage incorpore cette propriété architecturale non basée sur le signe, pas plus qu'il n'existe d'explication fonctionnelle pour ce fait intéressant. L'existence de ce principe constitue de prime abord un contre-exemple à l'HSFootnote 6.
Mon autre exemple de contrainte architecturale générale sur l'interaction entre les composantes grammaticales est un peu plus complexe. Il a à voir avec l'interaction entre l'assignation de cas et des phénomènes de déplacement, et il n'est pertinent que, pour les langues dans lesquelles on observe une productivité du marquage casuel des sujets et des objets directs, des arguments déplacés en positions d'arguments (passif et/ou montée, en termes dérivationnels) et des arguments déplacés en positions non argumentales (mouvement Qu, en termes dérivationnels). Dans toutes les langues qui me sont familières, il existe une relation d’« alimentation » entre ces phénomènes, qui est comme suit :
(3) Le passif/La montée alimente l'assignation de cas, qui, à son tour, alimente les mouvements Qu.
Prenons un exemple de l'anglais (dans un dialecte où who ‘qui (sujet)’ et whom ‘qui (objet)’ sont strictement distincts) :
(4)
a. She/*Her was seen by him.
3sg a été vue par lui
‘Elle a été vue par lui.’
b. *Who/Whom did you see?
‘Qui avez-vous vu?’
Le sujet passif est au cas nominatif, alors que le syntagme Qu déplacé est au cas objectif, en accord avec (3). Je ne connais aucune langue dans laquelle le mouvement Qu alimente systématiquement l'assignation de cas qui, à son tour, alimente systématiquement le passif/la montée. Dans une telle langue, les éléments Qu déplacés ne seraient pas marqués pour le cas, alors que le déplacement d'arguments dans la formation du passif préserverait le marquage casuel de l'objet directFootnote 7. Au début de la grammaire transformationnelle, cet état de choses était décrit par l'ordonnancement strict des règles (voir, par exemple, Akmajian et Heny Reference Akmajian and Heny1975). Depuis les années 1980, la généralisation découle de l'architecture de la grammaire elle-même. Les exemples incluent une distinction de principe entre les traces de SN et celles d’éléments Qu (Chomsky Reference Chomsky1981), un niveau dit « structure NP » (van Riemsdijk et Williams Reference van Riemsdijk and Williams1981), et, dans les modèles lexicalistes, la génération à la base des arguments passifs et des arguments « montés », de pair avec un mécanisme de transmission des traits pour les éléments générés à la base dans des positions non argumentales (Gazdar et al. Reference Gazdar, Klein, Pullum and Sag1985, Bresnan Reference Bresnan2001). Aucune de ces solutions ne semble compatible avec l'HS, puisque, dans chacune, il y a des combinaisons syntaxiques qui ne reflètent pas les combinaisons sémantiques.
3.2 L'existence de contraintes purement structurales dans les langues
L'HS semble empêcher l'existence de contraintes purement structurales dans les langues. Permettez-moi de donner un exemple de Mark C. Baker (Reference Baker1988) basé sur les travaux antérieurs de Mithun (Reference Mithun1984, Reference Mithun1986) : il y a une contrainte universelle selon laquelle, dans des propositions transitives, l'objet direct, mais non pas le sujet, peut être incorporé au verbe. Ainsi, des verbes « incorporés » complexes tels que (5a) sont possibles, alors qu'aucune langue à sujet nul ne comporte de constructions telles que (5b) :
(5)
a. The baby house-likes.
‘Le bébé maison-aime.’
b. *e [Vbaby-likes] the house.
*e [Vbébé-aime] la maison.
Notez qu'il n'y a rien de sémantiquement ou pragmatiquement déviant dans (5b). On pourrait imaginer une interprétation analogue à celle de ‘le/un bébé aime la maison’. L'explication de Baker est purement structurale. Un principe de la Grammaire universelle (le Principe des catégories vides) bloque le déplacement d'un sujet « vers le bas » dans la direction du verbe.
Un autre exemple peut être fourni par la Contrainte sur les structures coordonnées. Cette contrainte a été formulée par Ross (Reference Ross1967), comme en (6):
(6) Contrainte sur les structures coordonnées (CSC) :
Dans une structure coordonnée, aucun des constituants coordonnés ne peut être déplacé, et aucun élément contenu dans un constituant coordonné ne peut être extrait de ce dernier.
Notez que la CSC comporte deux propositions. Ross a illustré la première avec les exemples suivants :
(7)
a. *What sofa will the chair be put between some table and?
quel sofa aux la chaise être placée entre une table et?
b. *What table will the chair be put between and some sofa?
quelle table aux la chaise être placée entre et un sofa?
Ross a illustré la seconde proposition de la CSC comme suit :
(8)
a. *What did John eat hamburgers and Bill drink ___?
quoi aux John manger hamburgers et Bill boire ___?
b. *What did John eat ___ and Bill drank milk?
quoi aux John manger ___ et Bill a bu du lait?
Il s'avère qu'il existe cependant plusieurs contre-exemples à la seconde proposition de la CSC :
(9)
a. What did John go to the store and buy __? (Reference RossRoss 1967)
quoi aux John aller au magasin et acheter __?
‘Qu'est-ce que John est allé acheter au magasin?’
b. How much can you drink __ and still stay sober? (Reference GoldsmithGoldsmith 1985)
quelle quantité peux tu boire __ et toujours rester sobre?
‘Quelle quantité peux-tu boire tout en restant sobre?’
c. What did he go to the store, buy __, load __ in his car, drive home, and unload __? (Reference Lakoff, Farley, Farley and McCulloughLakoff 1986)
quoi aux il aller au magasin, acheter __, charger __ dans sa voiture, conduire à la maison, et décharger __?
‘Qu'est-ce qu'il est allé acheter au magasin, mis dans sa voiture, rapporté à la maison et déchargé de sa voiture?’
Toutefois, autant que je sache, la première proposition de la CSC est universelle et sans exception. Autrement dit, la première proposition semble être un exemple de contrainte purement structurale qui s'applique dans toutes les langues. On pourrait faire l'hypothèse que les violations à la CSC (voir (7a) et (7b)) posent des difficultés de parsage, d'où leur inacceptabilité. Bien que même les violations de parsage d'origine structurale soient problématiques pour une version forte de l'HS (voir la section 4 ci-dessous), ce ne sont pas toutes les violations à la CSC qui posent des problèmes de parsage. Considérons ce qui suit :
(10)
a. John ate beans and rice.
‘Jean a mangé des fèves et du riz.’
b. *What did John eat beans and?
‘Qu'est-ce que Jean a mangé des fèves et?’
Non seulement (10b) est à la fois facilement interprétable et indéniablement inacceptable, mais en plus, cet exemple contraste très peu avec la phrase suivante :
(11) What did John eat beans with?
quoi aux Jean manger des fèves avec?
‘Avec quoi Jean a-t-il mangé des fèves?’
La seule différence entre (10b) et (11) est que le premier exemple viole une contrainte structurale universelle, alors que le second, non. Il m'est difficile de voir comment une telle généralisation pourrait être compatible avec les prédictions de la Théorie du langage basée sur le signe.
3.3 L'existence de généralisations purement structurales spécifiques à des langues données
Tournons-nous maintenant vers les généralisations structurales propres à une langue en commençant par les cas les plus simples. La question des morphèmes cranberry est connue depuis les années 1940. Il s'agit de suites phonétiques en apparence morphémiques, mais non liées à un contenu sémantique évident. Des mots comme cranberry ‘canneberge’, mulberry ‘mûre’, twilight ‘crépuscule’ et cobweb ‘toile d'araignée’ sont plutôt clairement bimorphémiques puisque que berry ‘baie’, light ‘lumière’ et web ‘toile’ y ont des sens qui se rapprochent de leurs significations usuelles (c'est-à-dire ce sont des signes). Toutefois, cran, mul, twi et cob ne sont pas des signes, car aucun sens indépendant ne peut être relié à leur contenu phonétique. On peut dire la même chose du segment -ceive de l'anglais. Il doit s'agir d'un morphème, puisqu'il se combine avec plusieurs préfixes (per-, con-, re-, trans- et de-) pour former des mots. Et pourtant, il n'a aucun sens indépendant.
Plusieurs pages de NOL sont consacrées à la démonstration que les explétifs there ‘il y a’ et it ‘il’, soi-disant dépourvus de sens, ont en réalité un sens, comme le veut l'HS. Il est cependant moins clair qu'une telle affirmation puisse s'appliquer au complémenteur that ‘que’. En effet, de quelle façon les phrases (12a) et (12b) pourraient-elles avoir des sens différents?
(12)
a. Mary thinks that it's time to leave.
‘Marie pense qu'il est temps de partir.’
b. Mary thinks it's time to leave.
‘Marie pense qu'il est temps de partir.’
En fait, une douzaine de facteurs semblent interagir pour déterminer la probabilité de l'apparition du complémenteur that dans le discours (Bolinger Reference Bolinger1972, Quirk et al. Reference Quirk, Greenbaum, Leech and Svartvik1985, Thompson et Mulac Reference Thompson and Mulac1991, Biber et al. Reference Biber, Johansson, Leech, Conrad and Finegan1999, Ferreira et Dell Reference Ferreira and Dell2000, Hawkins Reference Hawkins2001, Yaguchi Reference Yaguchi2001, Dor Reference Dor2005, Kaltenböck Reference Kaltenböck2006, Kearns Reference Kearns2007, Dehé et Wichmann Reference Dehé and Wichmann2010, Jaeger Reference Jaeger2010). Parmi ces facteurs, nous trouvons :
(13)
a. le type et la fréquence du verbe matrice;
b. le type de sujet de la proposition matrice (pronom vs syntagme nominal complet);
c. le choix du pronom de la proposition matrice;
d. la longueur, le type et la référence du sujet enchâssé;
e. la position et la fonction de la proposition enchâssée;
f. la voix de la proposition principale (active vs passive);
g. l’évitement de l'ambiguïté;
h. l'adjacence ou la non-adjacence linéaire du verbe matrice et du complémenteur that;
i. le niveau de langue;
j. l'affirmation de la valeur de vérité (Dor Reference Dor2005) attribuée au contenu exprimé dans la proposition enchâssée;
k. la structure rythmique de l’énoncé;
l. les connaissances et les croyances du locuteur;
m. la densité de l'information véhiculée par l’énoncé.
Plusieurs de ces facteurs n'ont rien à voir avec le sens, quel que soit le sens qu'on attribue au terme sens.
On a souvent affirmé que l'ordre des morphèmes est sémantiquement dépendant, comme semble le supposer une théorie basée sur le signe. On en a un exemple clair dans une langue agglutinante typique comme le turc, dans laquelle une série d'affixes suit la racine :
(14) ev-ler-i-den
maison-pl-poss-abl
‘de leur maison’
L'ordre des morphèmes semble au moins en partie basé sur des notions telles que la portée, la pertinence et ainsi de suite (voir Tesnière Reference Tesnière1939, Bybee Reference Bybee1985, Butler Reference Butler2006). Toutefois, Larry Hyman a soutenu dans plusieurs articles que l'ordonnancement relatif de quatre des suffixes qui changent la valence en bantou est exclusivement déterminé par leur identité morphologique (voir, par exemple, Hyman Reference Hyman, Booij and van Marle2002). De leur côté, Hargus et Tuttle (Reference Hargus and Tuttle1997) discutent du placement du préfixe négatif s- en wet'suwet'en, une langue athabaskane parlée en Colombie-Britannique. Dans certains cas, s- apparaît à l'intérieur du préfixe de Temps/Aspect (T/A). En présence de sujets « internes », le préfixe s- apparaît à l'extérieur du préfixe T/A. L'analyse de Hargus et Tuttle est que l'ordre typique des préfixes est Nég-T/A, mais que cet ordre peut varier de sorte que s- devienne une coda, sauf dans les cas où cela créerait une coda complexe. Une telle condition sur l'ordre des morphèmes n'est pas basée sur le signe.
Considérons maintenant des cas où il y a une relation co-univoque entre la forme d'un morphème particulier et ses sens. Le redoublement en tagalog et l'inflexion vocalique (umlaut) de l'allemand en sont de bons exemples. Chacun de ces phénomènes a des effets sémantiques nombreux et variés :
(15)
a. Redoublement en tagalog : les gérondifs, les adjectifs comparatifs pluriels, les noms de métiers et de professions, les adjectifs causatifs, les verbes atténuants, les verbes intensifs, etc.
b. Inflexion vocalique en allemand : certains pluriels, certains noms abstraits, les diminutifs, certains noms féminins dérivés, les noms agentifs et instrumentaux, certains adjectifs dérivés, etc.
La version forte de l'HS interdirait toute référence aux processus de redoublement et de changement vocalique en soi, puisque ces processus ne sont pas en et par eux-mêmes basés sur le signe (ils sont définis en termes morphophonémiques). L'HS exigerait plutôt que le tagalog comporte des signes de redoublement distincts pour la formation des gérondifs, des adjectifs comparatifs pluriels, des noms de métiers et de professions, etc. Ces multiples structures forme-sens rendraient opaque la généralisation morphologique.
Demandons-nous maintenant s'il existe des généralisations syntaxiques non basées sur le signe. Une autre façon d'aborder la question est de se demander si la syntaxe a un certain degré d'autonomie. Il semble qu'il existe bel et bien des configurations syntaxiques dont la « réalité » est indépendante des sens avec lesquels ils sont associés. Considérons la structure des adjectifs avec des compléments infinitifs en anglais :
(16) nom – copule – adjectif – infinitif
Il y a six façons (logiquement) possibles de mettre le SN-sujet en relation (en termes de relations sémantiquement interprétables) avec l'adjectif et le verbe. Les six sont attestées :
(17) Relation du SN-sujet avec Adj avec V
a. Mary is eager to please. sujet sujet
‘Marie est désireuse de plaire.’
b. Mary is easy to please. aucune objet
‘Marie est facile à plaire.’
‘Il est facile de plaire à Marie.’
c. Mary is liable to be offended. aucune sujet
‘Marie est susceptible d’être offensée.’
d. Guns are cheap to buy. sujet objet
‘Les fusils ne coûtent pas cher.’
e. It is useless to try. aucune aucune
‘Il est inutile d'essayer.’
f. It is too dark to see. sujet aucune
‘Il fait trop noir pour voir.’
Il est clair qu'il y a quelque chose de « réel » dans la configuration elle-même, quels que soient les sens ou les usages qu'elle pourrait véhiculer. Autrement dit, les configurations formelles elles-mêmes ont une autonomie, laquelle ne peut être dérivée du sens ou de l'usage.
Nous avons vu des exemples de morphèmes dont l'ordre est phonologiquement déterminé. Il y a également des exemples de mots dont l'ordre est phonologiquement déterminé. Ainsi, en chinois, les composés peuvent prendre les formes V-O-Tête ou O-V-Tête (Duanmu Reference Duanmu1997) :
(18) V-O-Tête
qui cai dao
couper légume couteau
‘couteau à légumes’
(19) O-V-Tête
luobo jiagong dao
navet transformer couteau
‘couteau à navet’
L'ordre des mots est phonologiquement déterminé : quand V et O sont tous les deux monosyllabiques, l'ordre V-O-Tête est le seul possible. Quand V et O sont tous les deux disyllabiques, l'ordre O-V-Tête est le seul possible.
L'ordre des mots anglais révèle également des généralisations non basées sur le signe. Considérons la permutation d’éléments phonologiquement ou structuralement « lourds » vers la droite :
(20)
a. ? I met the twenty-three people who I had taken Astronomy 201 with last semester in the park.
‘J'ai rencontré les vingt-trois personnes avec qui j'ai suivi le cours d'astronomie 201 le semestre dernier dans le parc.’
b. I met in the park the twenty-three people who I had taken Astronomy 201 with last semester.
‘J'ai rencontré dans le parc les vingt-trois personnes avec qui j'ai suivi le cours d'astronomie 201 le semestre dernier.’
Certains ont soutenu que le déplacement à droite a une fonction de focalisation (focusing) et qu'il est par conséquent basé sur le signe. Cela n'est toutefois pas nécessairement vrai, comme le montrent les phrases suivantes :
(21)
a. To whom did you give all your books on the phonetic foundations of conventional implicature?
‘À qui as-tu donné tous tes livres sur les fondements phonétiques de l'implicature conventionnelle?’
b. I gave [to Mary] [all of my books on that topic].
‘J'ai donné à Marie tous mes livres sur ce sujet.’
En (21b), c'est le constituant [to Mary] qui est focalisé, et non pas [all of my books on that topic].
Tout processus morphosyntaxique qui privilégie la position syntaxique aux dépens du contenu sémantique de l’élément occupant cette position est problématique pour la version forte d'une théorie basée sur le signe. Considérons par exemple la loi de Wackernagel, qui stipule (à partir de données de plusieurs langues indo-européennes) que la deuxième position est réservée aux clitiques, quel que soit leur contenu sémantique. Un constat similaire pourrait être fait au sujet des langues V2, dans lesquelles essentiellement n'importe quel élément peut apparaître en position initiale, pourvu que le verbe tensé occupe la deuxième position.
Dans les langues, nous trouvons également des phénomènes qui posent des défis pour l'HS, y inclus la négation de phrase. On suppose généralement que la sémantique de la négation est essentiellement la même d'une langue à l'autre. Or, la réalisation morphosyntaxique de la négation varie largement d'une langue à l'autre. Par exemple, dans certaines langues telles que le tongien, la négation est encodée par un verbe qui permet la présence d'un complément. ‘Ikai se comporte comme un verbe de la classe de seem (nous savons qu'il y a un complément parce que ke n'apparaît que dans des propositions enchâssées) :
(22)
a. Na'e ‘alu ‘a Siale.
asp aller abs Charlie
‘Charlie y est allé.’
b. Na'e ‘ikai [S ke ‘alu ‘a Siale].
asp nég asp aller abs Charlie
‘Charlie n'y est pas allé.’ tongien (Churchward Reference Churchward1953 : 56, Payne Reference Payne and Shopen1985 : 208)
D'autres langues traitent le marqueur de négation comme un verbe auxiliaire. En ladakhi, une langue sino-tibétaine parlée en Inde, les auxiliaires yin et yod marquent ensemble le présent progressif, mais dans la forme négative, yod est remplacé par sa forme négative med. Le négatif med remplace yod dans la forme négative de toutes les catégories temps-aspect-mode où cette forme de la copule (yod) apparaît :
(23)
a. pəlldənni ʂpečhə ɖi-yin-yot.
Paldan.erg livre.abs écrire-aux-aux
‘Paldan est en train d’écrire un livre’.
b. pəlldənni ʂpečhə ɖi-yin-met.
Paldan.erg livre.abs écrire-aux-nég
‘Paldan n'est pas en train d’écrire un livre’. ladakhi (Koshal Reference Koshal1979, Miestamo Reference Miestamo2005)
Dans plusieurs langues, sinon la plupart, la négation est représentée par un affixe dérivationnel, ce qui peut être illustré par un exemple du turc où le morphème de la négation est l'un d'une série de tels affixes :
(24) acı-n-dır-ıl-ma-dı-k.
endeuiller-réfl-caus-pass-nég-pst-1.pl
‘Nous n'avons pas eu à nous endeuiller.’ turc (Payne Reference Payne and Shopen1985 : 227)
En evenki, anciennement connu sous le nom de tungus, un élément négatif (a#cin) appartient à la classe des noms. Considérons ce qui suit :
(25)
a. Nuηan a#cin.
il absence
‘Il n'est pas ici.’
b. Nuηartin a#cir.
ils absence
‘Ils ne sont pas ici.’
c. Nuηartin a#cir-du-tin.
ils absence-loc-leur
‘en leur absence’ evenki (Payne Reference Payne and Shopen1985 : 228)
L'exemple (25c) montre que a#cin a une forme plurielle et prend des terminaisons casuelles, comme les noms ordinaires. En anglais, le mot not ‘pas’ est un adverbe de la même classe que never ‘jamais’, always ‘toujours’, just ‘seulement’ et barely ‘à peine’ (Jackendoff Reference Jackendoff1972, Baker Reference Baker1991, Ernst Reference Ernst1992, Kim Reference Kim2000, Newmeyer Reference Newmeyer, Birner and Ward2006). Autrement dit, la négation vient appuyer l'idée qu'il existe des généralisations morphosyntaxiques qui ne sont pas directement liées à des généralisations sémantiques.
4. Les pressions externes sur la grammaire non basées sur le signe
Selon l'interprétation la plus forte de l'HS, toutes les généralisations morphosyntaxiques sont basées sur le signe. Conséquemment, semble-t-il, les grammaires ne devraient pas être sujettes aux pressions externes non basées sur le signe, c'est-à-dire des pressions non fondées sur quelque fonction d'optimisation des correspondances entre forme et sens (c'est-à-dire l'augmentation du degré d'iconicité liant la forme et le sens). Cependant, plusieurs pressions externes non basées sur le signe sont attestées, dont deux sont discutées dans Haspelmath (Reference Haspelmath, MacWhinney, Malchukov and Moravcsik2014) :
(26)
a. Minimisation de la forme basée sur la fréquence (« économie ») :
Les formes les plus fréquentes tendent à être plus courtes que les formes plus rares.
b. Encodage grammatical basé sur les classes (« pression systémique ») :
Les règles de grammaire ciblent généralement des classes larges d’éléments plutôt que des expressions individuelles ou des classes restreintes.
Ainsi, en accord avec (26a), les singuliers tendent à être plus courts que les pluriels, les formes pour le temps présent tendent à être plus courtes que les formes pour le temps futur, les possessifs inaliénables tendent à être plus courts que les possessifs aliénables, etc. Il est difficile de voir comment l'HS pourrait être compatible avec des généralisations semblables. En accord avec (26b), dans la plupart des langues, les marques de pluriel s'appliquent à tous les noms, et non seulement à ceux dont l'emploi singulier est le plus fréquent. En anglais, bien que les occurrences textuelles de eyes ‘yeux’ et trees ‘arbres’ soient plus nombreuses que celles de eye ‘œil’ et tree ‘arbre’, la pression systémique impose l'emploi du suffixe pluriel standard -s. Dans le même ordre d'idées, la pression systémique agit même plus fortement sur les marques verbales de personnes que sur les marques de nombre. Haspelmath affirme ne pas connaître de langue dépourvue du marquage de la troisième personne avec des verbes d'action comme work ‘travailler’ ou drink ‘boire’, mais tout en étant à la fois dépourvue du marquage de la première personne et pourvue du marquage de la troisième personne avec des verbes expérientiels tels que want ‘vouloir’, feel ‘ressentir’ et hope ‘espérer’.
La pression systémique sur le changement grammatical peut aussi être illustrée par le développement de l’échouage des prépositions (preposition-stranding) en anglais, soit dans des phrases telles que les suivantes :
(27)
a. Who did you talk to?
qui aux vous parler à
‘À qui avez-vous parlé?
b. Mary was talked to.
Mary aux parler à
‘Quelqu'un a parlé à Mary.’
Malgré la rareté de l’échouage d’éléments dans les langues, l'existence de ce phénomène remonte au vieil anglais. Par contre, fait intéressant, son domaine d'application a évolué au fil des ans et s'est plutôt, dans l'ensemble, étendu :
(28) Chronologie de l’échouage des prépositions en anglais
a. Vieil anglais (peut s'appliquer dans toutes les opérations de type mouvement Qu sans « pronom Qu » réalisé; topicalisation)
b. Débuts du moyen anglais (dans les mouvements Qu réalisés)
c. Moyen anglais plus tardif (dans les passifs)
d. Anglais moderne (au-delà d'un objet direct; par exemple, Who did they take advantage of? ‘De qui ont-ils profité?’; Mary was taken advantage of. ‘On a profité de Marie.’) (Allen Reference Allen1980, van Kemenade Reference van Kemenade1987)
Alors, qu'est-ce qui se passe ici? Nous sommes en présence d'un cas classique d'extension du domaine d'un processus grammatical existant. Les locuteurs utilisent la forme type et ils semblent l'aimer et l'employer dans des contextes de plus en plus nombreux. Je ferai l'hypothèse que cela découle de l'apparition, dès le début de la formation de l'anglais, d'autres types de phrases qui se terminent par des éléments de type prépositionnel :
(29)
a. Syntagmes verbaux avec particules postposées :
i. I looked the answer up.
‘J'ai cherché la réponse.’
ii. Let's check it out.
‘Allons vérifier ça.’
b. Particules directionnelles finales de type prépositionnel :
i. I found this lying around.
‘J'ai trouvé ça qui traînait.’
ii. She's coming up (e.g., the stairs).
‘Elle est en train de monter (par exemple, les escaliers).’
En d'autres termes, l’échouage des prépositions a été renforcé par l'existence de constructions similaires (mais analytiquement indépendantes) dans la langue. Par contre, à partir du moment où on parle de formes ou de patrons exerçant une pression sur une construction particulière, on se distancie nécessairement d'une théorie strictement basée sur le signe.
Les pressions externes qui ont une incidence sur l'ordre linéaire des principaux constituants de la phrase permettent aussi de tester l'HS. NOL propose une généralisation basée sur le signe (Bouchard Reference Bouchard2013 : 93) :
(30) Paramètre de linéarisation : le prédicat précède/suit l’élément auquel il s'applique.
Une théorie concurrente fait appel à des relations structurales et à une pression sur le parsage en tant que facteur déterminant qui influence l'ordre linéaire. Abondant dans ce sens, Dryer (Reference Dryer1992) a proposé ce qu'il a appelé la Branching-Direction Theory : pour les paires d’éléments associés, l'un syntagmatique et l'autre non syntagmatique (c'est-à-dire lexical), le nœud syntagmatique précède systématiquement ou suit systématiquement le nœud non syntagmatique. Autrement dit, la généralisation indépendante de la sémantique est que dans les langues les branchements tendent à être systématiquement gauche-droite ou uniformément droite-gauche. Hawkins (Reference Hawkins1994, Reference Hawkins2004) a montré que la Branching-Direction Theory découle directement de sa propre théorie de parsage et de son influence sur la structure grammaticale. L'idée maîtresse de cette théorie est que c'est dans l'intérêt d'un interlocuteur de reconnaître les groupements syntaxiques d'une phrase aussi rapidement que possible, intérêt qui se manifeste tant dans l'usage de la langue que dans la structure grammaticale. Dans le premier cas, quand le locuteur a un choix, il s'adapte généralement à la préférence de l'interlocuteur. Dans le second cas, la typologie des grammaires reflète généralement des préférences de parsage. Le principe central de la théorie de Hawkins est celui de la minimisation des domaines :
(31) Principe de minimisation des domaines (PMD) :
L'interlocuteur préfère l'ordonnancement d’éléments qui mènent à la reconnaissance la plus rapide de la structure de la phrase, ce qui influence par conséquent le mécanisme de parsage.
Considérons certaines prédictions typologiques du PMD. Dans une langue VO comme l'anglais, les têtes précèdent typiquement les compléments :
(32) V-SN, P-SN, A-of-SN, N-of-SN
Dans chaque cas, une tête « plus légère » précède un complément « plus lourd »; le placement du syntagme complément plus lourd après la tête lexicale plus légère permet une reconnaissance plus rapide de tous les constituants du syntagme dominant. En fait, la tendance léger-avant-lourd est loin de se limiter à la seule relation tête-complément. Par exemple, l'ordre canonique des constituants SV est systématiquement de léger-à-lourd :
(33) SV[V-SN-SP-SC] (convaincre mes étudiants avec des exemples bien choisis que toutes les grammaires ont des failles)
Notons également que les adjectifs et les participes sans compléments peuvent précéder la tête en anglais :
(34)
a. a silly proposal
‘une proposition stupide’
b. the ticking clock
‘l'horloge qui fait tic-tac’
Par contre, si ces adjectifs et ces participes ont des compléments, l'adjectif ou le participe, avec son complément, doit apparaître après la tête :
(35)
a. *a sillier than any I've ever seen proposal
b. a proposal sillier than any I've ever seen
‘une proposition plus stupide que toutes celles que j'aie jamais entendues’
(36)
a. *the ticking away the hours clock
b. the clock ticking away the hours
‘l'horloge qui marque les heures à coups de tic-tac’
Le PMD prédit clairement qu'une langue VO devrait être « prépositionnelle » et qu'une langue OV devrait être « postpositionnelle ». Et bien sûr, tel est généralement le cas. Comme le démontre Dryer (Reference Dryer1992), 94 % des langues OV sont postpositionnelles et 85 % des langues VO sont prépositionnellesFootnote 8. Le caractère exceptionnel des langues OV prépositionnelles (comme l'amharique) et des langues VO postpositionnelles (comme le finnois) s'ensuit directement. Aux fins d'illustration, considérons les quatre possibilités logiques, illustrées en (37a–d); VO et prépositionnelle (37a); OV et postpositionnelle (37b); VO et postpositionnelle (37c); et OV et prépositionnelle (37d) :
(37)
Suivant Hawkins, supposons que les grammaires sont organisées de façon à ce que leurs usagers puissent reconnaître les principaux constituants d'un syntagme aussi rapidement que possible. Dans les deux structures les plus courantes, (37a) et (37b), la reconnaissance du domaine du SV se limite à la distance entre V et P, en enjambant (crossing over) le SN objet. Par contre, dans les structures exceptionnelles (37c) et (37d), la reconnaissance du domaine prend plus de temps, car l'enjambement couvre l'objet ainsi que l'objet de la préposition. Ainsi, tant la régularité que l'exceptionnalité découlent naturellement de cette approche. Les cas exceptionnels sont simplement ceux qui contreviennent au Principe de minimisation des domaines.
La preuve de la supériorité d'une approche basée sur la performance plutôt que sur la Grammaire universelle pour expliquer la tendance léger-avant-lourd repose sur le fait que, quand les locuteurs d'une langue de type VO ont un choix, ils tendent à placer les constituants les plus courts devant les constituants les plus longs. Ainsi, à l'exception des cas de relations lexicales très étroites entre V et P, les SP peuvent typiquement apparaître dans n'importe quel ordre à la suite du verbe :
(38)
a. Mary talked to John about Sue.
‘Mary a parlé à John à propos de Sue.’
b. Mary talked about Sue to John.
‘Mary a parlé à propos de Sue à John.’
Toutes choses étant égales par ailleurs, cependant, plus la différence de longueur entre deux SP est grande, plus il est probable que les locuteurs placeront le PP le plus court en premier (Hawkins Reference Hawkins1994)Footnote 9. Fait intéressant, l'approche de Hawkins fait précisément les prédictions contraires pour les langues OV. On observe effectivement un effet lourd-avant-léger dans ces langues, tant dans l'usage de la langue que dans la grammaire elle-même. Par exemple, en japonais, les compléments longs seront plus probablement antéposés qu'extraposés. Encore une fois, aucun aspect de cette généralisation n'est basé sur le signe.
La généralisation basée sur la structure qu'est le PMD est préférable au paramètre de linéarisation basée sur le signe parce qu'elle est plus générale. Considérons les corrélations établies par Greenberg et exposées dans Dryer (Reference Dryer1992), dont les plus fortes sont énumérées en (39) :
(39) Corrélations, langues VO Corrélations, langues OV
adposition – SN SN – adposition
verbe copule – prédicat prédicat – verbe copule
want ‘vouloir’ – SV SV – want
verbe auxiliaire temps/aspect – SV SV – verbe auxiliaire temps/aspect
auxiliaire négatif – SV SV – auxiliaire négatif
complémenteur – S S – complémenteur
particule interrogative – S S – particule interrogative
élément adverbial de subordination – S S – élément adverbial de subordination
déterminant – Nʹ Nʹ – déterminant
mot pluriel – Nʹ Nʹ – mot pluriel
nom – génitif génitif – nom
nom – proposition relative proposition relative – nom
adjectif – terme de comparaison terme de comparaison– adjectif
verbe – SP SP – verbe
verbe – adverbe de manière adverbe de manière – verbe
L'approche Dryer-Hawkins est plus générale que le paramètre de linéarisation, parce que ce ne sont pas toutes les paires qui comportent des prédicats et des éléments auxquels ils s'appliquent. Par exemple, un complémenteur n'est pas un « prédicat » par rapport à une phrase, et un déterminant n'est pas un « prédicat » par rapport à un Nʹ. Or, dans les deux cas, les premiers éléments sont plus courts que les suivants, et en conséquence, ils forment une unité avec le verbe (lexical), et non avec l'objet (syntagmatique).
Le test décisif pour choisir entre les deux approches repose sur la non-existence d'une corrélation patente entre l'ordre N-Adj et l'ordre VO (Dryer Reference Dryer1988) :
(40) #Langues #Familles
OV et Adj-N 64 22
OV et N-Adj 94 21
VO et Adj-N 38 17
VO et N-Adj 91 22
Étant donné que les adjectifs et les noms sont tous les deux des éléments lexicaux, une approche basée sur le parsage prédit correctement qu'il n'y aura pas de corrélation entre l'ordre Adj-N et les ordres V-SN, P-SN, etc.
5. Quelques remarques spéculatives concernant l'hypothèse que la grammaire n'est pas naturellement basée sur le signeFootnote 10
Nous avons vu que l'Hypothèse substantive (HS) néo-saussurienne de Bouchard (Reference Bouchard2013) est trop forte. Ni les généralisations morphosyntaxiques ni les pressions externes qui peuvent contribuer à l'articulation de ces généralisations « have an external motivation in the prior properties of the perceptual and conceptual substances of language » [ne sont motivé[e]s indépendamment des propriétés antérieures des substances perceptuelles et conceptuelles du langage] (Bouchard Reference Bouchard2013 : 83). Dans ces dernières remarques, je tenterai de déterminer pourquoi la correspondance entre forme et sens est loin d’être absolue dans le langage.
La première remarque, et la moins intéressante, est que nous pouvons invoquer de purs accidents historiques. Considérons par exemple le fait que la plupart des adjectifs bisyllabiques de l'anglais commençant par un a- non accentué n'apparaissent pas en position prénominale :
(41) *the asleep baby, *the aslant window, *the ajar door, *the atilt picture, etc.
le endormi bébé, la inclinée fenêtre, la ouverte porte, le croche tableau, etc.
Aucune généralisation sémantique n'entre en jeu ici, puisque les constructions suivantes sont bien formées :
(42) the sleeping baby, the slanted window, the open door, the tilted picture
‘le bébé endormi, la fenêtre inclinée, la porte ouverte, le tableau croche’
La généralisation n'a pas de fondement phonologique non plus :
(43) the abrupt remark, the acerb comment, the astute recommendation
‘la remarque abrupte, le commentaire acerbe, la recommandation astucieuse’
L'agrammaticalité des expressions en (41) résulte d'un accident historique. La plupart des adjectifs qui n'apparaissent pas en position prénominale sont du point de vue historique des grammaticalisations de syntagmes prépositionnels :
(44) asleep < on sleep; awake < on wake; ajar < at jar
endormi < sur sommeil; réveillé < sur veillée; ouvert < à choc
Ces adjectifs n'apparaissent pas en position prénominale parce que les SP n'apparaissent pas dans cette position. D'un autre côté, abrupt ‘abrupte’, acerb ‘ascerbe’ et astute ‘astucieux’ ont connu des développements différents :
(45) abrupt (< Lat. abruptus); acerb (< acerbity < Fr. acerbité); astute (< Lat. astutus)
Étant donné leur évolution historique, il n'y a jamais eu d'obstacle à l'occurrence prénominale des adjectifs abrupt, acerb et astute.
Deuxièmement, comme nous l'avons vu, les grammaires sont en grande partie « conçues pour la vitesse ». L'avantage du parsage rapide est difficilement contestable. Chaque mot doit être tiré d'un corpus de 50 000 mots, identifié en un tiers de seconde et placé dans la bonne structure. Inévitablement, les exigences d'un parsage rapide auront priorité sur l'HS dans plusieurs cas.
Troisièmement, nous pouvons souligner les contraintes en temps réel imposées par l'appareil phonatoire (voir spécialement Chafe Reference Chafe1967). La linéarité inhérente de l'expression orale entraîne la nécessité de fusionner des distinctions sémantiques à l'intérieur d'une même position. Dans la plupart des langues, il y a beaucoup plus de rôles thématiques exprimables qu'il y a de moyens structuraux de les exprimer. Par conséquent, une relation grammaticale unique encode plus d'un rôle, ce qui résulte en une perte d'iconicité, comme dans les exemples suivants :
(46)
a. Mary threw the ball. [Mary est l'agent de l'action.]
‘Marie a lancé la balle.’
b. Mary saw the play. [Mary est l'expérienceur d'un événement.]
‘Marie a vu la pièce.’
c. Mary received a letter. [Mary est le but/bénéficiaire d'un transfert.]
‘Marie a reçu une lettre.’
d. Mary went from Chicago to Detroit. [Mary est un objet qui subit un changement de lieu.]
‘Marie est allée de Chicago à Détroit.’
Quatrièmement, les grammaires servent plusieurs fonctions et sont donc sujettes à plusieurs pressions, parfois conflictuelles (Martinet Reference Martinet1962), incluant même des pressions conflictuelles basées sur le signe. La montée d'un objet met l'emphase sur cet objet déplacé, comme en (47a) et en (47b). Toutefois, le coût de cette opération est la scission d'une entité sémantique, à savoir la relation entre le verbe et son objet direct :
(47)
a. What did you eat?
‘Qu’as-tu mangé?
b. Raw potatoes, I would never eat.
‘Des patates crues, je n'en mangerais jamais.’
Je clos la discussion avec quelques remarques hautement spéculatives. Le langage revêt plusieurs fonctions, qui le tirent dans toutes sortes de directions. Pour cette raison, il ne peut y avoir une relation invariablement simple entre forme et sens. Cependant, deux forces semblent suffisamment puissantes pour avoir « imprimé leur marque » sur la grammaire. L'une est la force qui pousse forme et sens à s'apparier, tel que souligné dans les théories néo-saussuriennes. L'autre est la force qui favorise la reconnaissance aussi rapide que possible de la structure de la phrase, autrement dit, la pression de parsage. Ces deux pressions elles-mêmes peuvent toutefois entrer en conflit, et dans certains cas, de façon notable. On en trouve deux exemples lorsqu'il y a la pression de parsage pour postposer une partie d'une unité sémantique ou encore lorsque la préférence pour l'ordre thème-prédicat entre en conflit avec la préférence long-court (lourd-léger), comme en japonaisFootnote 11. Le problème est donc d'obtenir une grammaire dont le degré de stabilité est suffisant pour l'affranchir de la pression constante de forces antagonistes. Une solution naturelle serait de doter le langage d'un noyau relativement stable et étanche aux pressions immanentes venant de toutes parts. Autrement dit, une solution naturelle consiste à incorporer au langage un système structural constituant son noyau. En d'autres termes, une composante syntaxique qui n'est pas exclusivement basée sur le signe constitue une solution intelligente au problème que posent l'apprentissage et l'usage d'une langue. Un tel système permet de réduire suffisamment le caractère arbitraire du langage pour en faciliter l'acquisition et l'usage, tout en étant suffisamment stable pour ne pas être tiraillé par des forces conflictuelles. Bref, il y a de bonnes raisons fonctionnelles pour que les grammaires ne soient pas entièrement basées sur le signe.
6. Conclusion
Dans cet article, nous avons examiné une composante clé de la Théorie du langage basée sur le signe de Denis Bouchard, à savoir l'Hypothèse substantive, selon laquelle « the most explanatory linguistic theory is one that minimizes the elements (ideally to zero) that do not have an external motivation in the prior properties of the perceptual and conceptual substances of language » [la théorie linguistique qui a le plus grand pouvoir explicatif est celle qui réduit (idéalement à zéro) les éléments qui ne sont pas motivés indépendamment des propriétés antérieures des substances perceptuelles et conceptuelles du langage.] (Bouchard Reference Bouchard2013 : 83). Nous avons vu que le langage présente plusieurs phénomènes systématiques qui n'ont apparemment aucune motivation perceptuelle ou sémantique. À mon avis, cet état de choses provient de l'interaction d'un certain nombre de facteurs : accidents historiques, pression pour une production et une compréhension rapide, contraintes imposées en temps réel par l'appareil phonatoire, et le fait que le langage sert à de multiples fonctions, lesquelles le « poussent » dans différentes directions. Le résultat est un système purement structural, qui fait interface avec la phonétique et la sémantique, mais qui ne peut être caractérisé uniquement en termes phonétiques ou sémantiques.