Table Of ContentVers une orthographe appropriée pour le kabba
Séminaire sur l’orthographe du ton des langues centrafricaines, SIL Yaoundé, du 5 au 23 janvier
2015, encadré par Dr Constance Kutsch Lojenga.
Rapport final rédigé par Dr David Roberts en collaboration avec M. BETINA Maguelet-Bodoli
(coordinateur du projet de traduction), M. NOUDJOUNDIMA Victor (coordinateur du projet
d’alphabétisation), et M. BANTAR-DJIMTOULOUM Constant (traducteur).
1. Présentation
1.1. Situation géographique et génétique
Le kabba [ksp] est une langue de la branche soudanique centrale du phylum
nilosaharien, parlée, estime-t-on, par 80.000 locuteurs en République Centrafricaine
(RCA) ainsi que, dans une moindre mesure, au Tchad et au Cameroun (Lewis et al. 2015).
Il existe une solide grammaire du kabba en anglais (Moser 2003), un dictionnaire
trilangue kabba-anglais-français (Moser 2007), un syllabaire destiné aux analphabètes
en trois tomes (Noudjoundima 2002), un guide de transition destiné aux francophones
désirant apprendre le kabba écrit (SIL 2002), ainsi que deux livres, de contes (Moser
2009) et de récits (Moser 2010).
Dans ce qui suit, les données orthographiques dans le corps du texte s’écrivent entre
<chevrons> et les données orthographiques dans les tableaux sans chevrons. Les
données phonémiques s’écrivent entre /barres obliques/ et les données phonétiques
entre [crochets]. Pour ce qui est des schèmes tonals, H est mis pour ‘ton haut’, M pour
‘ton moyen’ et B pour ‘ton bas’.
1.2. Décideurs et parties prenantes
Dans le courant de nos discussions, M. BETINA Maguelet-Bodoli, M. NOUDJOUNDIMA
Victor, et M. BANTAR-DJIMTOULOUM Constant (désormais « les participants ») ont
souligné qu’ils ne sont pas eux-mêmes les décideurs en matière d’orthographe kabba.
Les décisions sont plutôt prises par un comité local de langue, puis soumises pour
approbation à l’Institut de Linguistique Appliquée de l’Université de Bangui, organe
travaillant sous l’égide du Ministère de l’Éducation et de l’Enseignement Supérieur.
Néanmoins, il est clair que les trois participants à ce séminaire sont bien placés pour
proposer des rectifications au comité de langue, grâce à leurs métiers respectifs de
traducteurs et d’alphabétiseur, qui les confronter, tous les jours aux questions
d’ambiguïté dans la langue écrite.
L’orthographe actuelle du kabba a été arrêtée en 2000 et expliqué dans le guide de
transition (SIL 2002). Elle n’indique les tons que partiellement. Cependant, dans la
décennie qui s’est écoulée depuis l’arrêt de ces conventions, on a constaté que la
1
question de la représentation du ton mériterait d’être revue, car il reste d’autres
ambiguïtés à l’écrit.
1.3. Conventions pour représenter le ton en RCA
La RCA jouit d’une tradition quelque peu singulière pour indiquer les tons dans les
langues locales. Elle retient deux diacritiques, à savoir le circonflexe pour indiquer le
ton H et le tréma pour indiquer le ton M. Le ton B, lui, est marqué par l’absence
d’accent. Cette convention, d’abord employée en sango, langue véhiculaire de la RCA,
est recommandée pour les autres langues locales :
Tableau 1 : Conventions arrêtées pour la représentation du ton dans les langues centrafricaines
RCA API
H â [á]
M ä [ā]
B a [à]
Ce système a l’avantage que les deux diacritiques utilisés sont visuellement plus
distincts l’un de l’autre que ne sont les accents classiques (aigu, grave et macron).
L’inconvénient, en revanche, est que cette convention n’est utilisée nulle part ailleurs
en Afrique, et risque de rencontrer des réticences de la part des populations voisines
lorsqu’il s’agit des langues transfrontalières (au Tchad et au Cameroun dans le cas du
kabba).
1.4. Une représentation intégrale ou partielle ?
L’un de nos objectifs pendant ce séminaire était d’investiguer non seulement le système
tonal du kabba, mais aussi son rendement fonctionnel, pour évaluer si oui ou non
l’orthographe mérite une représentation intégrale des tons.
Les trois participants n’avaient pas trop de mal à ajouter des diacritiques à un texte de
400 mots. Au contraire : ils ont réussi avec un taux moyen d’exactitude de 86%. Ceci dit,
ils n’ont pas du tout apprécié la forme visuelle résultante : une densité diacritique de
63% (contre 3% dans l’orthographe actuelle). La répartition se résume comme suit :
Tableau 2 : fréquence et distribution des diacritiques dans une graphie tonale intégrale
pointage %
H
Circonflexe 217 35%
M
Tréma 173 28%
B
Absence 230 37%
UPT 620 100%
Ensuite, M. NOUDJOUNDIMA Victor a fait deux essais de représentation partielle sur le
même texte. D’abord il a écrit les tons systématiquement sur tous les verbes, et rien
d’autre. Or, sur les 91 verbes dans le texte, seulement dix sont jugés ambigus. Ensuite il
2
a essayé de marquer tous les substantifs, avec un résultat semblable. Sur les 84
substantifs dans le texte, seulement neuf sont jugés ambigus. Nous concluons donc que
de telles représentations partielles d’une catégorie grammaticale entière ne résoudront
pas le problème de l’ambiguïté dans l’orthographe actuelle.
Plutôt il semble judicieux de cibler uniquement certains cas de ton grammatical ainsi
que quelques lexèmes. Il s’agit de :
« […] découvrir là où les lecteurs ont du mal à décortiquer le sens, d’établir pourquoi, et
de ne rectifier que cela en laissant le reste de l'orthographe inchangé. Une métaphore
venant du contexte médical nous semble approprié à faire comprendre cela. Il s’agit de
la microchirurgie : une intervention chirurgicale d’une extrême précision, qui ne
provoque pas de dommages collatéraux. Cela veut dire qu’on doit se prémunir contre la
possibilité que, en éliminant certaines ambiguïtés, on en génère d'autres. […] On évite de
proposer des solutions qui peuvent avoir des répercussions néfastes ailleurs, afin
d’aboutir à une orthographe harmonieuse et limpide. » (Roberts 2008: 28)
C’est dans cette perspective que le présent rapport est rédigé. Après un bref résumé du
système tonal (section 2), nous présentons cinq arguments pour améliorer la graphie
des voyelles (section 3), puis nous passons en revue six propositions pour améliorer la
graphie tonale (section 4).
2. Aperçu du système tonal
A partir des 1.800 mots répertoriés dans le lexique, nous avons trié les substantifs selon
leurs structures syllabiques, puis par leurs schèmes tonals. Nous avons écarté les
emprunts et les mots composés. Cette démarche nous a permis de confirmer les trois
tons ponctuels, H, M et B identifiés par Moser (2003: 59).
2.1. Schèmes tonals des substantifs
Trois schèmes tonals sont attestés sur les substantifs monosyllabiques :
CV CVC
1 H dú fond bbɔ́l joue
2 wú escargot dér pigeon
3 jó canari búm poussière
4 M bū poudre kāl girafe
5 rī nom pɔ̄r chaux
6 yā porc-épic bbāl année
7 B mù herbe bèl plume
8 sà fumée màr crocodile
9 dò plaie wùm beau-parent
3
Huit des neuf schèmes tonals possibles sont attestés sur les substantifs dissyllabiques :
CVCV CV(C)CVC
10 HH kóró espèce de serpent jámkíl épilepsie
11 MM būru ̄ varan būlūm espèce d’herbe
12 BB kɔ̀sù houe gèrèm champs en jachère
13 HM gílā tumeur - -
14 HB mɔ́rì miracle rígèm hyène
15 MH gūsú manière yēréw saleté
16 MB - - - -
17 BM mbɔ̀kɔ̄ caillicédra tàkīr fagot
18 BH tìsá déchet dùndáy aubergine
Plusieurs substantifs commencent avec une voyelle <e> [ə] initiale. Nous avons noté
que :
- elle se prononce toujours à ton H ;
- elle est facultative dans certains mots ;
- rares sont les mots qui commencent par une voyelle autre que celle-ci ;
- en dehors d’elle, le schème tonal sur le reste du mot s’aligne avec ceux des autres
substantifs ;
- les mots en question témoignent d’une tendance sémantique : il y a beaucoup de
noms d’animaux.
Pour toutes ces raisons, on peut considérer que le schwa initial est la trace d’un ancien
préfixe de classe [ə́-]. Ceci constitue le seul cas d’un substantif singulier de structure
morphologiquement complexe. Tous les autres substantifs dans le corpus sont de
structure simple, c’est-à-dire que le substantif singulier est composé uniquement de
son radical sans aucune affixation.
2.2. Schèmes tonals des verbes
Trois schèmes tonals sont attestés sur les verbes monosyllabiques :
CV CVC
19 H tá préparer yár disputer
20 lá soutenir gɔ́l bercer
21 bú gagner mám tâtonner
22 M nī rêver nɔ̄m couver
23 tū fumer wūl refroidir
24 tɔ̄ se ramifier dānn accompagner
25 B pà dire kàr se tenir
26 tò être kɔ̀l aiguiser
27 kɔ̰̀ manger kèm respirer
4
Cinq des neuf schèmes tonals possibles sont attestés sur les verbes dissyllabiques :
CVCV
28 HH - -
29 MM gāngē arrêter
30 BB tètè casser
31 HM débbē couvrir
32 HB - -
33 MH ndōkó briller
34 MB - -
35 BM ngìsā se raser
36 BH - -
2.3. Taux de stabilité tonale
Nous avons testé les substantifs dans plusieurs combinaisons. Cette démarche a permis
de confirmer l’analyse de Moser (2003: 63), à savoir que les schèmes tonals des
substantifs restent entièrement stables en contexte. La même démarche avec les verbes
a produit un résultat semblable. Le taux de stabilité tonale du kabba est donc à 100%.
Il n’y a pas de downstep automatique en Kabba non plus. Un ton H ou un ton M qui suit
un ton B se prononce à la même hauteur que le ton H ou le ton M précédent.
3. Proposition pour améliorer la graphie des voyelles
Dans le courant de nos recherches sur le système tonal, il devenait évident assez tôt que
l’orthographe actuelle contient un exemple frappant de polyphonie1. Il s’agit d’un seul
graphème <e> pour représenter les trois phonèmes /ə, e, ɛ/. Ce fait ne concerne pas le
ton qui était le but de notre séminaire, bien sûr. Néanmoins, il serait imprudent d’en
passer sous silence.
Une analyse de la distribution des trois phonèmes en question dans un texte de 400
mots révèle que c’est le phonème /ə/ qui jouit du taux de fréquence le plus élevé, et
que celle du phonème /e/ s’y approche. Le graphème /ɛ/, lui, est nettement moins
fréquent :
Tableau 3 : Distribution et fréquence des phonèmes représentés par la graphème <e>
graphème phonème pointage cru %
e /ə/ 95 48
e /e/ 84 42
e /ɛ/ 19 10
198 100
1 Anglais : under-representation (par opposition à ‘polygraphie’ over-representation).
5
Cette polyphonie génère des ambiguïtés dans quatre domaines de la langue, il s’agit des
paires minimales lexicales (section 3.1), du complément d’objet de la 3e personne du
singulier (section 3.2) du possessif inaliénable (section 3.3), de l’opposition entre le
marqueur associatif aliénable et un déterminant (section 3.4), et de la particule <neenn>
(section 3.5). Parmi tous les phénomènes que nous avons étudiés pendant le séminaire,
cette carence semble la plus importante à régler. L’orthographe serait beaucoup plus
maniable si elle suivait le principe de la biunivocité2, en incorporant les graphèmes
/ə, ɛ/ dans l’orthographe.
3.1. Paires minimales lexicales
Les paires minimales suivantes prouvent l’opposition entre les phonèmes /ə/ et /e/ :
Graphie actuelle
/ə/ /e/
37 bbe B carquois bbe M ~ B village ~ champignon
38 bbere BM ~ MM esclave ~ taille bbere BH patronyme
39 bere BM ~ BB cochon ~ boue bere BB esp. mil
40 kere BM ~ BM éléphant ~ tromperie kere BB perdrix
41 kese HM toux kese BM reste de
La paire minimale suivante prouve l’opposition entre les phonèmes /ə/ et /ɛ/ :
Graphie actuelle
/ə/ /ɛ/
42 kare BB ~ HM soleil ~ tige kare BB ~ BM panier ~ force
Ces ambiguïtés s’effacent si on admet les trois graphèmes <ə, e, ɛ> dans l’orthographe :
Graphie proposée
/ə/ /e/
43 bbə carquois bbe village ~ champignon
44 bbərə esclave ~ taille bbere patronym
45 bərə cochon ~ boue bere esp. mil
46 kərə éléphant ~ tromperie kere perdrix
47 kəsə toux kəse reste de
/ə/ /ɛ/
48 karə BB ~ HM soleil ~ tige karɛ BB ~ BM panier ~ force
2 Anglais: the phonemic principle (ie. a one-to-one grapheme-phoneme correspondence).
6
3.2. Complément d’objet de la 3e personne du singulier
L’opposition entre les trois phonèmes /ə, e, ɛ/ permet également de distinguer entre le
syntagme verbal à l’accompli, avec ou sans complément d’objet de la 3e personne du
singulier :
Graphie actuelle
[ə] [ɛ]
49 m-ndange M-HM j’ai grondé m-ndange M-HH je l’ai grondé
50 m-sange M-HM j’ai cherché m-sange M-HH je l’ai cherché
51 m-labbe M-BM j’ai vendu m-labbe M-BH je l’ai vendu
52 m-gange M-MM j’ai arrêté m-gange M-MH je l’ai arrêté
53 mare MM j’ai donné mare MH je lui ai donné
[ə] [e]
54 m-tete M-BB j’ai cassé m-tete M-BH je l’ai cassé
55 m-gere M-BM j’ai connu m-gere M-BH je l’ai connu
56 m-mbete [ə ə] M-MH j’ai rejeté m-mbete [ə e] M-MH je l’ai rejeté
57 m-mbere [ə ə] M-HM j’ai choisi m-mbere [ə e] M-HH je l’ai choisi
Comme avant, ces ambiguïtés s’effacent si on admet les trois graphèmes <ə, e, ɛ> dans
l’orthographe :
Graphie proposée
[ə] [ɛ]
58 m-ndangə M-HM j’ai grondé m-ndangɛ M-HH je l’ai grondé
59 m-sangə M-HM j’ai cherché m-sangɛ M-HH je l’ai cherché
60 m-labbə M-BM j’ai vendu m-labbɛ M-BH je l’ai vendu
61 m-gangə M-MM j’ai arrêté m-gangɛ M-MH je l’ai arrêté
62 marə MM j’ai donné marɛ MH je lui ai donné
[ə] [e]
63 m-tətə M-BB j’ai cassé m-təte M-BH je l’ai cassé
64 m-gərə M-BM j’ai connu m-gəre M-BH je l’ai connu
65 m-mbətə M-MH j’ai rejeté m-mbəte M-MH je l’ai rejeté
66 m-mbərə M-HM j’ai choisi m-mbəre M-HH je l’ai choisi
Nous reviendrons sur ce sujet dans la section 0 pour traiter certaines ambiguïtés
tonales liées au complément d’objet de la 3e personne du singulier.
3.3. Possessif inaliénable
L’opposition entre les trois phonèmes /ə, e, ɛ/ est également présente au sein des
syntagmes nominaux possessifs inaliénables de la 3e personne du singulier. La plupart
se prononcent avec une voyelle [ɛ] en position finale de mot :
7
Graphie actuelle
[ɛ]
67 kar B poitrine kare BH sa poitrine
68 singa MM os, force singe MH son os, sa force
69 dɔ B tête dɔe ~ dee BH sa tête
70 gɔl B pied gole BH son pied
71 dunn M dos dune MH son dos
72 gɔsu HM cou gɔse HH son cou
73 rɔ M corps rɔe ~ ree MH son corps
74 ta B bouche tae ~ tee BM sa bouche
75 ndɔn B langue ndoen BH sa langue
76 um B nez ume BH son nez
77 kum M nombril kume MH son nombril
78 bbɔl H joue bbɔle H sa joue
79 mba B mamelle mbae ~ mbee BH sa mamelle
80 mɔtu BB sexe m. mɔte BH son sexe m.
81 tin B intestin tinye BH son intestin
82 kem M aisselle keme MH son aisselle
83 nar M périnée nare MH sa périnée
Mais une minorité se prononce avec une voyelle [e] en position finale de mot :
Graphie actuelle
[e]
84 kutu BB fesses kute BH ses fesses
85 bingi BM cuisse binge BH sa cuisse
86 wur B foie wure BH son foie
87 munju BB reins munje BH ses reins
En plus, certaines de ces paires sont ambiguës dans l’orthographe actuelle, car un seul
graphème vocalique <e> est mis pour représenter trois phonèmes :
Graphie actuelle
[ə] [ɛ] [e]
88 bake MM épaule bake MH son épaule
89 ngange MM dent ngange MH sa dent
90 me B ventre mee BH son ventre
91 mese [ə ə] HM sang mese [e e] HH son sang
Notons également que le même graphème peut avoir deux prononciations au sein d’un
seul mot :
Graphie actuelle
92 keme [ə ɛ] MH son aisselle
93 mete [ə e] MH je l’ai senti
94 m-mbete [ə e] MH je l’ai rejeté
Il serait beaucoup plus aisé pour le lecteur si on admet les trois graphèmes <ə, e, ɛ> dans
l’orthographe :
8
Graphie proposée
[ɛ]
95 karɛ sa poitrine
96 singɛ son os, sa force
97 dɔɛ ~ dɛɛ sa tête
98 golɛ son pied
99 dunɛ son dos
100 gɔsɛ son cou
101 rɔɛ ~ rɛɛ son corps
102 taɛ ~ tɛɛ sa bouche
103 ndoɛn sa langue
104 umɛ son nez
105 kumɛ son nombril
106 bbɔlɛ sa joue
107 mbaɛ ~ mbɛɛ sa mamelle
108 mɔtɛ son sexe m.
109 tiɛn son intestin
110 narɛ sa périnée
[e]
111 kute ses fesses
112 binge sa cuisse
113 wure son foie
114 munje ses reins
Ainsi on distingue entre les paires minimales suivantes :
Graphie proposée
[ə] [ɛ] [e]
115 bakə épaule bakɛ son épaule
116 ngangə dent ngangɛ sa dent
117 mə ventre məɛ ~ mɛɛ son ventre
118 məsə sang mese son sang
Nous reviendrons pour traiter certaines ambiguïtés tonales liées au possessif
inaliénable dans la section 4.4.
3.4. Marqueur associatif aliénable vs. déterminant
Puisque l’orthographe actuelle ne distingue pas entre les trois phonèmes vocaliques
/ə, e, ɛ/, la particule <le> est ambiguë. Lorsqu’il se prononce [lə̀], il s’agit du marqueur
associatif aliénable. Lorsqu’il se prononce [lé], il s’agit d’un déterminant :
Graphie actuelle
119 kunja le nje-mba B la poule de l’étranger kunja le H la poule-là
120 ndɔɔ le mbay B le champ du chef(cid:0) ndɔɔ le H le champ-là
121 tar le dene B l’histoire de la femme tar le H l’histoire-là
122 kula le ngonn B le travail de l’enfant kula le H le travail-là
123 ngem le dingaw B le mensonge de l’homme ngem le H le mensonge-là
9
Si on admet le schwa <ə> dans l’orthographe, toute ambiguïté s’efface :
Graphie proposée
124 kunja lə nje-mba la poule de l’étranger kunja le cette poule-là
125 ndɔɔ lə mbay le champ du chef ndɔɔ le le champ-là
126 tar lə dɛnɛ l’histoire de la femme tar le l’histoire-là
127 kula lə ngonn le travail de l’enfant kula le le travail-là
128 ngəm lə dingaw le mensonge de l’homme ngəm le le mensonge-là
3.5. Particule <neen>
Le mot <neenn>, tel qu’il s’écrit dans l’orthographe actuelle, comporte trois sens. Or, la
prononciation des voyelles est différente pour chaque sens :
Graphie actuelle
129 M-sange neenn [ɛɛ] HM J’ai cherché cette chose.
130 M-sange neenn [əə] BH J’ai cherché ici.
131 M-sange neenn [ee] HM j’ai cherché celui-là.
On pourrait désambiguïser ces formes par l’incorporation des deux voyelles <ɛ, ə> dans
l’orthographe :
Graphie proposée
132 M-sangə nɛɛnn J’ai cherché cette chose.
133 M-sangə nəənn J’ai cherché ici.
134 M-sangə neenn j’ai cherché celui-là.
4. Propositions pour améliorer la graphie tonale
Dans ce qui suit nous ciblons six éléments de la grammaire où nous considérons que
l’ajout des diacritiques serait légitime. Après un bref résumé de la graphie tonale
existante (section 4.1), nous passons en revue le locatif (section 4.2), le complément
d’objet de la 3e personne du singulier (section 0), le possessif inaliénable (section 4.4),
les marqueurs du futur et du focus (section 4.5), l’habituel exprimé par la réduplication
du verbe (section 4.6), et six homographes fréquents (section 4.7).
4.1. Graphie tonale existante
L’orthographe actuelle désambiguïse deux pronoms sujets qui sont des paires
minimales de ton au moyen des diacritiques. Les pronoms sujets de la 3e personne du
10