Pourquoi un "Vocabulaire orthographique de base" (VOB) ? Tout simplement, et d'une manière générale, parce que c'est le seul parti raisonnable et efficace.

- Il permet d'étudier l'essentiel avant l'accessoire

- Il n'est pas possible de tout étudier et des prétentions injustifiées en matière de vocabulaire et d'orthographe sont un luxe inutile

- Il s'avère que l'étude de mots nombreux et rares, de règles embrouillées par la présence d'exceptions surcharge la mémoire de consignes complexes au détriment d'une fixation solide de mots plus courants, plus communs et autrement plus utiles.

Or, les enquêtes effectuées le prouvent, trop d'auteurs de manuels scolaires ne tiennent aucun compte de cette limitation (cf "Lecture, base de l'orthographe" de C. SILVESTRE de SACY et S.D. de SECHELLES, cité par R. RIVIERE, 1979, p.13 et "Cours supérieur d'orthographe" de M. et Mme BLED, sondage réalisé par Chr. PICARD en 1977 et dont les résultats ont été repris par N. CATACH, 1984, p.9) et, chose plus grave, sans s'être assurés auparavant de la connaissance préalable des mots fondamentaux. Seuls, les vocabulaires de base, parce que reposant sur des données objectives, permettent de délimiter des objectifs orthographigues précis dans une optique d'efficience pratique.

D'une manière plus précise, les arguments qui plaident en faveur de l'utilisation de ces listes mettent au premier plan des critères de fréquence et de difficulté des mots.

1) En ce qui concerne les fréquences (c'est-à-dire le nombre d'apparitions de chaque mot), les principales recherches se recoupent largement du moins pour constater qu'un même noyau de base de 1000 mots suffit pour couvrir quelque 90 % de nos besoins en orthographe d'usage. De plus, alors même qu'apparaît par la suite une certaine dispersion du vocabulaire, il subsiste encore et toujours un tronc commun d'environ 3000 mots qui, avec leurs fréquences cumulées, représentent approximativement 95% de n'importe quel texte courant.

L'efficacité de ces échelles de fréquence est telle que nous considérons comme mineures les critiques qui leur sont habituellement adressées.

- Le programme PIRENNE se réfère à des travaux qui datent de 1936 et 1937. Il est probable qu'il ne recouvre plus exactement aujourd'hui le stock lexical de nos élèves. C'est relativement vrai, mais pour quelques centaines de mots au plus, puisque l'ensemble du corpus relevé à l'époque se retrouve en grande partie dans les recherches les plus récentes (cf. "Psychopédagogie des moins doués" de MASSARENTI, 1971).

- Les mots concrets échappent plus facilement à ces relevés que les termes à indice de répartition élevé (ceux qui se rencontrent dans la plupart des textes). C'est pour résoudre ce problème que les auteurs du français fondamental (GOUGENHEIM, RIVENC, MICHEA, SAUVAGEOT) ont eu recours à la méthode des centres d'intérêt pour introduire en plus des mots disponibles, dont la fréquence est faible et peu stable mais qui n'en sont pas moins usuels et utiles dans des circonstances particulières.

Quelles que soient les précautions prises en matière de lexicométrie les résultats varieront toujours qualitativement et quantitativement selon l'étendue des dépouillements et du type de textes consultés. C'est la raison pour laquelle des chercheurs ont proposé des améliorations qui paraissent souhaitables : en combinant la fréquence avec d'autres données comme la répartition et la dispersion pour obtenir un coefficient d'usage (JUILLAND, BRODIN, DAVIDOVITCH, Frequency Dictionary of French Words, Mouton, 1970), en introduisant des notions comme l'efficacité d'un mot (VERLEE, 1954) la valence lexicale (SAVARD, 1970) et une fréquence des formes fléchies pour affiner les résultats globalisés (CATACH, 1984). Le poids de ces divers "éléments", dans l'état actuel des recherches, reste néanmoins difficile à déterminer.

L'aspect "limitation du vocabulaire" suscite quelques critiques qui se fondent sur les dangers à restreindre le contenu d'une pensée dans un français de base avec comme conséquence un appauvrissement sur le plan de la communication. Rappelons, que dans l'esprit même des promoteurs du français .fondamental, il n'a jamais été question de réduire la connaissance d'une langue à quelque 3000 mots mais de viser à un minimum de connaissances indispensables "une première étape sur la route conduisant au français complet" (GOUGENHEIM, RIVENC, MICHEA, SAUVAGEOT, 1964, p.13 - "L'élaboration du français fondamental"). Ces vocabulaires de base ne doivent donc être considérés que comme une armature à partir de laquelle la pensée pourra se développer librement et pleinement.

Pour conclure sur ces listes de fréquence, nous pensons avec Nina CATACH (1984, p.10) qu'"un dépouillement récent portant sur des documents oraux et écrits du français courant d'aujourd'hui, nous manque cruellement. Il devrait porter au moins sur plusieurs millions d'occurrences". En l'absence de tels relevés statistiques récents, nous nous référerons au "Vocabulaire de la langue écrite" de R. RIVIERE (1987) dont le nouveau programme d'orthographe d'usage tente d'apporter des aménagements aux travaux de PIRENNE dans un souci raisonnable d'actualisation.

2) Le classement des mots par échelons de difficulté orthographique (cf Echelle D.B. remaniée par TERS, 1968) présente-t-il toutes les garanties de fiabilité, et à plus forte raison, quelque 40 ans plus tard ? R. THIMONNIER, dans un article "L'orthographe en question" (9 décembre 1977) se basant sur quelques exemples isolés ("revenir" plus "facile" que "venir", "filet" que "fil", "femme" que "farine", "homme" que "malade"...) émet de sérieuses réserves quant à leur rigueur. EL WAKIL (L'orthographe d'usage, 1969, p.279) pense qu'au niveau de la 5ème année tout au moins "il est possible d'établir un programme de vocabulaire en se fondant sur le sens des mots et leur fréquence d'emploi sans tenir compte de leur degré de difficulté orthographique, comme a cru devoir le faire PIRENNE". Des enquêtes effectuées par nos soins auprès d'une classe de 3ème année primaire et de plusieurs classes d'enseignement spécial (Examen des discordances entre les fautes d'orthographe d'usage de deux types de population, juin 1981) nous ont conduit à mettre en évidence une corrélation très significative entre l'échelle D.B. et les résultats d'ensemble pour 750 mots fondamentaux dictés à nos deux populations mais que cet instrument de mesure n'est pas suffisamment précis pour l'interprétation de cas particuliers. Que conclure de tout cela ? Nous pensons que la difficulté d'un mot n'est pas simplement fonction de sa complexité graphique mais qu'interviennent également des facteurs de fréquence, de motivation, d'affectivité, ce qui explique les apparentes contradictions relevées par THIMONNIER. Ce n'est pas un hasard si nous retrouvons à l'échelon 1 des mots comme "maison, rue, porte, papa" et que "maison" (échelon 1) est plus facile à écrire que "saison" et "raison" (échelon 15). Quant aux remarques formulées par EL WAKIL, il faut les relativiser dans la mesure où elles ne concernent que les mots du programme de 5ème année des écoles genevoises. Nous continuons donc à penser, gu'en l'absence de relevés statistiques reposant sur des dépouillements comparables, l'"Echelle DUBOIS-BUYSE" constitue encore et toujours un référentiel de première valeur pour juger de l'ensemble des résultats d'une classe, ce classement en échelons de difficulté étant à mettre en relation avec une génétique de l'acquisition de l'orthographe d'usage. L'étude de LAMBERT sur "L'analyse des fautes" complète d'une manière remarquable les précédentes recherches en ajoutant des renseignements d'ordre qualitatif à la difficulté de fait ou absolue des mots : localisation des fautes avec le pourcentage des erreurs les plus communes.

Ainsi, si nous voulons raisonnablement nous adapter à l'apprenant, il est évident que l'utilisation rationnelle et progressive d'un vocabulaire de base, même s'il n'est pas à l'abri de tout reproche, s'impose. Il est réconfortant de constater que la plupart des chercheurs, quelle que soit la diversité des démarches proposées en matière de pédagogie de l'orthographe, s'accordent pour souhaiter que l'effort se porte sur la connaissance d'un vocabulaire de base (TERS, 1973, GUION et Marie DE MAISTRE, 1974, DE MORHERY, 1981, CATACH, 1984). Ajoutons cependant qu'il importe également de tenir compte de données résultant d'enquêtes locales et de réactions spécifiques des élèves.

Enfin, insistons sur le fait que ce programme est et doit rester pour l'enseignant non un objectif mais un référentiel. Il ne peut donc être question de présenter aux élèves des listes de mots, si bien adaptés à leurs possibilités soient-ils, encore convient-il d'inclure ces termes isolés dans des situations de réelle communication.