Des mots, toujours des mots!
Les perlimpinpinologues de l'université Paris Descartes sont des gens formidables. Ils ont publié de belles statistiques sur l'utilisation que nous faisons des mots de notre jolie langue(*).
Statistiquer notre façon de parler ou d'écrire est un moyen un peu compliqué pour se comprendre, mais c'est un bon moyen.
Pour cela, ils ont téléchargé 218 textes littéraires (romans) publiés entre 1950 et 2000 (soit un corpus de 15 millions de mots) et les sous-titres de 9474 films ou saisons de séries (ce qui représente près de 50 millions de mots).
On voit que ce sont des gars solides en qui on peut faire confiance:
J'ai pioché ici et là, pour vous, quelques résultats...
1. Le hit-parade
Voici les quinze mots les plus utilisés, et leur fréquence (exprimée par million):
- de (37 524,35)
- la (23 889)
- et (18 621,71)
- le (17 901,87)
- à (16 994,68)
- les (16 011)
- d' (12 502,19)
- des (12 299,45)
- il (12 021,52)
- un (11 468,61)
- en (10 644,13)
- que (9 208,19)
- une (8 972,77)
- est (8 745,94)
- dans (7 480,9)
Ainsi, sur un million de mots recensés, le mot "de" est cité en moyenne 37524,35 fois et le mot "dans" est prononcé 7480,9 fois.. malheureusement, il n'est pas dit la part faisant de "de" une marque de noblesse, ni les endroits les plus souvent entendus dans "dans".
2. Je, tu, il, elle...
Le mot "il" arrive en 9ème position ( fréquence:12 021,52),
Le mot "je" arrive en 20ème,"elle" en 25ème, "on" en 30ème, "nous" en 36ème, "vous" en 45ème, "ils" en 52ème.
Le mot "tu" arrive en 64ème.
Brave dernier de la catégorie, le mot "elles" arrive en 109ème
On parle d'abord de lui, puis de soi.. Finalement, un monde encore très égoïstement misogyne!
Les écrivains en herbe devraient y réfléchir: une grande nouveauté serait d'écrire un roman à la deuxième personne du singulier (tu), et, tant qu'à faire, au féminin pluriel!
3. Etre ou avoir?
Le mot "est" parade en 14ème position tandis que le mot "a" traine en 31ème position..
Voilà qui ne m'étonne pas de la culture française. De quoi rester optimiste, non?
4. Les premiers mots sensés.
Si on écarte les articles, les prépositions, les conjonctions, les auxiliaires, les pronoms, les relatifs, les ordinaux et autres bricoles du même type, les trois premiers mots qui disent quelque chose de précis sont:
- "temps" en 79ème position
- "vie" en 106ème
- "homme" en 108ème
Encore un bon tuyau pour les apprentis en écriture: il est extrêmement banal d'écrire un roman qui parle du temps, de la vie ou de l'homme.
...
Une grande tristesse cependant : dans cette jolie étude, le mot perlimpinpinologie n'est même pas cité !
© M.DALMAZZO
(*)http://www.lexique.org/listes/liste_mots.php