L'indo-européen commun
Les études indo-européennes sont parties de la constatation qu’un certain nombre de langues parlées de l’Europe occidentale à l’Inde présentent des similitudes assez frappantes. Voici par exemple les dix chiffres dans quatre langues anciennes. Le c se prononce toujours tch en sanskrit et k en latin. Pour le gaulois, ce sont les ordinaux qui sont écrits :
| Sanskrit | Latin | Grec | Gaulois | I.-e. commun | |
| 1 | eka | unus | heis | cintux(os) | *sem-s |
| 2 | dvā | duo | duō | allos | *dwō(w) |
| 3 | trayas | tres | treis | tritos | *tréyes |
| 4 | catvāras | quattuor | tettares | petuar(ios) |
*kwetwores |
| 5 |
pañca |
quinque | pente | pinpetos |
*pénkwe |
| 6 | shas | sex | hex | sexametos | *s(w)eks |
| 7 | sapta | septem | hepta | suexos | *septm |
| 8 | ashta | octo | oktō | oxtumetos | *oktō(w) |
| 9 | nava | novem | ennea | nametos | *néwm |
| 10 | daśa | decem | deka | decametos | *dékm |
Certaines de ces similitudes avaient déjà été remarquées dans l’Antiquité, puisque Grecs et Romains s’étaient intimement côtoyés, mais on les expliquait alors par des emprunts entre ces deux langues qui auraient été effectués à une époque reculée. Platon, dans le Cratyle, notait les ressemblances entre certains mots grecs et phrygiens, le phrygien étant une langue aujourd’hui disparue qui avait été parlée en Anatolie au Ie millénaire avant notre ère.
Ces ressemblances ne concernent pas que le vocabulaire. Elles concernent aussi la morphologie, c’est-à-dire la façon dont certains mots varient avec leur fonction grammaticale. Ainsi, les conjugaisons du verbe « aller » en sanskrit et en lituanien ancien présentent de spectaculaires ressemblances :
| Sanskrit | Lituanien | |
| je vais | ēmi | eîmi |
| il va | ēti | eîti |
| nous allons | imah | eimè |
Il est extrêmement difficile d’échapper à la conclusion que ces langues dérivent d’un ancêtre commun, une langue-mère parlée il y a plusieurs millénaires. Une telle famille de langues est dite génétique. Il existe des familles dites aréales, dont les langues sont d’origines différentes mais ont acquis des points communs par suite de contacts prolongés entre leurs locuteurs. Les langues altaïques constituent une famille aréale. Elle comprend le mongol, le turc et le toungouse. Les ressemblances demeurent imparfaites, comme le montre la comparaison des noms de chiffres en ouzbek (langue turque parlée en Ouzbékistan) et en mongol :
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | |
| Ouzbek | bir | ikki | utch | tört | besh | olti | etti | sakkiz | töqqiz | ön |
| Mongol | neg | khoër | gurav | döröv | tav | zurgaa | doloo | naim | es | arav |
Ce sont les ressemblances des structures grammaticales qui
définissent la famille altaïque. En vérité,
il n’est pas impossible que ces langues dérivent d’un
ancêtre commun, mais il doit être extrêmement
ancien, de l’ordre d’une dizaine de milliers d’années.
Cette question est encore aujourd’hui à l’étude.
Il importe de signaler que la comparaison des langues est une discipline rigoureuse. Les linguistes ne se contentent pas de constater que certains mots présentent de vagues ressemblances. Un pas essentiel dans la fondation de cette discipline a été la découverte de la régularité phonétique. Elle résulte des observations effectuées par le mathématicien Hermann Grassman en 1865 et par Karl Verner en 1877. Hermann Osthoff et Karl Brugmann lui ont donné son énoncé définitif en 1878 : les phonèmes (c’est-à-dire les consonnes et les voyelles) de même nature situés dans la même position évoluent tous de la même façon. On peut le constater ci-dessus. Dans les chiffres 6 et 7, les Grecs ont changé le s en un h. Cette modification a été systématique et la correspondance entre le s latin et le h grec constitue ce que l’on appelle une loi phonétique. Ainsi, au latin semi-, il correspond le grec hēmi-. La reconnaissance de ces lois permet de savoir si deux mots se ressemblent parce qu’ils sont de même origine ou pour d’autres raisons, telles que l’emprunt tardif d’une langue à une autre.
Les processus d’évolution phonétique ont été identifiés. On sait ainsi qu’un t situé entre deux consonnes peut s’affaiblir en un d. Il peut ensuite devenir th, prononcé comme dans l’anglais that, puis disparaître complètement. C’est pourquoi le latin vita est devenu vie en français. Si le t a été conservé dans l’adjectif vital, c’est parce que ce terme est un emprunt tardif au latin, langue liturgique et savante qui a servi de « réservoir de vocabulaire ».
Les langues évoluent d’une part par l’effet de leur propre structure phonétique (un t suivi d’un i se transformera naturellement en un tch), d’autre part par l’influence d’autres langues. Quand un peuple est isolé sur une île ou dans une vallée, sa langue évolue peu. C’est ainsi que la langue des Islandais s’est très bien conservée depuis un millénaire. Par ailleurs, les langues se diffusent surtout parce qu’elles sont apprises par des populations étrangères, mais celles-ci la prononcent avec un certain « accent » conditionné par leurs propres parlers (ou même avec de véritables fautes !). Cet accent va diriger l’évolution de la langue dans une direction particulière. En vérité, la famille indo-européenne tout entière s’est étendue de cette manière : il ne reste aujourd’hui que des peuples indo-européanisés.
Les linguistes sont capables de reconstituer partiellement l’indo-européen commun, la langue-mère des langues indo-européennes. Il leur a fallu supposer l’existence d’une catégorie de phonèmes disparus de toutes les langues actuellement parlées, les laryngales, usuellement notées avec la lettre h. La reconstitution de l’indo-européen commun ne sera jamais vérifiée parce que le peuple qui parlait cette langue n’a laissé aucun document écrit. On peut néanmoins tester la méthode utilisée, en reconstruisant par exemple le latin par la comparaison des différentes langues latines. Pour indiquer qu’un terme est une reconstruction non attestée, on ajoute un astérisque. Par exemple, le chiffre 3 se disait *tréyes en indo-européen commun. Les dix noms de chiffre reconstitués ont été notés dans le premier tableau.
Les résultats obtenus par les linguistes vont parfois contre le sens commun. Ils ont ainsi démontré que le français langue et le russe yazyk « langue » sont apparentés. Ce qui a rendu le terme russe méconnaissable, c’est son évolution morphologique ajoutée à son évolution phonétique. Sont également apparentés les mots lituanien liežùvis, anglais tongue, vieil irlandais teng, sanskrit jihvā, vieux perse hizbāna- ou arménien lezu, qui signifient tous « langue ». Ils dérivent de l’indo-européen commun *dnghweha-n-, où ha est une laryngale. En latin, ce mot est devenu dingua puis lingua. La transformation du d en un l est un phénomène irrégulier qui s’explique par l’attraction du verbe « lécher ».