Le problème du nombre de racines réelles d'un polynôme

Au début du XIXe siècle, la détermination du nombre exact de racines réelles d'un polynôme à coefficients réels constituait un programme de recherche à part entière de l'analyse des équations algébriques. Des mathématiciens de grande envergure comme Fourier et Cauchy ont chacun de leur côté apporté leur contribution à ce programme, sans jamais apporter de solutions de manière satisfaisante.

En effet, Fourier était parvenu à fournir une borne supérieure du nombre de racines réelles d'un polynôme mais il échoua à déterminer une méthode générale pour trouver leur nombre exact. Quant aux méthodes de Cauchy, bien que mobilisant les notions d'indice qui s'avérèrent plus tard très utiles en analyse complexe, elles ne réussirent pas à attirer l'attention des mathématiciens, car les efforts nécessaires pour leur application exigeaient de laborieux calculs.

De manière éclatante, Sturm - alors en possession des travaux inédits de Fourier et qui s'inspira des méthodes de celui-ci comme il le reconnut lui-même - aurait donc été le premier à fournir un procédé relativement simple permettant de déterminer effectivement le nombre exact de racines réelles au moyen d'une méthode purement algorithmique. L'annonce de ce théorème, le 25 mai 1829 à l'Académie des Sciences à l'issue de la lecture du mémoire intitulé « Résolution des équations numériques », fit naturellement sensation.

L'énoncé particulier du théorème

Expliquons les étapes importantes de l'application du théorème de Sturm en oubliant volontairement certains détails : l'objectif est de déterminer le nombre de racines réelles d'un polynôme $P(X)$ à coefficients réels dans l'intervalle $[a~;~ b]$.

  1. On détermine la suite des polynômes de Sturm, $P_0(X)$, $P_1(X)$, $P_2(X)$, etc. à partir d'une variante de l'algorithme d'Euclide, en prenant pour polynôme initial $P_0(X)$ le polynôme $P(X)$. L'algorithme s'arrête dès que $P_n(X) = 0$.
  2. On construit ensuite les suites $(u_n)_n$ et $(v_n)_n$ définies par $u_n = P_n(a)$ et $v_n = P_n(b)$ pour tout entier naturel $n$.
  3. On énumère le nombre de fois où la suite $(u_n)_n$ change de signes et on procède de même avec la suite $(v_n)_n$.
  4. L'écart entre les deux nombres obtenus à l'étape précédente fournit alors le nombre exact de racines réelles situées dans l'intervalle $[a~;~ b]$.

Au premier abord, le théorème apparaît ainsi d'une efficacité redoutable pour le problème qu'il entend résoudre. Parce qu'il répondait à un besoin urgent d'effectivité, l'annonce du théorème de Sturm fut globalement saluée par la communauté des savants. Néanmoins, la détermination de la suite des polynômes de Sturm atteint un certain coût non négligeable en terme de calculs, et ceci dès que les équations dépassent le quatrième degré. Entre les années 1865 et 1873, le physicien et mathématicien Duhamel insista notamment sur les inconvénients pratiques du théorème de Sturm au cours des multiples rééditions de ses Méthodes dans les sciences du raisonnement1.

Pour le plaisir de l'anecdote, signalons que le théorème de Sturm joua un petit rôle dans l'histoire de l'astronomie, en permettant à Le Verrier de procéder à l'étude d'une équation algébrique du quatrième degré qui intervenait dans son analyse des irrégularités du mouvement de la planète Uranus.

L'usage du théorème dans l'enseignement des mathématiques

S'il est aujourd'hui en partie effacé des mémoires des professeurs de mathématiques, le théorème de Sturm connut peu de temps après l'annonce de son invention une certaine notoriété dans l'enseignement. Au XIXe siècle, les lycéens préparant les concours des grandes écoles étaient amenés à le convoquer régulièrement. Nous trouvons dans des extraits des rapports du concours d'admission à l'École Polytechnique2 des références au théorème de Sturm. Les candidats y avaient recours dans les résolutions des équations particulières de degré 3 ou 4 et ils l'appliquaient en général en ouverture de leur étude. Dans son « Mémoire sur les courbes dénies par une équation différentielle (I) » publié dans le Journal de Liouville en 1881, Poincaré résumait l'usage courant de ce théorème de la manière suivante, en le comparant à l'étude qualitative des solutions d'une équation différentielle :

 

Ainsi, par exemple, pour étudier une équation algébrique, on commence par rechercher, à l'aide du théorème de Sturm, quel est le nombre des racines réelles, c'est la partie qualitative, puis on calcule la valeur numérique de ces racines, ce qui constitue l'étude quantitative de l'équation.

— Henri Poincaré

Le théorème fut également convoqué en tant que méthode dans la résolution de certains exercices de géométrie où l'on cherche à maximiser ou minimiser une certaine quantité, comme une distance ou un volume. Employé de façon astucieuse, le théorème de Sturm permettait en effet de fournir les conditions d'existence d'une racine double, généralement synonyme d'un maximum ou d'un minimum. Des lycéens du XIXe siècle usèrent ainsi des nombreuses ressources offertes par ce théorème afin de résoudre des problèmes d'optimisation et en tant que substitut au calcul différentiel qui n'était pas encore enseigné à l'époque.

Notons également que le théorème de Sturm fit son apparition dans les leçons de l'Agrégation pour les sciences mathématiques au cours des années 1870 et 1880.

Le théorème de Sturm aujourd'hui

De nos jours, le théorème de Sturm n'est plus enseigné dans le cursus classique comme il a pu l'être par le passé. Peu connu des étudiants, le théorème a toutefois laissé des traces dans l'enseignement supérieur au sein de certains cours consacrés à l'algèbre effective et au calcul formel1. Des chercheurs intéressés par les problèmes de l'algèbre réelle ont également rencontré le théorème de Sturm en lui donnant au cours du XXe siècle une certaine actualité.

En effet, à la suite des recherches de Dedekind, Kronecker ou Steinitz, les mathématiciens ont étendu leurs analyses des équations à des structures plus générales et plus abstraites comme celles des corps. Les corps les plus connus sont bien sûr le corps des rationnels $\mathbf{Q}$, celui des réels $\mathbf{R}$ ou celui des complexes $\mathbf{C}$, tous les trois reliés entre eux par les inclusions $\mathbf{Q} \subset \mathbf{R} \subset \mathbf{C}$. Les algébristes parlent de préférence d'extensions de corps pour désigner ces chaînes d'inclusions entre des corps distincts. De plus, nous savons que tout nombre complexe est une racine d'un polynôme non nul à coefficients réels et de ce fait, l'extension $\mathbf{R} \subset \mathbf{C}$ est qualifiée d'algébrique.

Une classe particulière de corps a été étudiée dans le domaine de l'algèbre réelle : celle des corps réels. Par définition, un corps réel est un corps totalement ordonné au sein duquel il est impossible d'écrire le nombre $-1$ comme une somme de carrés de ses éléments. Les corps $\mathbf{Q}$ et $\mathbf{R}$ en sont deux exemples, mais pas le corps $\mathbf{C}$ en vertu de l'égalité $-1 = i^2$. Un corps réel clos est un cas particulier d'un corps réel qui n'admet pas d'extension algébrique réelle : le corps des nombres réels $\mathbf{R}$ en constitue lui-même un exemple.

Au cours de la première partie du XXe siècle, les mathématiciens Artin et Schreier2 ont alors remarqué que de nombreux résultats classiques, comme le théorème de Rolle ou la continuité uniforme des fonctions polynomiales sur des intervalles $[a ~;~ b]$, se conservaient et restaient valides dans un corps réel clos. Le théorème de Sturm entre alors en scène dans la propriété importante suivante : tout corps réel admet une clôture réelle, c'est-à-dire une extension algébrique réelle close. Or, le théorème de Sturm intervient dans la démonstration de l'unicité de la clôture réelle (à isomorphisme unique près) presque un siècle après son invention. Pour compléter le tableau, mentionnons brièvement les travaux du logicien Tarski qui s'inspira également des méthodes sturmiennes pour fournir une généralisation du théorème dans le domaine de l'algèbre réelle discrète3.

Ainsi, le théorème de Sturm constitue un exemple marquant d'une construction mathématique dont la perception et l'usage ont considérablement évolué depuis le début du XIXe siècle, attirant tour à tour l'attention des astronomes calculateurs, des lycéens préparant les concours d'admission des grandes écoles, ainsi que des logiciens et des mathématiciens accomplis.