Les généralisations de la notion mathématique d'intégrale au 19e siècle | CultureMath
Les généralisations de la notion mathématique d'intégrale au 19e siècle
Résumé

Nous retrouvons au 19e siècle quatre façons de définir ou de comprendre la notion mathématique d’intégrale : l’intégrale de Cauchy, l’intégrale de Riemann et les versions calculatoire et axiomatique de l’intégrale de Lebesgue.  Nous proposons d’étudier les généralisations de ces façons de définir l’intégrale en introduisant deux types de généralisations : les généralisations conservatives et les généralisations innovantes.  Dans le premier cas, la façon de définir l’intégrale ou de calculer l’intégrale est conservée et son extension est augmentée, c’est-à-dire qu’il y a plus de fonctions qui sont intégrables selon cette façon.  Dans ce second cas, la façon de comprendre l’intégrale change et il y a une réinterprétation, voire une reconstruction de la notion.

Utilisation en classe - Les enseignants de mathématiques trouveront dans cette approche historique et épistémologique de la notion d’intégrale des éléments pour enrichir l’introduction historique de cette notion faite aux élèves de terminale.
Pour les classes Post-Bac, dans lesquelles l’intégrale de Riemann est approfondie, une lecture accompagnée et commentée montrerait aux élèves que la notion d’intégrale a traversé le 19e siècle d’une façon dont on peut rendre compte grâce à quelques outils conceptuels.

 

 

Jean-Philippe Villeneuve, Cégep de Rimouski, Rimouski, Québec, Canada - e-mail
 

Article déposé le 16 janvier 2009. Editeur : Eric Vandendriessche. Toute reproduction pour publication ou à des fins commerciales, de la totalité ou d'une partie de l'article, devra impérativement faire l'objet d'un accord préalable avec l'éditeur (ENS Ulm). Toute reproduction à des fins privées, ou strictement pédagogiques dans le cadre limité d'une formation, de la totalité ou d'une partie de l'article, est autorisée sous réserve de la mention explicite des références éditoriales de l'article.
Version [pdf ] ( 22 p., 721 ko)

  
SOMMAIRE
6. Bibliographie

Encart 1: Le transfert des apprentissages
Encart 2: La généralisation de la condition R2
Schéma - Les différentes généralisations des intégrales
 

1.  Introduction

Nous retrouvons au 19e siècle quatre façons de définir ou de comprendre la notion mathématique d’intégrale.  En effet, Cauchy a défini en 1823 l’intégrale (définie) comme la limite des sommes de Cauchy d’une fonction continue.  Ensuite, en 1875, Darboux a réinterprété, en utilisant les travaux de Riemann de 1854, l’intégrale de Cauchy; l’intégrale de Riemann se définit comme l’égalité entre l’intégrale par défaut et l’intégrale par excès d’une fonction bornée.  Puis, en 1901, l’intégrale fut de nouveau réinterprétée avec l’introduction, par Lebesgue, de la version calculatoire de l’intégrale; l’intégrale de Lebesgue se calcule en prenant la limite sur les intégrales de fonctions simples.  Finalement, en 1904, Lebesgue présenta une reconstruction de l’intégrale, en l’occurrence la version axiomatique : un opérateur à valeurs réelles sur les fonctions est une intégrale s’il satisfait six propriétés.
 

Nous proposons, dans cet article, d’étudier les généralisations de ces façons de définir l’intégrale.  Pour ce faire, nous introduirons premièrement deux types de généralisations : les généralisations conservatives et les généralisations innovantes.  Nous donnerons deuxièmement des exemples de généralisations conservatives en étudiant les variantes des intégrales de Cauchy, de Riemann et de Lebesgue.  Troisièmement, nous nous intéresserons aux changements dans la façon d’intégrer en présentant un exemple d’une réinterprétation (le passage de l’intégrale de Cauchy à l’intégrale de Riemann) et un exemple d’une reconstruction (le passage à la version axiomatique).  Nous verrons ainsi qu’une réinterprétation représente une nouvelle façon équivalente de calculer l’intégrale et elle devient une généralisation innovante lorsqu’elle permet d’intégrer plus de fonctions.  Par contre, une reconstruction se présente plutôt comme une réinterprétation « drastique » et, dans ce cas, cette deuxième sorte de généralisation innovante fera intervenir aussi une abstraction, au sens du processus d’abstraction réfléchissante de Piaget.  Nous conclurons finalement en « généralisant » nos résultats, c’est-à-dire que nous tenterons d’augmenter la portée de nos résultats tout en les conservant comme des cas particuliers.

 

2. La généralisation des notions, un aperçu

Une généralisation se présente intuitivement comme un processus qui nous permet de faire une induction ou d’étendre l’extension d’une notion[1].  Par exemple, nous généralisons lorsque nous inférons que « toutes les pommes sont rondes » à partir de l’observation que « cette pomme est ronde » ou bien, lorsque nous passons de la notion de lion à la notion de félin, car tous les lions sont des félins, mais il existe des félins qui ne sont pas des lions, en l’occurrence des chats.  Nous obtenons ainsi une caractérisation du processus de généralisation par extension.
 

Ceci nous amène à utiliser la distinction, introduite en théorie des ensembles, entre la définition par extension et la définition par compréhension d’un ensemble.  Par exemple, les définitions par extension et par compréhension de l’ensemble des nombres pairs sont respectivement :

           $2\mathbb{N}=\{2,4,6,...,2n,...\},~~~~~~~~~~~2\mathbb{N}=\{2n:n \in \mathbb{N}\}$

Dans le premier cas, on donne la liste des éléments de l’ensemble, soit son extension.  Dans le second cas, on identifie une propriété commune à tous les éléments de l’ensemble et on s’intéresse alors à la compréhension de l’ensemble. 

Cette distinction nous permet donc de présenter deux types de généralisations.  D’une part, la généralisation sera dite conservative si elle permet à la fois d’augmenter l’extension d’une notion donnée (donc d’ajouter des instances à l’extension de la notion) et de conserver la façon de comprendre cette notion.  Par exemple, l’extension de la notion d’intégrale est constituée des fonctions intégrables.  Ainsi, on fera une généralisation conservative lorsqu’on se fixera une façon de calculer l’intégrale, donc une façon de comprendre cette notion, et on recherchera le plus grand ensemble de fonctions intégrables selon cette façon.

D’autre part, la généralisation sera dite innovante si elle permet de changer la compréhension de la notion soit en la réinterprétant, soit en la reconstruisant.  Dans le premier cas, une nouvelle façon équivalente de définir la notion est introduite et cette réinterprétation produit une nouvelle notion dont l’extension inclut strictement l’extension de la notion initiale.  Par exemple, le passage de l’intégrale de Cauchy à l’intégrale de Riemann change la façon de calculer l’intégrale et permet aussi d’augmenter l’ensemble de fonctions intégrables.  Dans le deuxième cas, il est possible que le changement dans la façon de comprendre la notion initiale soit « drastique » ou « radical » et ainsi la réinterprétation deviendra une reconstruction.  Le passage à la version axiomatique de l’intégrale sera un tel exemple.
 

3. Quelques exemples de généralisations conservatives 

Nous montrerons que les variantes de chacune des intégrales de Cauchy, de Riemann et de Lebesgue sont des généralisations conservatives, donc des généralisations qui ne changent pas la compréhension de la notion initiale.  En effet, pour chacune de ces variantes, la façon de calculer l’intégrale est conservée, mais elles permettront d’intégrer plus de fonctions selon cette façon.

Notre étude de ces variantes nous permettra d’introduire deux sortes de généralisations conservatives : celles (verticales) obtenues par l’ajout de complexité à la notion initiale, celles (horizontales) obtenues en changeant le contexte de la notion initiale.

 

3.1   Les variantes de l’intégrale de Cauchy

L’interprétation de Cauchy de l’intégrale définie se fait dans le contexte des fonctions continues et elle a été présentée dans la Leçon 21 du livre Résumé des Leçons sur le calcul infinitésimal publié en 1823[2].  Pour ce faire, il se donna une fonction f continue définie sur un intervalle [a, b], avec a < b, et une partition P = {x0, … , xn}, telle que a = x0 < … < xn = b.  Il calcula ensuite ce que nous appelons les sommes de Cauchy :

                                   $S_{C}(f,a,b,n)=\sum_{i=1}^{n}f(x_{i-1})(x_{i}-x_{i-1})$

Et il passa à la limite pour obtenir l’intégrale au sens de Cauchy :

                                    $I_{C1}(f,a,b)=\int_{a}^{b}f(x)dx=\lim_{n \to \infty}S_{C}(f,a,b,n)$

De plus, Cauchy démontra que les sommes de Cauchy d’une fonction continue convergeaient toujours et donc que toute fonction continue[3] était intégrable. 

 

Cauchy proposa dans les Leçons 24 et 25 deux variantes : l’intégrale impropre (I*C1) et l’intégrale de Cauchy pour les fonctions continues par morceaux (IC2).  Dans le premier cas, il permit à au moins une des deux bornes d’être infinie, dans le second, à la fonction d’avoir un nombre fini de points de discontinuité.  Dans les deux cas, il utilisa la même technique que nous appellerons une technique de transfert (voir Encart 1) : il tronqua l’intervalle d’intégration pour rendre la fonction continue sur un intervalle de longueur finie, il l’intégra en utilisant (IC1), puis il passa à la limite.  Par conséquent, si la limite existe, la fonction est intégrable, c’est-à-dire que les sommes de Cauchy convergent.

 

Cauchy ne fut pas le seul à travailler sur l’intégrale de Cauchy.  En effet, en 1864, Lipschitz présenta, comme thèse de Doctorat, un article intitulé : Recherches sur le développement en séries trigonométriques des fonctions arbitraires d’une variable et principalement de celles qui, dans un intervalle fini, admettent une infinité de maxima et de minima[4], dans lequel il poursuivit les travaux de Dirichlet[5] sur la convergence des séries de Fourier.  Pour ce faire, il réussit à interpréter l’intégrale de Cauchy dans le contexte des fonctions discontinues dont l’ensemble D des points de discontinuité est constitué d’un nombre infini de points, mais d’un nombre fini de points limites.  Dans ce cas, l’ensemble D’, qui est appelé le dérivé de l’ensemble D et qui est uniquement constitué des points limites de D, est de cardinalité finie. 

 

 Présentons l’idée de Lipschitz en supposant qu’il n’y ait qu’un seul point limite c de D.  Alors il est possible de construire un intervalle autour de c tel qu’il y a qu’un nombre fini de points de discontinuité à l’extérieur de cet intervalle (voir Figure 1).  Il est alors possible d’intégrer la fonction sur chacun des deux intervalles (disjoints) en utilisant la notion d’intégrale de Cauchy pour les fonctions continues par morceaux (IC2).  Ensuite, on passe à la limite et, si elle existe, la fonction est intégrable.  On obtient donc une troisième variante de l’intégrale de Cauchy (IC3).

Figure 1 : La technique de transfert utilisée par Lipschitz dans le cas où D’ = {c}.

 

Ces variantes sont en fait des généralisations conservatives, car l’intégrale est toujours définie comme la limite des sommes de Cauchy et elles permettent d’intégrer plus de fonctions.  De plus, elles ont été développées en complexifiant la même technique de transfert : on tronque d’abord l’intervalle d’intégration, on intègre ensuite la fonction sur cet intervalle en utilisant l’intégrale de Cauchy appropriée et finalement on passe à la limite.  Si la limite existe, la fonction est dite intégrable au sens de Cauchy.

 

3.2 Les variantes de l’intégrale de Riemann 

Riemann proposa une courte note sur la notion d’intégrale dans son texte La possibilité de représenter une fonction par une série trigonométrique[6] de 1854.  D’abord, Riemann généralisa les sommes de Cauchy en s’intéressant non seulement aux fonctions continues mais aux fonctions arbitraires et en permettant à la fonction d’être évaluée à un nombre quelconque du sous-intervalle de la partition.  Dans le détail, les sommes de Cauchy-Riemann sont :

   

Ensuite, il définit l’intégrale comme la limite des sommes de Cauchy-Riemann[7], donc comme le fit Cauchy, mais il n’utilisa jamais cette définition.  En effet, il démontra l’équivalence entre les deux conditions d’intégrabilité suivantes :

R1 : La fonction est à oscillation moyenne nulle, c’est-à-dire que

 

Di est l’oscillation[8] de la fonction sur le sous-intervalle Ii de la partition et δi est la longueur de l’intervalle Ii.

R2 : La somme des longueurs des intervalles où l’oscillation de la fonction est supérieure à σ peut être rendue aussi petite que l’on veut. Autrement dit :

 

                      
Ensuite, Riemann supposa que la convergence des sommes de Cauchy-Riemann était équivalente à la condition R1 et utilisa R2 comme condition d’intégrabilité de ce qu’il croyait être l’intégrale de Cauchy.  Or, Darboux montra, en 1875 dans son long article Mémoire sur les fonctions discontinues
[9], que R2 est une condition d’intégrabilité d’une nouvelle façon de calculer l’intégrale.  En fait, il introduisit les sommes de Riemann inférieures et supérieures et démontra que, pour les fonctions bornées, ces sommes convergent toujours vers deux nombres appelés respectivement l’intégrale par défaut et l’intégrale par excès :

 

 

 

 

         

Darboux affirma que lorsque les intégrales par défaut et par excès sont égales, alors on obtient la condition R1.  Ainsi, la condition R1 permet d’introduire une nouvelle façon de calculer l’intégrale : une fonction est intégrable au sens de Riemann si les intégrales par défaut et par excès sont égales[10].
 

Darboux récupéra donc la condition R2 comme une condition d’intégrabilité de l’intégrale de Riemann, c’est-à-dire que si une fonction satisfait cette condition alors la fonction est intégrale au sens de Riemann.  Cependant que cette condition soit satisfaite ne dit rien quant à la valeur de l’intégrale et nous dirons donc que cette condition est non constructive.

Nous retrouvons au moins deux variantes non constructives de l’intégrale de Riemann.  Selon Lebesgue[11], Du Bois-Reymond a montré que si les points où l’oscillation de la fonction est supérieur à un nombre réel s peuvent être inclus dans un groupe intégrable[12], alors la fonction est intégrable au sens de Riemann.  Pour faire cette démonstration, il utilisa une technique de transfert qui lui permit d’appliquer la condition d’intégrabilité R2 (Voir Encart 2).
 

Lebesgue a démontré, en utilisant aussi une technique de transfert, que ce groupe intégrable peut être remplacé par un ensemble de mesure nulle, en expliquant comment rendre l’ensemble de mesure nulle, un groupe intégrable et donc en appliquant les résultats de Du Bois-Reymond.

Ces deux preuves sont donc des utilisations plus complexes de la condition d’intégrabilité R2 de l’intégrale de Riemann.  Elles permettent ainsi d’intégrer, au sens de Riemann, plus de fonction, et ce, sans calculer explicitement la valeur de l’intégrale.  Nous en concluons que ces variantes sont des généralisations conservatives, mais non constructives.
 

3.3 Les variantes de l’intégrale de Lebesgue

Lebesgue présenta en 1901 dans l’article Sur une généralisation de l’intégrale définie[13], la version calculatoire[14] de l’intégrale de Lebesgue.  Dans ce cas, une fonction réelle à valeurs réelles bornée est intégrable si la limite sur les intégrales de fonctions simples existe.  Pour définir cette nouvelle façon d’intégrer, Lebesgue réinterpréta notamment la façon de partitionner l’intervalle d’intégration en partitionnant non plus le domaine de la fonction, mais son image. 

Pour être précis, soit f, une fonction réelle à valeurs réelles bornée.  Alors il existe deux nombres réels l et L tels que
 

  

On utilise l et L pour partitionner l’image de f, d’où la partition P = { l = l0, l1, l2, ..., ln-1, L = ln} et on construit les ensembles
 


 qui induisent une partition du domaine de f.  En passant à la limite, on obtient l’intégrale de Lebesgue :


 

Les variantes de l’intégrale de Lebesgue nous amènent directement à la notion contemporaine d’intégrale et elles n’ont pas été introduites par la complexification de l’utilisation de la notion initiale, mais plutôt en changeant le contexte des notions utilisées pour intégrer la fonction.  En effet, les travaux de Lebesgue se sont faits dans le contexte des nombres réels avec la théorie de la mesure développée par Lebesgue, alors que la version contemporaine de l’intégrale de Lebesgue est plutôt présentée dans le contexte d’un espace de mesure avec une mesure quelconque.
 

Nous en concluons que la version contemporaine de l’intégrale est une généralisation conservative de l’intégrale de Lebesgue, car l’intégrale est toujours définie comme la limite des intégrales des fonctions simples.  Ainsi, la compréhension de la notion est conservée.
 

3.4 Les sortes de généralisations conservatives  

Nous proposons donc deux sortes de généralisations conservatives : soit on ajoute de la complexité à la notion initiale, soit on change la notion initiale de contextes.  Dans le premier cas, on obtient une variante verticale, dans le second, une variante horizontale.
 

Dans les deux cas, nous retrouvons l’idée de se fixer une façon d’intégrer une fonction et de rechercher sa plus grande extension.  Il y a donc généralisation car augmentation d’extensions.  De plus, la compréhension de la notion initiale est conservée, car il est toujours possible de simplifier la nouvelle notion (variante verticale) ou de choisir le contexte initial (variante horizontale) pour retrouver exactement la notion initiale.  Dans les deux cas, la notion initiale devient alors un cas particulier de la nouvelle notion.
 

4. Les changements dans la façon de calculer l’intégrale 

Lorsqu’on change la compréhension de la notion, nous dirons que nous la réinterprétons ou nous la reconstruisons et, dans ces cas, il est possible que la nouvelle notion soit une généralisation ou une abstraction de la notion initiale. 

Nous proposons deux exemples.  D’une part, nous montrerons en quoi le passage de l’intégrale de Cauchy à l’intégrale de Riemann est une généralisation qui change la compréhension de la notion, donc une généralisation innovante.  D’autre part, nous étudierons la version axiomatique de l’intégrale de Lebesgue, et nous remarquerons que cette reconstruction se présente à la fois comme une abstraction et une généralisation.  Nous nous inspirerons alors des travaux de Piaget sur l’abstraction réfléchissante.
 

4.1 L’intégrale de Riemann : une généralisation innovante de l’intégrale de Cauchy 

Lebesgue écrit dans sa revue historique de l’intégrale :
 

[L]’intégrale de Riemann apparaît comme la généralisation naturelle de l’intégrale de Cauchy, que l’on se place au point de vue analytique ou géométrique.[15]
 

Nous comprenons que le point de vue analytique est celui que nous avons présenté, tandis que le point de vue géométrique est celui où l’intégrale nous permet de calculer l’aire sous une courbe.  Mais qu’est-ce que Lebesgue a voulu dire lorsqu’il a parlé de généralisation naturelle

Nous affirmons que, dans ce cas, la généralisation naturelle signifie une généralisation innovante avec réinterprétation.  En effet, d’abord la compréhension de la notion initiale a changé.  La façon d’intégrer une fonction, que ce soit la façon analytique ou son interprétation géométrique, change lorsqu’on passe de l’intégrale de Cauchy à l’intégrale de Riemann car, d’un côté, l’intégrale est vue comme la limite de sommes de Cauchy, de l’autre, comme l’égalité entre deux sortes d’intégrales : l’intégrale par défaut et l’intégrale par excès.  La notion est donc réinterprétée.
 

Ensuite, pour que cette réinterprétation soit une généralisation, il faut utiliser la définition par extension, c’est-à-dire qu’il faut montrer que l’intégrale de Riemann nous permet d’intégrer plus de fonctions que l’intégrale de Cauchy, donc l’extension de la nouvelle notion contient strictement l’extension de la notion initiale.
 

Premièrement, Darboux a montré[16], en utilisant la condition R2, que toutes les fonctions continues sont intégrables au sens de Riemann et donc que l’intégrale de Riemann contient, dans son extension, l’extension de l’intégrale de Cauchy pour les fonctions continues (IC1).

Deuxièmement, les variantes de l’intégrale de Cauchy, telles que IC2 et IC3, ont été développées dans le contexte des fonctions discontinues alors que celles de l’intégrale de Riemann, dans le contexte des fonctions bornées[17].  Or, il n’y a pas d’inclusion entre ces ensembles et ainsi, pour affirmer que l’extension de l’intégrale de Riemann contient l’extension de l’intégrale de Cauchy, il faut introduire un « point de bifurcation » dans le choix des fonctions à intégrer.  On utilisera donc le contexte des fonctions bornées pour affirmer qu’il y a une inclusion des extensions. 

Ajoutons qu’il y a aussi un point de bifurcation dans les objectifs de recherche portant sur la recherche de la plus grande extension de la notion.  En effet, les recherches sur l’intégrale de Cauchy avaient comme objectif de trouver les conditions à imposer aux points de discontinuité d’une fonction discontinue pour qu’elle soit intégrable, alors que les recherches sur l’intégrale de Riemann caractérisent plutôt la fonction et son oscillation[18].
 

Troisièmement, nous retrouvons, dans les travaux de Riemann, la construction d’une fonction qui est intégrable au sens de Riemann, c’est-à-dire qu’elle satisfait la condition R2, mais qui n’est pas intégrable au sens de Cauchy[19].  Nous pouvons ainsi utiliser ce résultat pour affirmer que l’inclusion d’extensions est stricte.
 

Nous en concluons donc que l’intégrale de Riemann telle que développée au 19e siècle[20] est une généralisation innovante de l’intégrale de Cauchy, car elle propose une façon équivalente de calculer l’intégrale d’une fonction et qu’elle permet d’étendre l’extension de l’intégrale de Cauchy.
 

4.2 La définition axiomatique de l’intégrale : une abstraction de la notion d’intégrale

Nous avons vu que Lebesgue a défini l’intégrale comme la limite sur les intégrales de fonctions simples.  Il a aussi proposé, en 1904, une définition axiomatique de l’intégrale et cette réinterprétation « drastique » ou « radicale » devient une reconstruction, car elle s’attaque à la nature même de la notion.  Il écrit dans la préface de son livre de 1904 :
 

[J]’ai introduit dans ce Livre une définition de l’intégrale plus générale que celle de Riemann [qui comprend] celle-ci comme cas particulier. (...) Elle est plus simple parce qu’elle met en évidence les propriétés les plus importantes de l’intégrale, tandis que la définition de Riemann ne met en évidence qu’un procédé de calcul.[21]

Il recherchait donc à « généraliser » la notion d’intégrale de Riemann en identifiant les propriétés « les plus importantes de l’intégrale ».  Or, comment savoir si une propriété est plus importante qu’une autre?  Qu’est-ce qui fait l’importance d’une propriété?  En fait, pour répondre à ces questions, on doit s’intéresser à la nature de la notion d’intégrale : Quels sont les problèmes mathématiques que cette notion doit résoudre?  Quelles sont les propriétés que doit satisfaire une intégrale pour résoudre ces problèmes?  On remarque que le changement dans la compréhension de la notion est normatif.
 

Lebesgue affirma que l’intégrale doit nécessairement résoudre le problème de la recherche de primitives et il montra que six propriétés permettent de le faire.  Il en conclut que l’intégrale est un opérateur[22]  $\int$ dont le domaine est les fonctions réelles à valeurs réelles bornées définies sur un intervalle et le codomaine est R.  Cet opérateur doit satisfaire les six propriétés suivantes :

 


D’abord, Lebesgue a changé la compréhension de la notion initiale, puisque l’intégrale est maintenant vue comme un opérateur qui satisfait certaines propriétés et non comme un calcul qu’on effectue sur une fonction.  Il n’a donc pas fait une généralisation conservative. 
 

En fait, on ne s’intéresse plus à calculer l’intégrale, mais à vérifier si un certain opérateur sur les fonctions satisfait une liste de propriétés.  On passe alors d’un questionnement sur les objets à un questionnement sur les actions que l’on pose sur ces objets.  En effet, lorsqu’on calcule une intégrale, on pose des actions sur les objets « fonctions » et on a vu qu’il y a plusieurs combinaisons possibles d’actions qui peuvent être utilisées pour calculer l’intégrale (on fait alors référence aux intégrales de Cauchy, de Riemann et de Lebesgue).  Or, vérifier si une intégrale satisfait une liste de propriétés n’est pas une action qui est au même niveau que l’action de calculer l’intégrale : notre attention ne porte plus sur les objets « fonctions », mais sur les objets « intégrales » qui eux sont des actions sur les objets « fonctions ».  Donc, ce changement dans la compréhension de la notion implique que le sujet doit identifier les propriétés des actions qu’il pose lorsqu’il manipule les objets et non qu’il doit présenter une nouvelle façon équivalente de manipuler ces objets.
 

De plus, ce changement dans la compréhension est plus important qu’une simple réinterprétation.  En effet, nous avons vu que l’intégrale de Riemann est une réinterprétation de l’intégrale de Cauchy, parce qu’elle proposait une nouvelle façon équivalente de calculer l’intégrale.  Or, pour proposer une telle équivalence, il faut que les extensions des notions en jeu, en l’occurrence celles des intégrales de Cauchy et de Riemann, soient constituées des mêmes éléments, qui sont, dans ce cas-ci, des fonctions réelles.  Le passage à la définition axiomatique de l’intégrale implique le passage des fonctions aux opérateurs sur les fonctions et ce passage empêche la comparaison des extensions, puisque ces extensions ne se trouvent plus sur le même « niveau » : l’intégrale de Riemann devient un cas particulier (plus précisément une instance) de la version axiomatique de l’intégrale. 
 

Ceci nous amène à la question suivante : avons-nous un nouveau type de généralisation ou bien sommes-nous en présence d’un nouveau type de processus 

Ce passage des fonctions aux opérateurs sur les fonctions et cette recherche de propriétés essentielles s’apparentent au processus d’abstraction réfléchissante introduit par Jean Piaget pour formaliser le passage entre niveaux de développement chez l’enfant.  Il écrit : 

Le propre (...) de l’abstraction réfléchissante (...) est d’être tirée non pas des objets, mais des actions que l’on peut exercer sur eux et essentiellement des coordinations les plus générales de ces actions, telles que de réunir, ordonner, mettre en correspondances, etc.[23]

 
Ce processus implique que les pensées du sujet ne portent plus sur les objets mais sur les actions qu’il pose sur ces objets.  Par exemple, lorsqu’on manipule physiquement 10 billes, on peut les regrouper, les séparer, les compter, etc.  Dans ces cas, il est possible que le sujet reconstruise les gestes physiques en actions mentales.  Il monte alors d’un niveau. 

Pour faire cette reconstruction, le sujet doit aussi identifier les propriétés qu’il utilise lorsqu’il pose le geste.  En fait, on interprète les « coordinations les plus générales de ces actions » comme des propriétés qui sont vraiment à l’œuvre lorsque le sujet pose les gestes.  Par exemple, lorsque le sujet regroupe physiquement les 10 billes en paquets, il pose l’action de réunir ces 10 billes en paquets, mais aussi l’action de réunir des billes et surtout l’action de réunir des objets.  Il utilise donc la propriété d’union qui est une propriété constitutive de chacune de ces actions. 

De plus, cette reconstruction procure au sujet une vue d’ensemble, car les actions de regrouper des billes, des crayons ou des verres deviennent des instances d’une même action : l’action de regrouper des objets.

On en conclut que le processus d’abstraction réfléchissante est caractérisé par la reconstruction des gestes physiques en action mentale et cette reconstruction nécessite que les propriétés des gestes physiques deviennent constitutives des actions mentales[24]

Nous affirmons que le passage de la notion d’intégrale de Riemann à la version axiomatique de l’intégrale est caractérisé par le processus d’abstraction réfléchissante.  D’une part, le passage de la notion d’intégrale de Riemann à la version axiomatique implique que l’on monte d’un niveau : l’intégrale de Riemann est un cas particulier de la version axiomatique[25].

D’autre part, la nouvelle notion est introduite en identifiant des propriétés constitutives ou « essentielles », c’est-à-dire des propriétés qui sont vraiment à l’œuvre lorsqu’on utilise la notion initiale.  En effet, l’intégrale de Riemann est une méthode pour calculer l’intégrale d’une fonction, donc une suite de « gestes » que l’on pose sur la fonction pour faire le calcul de l’intégrale.  Or, ces « gestes » satisfont les 6 propriétés de la version axiomatique.

Par ailleurs, on ne voit plus la notion initiale de la même façon : elle devient un opérateur sur les fonctions.  Par exemple, l’intégrale de Riemann n’est plus vue comme des actions sur les objets « fonctions », mais comme un opérateur sur les fonctions qui satisfait les propriétés de l’opérateur intégrale.

Nous en concluons que la version axiomatique de l’intégrale telle que proposée par Lebesgue est une abstraction et une généralisation de l’intégrale de Riemann, donc une généralisation innovante avec reconstruction.
 

Il est intéressant de remarquer, en terminant, que cette définition n’est plus utilisée aujourd’hui.  La sixième propriété est maintenant appelée le Théorème de la convergence dominée de Lebesgue, alors que les autres ont été récupérées pour constituer, entre autres, la notion d’espace de mesure et la notion de mesure.

 

5. La généralisation de nos résultats 

Nous avons caractérisé le développement d’une notion mathématique en introduisant des généralisations conservatives (horizontales et verticales) et des généralisations innovantes (avec réinterprétation et avec reconstruction).  Nous généraliserons nos résultats en augmentant de la portée de ceux-ci tout en les conservant comme un cas particulier, c’est-à-dire que nous ferons une généralisation conservative horizontale.  Pour ce faire, nous nous intéresserons non plus à la généralisation d’une notion mais à la généralisation d’une méthode de résolution de problèmes. 

Premièrement, lorsqu’on réussit à résoudre un problème, on fait une généralisation conservative lorsqu’on affirme qu’on serait capable de résoudre un problème « similaire », en l’occurrence un problème plus complexe ou le « même » problème dans un nouveau contexte.  Par exemple, si on apprend la méthode d’élimination de Gauss-Jordan pour résoudre un système particulier de deux équations à deux inconnues, on fera alors une généralisation conservative verticale en transférant la méthode pour résoudre un système de m équations à n inconnues, ou bien horizontale en transférant la méthode dans le contexte de la théorie des matrices. 

Deuxièmement, on fait plutôt une réinterprétation si on apprend une nouvelle façon de résoudre le problème, c’est-à-dire qu’on obtient la même réponse en utilisant une solution équivalente.  Par exemple, on pourrait utiliser une autre méthode pour résoudre le système particulier de deux équations à deux inconnues, comme la méthode d’égalité des équations en isolant la même variable dans les deux équations.  Dans ce cas, on réinterprète la façon de résoudre le problème, car on propose deux façons équivalentes (la méthode de Gauss-Jordan ou la méthode d’égalité) de résoudre le problème.  De plus, on fait une généralisation innovante lorsque cette réinterprétation permet de résoudre plus de problèmes. 

Finalement, on reconstruit la méthode de résolution de problèmes lorsqu’on passe des matrices aux espaces vectoriels sur un corps K.  On met alors en évidence certaines propriétés des matrices qui deviennent constitutives de la nouvelle notion des espaces vectoriels.
 

6. Bibliographie 

Cauchy, Augustin Louis, 1823, « Résumé des Leçons sur le calcul infinitésimal » dans Œuvres complètes, vol. 16, Paris : Gauthier-Villars, 1903.

Daniell, P. J., 1917-18, « A General Form of the Integral»,  Annals of Mathematics, (2) 19, p. 279-294.

Dirichlet, P. G. Lejeune, 1829, « Sur la convergence des séries trigonométriques qui servent à représenter une fonction arbitraire entre des limites données»,  Journal für die reine und angewandte Mathematik, 4, p. 157-169.

Darboux, Gaston, 1875, « Mémoire sur la théorie des fonctions discontinues » ,  Annales scientifiques de l’École normale supérieure (2) 4, p. 57-112.

Dugac, Pierre, 2003, Histoire de l’analyse : autour de la notion de limite et de ses voisinages, Paris : Vuibert.

Hawkins, Thomas, 1975, Lebesgue's theory of integration : its origin and development, New York : Chelsea Publishing company.

Hawkins, Thomas, 1980, « The origins of modern theories of integration, » in From the calculus to set Theory 1630-1910, ed. Grattan-Guinness, London : Duckworth. p. 149-219.

Hochkirchen, Thomas, 2003, « Theory of Measure and Integration form Riemann to Lebesgue », in A History of Analysis, ed. Hans Niels Jahnke, Providence, RI : American Mathematical Society, p. 261-290.

Labelle, Jacques, Mercier, Armel, 1993, Introduction à l’analyse réelle, Montréal : Modulo.

Lalande, André, 1996, Vocabulaire technique et critique de la philosophie, 18e éd., Paris : PUF.

Lebesgue, Henri, 1901, « Sur une généralisation de l’intégrale définie », Comptes rendus hebdomadaires des séances de l’Académie des sciences, 132, p. 1025-1028.

Lebesgue, Henri, 1904, Leçon sur l' intégration et la recherche des fonctions primitives, 2e éd, Paris : Gauthier-Villars, 1928.

Lipschitz, Rudolf 1864, «Recherches sur le développement en séries trigonométrique des fonctions arbitraires d’une variable et principalement de celles qui, dans un intervalle fini, admettent une infinité de maxima et de minima », Acta Mathematica, 1913 (36), p. 281-294.

Lützen, Jesper, 2003, « The Foundation of Analysis in the 19th Century », in A History of Analysis, éd. Hans Niels Jahnke, Providence, RI : American Mathematical Society, p. 155-195.

Michel, Alain, 1992, Constitution de la théorie moderne de l’intégration, Paris : Vrin.

Piaget, Jean, 1968, Le structuralisme, 1re éd., Paris : PUF, 2007.

Piaget, Jean, 1975, L’équilibration des structures cognitives : Problème central du développement, Paris : PUF.

Pier, Jean-Paul, 1996, Histoire de l'intégration : vingt-cinq siècles de mathématiques, Paris : Masson.

Riemann, Bernhard, 1854, « La possibilité de représenter une fonction par une série trigonométrique », Bulletin des sciences mathématiques et astronomique, Tome V, 1873, p. 225-279.

Villeneuve, Jean-Philippe, 2008, Types de généralisations et épistémologie des mathématiques : de l’intégrale de Cauchy à l’intégrale de Lebesgue, Thèse, Université de Montréal.

 

 

 



Notes

[1] L’extension d’une notion (ou d’un concept) est l’ensemble de tous les objets qui sont des instances de la notion.  Par exemple, l’extension du concept « lion » est composée de tous les objets lions, qu’ils soient réels ou imaginaires. Par exemple, un lion vivant est une instance du concept et donc cet objet fait partie de l’extension du concept « lion ».  Consulter au besoin [Lalande, 1996].

[2] [Cauchy, 1823].  Consulter ce document  (pdf, 3758 ko)

[3] En fait, Cauchy a confondu la continuité et la continuité uniforme d’une fonction et a fait la démonstration pour le cas des fonctions uniformément continues.

[4] [Lipschitz, 1864]

[5] [Dirichlet, 1829]

[6] [Riemann, 1873]. Consulter ce document  (pdf, 1313 ko)

[7] Notre interprétation va dans le même sens que Hawkins ([Hawkins, 1980, section 4.3]).

[8] L’oscillation d’une fonction sur un intervalle se définit comme la différence entre la limite supérieure et la limite inférieure de la fonction sur l’intervalle (Voir Encart 2).

[9] [Darboux, 1875].  Consulter ce document  (pdf,  6660 ko)

[10] En même temps que Darboux, soit en 1875, les mathématiciens Ascoli, Smith et Thomae ont démontré le même résultat.  La notation adoptée aujourd’hui est celle développée par Volterra (voir [Hochkirchen, 2003, p.270]).

[11] Consulter au besoin [Lebesgue, 1928, p. 26-29].

[12] Un ensemble est un groupe intégrable si ses points peuvent être inclus dans un nombre fini d’intervalles dont la longueur peut être rendue aussi petite que l’on veut.

[13] [Lebesgue, 1901].  Consulter ce document  (pdf,  76 ko)

[14] Il introduit ensuite la version axiomatique en 1904 dans son livre Leçons sur l’intégration et la recherche des fonctions primitives ([Lebesgue, 1928]) et il existe aussi des variantes, voir [Daniell, 1917].

[15] [Lebesgue, 1928, p. 36]

[16] Ce résultat est le Théorème III de [Darboux, 1875, p. 73].  Consulter ce document (pdf, 6660 ko)

[17] Il s’agit plutôt du contexte des fonctions à variations bornées, mais ni Riemann, ni Darboux ne fit cette distinction.

[18] Notre interprétation va dans le même sens que celle de Michel [Michel, 1992], Hawkins [Hawkins, 1975] et Dugac [Dugac, 2003].

[19] Dirichlet (voir [Dirichlet, 1829]) posa la conjecture qu’une fonction discontinue était intégrable (au sens de Cauchy) si et seulement si l’ensemble de ses points de discontinuité était partout non dense.  Or, Riemann (voir [Riemann, 1854]) a montré cette conjecture n’était pas nécessaire en construisant une fonction qui satisfait la condition R2 et dont l’ensemble de ses points de discontinuité est dense.

[20] On peut montrer aujourd’hui que ces deux définitions sont équivalentes (voir la section 6.4 de [Labelle, 1993]).

[21] [Lebesgue, 1928, p. ix]

[22] Lebesgue parle d’opération mais utilise un opérateur dans sa définition, ([Lebesgue, 1928, p. 105]).

[23] [Piaget, 1968, p. 20]

[24] En fait, pour être précis, il y a deux sortes d’actions mentales : les opérations concrètes et les opérations hypothético-déductives. Ainsi, les gestes sont reconstruits en opérations concrètes et les opérations concrètes, en opérations hypothético-déductives et cette reconstruction s’effectue en identifiant des propriétés essentielles de l’action du niveau inférieur.

[25] Notons que cette caractéristique est aussi une caractéristique du processus de généralisation et ainsi le processus d’abstraction réfléchissante est une sorte de généralisation.

 
 
 
 
 
Dernières publications