blogs.fr: Blog multimédia 100% facile et gratuit

doclabidouille

Blog multimédia 100% facile et gratuit

 

BLOGS

Blog dans la catégorie :
Sciences

 

Statistiques

 




Signaler un contenu illicite

 

doclabidouille

BIDOUILLE 14 : UN MODELE MAXIMAL

Le 18/12/2012

Justement, on a essayé de réfléchir un peu et on a fini par aboutir sur un modèle MAXIMAL, c’est-à-dire, non extensible. Je ne prétends alors absolument pas que ce modèle est le meilleur, ni même qu’il est réellement adapté à la situation, je dis seulement qu’il présente certains intérêts de construction. Voici lesquels.

On regarde la partie cinétique de la densité de Lagrangien de champ électromagnétique, on voit qu’elle se compose du carré (de Casimir) de Fij(x) = ðiAj(x) – ðjAi(x), composantes d’une 2-forme, au nombre de 6 donc, en dimension 4. Et on se dit : pourquoi ne pas envisager, pour la partie potentielle, un terme également quadratique mais, cette fois, de la forme Cij(x)Cij(x), avec :

 

  1. Cij(x) = kiAj(x) – kjAi(x)  ,  ki = 4-vecteur d’onde, en m-1.

 

L’intérêt ?

 

LA DENSITE D’ENERGIE CINETIQUE DE CHAMP EST PROPORTIONNELLE AU CARRE Fij(x)Fij(x) DE LA VARIATION INSTANTANEE Fij(x) = ðiAj(x) – ðjAi(x) ;

LA DENSITE D’ENERGIE POTENTIELLE DE CHAMP EST PROPORTIONNELLE AU CARRE Cij(x)Cij(x) DE LA VARIATION MOYENNE (1).

 

On se retrouverait déjà avec une densité de Lagrangien de la forme (partielle) :

 

  1. LEM[A(x),F(x),x] = (2µ)-1[Fij(x)Fij(x) + ½ Cij(x)Cij(x)]

 

quadratique en les Ai(x). On remarque que 1/µ est en J/m3T² et représente bien une densité, bien que ce soit un coefficient. Donc, bémol sur ce que énoncé dans Bidouille 13, à savoir qu’en fin de compte, on n’a pas besoin de disposer partout de distributions dépendant de x, on a surtout besoin d’effectuer, à chaque étape, une analyse dimensionnelle.

On voit que CijCij est en T², comme il se doit. Jusqu’ici, on est dimensionné. On écrit les équations de champ sous la forme :

 

  1. ði[ðLEM/ðFij(x)] = ðLEM/ðAj(x) = [ðCik(x)/ðAj(x)]ðLEM/ðCik(x)

 

qui permet 1) de calculer un petit peu plus commodément et 2) qui assure automatiquement la symétrie. On obtient :

 

  1. ðiFij(x) = ½ (kidkj – kkdij)Cik(x) = kiCij(x) = |k|²Aj(x) – kikjAi(x)  ,  |k|² = kiki     (d = delta)

 

Dans la jauge de Lorentz ðiAi(x) = 0 :

 

  1. ðiðiAj(x) = |k|²Aj(x) – kikjAi(x)

 

En multipliant des 2 côtés par kj, on trouve kjðiðiAj(x) = ðiði[kjAj(x)] = 0, de sorte qu’on n’a que 2 possibilités : kiAi(x) = onde, mais cela restreint fortement la généralité, ou bien :

 

  1. kiAi(x) = 0

 

qui est une seconde condition de transversalité, équivalente à eijCij(x) = 0, eij = -eji : produit scalaire grassmannien (antisymétrique) de k et A nul. Du coup, les équations (5) se simplifient en :

 

  1. ðiðiAj(x) = |k|²Aj(x)

 

dont la solution élémentaire est :

 

  1. Aj(x) = aj(k)exp(-kixi)  ,  kixi >= 0  ,  aj(k) en Tm  ,  kiai(k) = 0

 

et la solution générale, une superposition linéaire :

 

  1. Aj(x) = I aj(k)exp(-kixi)d4k/k0k1k2k3     (I = intégrale)

 

1/|k| est la portée du champ. Si elle est infinie, |k| = 0 => ki = 0 (en causal) et on retrouve Maxwell dans le vide.

On ajoute maintenant un terme quartique en les Ai(x). Comme on n’a que des carrés de termes antisymétriques, on le prend sous la forme Cijkl(x)Cijkl(x), avec :

 

  1. Cijkl(x) = Cij(x)Ckl(x) – Cik(x)Cjl(x) + Cil(x)Cjk(x)  en  T²

 

complètement antisymétrique, donc à une seule composante en dim 4. On modifie (2) :

 

  1. LEM[A(x),F(x),x] = (2µ)-1[Fij(x)Fij(x) + ½ Cij(x)Cij(x) - Cijkl(x)Cijkl(x)/4!|f|²]

 

avec |f|² = fijfij > 0 en T². Je suis fainéant aujourd’hui, j’ai écrit les équations de champ la nuit dernière à 2 du mat’ mais je n’ai pas pris mes notes avec (4h30 de sommeil). Comme dans les livres, « je laisse donc au lecteur le soin de » faire le boulot lui-même… :)) en suivant le procédé donné plus haut, par exemple. Rien de compliqué, un peu long, c’est tout. On aboutit évidemment à un membre de droite cubique en les Ai(x).

Pourquoi une expression comme (11) ?

Parce qu’en dimension 4, en ne prenant que les antisymétriques, 1) on s’assure que le développement ne va pas au-delà du quartique, puisque Cijkl(x) est le coefficient d’une 4-forme et 2) parce qu’on a deux invariances de jauge :

 

  1. Ai(x) -> Ai(x) + ðiG(x) : laisse Fij(x) invariant ;
  2. Ai(x) -> Ai(x) + kiG(x) : laisse Cij(x) invariant.

 

alors que, chez Maxwell, on n’a que (12), puisque les ki y sont nuls. Enfin, pour les puristes, (11) rappelle un peu la construction par invariants conformes de Weyl.

Il reste :

  • un nouveau paramètre, fij, nécessaire au dimensionnement de (11) ;
  • à ajouter les sources.

 

Le nouveau paramètre : j’ai déjà une petite idée dessus, j’ai construit un modèle l’utilisant il y a quelques mois. J’y reviendrai, mais pas ici (sinon, on va tout mélanger – il me paraît plus clair de faire des Bidouilles séparées).

Les sources : on a un terme linéaire ji(x)Ai(x) et on s’attend à trouver un terme cubique (dans la logique du développement), moyennant antisymétrie.

Le terme linéaire : on modifie (11) (la famille s’agrandit…),

 

  1. LEM[A(x),F(x),x] = (2µ)-1[Fij(x)Fij(x) + 2µji(x)Ai(x) + ½ Cij(x)Cij(x) - Cijkl(x)Cijkl(x)/4!|f|²]

 

Hmm… et alors ? Et alors, j’en suis resté là hier soir (enfin, ce matin), pour tout dire et je me suis dit, motivé que, cet après-midi, devant l’écran, je trouverai l’inspiration.

Ah bon ? Si je me le suis dit…

Il s’agit de trouver du AiAjAk antisymétrique, qui fournit un scalaire. Après quelques essais infructueux, il s’avère que l’expression :

 

  1. Cijkl(eijCkl – eikCjl + eilCjk + ejkCil – ejlCik + eklCij)/3!µ|f| = Cijkl(x)Wijkl(x)/3!µ|f|

 

est correctement dimensionnée. On l’ajoute à (14) :

 

  1. LEM[A(x),F(x),x] = (2µ)-1[Fij(x)Fij(x) + 2µji(x)Ai(x) + ½ Cij(x)Cij(x) + Cijkl(x)Wijkl(x)/3!|f| - Cijkl(x)Cijkl(x)/4!|f|²]

 

On regarde ensuite les progressions des termes potentiels : le CijCij est en puissance zéro de |f| ; le CijklWijkl, en puissance -1 et le CijklCijkl, en puissance -2. On se demande alors si le µji(x)Ai(x) ne pourrait pas être en puissance +1 :

 

  1. µji(x)Ai(x) = ½ |f|Cij(x)eij = ½ µeij[ji(x)Aj(x) – jj(x)Ai(x)]  en T²

 

ce qui donnerait :

 

  1. ji(x) = |f|ki

 

Pourquoi pas, à condition que fij dépende de x. Comme 1/µ est déjà une densité, il suffit que les fij(x) soient des fonctions. En effet, µji(x) = ji(x)/(1/µ) s’avère être un rapport de densités, de sorte que tous les termes entre crochets dans (16) sont des fonctions et non des « fonctions-densité ». Il serait alors plus judicieux de renverser la relation (18) et exprimer |f(x)| en fonction de ji(x) :

 

(19)     |f(x)| = µkiji(x)/|k|²

 

Le problème est qu’en l’absence de sources, |f| = 0 d’où fij = 0 et que, dès que fij est non nul, on doit trouver des sources…

 

Walle walle chichewalle… ‘core un modèle à la mardickoise, ça…

 

On va essayer d’améliorer ça.

 

 

BIDOUILLE 13 : RETOUR SUR LES BIDOUILLES 1, 2 ET 3

Le 12/12/2012

Dans la bidouille 1, j’ai proposé un « espace-temps électromagnétique » en utilisant l’analogie de construction entre la densité de lagrangien de Maxwell et la fonctionnelle de Lagrange d’un mobile dans l’espace euclidien E3, ce qui permettait de ramener le concept de champ dans l’espace-temps 4D X au concept de mouvement dans EM(x), espace-temps fonctionnel 4D situé « au-dessus » de X. la densité de 4-courant ji(x) s’y réinterprétait alors comme l’analogue de la 4-force extérieure appliquée au mobile.

Dans la bidouille 2, j’ai non linéarisé le raisonnement et, dans la bidouille 3, j’ai proposé d’appliquer ce champ non linéaire à la description physique de la pensée, la ramenant à de « l’espace magnétique » évoluant au cours d’un « temps électrique ».

Ici, nous allons revenir plus en détail sur la dynamique de champ non linéaire esquissée Bidouille 2. Je reporte ci-dessous les équations de base, pour plus de commodité :

 

  • densité de Lagrangien :

4.     LEM[A(x),F(x),x] = Fij(x)Fij(x)/2µ + ∫ Ji[A(x),x]dAi(x)

- équations de champ (en variables Fij, pour raisons de symétrie) :

  1. ðLEM/ðFij(x) = Pij(x) = Fij(x)/µ  ,  ðiPij(x) = ðLEM/ðAj = Jj[A(x),x]
  • solutions :
  1. Ai(x) = A(ond)i(x) + Ci[S(x),x]  ,  Si(x) = Ji[A(x),x]

J’avais interprété la fonctionnelle vectorielle Ji[A(x),x] comme un 4-courant généralisé. Une analyse plus fine montre que ce n’est pas tout à fait exact, car on a un mélange de matière et de champ. On va donc revenir là-dessus et approfondir les ordres 0, 1, 2 et 3 en Ji, ce qui correspond aux ordres 1, 2, 3 et 4 en la fonctionnelle potentielle, les plus couramment rencontrés.

 

ORDRE 0 :

Maxwell, donc. La fonctionnelle Ji est C0 seulement en les Ai(x) : comme on l’avait vu, c’est en fait la situation la plus discontinue. Une autre approche consiste à considérer que les Ji ne dépendent pas explicitement des Ai(x), ce qui, d’une certaine manière, revient au même. Mais, d’une manière beaucoup plus générale, ce que l’on appellera « densité de 4-courant » est :

 

  1. ji(x) = Ji(0,x) = Ji[A(x) = 0,x]

 

C’est une distribution. Et on voit facilement que :

 

TOUS LES COEFFICIENTS DE Ji[A(x),x] DANS LE DEVELOPPEMENT EN PUISSANCES DES Ai(x) SONT DES DISTRIBUTIONS DANS X ET DES DISTRIBUTIONS MATERIELLES.

 

On regarde (1) et on se dit que ji(x) est la distribution issue de Ji en champ nul (par extension, pour des valeurs fixées des potentiels de champ, qui peuvent toujours être ramenées à zéro en changeant de référence). C'est-à-dire ce qui subsiste après annulation du champ ou en l’absence de champ (mais cette dernière assertion est un peu dénuée de sens puisque, dès qu’il y a sources, il y a émission de champ). A cet ordre, on ne peut guère en dire plus. Si on remonte à la fonctionnelle potentielle, étant donnée que Ji en est le 4-gradient par rapport aux Ai(x), les extrema seront atteints pour :

 

  1. Ji[A(x),x] = 0

 

ce qui, à l’ordre 0, conduit à ji(x) = 0, que l’on peut interpréter de deux manières : absence de sources ou extérieur des sources d’émission. Absence de sources : s’il n’y a pas de sources, les seuls champs possibles sont des ondes, susceptibles ainsi de préexister à toute source matérielle. Extérieur des sources : on a des champs qui se propagent dans le vide de charges sous la forme ou à la manière d’ondes. Il faut bien garder à l’esprit que le système de Maxwell décrit en fait des champs électromagnétiques dans la matière (électriquement chargée) et qu’hors de la matière, i.e. dans le vide, on n’a que des équations d’ondes. En toute rigueur, on ne peut donc parler de « champs maxwelliens » qu’à l’intérieur de la matière. Si ces champs sortent de la matière qui les a produits, ils se transforment en ondes.

La relation (2) ci-dessus est plus complexe, puisqu’elle mêle sources matérielles et champs. A l’ordre zéro, aucune relation fonctionnelle ne peut être établie entre sources et champs à l’extremum. Tout ce que l’on peut dire est que le vide maxwellien se confond partout avec l’extremum potentiel et que, dans ce vide, on n’a plus que de l’énergie cinétique d’ondes.

Enfin, à l’ordre zéro, la portée du champ est illimitée, puisque rien, dans la partie potentielle de son énergie, ne limite sa portée. Il s’ensuit que le volume spatial V3 que peut recouvrir le champ s’étend à E3 tout entier. Chez Maxwell, les conditions aux bords sont les conditions asymptotiques Ai(x,t) -> 0 pour tout t quand |x| -> oo. On peut dire que les champs maxwelliens sont dépourvus de forme.

 

ORDRE 1 :

 

C’est le « post-Maxwell », si l’on veut. La fonctionnelle Ji est C1 en les Ai(x) : c’est un petit peu plus régulier (mais pas beaucoup plus). La fonctionnelle potentielle est quadratique en les Ai(x). On écrit :

 

  1. Ji[A(x),x] = ji(x) – j1,ij(x)Aj(x)

 

Pour connaître l’allure (le comportement) du champ dans l’espace-temps, il faut résoudre le système (5) ci-dessus. Pour cela, on est obligé de faire passer le couplage potentiel j1,ij(x)Aj(x) du côté de la partie cinétique ðiPij(x). Attention à ne pas confondre les deux : même si énergie cinétique et énergie potentielle se transforment l’une en l’autre, de sorte que seule l’énergie totale est pertinente, c’est une variation de l’énergie cinétique (resp. potentielle) qui induit une variation en sens contraire de l’énergie potentielle (resp. cinétique) sur toute (hyper-)surface de Hill, i.e. d’énergie totale constante. C’est cela qu’on doit entendre par « transformation » ou « conversion ». Il n’en reste pas moins que ce qui est cinétique (resp. potentiel) reste cinétique (resp. potentiel) : les deux formes d’énergie sont duales et complémentaires. Elles contribuent toutes deux à la dynamique.

Ceci étant dit, la distribution j1,ij(x) limite déjà la portée du champ : l’invariance de jauge étant préservée à tout ordre, sur la partie cinétique, on peut se placer dans la jauge de Lorentz, même dans le cas non linéaire générale, sans restriction aucune. A l’ordre 1 et dans cette jauge, on obtiendra donc les équations de champ suivantes :

 

  1. ðjðjAi(x) + µj1,ij(x)Aj(x) = µji(x) = ðjðjAi(Max)(x)

 

La seconde égalité ne fait que rappeler les équations de Maxwell, établies à l’ordre zéro. Même si le système n’est pas intégrable par quadratures dès que les j1,ij sont variables, on voit clairement que le champ de Maxwell est modifié par un facteur de type exponentiel. Il est possible d’expliciter la portée spatiale du champ (c’est ce qui nous intéresse) en prenant pour distribution :

 

  1. j1,ij(x) = j1deltaijdelta(x)

 

Les équations (4) deviennent :

 

  1. ðjðjAi(x) + µj1delta(x)Ai(x) = µji(x) = ðjðjAi(Max)(x)

 

de sorte que :

 

  1. ksi² = 1/µ|j1­| = carré de la portée spatiale du champ.

 

Si j1 < 0, on aura un régime spatial oscillant ; si j1 > 0, un régime spatial amorti. C’est ce dernier cas qui est intéressant, puisqu’à des distances > ksi (en valeur absolue), le champ s’amortit alors très rapidement, de sorte qu’on peut considérer qu’il est nul ou, au moins, négligeable sur le bord B2 du volume V3 de rayon caractéristique ksi. Ce champ-là a déjà de la forme. Cette fois, l’extremum se situe en :

 

  1. j1,ij(x)Aj(x) = ji(x)

 

Et Ai(x) se comporte comme une onde. Pourtant, il y a une source matérielle ji(x) et le champ se trouve bien dans cette matière, il est bien à portée limitée, mais tout se passe comme si ce champ, non seulement était dans le vide, mais avec une portée illimitée !

Bizarre, ces extrema d’énergie potentielle…

 

ORDRE 2 :

 

Ji est C2 en les Ai(x), on a :

 

  1. Ji[A(x),x] = ji(x) – j1,ij(x)Aj(x) + ½ j2,ijk(x)Aj(x)Ak(x)

 

Les équations de champ sont :

 

  1. ðjðjAi(x) + µj1,ij(x)Aj(x) – ½ j2,ijkAj(x)Ak(x) = µji(x)

 

On devient non linéaire. On ne songe même pas à résoudre par quadratures, on regarde les extrema :

 

  1. ½ j2,ijk(x)Aj(x)Ak(x) – j1,ij(x)Aj(x) + ji(x) = 0

 

Il y en a 2, qui peuvent être confondus, selon les coefficients matériels. Rebelote : on a une onde. Et comme ça à tous les ordres. Bon…

 

ORDRE 3 :

 

Allez, pour dire d’appliquer le programme. Ji est C3 en Ai(x), la partie potentielle du Lagrangien est quartique en les Ai(x), les équations de champ sont cubiques, il y a 3 extrema, qui peuvent se confondre.

 

Il faudra que je réfléchisse à cette histoire de champs dans la matière qui se comportent comme des ondes dans le vide…

 

 

BIDOUILLE 12 : L'UNIFICATION DU CLASSIQUE, DU STOCHASTIQUE ET DU QUANTIQUE !

Le 27/11/2012

De fil an aiguille, on arrive à boucler la boucle (non sans mal). Nous passons à la dynamique et, surtout, à ses INTERPRETATIONS PHYSIQUES (c’est ça l’intéressant).

Dans la situation classique, le mouvement dans l’espace au cours du temps est représenté par une courbe x(t), où t est le temps classique et x, l’espace (le lieu) classique. Ce type de mouvement est toujours déterministe : il suffit de connaître la position initiale x0 = x(t0) d’un mobile à l’instant de départ t0 pour être en mesurer de déterminer avec exactitude n’importe laquelle de ses positions ultérieures x(t) à l’instant t > t0 sur la trajectoire.

Dans la situation quantique, il faut reconsidérer les choses du début.

Soit t un instant classique et tau > 0 le pas temporel. L’instant classique immédiatement précédent est t – tau, l’instant classique immédiatement suivant est t + tau. Peut-on en déduire pour autant que t – tau se situe dans le passé de t est t + tau dans le futur de t ? Ce n’est pas si simple. Parce que, classiquement, le temps étant discret, il procède par sauts de n.tau, avec n entier relatif : n < 0 va vers le passé de t ; n > 0, vers le futur de t. Donc, classiquement, IL N’Y A RIEN sur les intervalles temporels ouverts ]t-tau,t[ et ]t,t+tau[ : pas de temps. Pas très satisfaisant sur le plan de la physique. Se dire que, sur un laps de temps de 2tau, le temps n’existe pas, sauf au point central t (le présent) n’a pas grand-chose de physique.

C’est la même chose que de dire, comme Connes que, du point de vue classique, les espaces discrets ne renferment aucune information intéressante.

Mais « rien » classiquement signifie en fait la présence de VIDE. Et le vide quantique, lui, est siège de FLUCTUATIONS. On peut donc envisager que sur ]t-tau,t[ U ]t,t+tau[ existent des FLUCTUATIONS TEMPORELLES. C’est déjà beaucoup plus satisfaisant. Alors, « l’instant présent » t représente le présent REALISé, celui qui a la probabilité maximale de se réaliser, tandis que le reste a une probabilité moindre de se réaliser, c’est du présent REALISABLE. De la sorte, le présent s’étend à tout l’intervalle ]t-tau,t+tau[, incluant t, tandis qu’aux bornes de l’intervalle, la probabilité de réalisation de ce présent devient nulle ou négligeable. Mais alors, si l’on décide d’introduire les probabilités dans notre description, il faut considérer un temps STOCHASTIQUE T qui, lui, n’a plus aucune raison d’être DISCRET. Autrement dit, seuls les instants CLASSIQUES seraient DISCRETS, tandis que le temps stochastique resterait continu, mais au sens probabiliste du terme (« probablement continu »). Sous cette description des choses, on pense immédiatement à une distribution de probabilité (de réalisation) de la forme :

 

  1. rhôtau[(T-t)/tau] = rhô’tau[(T-t)/tau]cos²[pi.(T-t)/2tau]
  2. rhô’tau[-(T-t)/tau] = rhô’tau[(T-t)/tau]

 

Le module rhô’tau peut être, par exemple, une gaussienne. L’instant classique t devient la MOYENNE STATISTIQUE du temps stochastique (du « processus temporel ») T et tau, la PORTEE DES FLUCTUATIONS TEMPORELLES : on rejoint la description quantique en termes de probabilité de présence et fonctions d’onde, mais appliquée au temps lui-même et non à des particules. C’est tout à fait en accord avec la structure non commutative d’algèbres et de modules d’opérateurs sous-jacente aux espaces discrets : statistiquement, le cadre préserve la continuité et les variables dynamiques deviennent des opérateurs agissant sur une fonction d’onde (amplitude de probabilité de présence).

La présence du terme oscillant cos² dans (1) assure que la loi de probabilité se répète d’intervalle en intervalle, qu’elle possède des VENTRES en T – t = 2n.tau (proba maxi de réalisation en t, t +/- 2tau, t +/- 4 tau, etc. et des NŒUDS en T – t = (2n+1).tau (proba mini de réalisation – nulle dans le présent modèle) aux bornes des intervalles. Le carré est impératif puisqu’une proba négative n’a aucune signification physique. La condition (2) ne fait, elle, que traduire l’égale probabilité de réalisation entre passé et futur.

S’il y a un cos, c’est qu’il y a INTERFERENCES. C’est précisément le fondement du PAQUET D’ONDES : les ondes (monochromatiques) qui constituent ce paquet interfèrent entre elles, soit constructivement (aux ventres), soit destructivement (aux nœuds).

En résumé, on peut dire que :

 

LE PRESENT S’ETALE STATISTIQUEMENT SUR TOUT L’INTERVALLE TEMPOREL [t-tau,t+tau] CENTRé SUR L’INSTANT CLASSIQUE t, PRESENT REALISABLE AVEC PROBA MAXI, TANDIS QUE t-tau et t+tau SONT LES PRESENTS REALISABLES AVEC PROBA MINI. L’INTERVALLE [t-tau,t+tau] EST LE SIEGE DE FLUCTUATIONS TEMPORELLES, LE TEMPS t EST DISCRET ; LE TEMPS STOCHASTIQUE T, CONTINU AU SENS PROBABILISTE DU TERME. LES FLUCTUATIONS TEMPORELLES SE TRADUISENT PAR LA PRESENCE D’UNE FONCTION D’ONDES ET LES ONDES CONSTITUTIVES DE CE « PAQUET D’ONDES TEMPORELLES » SONT EN INTERFERENCES LES UNES AVEC LES AUTRES, CONSTRUCTIVEMENT AUX VENTRES (INSTANTS CLASSIQUES), DESTRUCTIVEMENT AUX NŒUDS (INSTANTS PUREMENT QUANTIQUES).

 

Pourquoi purement quantiques ? Faisons tendre tau vers l’infini. Alors, tout instant classique t se retrouve complètement « noyé » dans les fluctuations temporelles : le temps conventionnel s’est DILUé, c’est la « limite quantique », où plus rien de classique ne subsiste. C’est le VIDE TEMPOREL :

 

A LA LIMITE QUANTIQUE (VIDE TEMPOREL), LE TEMPS A DISPARU AU SENS CLASSIQUE DU TERME, « NOYé » DANS LES FLUCTUATIONS TEMPORELLES. C’EST AUSSI LE DOMAINE DU « QUANTIQUE MACROSCOPIQUE ».

 

Ça veut dire aussi que, dans les processus quantiques à grande échelle (temporelle), i.e. sur de longues périodes de temps, la notion classique de temps DISPARAIT : classiquement, ces processus deviennent ATEMPORELS.

L’erreur d’analyse serait de considérer l’instant t-tau comme situé « dans le passé » de t et l’instant t+tau, « dans le futur » de t : c’est TOUT L’INTERVALLE [t-tau,t+tau] qui représente le « présent ». Le passé de t, lui, est centré en t-2tau, il occupe un intervalle de même longueur que celui de t. Le futur de t, lui, est centré en t+2tau et occupe également un intervalle de même longueur : on va de ventre à ventre et de nœud à nœud. Considérer t+tau comme une sorte de « futur antérieur » de t+2tau et de « futur immédiat » de t mènerait à des paradoxes temporels. Et chacun sait que les paradoxes ne naissent que d’une analyse inappropriée des choses. Non : on a un laps de temps présent, suivi du même laps de temps futur et précédé du même laps de temps passé. Il faut passer de la description en POINTS à la description en INTERVALLES (fermés, donc compacts – sauf à la limite quantique, bien sûr – et encore, en incluant l’infini, on compactifie à la Riemann).

 

Il existe quand même des instants discrets, dénombrables (les nœuds) où il n’y a pas de temps. Mais ces « instants singuliers » étant ponctuels, ils sont tous de mesure nulle. En fait, ils résultent de l’interférence destructive (opposition de phases dans la fonction d’onde en ces points) : en t+tau, il n’y a plus de présent et pas encore de futur ; en t-tau, il n’y a plus de passé et pas encore de présent. C’est très bizarre, mais ça entre dans le catalogue de bizarreries de la physique quantique… Le monde quantique a l’air de nous dire que, statistiquement du moins, il PEUT ne plus y avoir de temps du tout, mais en des points bien séparés seulement, bien qu’ils restent en infinité dénombrable.

 

A présent (!) que nous avons notre temps, nous pouvons analyser le MOUVEMENT.

A t correspond une position CLASSIQUE x(t) dans l’espace (en 1D, pour simplifier, peu importe ici).

A t+tau correspond une position x(t+tau) et à t-tau, une position x(t-tau). Ces positions « marginales » doivent traduire la longueur d’un INTERVALLE, image de [t-tau,t+tau] par la fonction x(.). En conséquence :

 

  1. x(t+tau) = x(t) + h(t,tau)
  2. x(t-tau) = x(t) – h(t,tau)

 

Il est facile de voir, sur des exemples élémentaires, que h dépend à la fois de t et de tau. Ainsi, sur le mouvement classique uniformément accéléré :

 

x(t) = ½ a0t² + v0t  (on prend x0 = 0 comme référence)  ,  h(t,tau) = (a0t + v0)tau

 

De (3) et (4), on tire :

 

  1. 2h(t,tau) = x(t+tau) – x(t-tau)  ,  h(t,0) = 0 pour tout t  ,  h(t,-tau) = -h(t,tau)
  2. x(t+tau) + x(t-tau) = 2x(t)
  3. h(t,tau) = dtaux(t) = tau.Dtaux(t), tau-différentielle de x(t).

 

tau étant la DUREE CORRELATIVE, h est la DISTANCE CORRELATIVE. De même que pour le temps, seul l’espace CLASSIQUE est discret et la continuité se retrouve au niveau STATISTIQUE, au sein d’un espace STOCHASTIQUE. On a une position stochastique X, de moyenne statistique x, un mouvement stochastique X(t) et un MOYEN MOUVEMENT, classique, x(t). Tout comme <(T-t)²>temporelle = tau², <(X-x)²>spatiale = h².

La VITESSE est donnée par la tau-dérivée de x(t) :

 

  1. v(t,tau) = Dtaux(t) = [x(t+tau) – x(t)]/tau = h(t,tau)/tau

 

d’après (3). C’est donc le rapport (distance corrélative)/(durée corrélative). A la limite tau -> 0, tau s’identifie à dt, tandis que h(t,tau) s’identifie à dx(t) et on retrouve la vitesse classique instantanée v(t,0) = dx(t)/dt. A la limite tau -> oo, IL SUFFIT que v(t, tau) soit en tau-(1+a) avec a réel > 0 pour que h(t,tau) tende asymptotiquement vers zéro ! Dans ce cas de figure, on se retrouve avec un temps macroscopiquement quantique (tau -> oo) et un espace microscopiquement classique (h -> 0) !!! Cela montre que TOUTES LES SITUATIONS PHYSIQUES DEVIENNENT POSSIBLES : du micro (resp. méso, macro) temporel avec du micro (resp. méso, macro) spatial. Tout dépend de la forme de v(t,tau) et cette forme est donnée par les équations de mouvement.

La construction en fonction d’onde – proba de réalisation s’applique à l’espace. En place de (1) et (2) on aura :

 

  1. rhôh[(X-x)/h] = rhô’h[(X-x)/h]cos²[pi.(X-x)/2h]
  2. rhô’h[-(X-x)/h] = rhô’[(X-x)/h]

 

De nouveau, il PEUT exister des points, isolés mais en infinité dénombrable, où l’espace n’existe plus, c'est-à-dire, où sa proba de réalisation est très faible voire nulle… Notez qu’ici, on parle de temps et d’espace au sens STATISTIQUE du terme, pas seulement classique ! Cela sous-entend qu’en les nœuds des distributions de probabilité, il n’y aurait plus rien, même plus de vide… je pense plutôt qu’il doit y avoir interférence destructive :

  • en t+tau, entre une « onde du présent » (composante du paquet d’ondes sur [t-tau,t+tau]) et une « onde du futur » (composante du paquet d’ondes sur [t+tau,t+3tau]), en opposition de phases, d’où neutralisation mutuelle, et
  • en t-tau, entre une « onde du passé » (composante du paquet d’ondes sur [t-3tau,t-tau]) et une « onde du présent », en opposition de phases.

 

ce qui ne nécessiterait pas l’élimination, même locale, même au sens statistique, du temps. C’est L’EFFET (ondulatoire) qui serait neutralisant. Et ces « ondes du futur » étant présentes dans tout l’intervalle [t+tau, t+3tau], elles peuvent se propager aussi bien « vers l’avant », de t+2tau (futur classique) à t+3tau que « vers l’arrière », de t+2tau à t+tau. Idem pour les « ondes du passé ». En réalité, la mécanique quantique nous montre qu’au sein du paquet d’ondes, il ne s’agit pas de « mouvement » au sens conventionnel du terme : il n’y a aucune propagation à l’intérieur du paquet d’ondes, c’est le paquet d’ondes au complet qui se propage. Le paquet en lui-même est à support compact. On peut le voir comme un assemblage d’ondes monochromatiques qui se réfléchissent en permanence sur les « parois » du paquet, donc de l’intervalle qui lui sert de support. Ça veut dire que les « ondes du futur » se « réfléchissent » en t+tau et en t+3tau : en t+tau, elles repartent vers l’avant (vers t + 3tau) ; en t+3tau, vers l’arrière jusqu’en t+tau, etc. De même, les « ondes du passé » se « réfléchissent » en t-3tau et en t-tau : en t-3tau, elles repartent vers l’avant (vers t-tau), puis vers l’arrière, jusqu’à t-3tau, etc. C’est un va-et-vient perpétuel. Tout cela constitue « le passé », « le présent », « le futur ». Ces laps de temps successifs sont bien séparés les uns des autres et ne communiquent qu’à leurs extrémités. Il n’y a pas de recouvrement, donc pas de paradoxe.

Pour l’espace, c’est la même chose. Alors, on n’a plus besoin « d’éliminer » l’espace où que ce soit. Conceptuellement, c’est même plus simple, parce que ce n’est plus qu’une question D’ORIENTATION : on n’a plus de SUCCESSION, comme avec le temps. Si on ne choisit aucune orientation, toutes les directions se valent ; si on choisit une orientation, on se donne une origine (forcément), tout ce qui se trouve dans le sens d’orientation est compté positivement et tout ce qui se trouve en sens contraire est compté négativement (Schwartz, calcul tensoriel, algèbre extérieure).

 

Dérivons la vitesse, nous obtenons l’accélération :

 

  1. a(t,tau) = Dtauv(t,tau)  => v(t+tau,tau) = v(t,tau) + a(t,tau)tau = v(t,tau) + nu(t,tau)

 

La vitesse :

 

  1. nu(t,tau) = a(t,tau)tau

 

est l’équivalent de h(t,tau) : c’est la VITESSE CORRELATIVE. Il est facile de voir que :

 

  1. nu(t,tau) = Dtauh(t,tau)

 

est bien la tau-dérivée de la distance corrélative. En dérivant encore une fois, on établit de même que L’ACCELERATION CORRELATIVE :

 

  1. gamma(t,tau) = a(t+tau) – a(t,tau) = dtaua(t)

 

est la tau-dérivée de la vitesse corrélative :

 

  1. gamma(t,tau) = Dtaunu(t,tau) = Dtau²h(t,tau)

 

comme on est en droit de s’y attendre. Il y a donc un mouvement CLASSIQUE, DETERMINISTE, sur les MOYENNES SPATIALES et un mouvement FLUCTUANT, STATISTIQUE, sur les CORRELATIFS. En fait, c’est inexact, c’est de la dichotomie « théorie de champ moyen » : il n’y a QU’UN SEUL mouvement, c’est celui de X(T) et il est STOCHASTIQUE. Il exprime la position statistique X du mobile dans l’espace à l’instant statistique T. A la moindre non-linéarité, moyen mouvement et fluctuations sont indissociables (couplées, plus ou moins fortement) : l’évolution des fluctuations dans le temps influe sur le moyen mouvement, qui influe en retour sur ces fluctuations. Ne pas eprdre de vue que ce moyen mouvement, x(t) en toute rigueur, est FONCIEREMENT DISCONTINU, puisqu’on saute d’un instant classique à l’autre et donc, d’une position classique à l’autre. En revanche, au sens statistique du terme, le mouvement réel X(T) est continu.

 

ON PASSE D’UNE DYNAMIQUE CLASSIQUE, DETERMINISTE, EN TERMES DE COURBES, A UNE DYNAMIQUE QUANTIQUE, STOCHASTIQUE, EN TERMES DE RUBANS.

 

On a un ruban qui se développe entre l’intervalle temporel [t-tau,t+tau], de largeur 2tau, et l’intervalle spatial [x(t-tau),x(t+tau)], de largeur 2h(t,tau). On peut voir ces rubans comme des surfaces aléatoires, si l’on veut. Mais je ne suis pas d’accord avec ça, parce qu’en dimension spatiale > 1, on ne trouve ni surfaces ni hypersurfaces, mais des RUBANS le long de chaque axe de coordonnées. En dim 2, par exemple, on trouve un ruban [x(t-tau),x(t+tau)] dans la direction x et un ruban [y(t-tau),y(t+tau)] dans la direction y. Les 2 rubans se recoupent en leur centre [x(t),y(t)]. On ne peut pas avoir de surface, car il n’y a qu’un seul paramètre. En dim n, on trouvera donc n rubans, qui se recouperont tous en leur centre [x1(t),…xn(t)]. La construction en surfaces aléatoires procède d’un tout autre principe. On trouvera ainsi des plaquettes A L’INTERIEUR DES INTERVALLES. Mais, ici, il s’agit du mouvement D’INTERVALLES SPATIAUX dans l’espace.

 

Voici pour l’essentiel. Je travaille actuellement sur la masse et ses interprétations physiques.

 

NB : tout comme le temps classique disparait à la limite quantique tau -> oo, l'espace classique disparaît à la limite h -> oo :

 

LE QUANTIQUE MACROSCOPIQUE S'ABSOUT AUSSI BIEN DU TEMPS QUE DE L'ESPACE.

 

Inutile, alors, de rechercher une quelconque PROPAGATION DE SIGNAUX... :) Il n'y a que du PAQUET D'ONDES.

 

 

BIDOUILLE 11 : INTERPRETATION

Le 06/11/2012

J’ai tenu à vérifier certains points existants relatifs aux notions de calcul discret et bien m’en a pris, car le concept dans lequel s’inscrit la « dérivation non linéaire » de la Bidouille 10 ci-avant est radicalement différent de ce qu’on trouve habituellement, par exemple sur :

http://fr.wikipedia.org/wiki/M%C3%A9thode_des_diff%C3%A9rences_finies

"La résolution des schémas numériques s’appuie en général sur des méthodes algébriques classiques. Cependant d’autres formulations équivalentes peuvent faire appel à des méthodes d'optimisation."

ou : http://fr.wikipedia.org/wiki/Diff%C3%A9rence_finie

Mon approche a beaucoup plus à faire avec la notion d’espaces discrets et, plus exactement encore, quantiques. En tant que telle, elle rejoint la géométrie non commutative de Connes. En effet, il n’est pas question ici d’obtenir des solutions approchées d’équations différentielles dans le continu, ni d’optimiser quoi que ce soit : une équation telle que

 

  1. Dhf(x,h) = a(x,h)f(x,h)

 

ne doit pas être considérée comme une expression discrétisée de l’équation différentielle :

 

  1. Df(x,0) = Df0(x) = a0(x)f0(x)     pour h -> 0

 

 

mais, au contraire, comme une généralisation de (2). L’approche est donc inverse de celle des méthodes d’analyse finie : c’est maintenant (2) qui est considérée comme une forme limite de (1) lorsque h -> 0.

Pour une meilleure vision du contexte, je vais argumenter en termes physiques.

D’abord, nous avons établi que h = dhx était « l’unité », « l’élément de longueur », le « pas » dans le cas d’un réseau ou d’un maillage de points, avec l’identification dhx = dx à la limite du continu h -> 0. On sait qu’en physique, c’est cette limite du continu (le « continuum ») qui devient l’approximation, tandis que la réalité fondamentale s’avère foncièrement discontinue.

La limite h -> 0 correspond donc, soit au macroscopique (physique « classique », déterministe), soit à un « zoom arrière » théoriquement infini. C'est-à-dire que l’observateur s’éloigne « à l’infini » d’une portion d’espace comprise entre un point x et son voisin immédiat x+h (ou x-h). Résultat : notre observateur a l’impression que les points x, x+h et x-h se rapprochent l’un de l’autre, jusqu’à finir par se confondre « à l’infini ». Il ne parvient plus à distinguer la distance élémentaire séparant ces 3 points.

Si l’on « zoom avant », au fur et à mesure qu’on va se rapprocher, on va distinguer de mieux en mieux cet écartement h. Et on va réaliser que ce qu’on prenait pour un « continuum », un espace continu, est en réalité un espace complètement discontinu, un espace « à trous ». Ou encore, discret. Mais alors, entre chaque point, il n’y a rien, puisqu’on ne peut descendre en dessous d’une distance de h. Mathématiquement, cela signifie qu’il n’existe aucune structure, au moins au sens classique, fonctionnel, du terme ; physiquement, cela signifie qu’il y a du vide. Classiquement, le vide, c’est l’absence de tout ; quantiquement, c’est un milieu purement fluctuant. Les points représentent alors l’espace effectivement réalisé, tandis que les vides d’étendue h entre ces points représentent l’espace non encore réalisé, mais réalisable. On sait, en effet, qu’il suffit de polariser le vide quantique pour réaliser des objets, en séparant les paires virtuelles. Nos points représentent des objets physiques, comme des points matériels, par exemples, ou des particules.

Voilà pourquoi (1) généralise (2) : parce que l’observateur peut, en outre, faire varier le pas de résolution h. Plus il diminuera h, plus il s’éloignera du segment [x-h,x+h] : c’est la transition vers le classique, la grande échelle ; plus il augmentera h, plus il se rapprochera du segment [x-h,x+h] : c’est la transition vers le quantique, la petite échelle.

A l’autre extrémité, la limite sera h -> oo.

Peut-il exister des solutions non nulles et finies de (1) à cette limite supérieure ? La réponse est oui. Résolvons déjà :

 

  1. Dhf(x,h) = a(h)f(x,h)

 

Cette équation nous dit que la h-dérivée de f(x,h) lui est proportionnelle et que le coefficient de proportionnalité a(h) dépend explicitement de h. La solution est :

 

  1. f(x,h) = f(0,h)[1 + ha(h)]x/h

 

Plusieurs remarques :

 

  1. la h-dérivée d’une fonction f(x) est TOUJOURS, par construction même, une fonction g(x,h) de x ET de h ;
  2. la h-primitive d’une fonction f(x) est TOUJOURS, par construction même, une fonction F(x,h). Il suffit de former DhF(x,h) = f(x) pour s’en convaincre : on ne peut avoir de résultat indépendant de h que ssi F dépend aussi bien de x que du pas de résolution h ;
  3. c’est pourquoi, d’une manière générale, on considère, non plus DES fonctions ou applications f(x), mais des FAISCEAUX de fonctions ou d’applications f(x,h) ;
  4.  tout coefficient a(h) ne dépendant que de h a une h-dérivée nulle et peut donc être assimilé à une constante, vis-à-vis de cet opérateur ;
  5.  La h-primitive Iha(h) de a(h) est de la forme A(x,h) = a(h)x + b(h) (dériver).

 

L’erreur serait maintenant de considérer la solution (4) comme une fonction ANALYTIQUE et donc, LISSE, de x : C’EST FAUX !

Nous sommes dans un espace discret. La progression d’un point à un autre procède par saut discontinu. En conséquence, si nous partons d’un point x0, les points suivants ne pourront être que des multiples entiers de h : x0, x0 +/- h,…, x0 +/- nh. La variable x n’est plus une variable continue ! Ce n’est qu’à la limite h -> 0 qu’elle le devient ou, plus correctement, qu’elle en prend l’aspect.

Par contre, rien, a priori, n’empêche le faisceau f(x,h) d’être continu en h.

 

Devinette : si nous faisons a(h) = 1 dans (4), qu’obtenons-nous au point x = 1 ?

 

  1. e(h) = (1 + h)1/h = exp{[Ln(1+h)]/h} ,  Limh->0 e(h) = e(0) = e

 

La fonction e(h) généralise l’exponentielle.

Il doit donc logiquement exister une généralisation de log, non ? Effectivement, la fonction :

 

(6)     Ln(h) = h Ln/Ln(1+h) = h Ln1+h   ,   Limh->0 Ln(h) = Ln(0) = Ln

 

généralise le logarithme naturel (ou népérien).

On voit que ces deux fonctions dépendent fortement de l’échelle. En h = 1, par exemple, j’obtiens e(1) = 2 et non plus 2,71828…, ce qui modifie ma fonction puissance et me fait passer d’une solution à l’autre, Ln(1) = Ln2 : je passe de la base e à la base 2…

Les bases numériques diminuent régulièrement, puisque :

 

  1. Limh->oo e(h) = 1

 

Par contre, ln(h) diverge. Ensuite :

 

  1. f(x,h) = f(0,h)exp(h)[Ih{Ln1+h[1 + ha(x,h)]}]

 

est solution de

 

  1. Dhf(x,h) = a(x,h)f(x,h) pour tout h.

 

Preuve : on sait qu’à la limite du continu, la solution de Df0(x) = a0(x)f0(x) est f0(x) = f0(0)exp[I a0(x)dx] avec I = I0 = opérateur intégral. On va donc chercher la solution de (8) sous la forme :

 

f(x,h) = f(0,h)exp(h)[A(x,h) + g(x,h)]

 

où A(x,h) est la h-primitive de a(x,h), avec A(x,0) = I a0(x)dx et g(x,0) = 0 pour tout x. Différencions :

 

dhf(x,h) = f(x+h+,h) – f(x,h) = f(0,h){exp(h)[A(x+h,h) + g(x+h,h)] - exp(h)[A(x,h) + g(x,h)]} = f(0,h)exp(h)[A(x,h) + g(x,h)]{exp(h)[A(x+h+,h) – A(x,h) + g(x+h,h) – g(x,h)] – 1}

= f(x,h){exp(h)[dhA(x,h) + dhg(x,h)] – 1}

 

Or, Ih = Dh-1 => DhA(x,h) = a(x,h) d’où dhA(x,h) = hDhA(x,h) = ha(x,h) et :

 

dhf(x,h) = hDhf(x,h) = f(x,h){exp(h)[ha(x,h) + hDhg(x,h)] – 1} = ha(x,h)f(x,h)

 

en vertu de (8). Il en résulte que :

 

ha(x,h) + hDhg(x,h) = Ln(h)[1 + ha(x,h)]

 

soit :

 

Dhg(x,h) = h-1Ln(h)[1 + ha(x,h)] – a(x,h)

 

En intégrant :

 

g(x,h) = Ih{h-1Ln(h)[1 + ha(x,h)]} – A(x,h)

 

On vérifie facilement que g(x,0) = 0 pour tout x, d’où la solution.

 

En fait, d’une manière assez générale, on recherchera les solutions d’équations discrètes (« quantiques ») comme des extensions des solutions de leurs homologues continues (« classiques »), en gardant toutefois à l’esprit que seul l’opérateur limite I0 = I est une somme continue. Les opérateurs Ih pour h non nul ne sont pas des intégrales.

 

Solution de :

 

  1. [Dh² + a(h)Dh + b(h)Id]f(x,h) = 0 ?

 

Réponse :

 

  1. f(x,h) = c(h)[1 + hX1(h)]x/h + d(h)[1 + hX2(h)]x/h

 

où X1,2(h) sont racines du polynôme caractéristique :

 

  1. X²(h) + a(h)X(h) + b(h) = 0

 

Pour les équations à coeffs constants, c’est facile. La solution de :

 

  1. PN(Dh)f(x,h) = [Sn=0N an(h)Dhn] = 0

 

est :

 

  1. f(x,h) = Sn=0N cn(h)[1 + hXn(h)]x/h

 

où les Xn(h) sont racines du polynôme caractéristique :

 

  1. PN[X(h)] = 0

 

En revanche, pour des coeffs variables (fonctions de x, quoi), on rencontre les mêmes problèmes que dans le cas continu, à savoir qu’à cause des dérivations, les équations d’ordre >= 2 ne se laissent pas exprimer à l’aide d’opérateurs Ih, car il faut encore dériver les coefficients.

 

La prochaine fois, j’analyserai l’application à la mécanique.

 

 

BIDOUILLE 10 : DERIVATION NON LINEAIRE

Le 02/11/2012

Dans cet article, je propose d’étendre les notions linéaires duales de dérivée et de différentielle. Avec, comme toujours, quelques surprises à la clé, certaines de taille.

On part donc de la formule des accroissements finis : soient E et F deux ensembles, f : E -> F une application de E dans F, x un élément de E (un point si E est muni d’une structure d’espace affine) et h > 0 un autre élément de E, distinct de x.

 

Définition 1 : On appelle nombre dérivé de f en x, la quantité :

 

  1. Dhf(x) = [f(x+h) – f(x)]/h

 

Il ne s’agit PLUS d’une approximation linéaire : le nombre Dhf(x) dépend généralement de x et de h de façon NON linéaire. En fait, il mesure le rapport à h de l’écart entre la valeur de f en l’élément x+h et sa valeur en l’élément x. On retrouve l’approximation linéaire en passant à la limite :

 

  1. Limh->0 Dhf(x) = Df(x)

 

Ce que l’on peut écrire en termes d’opérateurs seuls :

 

  1. Limh->0 Dh = D

 

Nous verrons pour les subtilités ensuite. Pour l’instant, établissons des propriétés fort générales. On remarque tout d’abord qu’en remplaçant h par nh dans (1), où n est un entier naturel, on a :

 

  1. Dnhf(x) = [f(x+nh) – f(x)]/nh

 

d’où :

 

  1. f(x+nh) = f(x) + nhDnhf(x)

 

Calculons à présent les dérivées successives de f en x :

 

hf(x) = [f(x+2h) – 2f(x+h) + f(x)]/h²

D3hf(x) = [f(x+3h) – 3f(x+2h) + 3f(x+h) – f(x)]/h3

Dnhf(x) = h-nSk=0n (-1)kCknf[x+(n-k)h]

 

Soit, en utilisant (5) et en termes d’opérateurs :

 

  1. hnDnh = (hDh)n = Sk=0n-1 (-1)kCkn(n-k)hD(n-k)h     (S = somme discrète)

 

Réciproquement, on établit facilement la relation inverse :

 

  1. Id + nhDnh = (Id + hDh)n

 

qui montre qu’une homothétie sur h se traduit en une loi de puissance.

Chose assez étonnante vu le caractère (fortement) non linéaire de Dh, on a encore les propriétés de linéarité suivantes :

 

  • Dh[f(x) + g(x)] = Dhf(x) + Dhg(x) et
  • Dh[af(x)] = aDhf(x) , a un élément du corps considéré (N, Q, R, C, etc.).

 

Il suffit, en effet, de regarder (1) pour s’assurer que, même sur les espaces discrets, Dhf(x) se définit sans ambiguïté dès que f est définie en les points utilisés. Justement, Dhf(x) ne peut exister que si et seulement si f est définie à la fois en x et en x+h, ce qui est loin d’être établi a priori, puisque cela dépend du domaine de définition def(f) de f. De même, D²hf(x) n’est définie que ssi f est définie à la fois en x, x+h et x+2h. Etc. Il s’ensuit que Dnhf(x) ne sera définie que ssi f est définie en x, x+h, x+2h,…, x+nh, ce qui réduit considérablement, non pas def(f), mais def(Dnhf).

On ne trouve pas de telle complication à l’approximation linéaire : dès qu’on fait tendre h vers zéro, à la limite, il suffit que Dnhf soit définie en x, quel que soit l’entier n >=0.

 

Prenons tout de suite un exemple, important en physique et à partir duquel nous établirons une proposition générale et son corollaire : f : R -> R, x -> f(x) = (1 – x²)1/2. Le domaine de définition de f est def(f) = [-1,+1], il est donc borné et même compact. Vis-à-vis de la dérivation usuelle (linéaire), f est clairement Doo et même Coo sur ]-1,+1[, puisque f et toutes ses dérivées sont continues sur cet intervalle ouvert (f est même continue aux extrémités -1 et +1, mais pas ses dérivées). Il n’en est plus de même, loin de là, vis-à-vis de la dérivation non linéaire. Nous venons de voir, en effet que, pour que Dnhf(x) soit définie, il faut et il suffit que les points successifs x, x+h,…, x+nh appartiennent à def(Dnhf), ce qui conduit aux inégalités suivantes :

 

-1 =< x =< +1 , -1 =< x+h =< +1,…, -1 =< x+nh =< +1

 

qui doivent être satisfaites simultanément (ou conjointement, c’est selon), ce qui conduit à l’inégalité unique :

 

  1. -1 =< x =< 1 – nh

 

Il devient alors évident que, pour h > 0 non nul, il apparaît une limite supérieure à l’ordre de dérivation. Cette limite est donnée par l’entier N satisfaisant à :

 

(9)     1 – Nh = -1     d’où     N = E(2/h)

 

Où E(.) désigne la partie entière, puisqu’alors le domaine de définition de DNhf se réduit au singleton {-1}, c'est-à-dire, à un seul point ! Au-dessus, DN+1h n’existe pas car les points x + (N+1)h sortent tous du domaine de définition de f.

Conclusion : pour h > 0 non nul, (1-x²)1/2 est DN sur [-1,+1] avec N = E(2/h) < oo et CN sur ]-1,+1[.

 

CONTRAIREMENT AUX PREJUGéS, LA FONCTION f(x) = (1-x²)1/2 (FACTEUR DE LORENTZ) N’EST PAS LISSE. LE PASSAGE A LA LIMITE h -> 0 (APPROXIMATION LINEAIRE) FAUSSE LE JUGEMENT.

 

Or, cette description, « macroscopique » en physique, est clairement idéaliste. Bien sûr, si h est de l’ordre du rayon de Planck, soit 10-35, N sera de l’ordre de  2x10-35, ce qui est énorme… mais reste néanmoins fini. Au-delà, on n’est plus dérivable. Ce qui change quand même radicalement la nature du mouvement. Et des équations censées le décrire.

Enonçons maintenant notre proposition :

 

PROPOSITION : Soit f : R -> R, x -> f(x) une application telle que def(f) soit borné : def(f) = [x1,x2] avec x1 =< x2 (resp. ]x1,x2], [x1,x2[, ]x1,x2[). Alors, f est de classe DN sur def(f) avec N = E[(x2 – x1)/h]. Si, de plus, f est continue sur def(f), alors f est CN sur def(f).

 

En effet, Dnhf(x) ne sera définie que ssi les inégalités suivantes sont simultanément satisfaites : x1 =< x =< x2, x1 =< x + h =< x2,…, x1 =< x+nh =< x2, ce qui conduit à l’inégalité unique x1 =< x =< x2 – nh. Def(Dnhf) se réduira à {x1}, ultime étape de la dérivabilité de f pour x2 – nh = x1, soit N = E[(x2 – x1)/h], comme annoncé. D’autre part, f est bien de classe DN sur def(f) tout entier, puisque f(x), f(x+h),…, f(x+Nh) sont toutes définies sur def(f). Enfin, la continuité de f se transmet à ses dérivées, comme le montrent (1) et (6).

 

COROLLAIRE : f est Doo (resp. Coo) sur def(f) ssi def(f) est non borné.

 

Dans ce cas, en effet, l’une des extrémités de def(f) est nécessairement rejetée à l’infini (positif ou négatif) et l’entier N = oo.

 

Etablissons d’autres formules de base de la dérivation. Tout d’abord, le produit de deux applications f(x) et g(x). On a :

 

Dh[f(x)g(x)] = [f(x+h)g(x+h) – f(x)g(x)]/h.

 

Utilisons (5) pour n = 1 :

 

(10)     Dh[f(x)g(x)] = {[f(x) + hDhf(x)][g(x) + hDhg(x)] – f(x)g(x)}/h

                                = g(x)Dhf(x) + f(x)Dhg(x) + hDhf(x)Dhg(x)

 

On reconnait bien sûr les deux premiers termes de la dérivée usuelle du produit, D étant remplacée par Dh, mais il apparaît désormais un troisième terme, produit des dérivées, qui s’annule pour h -> 0. Tant mieux d’ailleurs, car c’est surtout ce terme supplémentaire qui exhibe la nature non linéarisante de Dh.

 

(11)     Dh[1/g(x)] = [1/g(x+h) – 1/g(x)]/h = -[g(x+h) – g(x)]/hg(x+h)g(x) =

                             = -Dhg(x)/g(x)[g(x) + hDhg(x)]

 

Eh oui : c’est un petit plus compliqué que lorsque h -> 0…

A partir de cette formule, nous déduisons facilement l’expression de la dérivée d’un quotient :

 

Dh[f(x)/g(x)] = [Dhf(x)]/g(x) + f(x)Dh[1/g(x)] + hDhf(x)Dh[1/g(x)]

                      = [Dhf(x)]/g(x) - f(x)Dhg(x)/g(x)[g(x) + hDhg(x)] - hDhf(x)Dhg(x)/g(x)[g(x) + hDhg(x)]

                      = {[g(x) + hDhg(x)]Dhf(x) - f(x)Dhg(x) - hDhf(x)Dhg(x)}/g(x)[g(x) + hDhg(x)]

 

Soit, en fin de compte :

 

  1. Dh[f(x)/g(x)] = [g(x)Dhf(x) – f(x)Dhg(x)]/g(x)[g(x) + hDhg(x)]

 

Etonnamment, le terme supplémentaire de (10) a disparu : on retrouve au numérateur une forme semblable à celle dans le continu (h -> 0). Comme, pour f(x) = 1, Dhx = 0, on retrouve bien (11).

Donnons quelques exemples pratiques de dérivée non linéaire de fonctions connues.

 

  1. Dh(xn) = [(x+h)n – xn]/h = Sk=0n-1 Cknhn-k-1xk, avec n entier >=0 ;

 

On voit bien, dans cet exemple, la non linéarité de Dh. A la limite h -> 0 ne subsiste plus que le dernier terme k = n-1 qui donne bien nxn-1.

 

  1.  Dh(eax) = [ea(x+h) – eax]/h = eax(eah – 1)/h  , a réel ;

 

Surprise ! Pour a = 1, ex n’est plus égale à sa dérivée ! Ce qui a des conséquences non négligeables sur toute la théorie des EDOs linéaires, puisque le polynôme caractéristique se fonde justement sur cette propriété « universelle » de la fonction exponentielle dans le continu… On ne peut même pas approcher le facteur (eah – 1)/h, puisqu’il peut prendre une valeur arbitraire, voire arbitrairement grande ! Par contre, on a :

 

  1. Dnh(eax) = [(eah – 1)/h]neax , n entier >= 0

 

qui conserve encore une propriété multiplicative.

 

Dh(xa), a réel > 0 ?

 

On utilise la propriété xa = exp(aLnx) ? on n’obtiendra plus grand-chose. On utilise une approximation ? on ne peut pas ! Alors, comment fait-on ? Le « moins pire » me paraît être encore ceci :

 

  1. (x+h)a = I0a Cbaha-bxbdb  ,  Cba = PI(b)/PI(a)PI(a-b) , I = intégrale (somme continue).

 

Alors,

 

  1. Dh(xa) = h-1[I0a Cbaha-bxbdb – xa]

 

Pff… pas le pied. Si quelqu’un trouve mieux, plus en rapport avec la dérivée linéaire, tant mieux.

 

  • Dérivée non linéaire d’une fonction de fonction :

 

Alors, ça, c’est pas beau, comme formule… :( je préviens de suite… :)

 

Dhf[g(x)] = {f[g(x+h)] – f[g(x)]}/h = {f[g(x) + hDhg(x)] – f[g(x)]}/h

 

On effectue les substitutions x -> g(x), h -> hDhg(x) = y(x,h), ce qui donne :

 

  1. Dhf[g(x)] = y(x,h)Dy(x,h)f[g(x)]/h = Dhg(x)Dy(x,h)f[g(x)]

 

On peut expliciter un peu mieux cette formule à l’aide de la notion de différentielle non linéaire, duale de la notion de dérivée non linéaire.

 

DEFINITION 2 : Soit f comme dans la définition 1. On appelle différentielle de f en x la quantité :

 

  1. dhf(x) = hDhf(x)

 

Evidemment, cette différentielle-là n’a plus grand-chose à voir avec un infiniment petit du premier ordre…

On note tout de suite que :

 

  1. dhx = h     et     Limh->0 dh = d

 

qui montre que h est bien la quantité « unité ». La différence est que l’utilisateur se la fixe lui-même en fonction du problème qui se pose à lui : elle n’est plus une grandeur « universelle », « proche de zéro ». Sous forme différentielle, (6) et (7) deviennent :

 

  1. dnh = Sk=0n-1 (-1)kCknd(n-k)h
  2. Id + dnh = (Id + dh)n

 

Dans (18), on aura donc y(x,h) = dhg(x). Cette notation ne devrait pas choquer : dh n’est PLUS un opérateur infinitésimal. C’est à la limite que y(x,0) = dg(x) EST une quantité infinitésimale du premier ordre. Mais, encore une fois, il s’agit d’une approximation, d’une idéalisation. A cette limite, (18) donne Dg(x)Ddg(x)f[g(x)] = Dg(x){f[g(x)+dg(x)] – f[g(x)]}/dg(x) = Dg(x)Df[g(x)]/dg(x), qui est bien l’expression dans le continu.

 

Circonstance importante : pour définir la différentielle non linéaire de f en un point x, on n’a plus besoin que f soit définie au voisinage de ce point, il suffit que f soit définie en x et x + h. Cette condition est aussi nécessaire. En effet, si Dhf(x) est définie, alors dhf(x) sera définie, au point x même. Réciproquement, si dhf(x) existe en x, Dhf(x) = dhf(x)/h existe.

On n’a pas du tout la même chose dans le continu : quand h -> 0, on trouve des dérivées sans différentielles, ce qui conduit quand même à une mise en défaut de la dualité et on a besoin que la fonction considérée soit définie, non seulement au point choisi, mais en son voisinage. Ce qui induit des complications topologiques telles que de considérer partout des boules centrées en des points. Ici, pas de boules. Plus besoin. Quand les valeurs de x+nh sortent du domaine de définition de f, la différentielle n’existe plus, point. Bon ou mauvais voisinage, elle n’existe plus. :)

 

La prochaine fois, je tente l’intégration.

 

 

Minibluff the card game

Hotels