doclabidouille

BIDOUILLE 13 : RETOUR SUR LES BIDOUILLES 1, 2 ET 3

Le 12/12/2012

Dans la bidouille 1, j’ai proposé un « espace-temps électromagnétique » en utilisant l’analogie de construction entre la densité de lagrangien de Maxwell et la fonctionnelle de Lagrange d’un mobile dans l’espace euclidien E³, ce qui permettait de ramener le concept de champ dans l’espace-temps 4D X au concept de mouvement dans EM(x), espace-temps fonctionnel 4D situé « au-dessus » de X. la densité de 4-courant j_i(x) s’y réinterprétait alors comme l’analogue de la 4-force extérieure appliquée au mobile.

Dans la bidouille 2, j’ai non linéarisé le raisonnement et, dans la bidouille 3, j’ai proposé d’appliquer ce champ non linéaire à la description physique de la pensée, la ramenant à de « l’espace magnétique » évoluant au cours d’un « temps électrique ».

Ici, nous allons revenir plus en détail sur la dynamique de champ non linéaire esquissée Bidouille 2. Je reporte ci-dessous les équations de base, pour plus de commodité :

densité de Lagrangien :

4. L_EM[A(x),F(x),x] = F_ij(x)F^ij(x)/2µ + ∫ J_i[A(x),x]dAⁱ(x)

- équations de champ (en variables F_ij, pour raisons de symétrie) :

ðL_EM/ðF^ij(x) = P_ij(x) = F_ij(x)/µ , ðⁱP_ij(x) = ðL_EM/ðA^j = J_j[A(x),x]

solutions :

A_i(x) = A^(ond)_i(x) + C_i[S(x),x] , S_i(x) = J_i[A(x),x]

J’avais interprété la fonctionnelle vectorielle J_i[A(x),x] comme un 4-courant généralisé. Une analyse plus fine montre que ce n’est pas tout à fait exact, car on a un mélange de matière et de champ. On va donc revenir là-dessus et approfondir les ordres 0, 1, 2 et 3 en J_i, ce qui correspond aux ordres 1, 2, 3 et 4 en la fonctionnelle potentielle, les plus couramment rencontrés.

ORDRE 0 :

Maxwell, donc. La fonctionnelle J_i est C⁰ seulement en les A_i(x) : comme on l’avait vu, c’est en fait la situation la plus discontinue. Une autre approche consiste à considérer que les J_i ne dépendent pas explicitement des A_i(x), ce qui, d’une certaine manière, revient au même. Mais, d’une manière beaucoup plus générale, ce que l’on appellera « densité de 4-courant » est :

j_i(x) = J_i(0,x) = J_i[A(x) = 0,x]

C’est une distribution. Et on voit facilement que :

TOUS LES COEFFICIENTS DE J_i[A(x),x] DANS LE DEVELOPPEMENT EN PUISSANCES DES A_i(x) SONT DES DISTRIBUTIONS DANS X ET DES DISTRIBUTIONS MATERIELLES.

On regarde (1) et on se dit que j_i(x) est la distribution issue de J_i en champ nul (par extension, pour des valeurs fixées des potentiels de champ, qui peuvent toujours être ramenées à zéro en changeant de référence). C'est-à-dire ce qui subsiste après annulation du champ ou en l’absence de champ (mais cette dernière assertion est un peu dénuée de sens puisque, dès qu’il y a sources, il y a émission de champ). A cet ordre, on ne peut guère en dire plus. Si on remonte à la fonctionnelle potentielle, étant donnée que J_i en est le 4-gradient par rapport aux A_i(x), les extrema seront atteints pour :

J_i[A(x),x] = 0

ce qui, à l’ordre 0, conduit à j_i(x) = 0, que l’on peut interpréter de deux manières : absence de sources ou extérieur des sources d’émission. Absence de sources : s’il n’y a pas de sources, les seuls champs possibles sont des ondes, susceptibles ainsi de préexister à toute source matérielle. Extérieur des sources : on a des champs qui se propagent dans le vide de charges sous la forme ou à la manière d’ondes. Il faut bien garder à l’esprit que le système de Maxwell décrit en fait des champs électromagnétiques dans la matière (électriquement chargée) et qu’hors de la matière, i.e. dans le vide, on n’a que des équations d’ondes. En toute rigueur, on ne peut donc parler de « champs maxwelliens » qu’à l’intérieur de la matière. Si ces champs sortent de la matière qui les a produits, ils se transforment en ondes.

La relation (2) ci-dessus est plus complexe, puisqu’elle mêle sources matérielles et champs. A l’ordre zéro, aucune relation fonctionnelle ne peut être établie entre sources et champs à l’extremum. Tout ce que l’on peut dire est que le vide maxwellien se confond partout avec l’extremum potentiel et que, dans ce vide, on n’a plus que de l’énergie cinétique d’ondes.

Enfin, à l’ordre zéro, la portée du champ est illimitée, puisque rien, dans la partie potentielle de son énergie, ne limite sa portée. Il s’ensuit que le volume spatial V₃ que peut recouvrir le champ s’étend à E³ tout entier. Chez Maxwell, les conditions aux bords sont les conditions asymptotiques A_i(x,t) -> 0 pour tout t quand |x| -> oo. On peut dire que les champs maxwelliens sont dépourvus de forme.

ORDRE 1 :

C’est le « post-Maxwell », si l’on veut. La fonctionnelle J_i est C¹ en les A_i(x) : c’est un petit peu plus régulier (mais pas beaucoup plus). La fonctionnelle potentielle est quadratique en les A_i(x). On écrit :

J_i[A(x),x] = j_i(x) – j_1,ij(x)A^j(x)

Pour connaître l’allure (le comportement) du champ dans l’espace-temps, il faut résoudre le système (5) ci-dessus. Pour cela, on est obligé de faire passer le couplage potentiel j_1,ij(x)A^j(x) du côté de la partie cinétique ðⁱP_ij(x). Attention à ne pas confondre les deux : même si énergie cinétique et énergie potentielle se transforment l’une en l’autre, de sorte que seule l’énergie totale est pertinente, c’est une variation de l’énergie cinétique (resp. potentielle) qui induit une variation en sens contraire de l’énergie potentielle (resp. cinétique) sur toute (hyper-)surface de Hill, i.e. d’énergie totale constante. C’est cela qu’on doit entendre par « transformation » ou « conversion ». Il n’en reste pas moins que ce qui est cinétique (resp. potentiel) reste cinétique (resp. potentiel) : les deux formes d’énergie sont duales et complémentaires. Elles contribuent toutes deux à la dynamique.

Ceci étant dit, la distribution j_1,ij(x) limite déjà la portée du champ : l’invariance de jauge étant préservée à tout ordre, sur la partie cinétique, on peut se placer dans la jauge de Lorentz, même dans le cas non linéaire générale, sans restriction aucune. A l’ordre 1 et dans cette jauge, on obtiendra donc les équations de champ suivantes :

ð^jð_jA_i(x) + µj_1,ij(x)A^j(x) = µj_i(x) = ð^jð_jA_i^(Max)(x)

La seconde égalité ne fait que rappeler les équations de Maxwell, établies à l’ordre zéro. Même si le système n’est pas intégrable par quadratures dès que les j_1,ij sont variables, on voit clairement que le champ de Maxwell est modifié par un facteur de type exponentiel. Il est possible d’expliciter la portée spatiale du champ (c’est ce qui nous intéresse) en prenant pour distribution :

j_1,ij(x) = j₁delta_ijdelta(x)

Les équations (4) deviennent :

ð^jð_jA_i(x) + µj₁delta(x)A_i(x) = µj_i(x) = ð^jð_jA_i^(Max)(x)

de sorte que :

ksi² = 1/µ|j₁| = carré de la portée spatiale du champ.

Si j₁ < 0, on aura un régime spatial oscillant ; si j₁ > 0, un régime spatial amorti. C’est ce dernier cas qui est intéressant, puisqu’à des distances > ksi (en valeur absolue), le champ s’amortit alors très rapidement, de sorte qu’on peut considérer qu’il est nul ou, au moins, négligeable sur le bord B₂ du volume V₃ de rayon caractéristique ksi. Ce champ-là a déjà de la forme. Cette fois, l’extremum se situe en :

j_1,ij(x)A^j(x) = j_i(x)

Et A_i(x) se comporte comme une onde. Pourtant, il y a une source matérielle j_i(x) et le champ se trouve bien dans cette matière, il est bien à portée limitée, mais tout se passe comme si ce champ, non seulement était dans le vide, mais avec une portée illimitée !

Bizarre, ces extrema d’énergie potentielle…

ORDRE 2 :

J_i est C² en les A_i(x), on a :

J_i[A(x),x] = j_i(x) – j_1,ij(x)A^j(x) + ½ j_2,ijk(x)A^j(x)A^k(x)

Les équations de champ sont :

ð^jð_jA_i(x) + µj_1,ij(x)A^j(x) – ½ j_2,ijkA^j(x)A^k(x) = µj_i(x)

On devient non linéaire. On ne songe même pas à résoudre par quadratures, on regarde les extrema :

½ j_2,ijk(x)A^j(x)A^k(x) – j_1,ij(x)A^j(x) + j_i(x) = 0

Il y en a 2, qui peuvent être confondus, selon les coefficients matériels. Rebelote : on a une onde. Et comme ça à tous les ordres. Bon…

ORDRE 3 :

Allez, pour dire d’appliquer le programme. J_i est C³ en A_i(x), la partie potentielle du Lagrangien est quartique en les A_i(x), les équations de champ sont cubiques, il y a 3 extrema, qui peuvent se confondre.

Il faudra que je réfléchisse à cette histoire de champs dans la matière qui se comportent comme des ondes dans le vide…

Commentaires textes : Écrire

BIDOUILLE 12 : L'UNIFICATION DU CLASSIQUE, DU STOCHASTIQUE ET DU QUANTIQUE !

Le 27/11/2012

De fil an aiguille, on arrive à boucler la boucle (non sans mal). Nous passons à la dynamique et, surtout, à ses INTERPRETATIONS PHYSIQUES (c’est ça l’intéressant).

Dans la situation classique, le mouvement dans l’espace au cours du temps est représenté par une courbe x(t), où t est le temps classique et x, l’espace (le lieu) classique. Ce type de mouvement est toujours déterministe : il suffit de connaître la position initiale x₀ = x(t₀) d’un mobile à l’instant de départ t₀ pour être en mesurer de déterminer avec exactitude n’importe laquelle de ses positions ultérieures x(t) à l’instant t > t₀ sur la trajectoire.

Dans la situation quantique, il faut reconsidérer les choses du début.

Soit t un instant classique et tau > 0 le pas temporel. L’instant classique immédiatement précédent est t – tau, l’instant classique immédiatement suivant est t + tau. Peut-on en déduire pour autant que t – tau se situe dans le passé de t est t + tau dans le futur de t ? Ce n’est pas si simple. Parce que, classiquement, le temps étant discret, il procède par sauts de n.tau, avec n entier relatif : n < 0 va vers le passé de t ; n > 0, vers le futur de t. Donc, classiquement, IL N’Y A RIEN sur les intervalles temporels ouverts ]t-tau,t[ et ]t,t+tau[ : pas de temps. Pas très satisfaisant sur le plan de la physique. Se dire que, sur un laps de temps de 2tau, le temps n’existe pas, sauf au point central t (le présent) n’a pas grand-chose de physique.

C’est la même chose que de dire, comme Connes que, du point de vue classique, les espaces discrets ne renferment aucune information intéressante.

Mais « rien » classiquement signifie en fait la présence de VIDE. Et le vide quantique, lui, est siège de FLUCTUATIONS. On peut donc envisager que sur ]t-tau,t[ U ]t,t+tau[ existent des FLUCTUATIONS TEMPORELLES. C’est déjà beaucoup plus satisfaisant. Alors, « l’instant présent » t représente le présent REALISé, celui qui a la probabilité maximale de se réaliser, tandis que le reste a une probabilité moindre de se réaliser, c’est du présent REALISABLE. De la sorte, le présent s’étend à tout l’intervalle ]t-tau,t+tau[, incluant t, tandis qu’aux bornes de l’intervalle, la probabilité de réalisation de ce présent devient nulle ou négligeable. Mais alors, si l’on décide d’introduire les probabilités dans notre description, il faut considérer un temps STOCHASTIQUE T qui, lui, n’a plus aucune raison d’être DISCRET. Autrement dit, seuls les instants CLASSIQUES seraient DISCRETS, tandis que le temps stochastique resterait continu, mais au sens probabiliste du terme (« probablement continu »). Sous cette description des choses, on pense immédiatement à une distribution de probabilité (de réalisation) de la forme :

rhô_tau[(T-t)/tau] = rhô’_tau[(T-t)/tau]cos²[pi.(T-t)/2tau]
rhô’_tau[-(T-t)/tau] = rhô’_tau[(T-t)/tau]

Le module rhô’_tau peut être, par exemple, une gaussienne. L’instant classique t devient la MOYENNE STATISTIQUE du temps stochastique (du « processus temporel ») T et tau, la PORTEE DES FLUCTUATIONS TEMPORELLES : on rejoint la description quantique en termes de probabilité de présence et fonctions d’onde, mais appliquée au temps lui-même et non à des particules. C’est tout à fait en accord avec la structure non commutative d’algèbres et de modules d’opérateurs sous-jacente aux espaces discrets : statistiquement, le cadre préserve la continuité et les variables dynamiques deviennent des opérateurs agissant sur une fonction d’onde (amplitude de probabilité de présence).

La présence du terme oscillant cos² dans (1) assure que la loi de probabilité se répète d’intervalle en intervalle, qu’elle possède des VENTRES en T – t = 2n.tau (proba maxi de réalisation en t, t +/- 2tau, t +/- 4 tau, etc. et des NŒUDS en T – t = (2n+1).tau (proba mini de réalisation – nulle dans le présent modèle) aux bornes des intervalles. Le carré est impératif puisqu’une proba négative n’a aucune signification physique. La condition (2) ne fait, elle, que traduire l’égale probabilité de réalisation entre passé et futur.

S’il y a un cos, c’est qu’il y a INTERFERENCES. C’est précisément le fondement du PAQUET D’ONDES : les ondes (monochromatiques) qui constituent ce paquet interfèrent entre elles, soit constructivement (aux ventres), soit destructivement (aux nœuds).

En résumé, on peut dire que :

LE PRESENT S’ETALE STATISTIQUEMENT SUR TOUT L’INTERVALLE TEMPOREL [t-tau,t+tau] CENTRé SUR L’INSTANT CLASSIQUE t, PRESENT REALISABLE AVEC PROBA MAXI, TANDIS QUE t-tau et t+tau SONT LES PRESENTS REALISABLES AVEC PROBA MINI. L’INTERVALLE [t-tau,t+tau] EST LE SIEGE DE FLUCTUATIONS TEMPORELLES, LE TEMPS t EST DISCRET ; LE TEMPS STOCHASTIQUE T, CONTINU AU SENS PROBABILISTE DU TERME. LES FLUCTUATIONS TEMPORELLES SE TRADUISENT PAR LA PRESENCE D’UNE FONCTION D’ONDES ET LES ONDES CONSTITUTIVES DE CE « PAQUET D’ONDES TEMPORELLES » SONT EN INTERFERENCES LES UNES AVEC LES AUTRES, CONSTRUCTIVEMENT AUX VENTRES (INSTANTS CLASSIQUES), DESTRUCTIVEMENT AUX NŒUDS (INSTANTS PUREMENT QUANTIQUES).

Pourquoi purement quantiques ? Faisons tendre tau vers l’infini. Alors, tout instant classique t se retrouve complètement « noyé » dans les fluctuations temporelles : le temps conventionnel s’est DILUé, c’est la « limite quantique », où plus rien de classique ne subsiste. C’est le VIDE TEMPOREL :

A LA LIMITE QUANTIQUE (VIDE TEMPOREL), LE TEMPS A DISPARU AU SENS CLASSIQUE DU TERME, « NOYé » DANS LES FLUCTUATIONS TEMPORELLES. C’EST AUSSI LE DOMAINE DU « QUANTIQUE MACROSCOPIQUE ».

Ça veut dire aussi que, dans les processus quantiques à grande échelle (temporelle), i.e. sur de longues périodes de temps, la notion classique de temps DISPARAIT : classiquement, ces processus deviennent ATEMPORELS.

L’erreur d’analyse serait de considérer l’instant t-tau comme situé « dans le passé » de t et l’instant t+tau, « dans le futur » de t : c’est TOUT L’INTERVALLE [t-tau,t+tau] qui représente le « présent ». Le passé de t, lui, est centré en t-2tau, il occupe un intervalle de même longueur que celui de t. Le futur de t, lui, est centré en t+2tau et occupe également un intervalle de même longueur : on va de ventre à ventre et de nœud à nœud. Considérer t+tau comme une sorte de « futur antérieur » de t+2tau et de « futur immédiat » de t mènerait à des paradoxes temporels. Et chacun sait que les paradoxes ne naissent que d’une analyse inappropriée des choses. Non : on a un laps de temps présent, suivi du même laps de temps futur et précédé du même laps de temps passé. Il faut passer de la description en POINTS à la description en INTERVALLES (fermés, donc compacts – sauf à la limite quantique, bien sûr – et encore, en incluant l’infini, on compactifie à la Riemann).

Il existe quand même des instants discrets, dénombrables (les nœuds) où il n’y a pas de temps. Mais ces « instants singuliers » étant ponctuels, ils sont tous de mesure nulle. En fait, ils résultent de l’interférence destructive (opposition de phases dans la fonction d’onde en ces points) : en t+tau, il n’y a plus de présent et pas encore de futur ; en t-tau, il n’y a plus de passé et pas encore de présent. C’est très bizarre, mais ça entre dans le catalogue de bizarreries de la physique quantique… Le monde quantique a l’air de nous dire que, statistiquement du moins, il PEUT ne plus y avoir de temps du tout, mais en des points bien séparés seulement, bien qu’ils restent en infinité dénombrable.

A présent (!) que nous avons notre temps, nous pouvons analyser le MOUVEMENT.

A t correspond une position CLASSIQUE x(t) dans l’espace (en 1D, pour simplifier, peu importe ici).

A t+tau correspond une position x(t+tau) et à t-tau, une position x(t-tau). Ces positions « marginales » doivent traduire la longueur d’un INTERVALLE, image de [t-tau,t+tau] par la fonction x(.). En conséquence :

x(t+tau) = x(t) + h(t,tau)
x(t-tau) = x(t) – h(t,tau)

Il est facile de voir, sur des exemples élémentaires, que h dépend à la fois de t et de tau. Ainsi, sur le mouvement classique uniformément accéléré :

x(t) = ½ a₀t² + v₀t (on prend x₀ = 0 comme référence) , h(t,tau) = (a₀t + v₀)tau

De (3) et (4), on tire :

2h(t,tau) = x(t+tau) – x(t-tau) , h(t,0) = 0 pour tout t , h(t,-tau) = -h(t,tau)
x(t+tau) + x(t-tau) = 2x(t)
h(t,tau) = d_taux(t) = tau.D_taux(t), tau-différentielle de x(t).

tau étant la DUREE CORRELATIVE, h est la DISTANCE CORRELATIVE. De même que pour le temps, seul l’espace CLASSIQUE est discret et la continuité se retrouve au niveau STATISTIQUE, au sein d’un espace STOCHASTIQUE. On a une position stochastique X, de moyenne statistique x, un mouvement stochastique X(t) et un MOYEN MOUVEMENT, classique, x(t). Tout comme <(T-t)²>_temporelle = tau², <(X-x)²>_spatiale = h².

La VITESSE est donnée par la tau-dérivée de x(t) :

v(t,tau) = D_taux(t) = [x(t+tau) – x(t)]/tau = h(t,tau)/tau

d’après (3). C’est donc le rapport (distance corrélative)/(durée corrélative). A la limite tau -> 0, tau s’identifie à dt, tandis que h(t,tau) s’identifie à dx(t) et on retrouve la vitesse classique instantanée v(t,0) = dx(t)/dt. A la limite tau -> oo, IL SUFFIT que v(t, tau) soit en tau^-(1+a) avec a réel > 0 pour que h(t,tau) tende asymptotiquement vers zéro ! Dans ce cas de figure, on se retrouve avec un temps macroscopiquement quantique (tau -> oo) et un espace microscopiquement classique (h -> 0) !!! Cela montre que TOUTES LES SITUATIONS PHYSIQUES DEVIENNENT POSSIBLES : du micro (resp. méso, macro) temporel avec du micro (resp. méso, macro) spatial. Tout dépend de la forme de v(t,tau) et cette forme est donnée par les équations de mouvement.

La construction en fonction d’onde – proba de réalisation s’applique à l’espace. En place de (1) et (2) on aura :

rhô_h[(X-x)/h] = rhô’_h[(X-x)/h]cos²[pi.(X-x)/2h]
rhô’_h[-(X-x)/h] = rhô’[(X-x)/h]

De nouveau, il PEUT exister des points, isolés mais en infinité dénombrable, où l’espace n’existe plus, c'est-à-dire, où sa proba de réalisation est très faible voire nulle… Notez qu’ici, on parle de temps et d’espace au sens STATISTIQUE du terme, pas seulement classique ! Cela sous-entend qu’en les nœuds des distributions de probabilité, il n’y aurait plus rien, même plus de vide… je pense plutôt qu’il doit y avoir interférence destructive :

en t+tau, entre une « onde du présent » (composante du paquet d’ondes sur [t-tau,t+tau]) et une « onde du futur » (composante du paquet d’ondes sur [t+tau,t+3tau]), en opposition de phases, d’où neutralisation mutuelle, et
en t-tau, entre une « onde du passé » (composante du paquet d’ondes sur [t-3tau,t-tau]) et une « onde du présent », en opposition de phases.

ce qui ne nécessiterait pas l’élimination, même locale, même au sens statistique, du temps. C’est L’EFFET (ondulatoire) qui serait neutralisant. Et ces « ondes du futur » étant présentes dans tout l’intervalle [t+tau, t+3tau], elles peuvent se propager aussi bien « vers l’avant », de t+2tau (futur classique) à t+3tau que « vers l’arrière », de t+2tau à t+tau. Idem pour les « ondes du passé ». En réalité, la mécanique quantique nous montre qu’au sein du paquet d’ondes, il ne s’agit pas de « mouvement » au sens conventionnel du terme : il n’y a aucune propagation à l’intérieur du paquet d’ondes, c’est le paquet d’ondes au complet qui se propage. Le paquet en lui-même est à support compact. On peut le voir comme un assemblage d’ondes monochromatiques qui se réfléchissent en permanence sur les « parois » du paquet, donc de l’intervalle qui lui sert de support. Ça veut dire que les « ondes du futur » se « réfléchissent » en t+tau et en t+3tau : en t+tau, elles repartent vers l’avant (vers t + 3tau) ; en t+3tau, vers l’arrière jusqu’en t+tau, etc. De même, les « ondes du passé » se « réfléchissent » en t-3tau et en t-tau : en t-3tau, elles repartent vers l’avant (vers t-tau), puis vers l’arrière, jusqu’à t-3tau, etc. C’est un va-et-vient perpétuel. Tout cela constitue « le passé », « le présent », « le futur ». Ces laps de temps successifs sont bien séparés les uns des autres et ne communiquent qu’à leurs extrémités. Il n’y a pas de recouvrement, donc pas de paradoxe.

Pour l’espace, c’est la même chose. Alors, on n’a plus besoin « d’éliminer » l’espace où que ce soit. Conceptuellement, c’est même plus simple, parce que ce n’est plus qu’une question D’ORIENTATION : on n’a plus de SUCCESSION, comme avec le temps. Si on ne choisit aucune orientation, toutes les directions se valent ; si on choisit une orientation, on se donne une origine (forcément), tout ce qui se trouve dans le sens d’orientation est compté positivement et tout ce qui se trouve en sens contraire est compté négativement (Schwartz, calcul tensoriel, algèbre extérieure).

Dérivons la vitesse, nous obtenons l’accélération :

a(t,tau) = D_tauv(t,tau) => v(t+tau,tau) = v(t,tau) + a(t,tau)tau = v(t,tau) + nu(t,tau)

La vitesse :

nu(t,tau) = a(t,tau)tau

est l’équivalent de h(t,tau) : c’est la VITESSE CORRELATIVE. Il est facile de voir que :

nu(t,tau) = D_tauh(t,tau)

est bien la tau-dérivée de la distance corrélative. En dérivant encore une fois, on établit de même que L’ACCELERATION CORRELATIVE :

gamma(t,tau) = a(t+tau) – a(t,tau) = d_taua(t)

est la tau-dérivée de la vitesse corrélative :

gamma(t,tau) = D_taunu(t,tau) = D_tau²h(t,tau)

comme on est en droit de s’y attendre. Il y a donc un mouvement CLASSIQUE, DETERMINISTE, sur les MOYENNES SPATIALES et un mouvement FLUCTUANT, STATISTIQUE, sur les CORRELATIFS. En fait, c’est inexact, c’est de la dichotomie « théorie de champ moyen » : il n’y a QU’UN SEUL mouvement, c’est celui de X(T) et il est STOCHASTIQUE. Il exprime la position statistique X du mobile dans l’espace à l’instant statistique T. A la moindre non-linéarité, moyen mouvement et fluctuations sont indissociables (couplées, plus ou moins fortement) : l’évolution des fluctuations dans le temps influe sur le moyen mouvement, qui influe en retour sur ces fluctuations. Ne pas eprdre de vue que ce moyen mouvement, x(t) en toute rigueur, est FONCIEREMENT DISCONTINU, puisqu’on saute d’un instant classique à l’autre et donc, d’une position classique à l’autre. En revanche, au sens statistique du terme, le mouvement réel X(T) est continu.

ON PASSE D’UNE DYNAMIQUE CLASSIQUE, DETERMINISTE, EN TERMES DE COURBES, A UNE DYNAMIQUE QUANTIQUE, STOCHASTIQUE, EN TERMES DE RUBANS.

On a un ruban qui se développe entre l’intervalle temporel [t-tau,t+tau], de largeur 2tau, et l’intervalle spatial [x(t-tau),x(t+tau)], de largeur 2h(t,tau). On peut voir ces rubans comme des surfaces aléatoires, si l’on veut. Mais je ne suis pas d’accord avec ça, parce qu’en dimension spatiale > 1, on ne trouve ni surfaces ni hypersurfaces, mais des RUBANS le long de chaque axe de coordonnées. En dim 2, par exemple, on trouve un ruban [x(t-tau),x(t+tau)] dans la direction x et un ruban [y(t-tau),y(t+tau)] dans la direction y. Les 2 rubans se recoupent en leur centre [x(t),y(t)]. On ne peut pas avoir de surface, car il n’y a qu’un seul paramètre. En dim n, on trouvera donc n rubans, qui se recouperont tous en leur centre [x¹(t),…xⁿ(t)]. La construction en surfaces aléatoires procède d’un tout autre principe. On trouvera ainsi des plaquettes A L’INTERIEUR DES INTERVALLES. Mais, ici, il s’agit du mouvement D’INTERVALLES SPATIAUX dans l’espace.

Voici pour l’essentiel. Je travaille actuellement sur la masse et ses interprétations physiques.

NB : tout comme le temps classique disparait à la limite quantique tau -> oo, l'espace classique disparaît à la limite h -> oo :

LE QUANTIQUE MACROSCOPIQUE S'ABSOUT AUSSI BIEN DU TEMPS QUE DE L'ESPACE.

Inutile, alors, de rechercher une quelconque PROPAGATION DE SIGNAUX... :) Il n'y a que du PAQUET D'ONDES.

Commentaires textes : Écrire

BIDOUILLE 11 : INTERPRETATION

Le 06/11/2012

J’ai tenu à vérifier certains points existants relatifs aux notions de calcul discret et bien m’en a pris, car le concept dans lequel s’inscrit la « dérivation non linéaire » de la Bidouille 10 ci-avant est radicalement différent de ce qu’on trouve habituellement, par exemple sur :

http://fr.wikipedia.org/wiki/M%C3%A9thode_des_diff%C3%A9rences_finies

"La résolution des schémas numériques s’appuie en général sur des méthodes algébriques classiques. Cependant d’autres formulations équivalentes peuvent faire appel à des méthodes d'optimisation."

ou : http://fr.wikipedia.org/wiki/Diff%C3%A9rence_finie

Mon approche a beaucoup plus à faire avec la notion d’espaces discrets et, plus exactement encore, quantiques. En tant que telle, elle rejoint la géométrie non commutative de Connes. En effet, il n’est pas question ici d’obtenir des solutions approchées d’équations différentielles dans le continu, ni d’optimiser quoi que ce soit : une équation telle que

D_hf(x,h) = a(x,h)f(x,h)

ne doit pas être considérée comme une expression discrétisée de l’équation différentielle :

Df(x,0) = Df₀(x) = a₀(x)f₀(x) pour h -> 0

mais, au contraire, comme une généralisation de (2). L’approche est donc inverse de celle des méthodes d’analyse finie : c’est maintenant (2) qui est considérée comme une forme limite de (1) lorsque h -> 0.

Pour une meilleure vision du contexte, je vais argumenter en termes physiques.

D’abord, nous avons établi que h = d_hx était « l’unité », « l’élément de longueur », le « pas » dans le cas d’un réseau ou d’un maillage de points, avec l’identification d_hx = dx à la limite du continu h -> 0. On sait qu’en physique, c’est cette limite du continu (le « continuum ») qui devient l’approximation, tandis que la réalité fondamentale s’avère foncièrement discontinue.

La limite h -> 0 correspond donc, soit au macroscopique (physique « classique », déterministe), soit à un « zoom arrière » théoriquement infini. C'est-à-dire que l’observateur s’éloigne « à l’infini » d’une portion d’espace comprise entre un point x et son voisin immédiat x+h (ou x-h). Résultat : notre observateur a l’impression que les points x, x+h et x-h se rapprochent l’un de l’autre, jusqu’à finir par se confondre « à l’infini ». Il ne parvient plus à distinguer la distance élémentaire séparant ces 3 points.

Si l’on « zoom avant », au fur et à mesure qu’on va se rapprocher, on va distinguer de mieux en mieux cet écartement h. Et on va réaliser que ce qu’on prenait pour un « continuum », un espace continu, est en réalité un espace complètement discontinu, un espace « à trous ». Ou encore, discret. Mais alors, entre chaque point, il n’y a rien, puisqu’on ne peut descendre en dessous d’une distance de h. Mathématiquement, cela signifie qu’il n’existe aucune structure, au moins au sens classique, fonctionnel, du terme ; physiquement, cela signifie qu’il y a du vide. Classiquement, le vide, c’est l’absence de tout ; quantiquement, c’est un milieu purement fluctuant. Les points représentent alors l’espace effectivement réalisé, tandis que les vides d’étendue h entre ces points représentent l’espace non encore réalisé, mais réalisable. On sait, en effet, qu’il suffit de polariser le vide quantique pour réaliser des objets, en séparant les paires virtuelles. Nos points représentent des objets physiques, comme des points matériels, par exemples, ou des particules.

Voilà pourquoi (1) généralise (2) : parce que l’observateur peut, en outre, faire varier le pas de résolution h. Plus il diminuera h, plus il s’éloignera du segment [x-h,x+h] : c’est la transition vers le classique, la grande échelle ; plus il augmentera h, plus il se rapprochera du segment [x-h,x+h] : c’est la transition vers le quantique, la petite échelle.

A l’autre extrémité, la limite sera h -> oo.

Peut-il exister des solutions non nulles et finies de (1) à cette limite supérieure ? La réponse est oui. Résolvons déjà :

D_hf(x,h) = a(h)f(x,h)

Cette équation nous dit que la h-dérivée de f(x,h) lui est proportionnelle et que le coefficient de proportionnalité a(h) dépend explicitement de h. La solution est :

f(x,h) = f(0,h)[1 + ha(h)]^x/h

Plusieurs remarques :

la h-dérivée d’une fonction f(x) est TOUJOURS, par construction même, une fonction g(x,h) de x ET de h ;
la h-primitive d’une fonction f(x) est TOUJOURS, par construction même, une fonction F(x,h). Il suffit de former D_hF(x,h) = f(x) pour s’en convaincre : on ne peut avoir de résultat indépendant de h que ssi F dépend aussi bien de x que du pas de résolution h ;
c’est pourquoi, d’une manière générale, on considère, non plus DES fonctions ou applications f(x), mais des FAISCEAUX de fonctions ou d’applications f(x,h) ;
tout coefficient a(h) ne dépendant que de h a une h-dérivée nulle et peut donc être assimilé à une constante, vis-à-vis de cet opérateur ;
La h-primitive I_ha(h) de a(h) est de la forme A(x,h) = a(h)x + b(h) (dériver).

L’erreur serait maintenant de considérer la solution (4) comme une fonction ANALYTIQUE et donc, LISSE, de x : C’EST FAUX !

Nous sommes dans un espace discret. La progression d’un point à un autre procède par saut discontinu. En conséquence, si nous partons d’un point x₀, les points suivants ne pourront être que des multiples entiers de h : x₀, x₀ +/- h,…, x₀ +/- nh. La variable x n’est plus une variable continue ! Ce n’est qu’à la limite h -> 0 qu’elle le devient ou, plus correctement, qu’elle en prend l’aspect.

Par contre, rien, a priori, n’empêche le faisceau f(x,h) d’être continu en h.

Devinette : si nous faisons a(h) = 1 dans (4), qu’obtenons-nous au point x = 1 ?

e(h) = (1 + h)^1/h = exp{[Ln(1+h)]/h} , Lim_h->0 e(h) = e(0) = e

La fonction e(h) généralise l’exponentielle.

Il doit donc logiquement exister une généralisation de log, non ? Effectivement, la fonction :

(6) Ln(h) = h Ln/Ln(1+h) = h Ln_1+h , Lim_h->0 Ln(h) = Ln(0) = Ln

généralise le logarithme naturel (ou népérien).

On voit que ces deux fonctions dépendent fortement de l’échelle. En h = 1, par exemple, j’obtiens e(1) = 2 et non plus 2,71828…, ce qui modifie ma fonction puissance et me fait passer d’une solution à l’autre, Ln(1) = Ln₂ : je passe de la base e à la base 2…

Les bases numériques diminuent régulièrement, puisque :

Lim_h->oo e(h) = 1

Par contre, ln(h) diverge. Ensuite :

f(x,h) = f(0,h)exp(h)[I_h{Ln_1+h[1 + ha(x,h)]}]

est solution de

D_hf(x,h) = a(x,h)f(x,h) pour tout h.

Preuve : on sait qu’à la limite du continu, la solution de Df₀(x) = a₀(x)f₀(x) est f₀(x) = f₀(0)exp[I a₀(x)dx] avec I = I₀ = opérateur intégral. On va donc chercher la solution de (8) sous la forme :

f(x,h) = f(0,h)exp(h)[A(x,h) + g(x,h)]

où A(x,h) est la h-primitive de a(x,h), avec A(x,0) = I a₀(x)dx et g(x,0) = 0 pour tout x. Différencions :

d_hf(x,h) = f(x+h+,h) – f(x,h) = f(0,h){exp(h)[A(x+h,h) + g(x+h,h)] - exp(h)[A(x,h) + g(x,h)]} = f(0,h)exp(h)[A(x,h) + g(x,h)]{exp(h)[A(x+h+,h) – A(x,h) + g(x+h,h) – g(x,h)] – 1}

= f(x,h){exp(h)[d_hA(x,h) + d_hg(x,h)] – 1}

Or, I_h = D_h^-1 => D_hA(x,h) = a(x,h) d’où d_hA(x,h) = hD_hA(x,h) = ha(x,h) et :

d_hf(x,h) = hD_hf(x,h) = f(x,h){exp(h)[ha(x,h) + hD_hg(x,h)] – 1} = ha(x,h)f(x,h)

en vertu de (8). Il en résulte que :

ha(x,h) + hD_hg(x,h) = Ln(h)[1 + ha(x,h)]

soit :

D_hg(x,h) = h^-1Ln(h)[1 + ha(x,h)] – a(x,h)

En intégrant :

g(x,h) = I_h{h^-1Ln(h)[1 + ha(x,h)]} – A(x,h)

On vérifie facilement que g(x,0) = 0 pour tout x, d’où la solution.

En fait, d’une manière assez générale, on recherchera les solutions d’équations discrètes (« quantiques ») comme des extensions des solutions de leurs homologues continues (« classiques »), en gardant toutefois à l’esprit que seul l’opérateur limite I₀ = I est une somme continue. Les opérateurs I_h pour h non nul ne sont pas des intégrales.

Solution de :

[D_h² + a(h)D_h + b(h)Id]f(x,h) = 0 ?

Réponse :

f(x,h) = c(h)[1 + hX₁(h)]^x/h + d(h)[1 + hX₂(h)]^x/h

où X_1,2(h) sont racines du polynôme caractéristique :

X²(h) + a(h)X(h) + b(h) = 0

Pour les équations à coeffs constants, c’est facile. La solution de :

P_N(D_h)f(x,h) = [S_n=0^N a_n(h)D_hⁿ] = 0

est :

f(x,h) = S_n=0^N c_n(h)[1 + hX_n(h)]^x/h

où les X_n(h) sont racines du polynôme caractéristique :

P_N[X(h)] = 0

En revanche, pour des coeffs variables (fonctions de x, quoi), on rencontre les mêmes problèmes que dans le cas continu, à savoir qu’à cause des dérivations, les équations d’ordre >= 2 ne se laissent pas exprimer à l’aide d’opérateurs I_h, car il faut encore dériver les coefficients.

La prochaine fois, j’analyserai l’application à la mécanique.

Commentaires textes : Écrire

BIDOUILLE 10 : DERIVATION NON LINEAIRE

Le 02/11/2012

Dans cet article, je propose d’étendre les notions linéaires duales de dérivée et de différentielle. Avec, comme toujours, quelques surprises à la clé, certaines de taille.

On part donc de la formule des accroissements finis : soient E et F deux ensembles, f : E -> F une application de E dans F, x un élément de E (un point si E est muni d’une structure d’espace affine) et h > 0 un autre élément de E, distinct de x.

Définition 1 : On appelle nombre dérivé de f en x, la quantité :

D_hf(x) = [f(x+h) – f(x)]/h

Il ne s’agit PLUS d’une approximation linéaire : le nombre D_hf(x) dépend généralement de x et de h de façon NON linéaire. En fait, il mesure le rapport à h de l’écart entre la valeur de f en l’élément x+h et sa valeur en l’élément x. On retrouve l’approximation linéaire en passant à la limite :

Lim_h->0 D_hf(x) = Df(x)

Ce que l’on peut écrire en termes d’opérateurs seuls :

Lim_h->0 D_h = D

Nous verrons pour les subtilités ensuite. Pour l’instant, établissons des propriétés fort générales. On remarque tout d’abord qu’en remplaçant h par nh dans (1), où n est un entier naturel, on a :

D_nhf(x) = [f(x+nh) – f(x)]/nh

d’où :

f(x+nh) = f(x) + nhD_nhf(x)

Calculons à présent les dérivées successives de f en x :

D²_hf(x) = [f(x+2h) – 2f(x+h) + f(x)]/h²

D³_hf(x) = [f(x+3h) – 3f(x+2h) + 3f(x+h) – f(x)]/h³

…

Dⁿ_hf(x) = h^-nS_k=0ⁿ (-1)^kC_kⁿf[x+(n-k)h]

Soit, en utilisant (5) et en termes d’opérateurs :

hⁿDⁿ_h = (hD_h)ⁿ = S_k=0^n-1 (-1)^kC_kⁿ(n-k)hD_(n-k)h (S = somme discrète)

Réciproquement, on établit facilement la relation inverse :

Id + nhD_nh = (Id + hD_h)ⁿ

qui montre qu’une homothétie sur h se traduit en une loi de puissance.

Chose assez étonnante vu le caractère (fortement) non linéaire de D_h, on a encore les propriétés de linéarité suivantes :

D_h[f(x) + g(x)] = D_hf(x) + D_hg(x) et
D_h[af(x)] = aD_hf(x) , a un élément du corps considéré (N, Q, R, C, etc.).

Il suffit, en effet, de regarder (1) pour s’assurer que, même sur les espaces discrets, D_hf(x) se définit sans ambiguïté dès que f est définie en les points utilisés. Justement, D_hf(x) ne peut exister que si et seulement si f est définie à la fois en x et en x+h, ce qui est loin d’être établi a priori, puisque cela dépend du domaine de définition def(f) de f. De même, D²_hf(x) n’est définie que ssi f est définie à la fois en x, x+h et x+2h. Etc. Il s’ensuit que Dⁿ_hf(x) ne sera définie que ssi f est définie en x, x+h, x+2h,…, x+nh, ce qui réduit considérablement, non pas def(f), mais def(Dⁿ_hf).

On ne trouve pas de telle complication à l’approximation linéaire : dès qu’on fait tendre h vers zéro, à la limite, il suffit que Dⁿ_hf soit définie en x, quel que soit l’entier n >=0.

Prenons tout de suite un exemple, important en physique et à partir duquel nous établirons une proposition générale et son corollaire : f : R -> R, x -> f(x) = (1 – x²)^1/2. Le domaine de définition de f est def(f) = [-1,+1], il est donc borné et même compact. Vis-à-vis de la dérivation usuelle (linéaire), f est clairement D^oo et même C^oo sur ]-1,+1[, puisque f et toutes ses dérivées sont continues sur cet intervalle ouvert (f est même continue aux extrémités -1 et +1, mais pas ses dérivées). Il n’en est plus de même, loin de là, vis-à-vis de la dérivation non linéaire. Nous venons de voir, en effet que, pour que Dⁿ_hf(x) soit définie, il faut et il suffit que les points successifs x, x+h,…, x+nh appartiennent à def(Dⁿ_hf), ce qui conduit aux inégalités suivantes :

-1 =< x =< +1 , -1 =< x+h =< +1,…, -1 =< x+nh =< +1

qui doivent être satisfaites simultanément (ou conjointement, c’est selon), ce qui conduit à l’inégalité unique :

-1 =< x =< 1 – nh

Il devient alors évident que, pour h > 0 non nul, il apparaît une limite supérieure à l’ordre de dérivation. Cette limite est donnée par l’entier N satisfaisant à :

(9) 1 – Nh = -1 d’où N = E(2/h)

Où E(.) désigne la partie entière, puisqu’alors le domaine de définition de D^N_hf se réduit au singleton {-1}, c'est-à-dire, à un seul point ! Au-dessus, D^N+1_h n’existe pas car les points x + (N+1)h sortent tous du domaine de définition de f.

Conclusion : pour h > 0 non nul, (1-x²)^1/2 est D^N sur [-1,+1] avec N = E(2/h) < oo et C^N sur ]-1,+1[.

CONTRAIREMENT AUX PREJUGéS, LA FONCTION f(x) = (1-x²)^1/2 (FACTEUR DE LORENTZ) N’EST PAS LISSE. LE PASSAGE A LA LIMITE h -> 0 (APPROXIMATION LINEAIRE) FAUSSE LE JUGEMENT.

Or, cette description, « macroscopique » en physique, est clairement idéaliste. Bien sûr, si h est de l’ordre du rayon de Planck, soit 10^-35, N sera de l’ordre de 2x10^-35, ce qui est énorme… mais reste néanmoins fini. Au-delà, on n’est plus dérivable. Ce qui change quand même radicalement la nature du mouvement. Et des équations censées le décrire.

Enonçons maintenant notre proposition :

PROPOSITION : Soit f : R -> R, x -> f(x) une application telle que def(f) soit borné : def(f) = [x₁,x₂] avec x₁ =< x₂ (resp. ]x₁,x₂], [x₁,x₂[, ]x₁,x₂[). Alors, f est de classe D^N sur def(f) avec N = E[(x₂ – x₁)/h]. Si, de plus, f est continue sur def(f), alors f est C^N sur def(f).

En effet, Dⁿ_hf(x) ne sera définie que ssi les inégalités suivantes sont simultanément satisfaites : x₁ =< x =< x₂, x₁ =< x + h =< x₂,…, x₁ =< x+nh =< x₂, ce qui conduit à l’inégalité unique x₁ =< x =< x₂ – nh. Def(Dⁿ_hf) se réduira à {x₁}, ultime étape de la dérivabilité de f pour x₂ – nh = x₁, soit N = E[(x₂ – x₁)/h], comme annoncé. D’autre part, f est bien de classe D^N sur def(f) tout entier, puisque f(x), f(x+h),…, f(x+Nh) sont toutes définies sur def(f). Enfin, la continuité de f se transmet à ses dérivées, comme le montrent (1) et (6).

COROLLAIRE : f est D^oo (resp. C^oo) sur def(f) ssi def(f) est non borné.

Dans ce cas, en effet, l’une des extrémités de def(f) est nécessairement rejetée à l’infini (positif ou négatif) et l’entier N = oo.

Etablissons d’autres formules de base de la dérivation. Tout d’abord, le produit de deux applications f(x) et g(x). On a :

D_h[f(x)g(x)] = [f(x+h)g(x+h) – f(x)g(x)]/h.

Utilisons (5) pour n = 1 :

(10) D_h[f(x)g(x)] = {[f(x) + hD_hf(x)][g(x) + hD_hg(x)] – f(x)g(x)}/h

= g(x)D_hf(x) + f(x)D_hg(x) + hD_hf(x)D_hg(x)

On reconnait bien sûr les deux premiers termes de la dérivée usuelle du produit, D étant remplacée par D_h, mais il apparaît désormais un troisième terme, produit des dérivées, qui s’annule pour h -> 0. Tant mieux d’ailleurs, car c’est surtout ce terme supplémentaire qui exhibe la nature non linéarisante de D_h.

(11) D_h[1/g(x)] = [1/g(x+h) – 1/g(x)]/h = -[g(x+h) – g(x)]/hg(x+h)g(x) =

= -D_hg(x)/g(x)[g(x) + hD_hg(x)]

Eh oui : c’est un petit plus compliqué que lorsque h -> 0…

A partir de cette formule, nous déduisons facilement l’expression de la dérivée d’un quotient :

D_h[f(x)/g(x)] = [D_hf(x)]/g(x) + f(x)D_h[1/g(x)] + hD_hf(x)D_h[1/g(x)]

= [D_hf(x)]/g(x) - f(x)D_hg(x)/g(x)[g(x) + hD_hg(x)] - hD_hf(x)D_hg(x)/g(x)[g(x) + hD_hg(x)]

= {[g(x) + hD_hg(x)]D_hf(x) - f(x)D_hg(x) - hD_hf(x)D_hg(x)}/g(x)[g(x) + hD_hg(x)]

Soit, en fin de compte :

D_h[f(x)/g(x)] = [g(x)D_hf(x) – f(x)D_hg(x)]/g(x)[g(x) + hD_hg(x)]

Etonnamment, le terme supplémentaire de (10) a disparu : on retrouve au numérateur une forme semblable à celle dans le continu (h -> 0). Comme, pour f(x) = 1, D_hx = 0, on retrouve bien (11).

Donnons quelques exemples pratiques de dérivée non linéaire de fonctions connues.

D_h(xⁿ) = [(x+h)ⁿ – xⁿ]/h = S_k=0^n-1 C_kⁿh^n-k-1x^k, avec n entier >=0 ;

On voit bien, dans cet exemple, la non linéarité de D_h. A la limite h -> 0 ne subsiste plus que le dernier terme k = n-1 qui donne bien nx^n-1.

D_h(e^ax) = [e^a(x+h) – e^ax]/h = e^ax(e^ah – 1)/h , a réel ;

Surprise ! Pour a = 1, e^x n’est plus égale à sa dérivée ! Ce qui a des conséquences non négligeables sur toute la théorie des EDOs linéaires, puisque le polynôme caractéristique se fonde justement sur cette propriété « universelle » de la fonction exponentielle dans le continu… On ne peut même pas approcher le facteur (e^ah – 1)/h, puisqu’il peut prendre une valeur arbitraire, voire arbitrairement grande ! Par contre, on a :

Dⁿ_h(e^ax) = [(e^ah – 1)/h]ⁿe^ax , n entier >= 0

qui conserve encore une propriété multiplicative.

D_h(x^a), a réel > 0 ?

On utilise la propriété x^a = exp(aLnx) ? on n’obtiendra plus grand-chose. On utilise une approximation ? on ne peut pas ! Alors, comment fait-on ? Le « moins pire » me paraît être encore ceci :

(x+h)^a = I₀^a C_b^ah^a-bx^bdb , C_b^a = PI(b)/PI(a)PI(a-b) , I = intégrale (somme continue).

Alors,

D_h(x^a) = h^-1[I₀^a C_b^ah^a-bx^bdb – x^a]

Pff… pas le pied. Si quelqu’un trouve mieux, plus en rapport avec la dérivée linéaire, tant mieux.

Dérivée non linéaire d’une fonction de fonction :

Alors, ça, c’est pas beau, comme formule… :( je préviens de suite… :)

D_hf[g(x)] = {f[g(x+h)] – f[g(x)]}/h = {f[g(x) + hD_hg(x)] – f[g(x)]}/h

On effectue les substitutions x -> g(x), h -> hD_hg(x) = y(x,h), ce qui donne :

D_hf[g(x)] = y(x,h)D_y(x,h)f[g(x)]/h = D_hg(x)D_y(x,h)f[g(x)]

On peut expliciter un peu mieux cette formule à l’aide de la notion de différentielle non linéaire, duale de la notion de dérivée non linéaire.

DEFINITION 2 : Soit f comme dans la définition 1. On appelle différentielle de f en x la quantité :

d_hf(x) = hD_hf(x)

Evidemment, cette différentielle-là n’a plus grand-chose à voir avec un infiniment petit du premier ordre…

On note tout de suite que :

d_hx = h et Lim_h->0 d_h = d

qui montre que h est bien la quantité « unité ». La différence est que l’utilisateur se la fixe lui-même en fonction du problème qui se pose à lui : elle n’est plus une grandeur « universelle », « proche de zéro ». Sous forme différentielle, (6) et (7) deviennent :

dⁿ_h = S_k=0^n-1 (-1)^kC_kⁿd_(n-k)h
Id + d_nh = (Id + d_h)ⁿ

Dans (18), on aura donc y(x,h) = d_hg(x). Cette notation ne devrait pas choquer : d_h n’est PLUS un opérateur infinitésimal. C’est à la limite que y(x,0) = dg(x) EST une quantité infinitésimale du premier ordre. Mais, encore une fois, il s’agit d’une approximation, d’une idéalisation. A cette limite, (18) donne Dg(x)D_dg(x)f[g(x)] = Dg(x){f[g(x)+dg(x)] – f[g(x)]}/dg(x) = Dg(x)Df[g(x)]/dg(x), qui est bien l’expression dans le continu.

Circonstance importante : pour définir la différentielle non linéaire de f en un point x, on n’a plus besoin que f soit définie au voisinage de ce point, il suffit que f soit définie en x et x + h. Cette condition est aussi nécessaire. En effet, si D_hf(x) est définie, alors d_hf(x) sera définie, au point x même. Réciproquement, si d_hf(x) existe en x, D_hf(x) = d_hf(x)/h existe.

On n’a pas du tout la même chose dans le continu : quand h -> 0, on trouve des dérivées sans différentielles, ce qui conduit quand même à une mise en défaut de la dualité et on a besoin que la fonction considérée soit définie, non seulement au point choisi, mais en son voisinage. Ce qui induit des complications topologiques telles que de considérer partout des boules centrées en des points. Ici, pas de boules. Plus besoin. Quand les valeurs de x+nh sortent du domaine de définition de f, la différentielle n’existe plus, point. Bon ou mauvais voisinage, elle n’existe plus. :)

La prochaine fois, je tente l’intégration.

Commentaires textes : Écrire

BIDOUILLE N°9 : CONVOLUTION ET DERIVEE NON ENTIERE

Le 28/10/2012

1^ER ASPECT : SUR LA CONVOLUTION DES FONCTIONS.

http://www.johndcook.com/blog/2009/10/25/how-to-differentiate-a-non-differentiable-function/

Au sujet de la derivation des distributions :

« We can use this procedure to define as many derivatives of f as we’d like, as long as f is integrable. So f could be some horribly ill-behaved function, differentiable nowhere in the classical sense, and we could define its 37th derivative by repeatedly applying this idea.”

C’est tout à fait ce qu’on trouve chez tous les auteurs et notamment Laurent Schwartz. J’ai cependant noté une circonstance bizarre. Reprenant la trop bien connue équation de la chaleur et son noyau gaussien, j’ai fait quelques calculs simples de solutions de cette équation : si f(x,0) est la valeur initiale du champ (i.e. à t = 0), la valeur de ce champ à l’instant t s’obtient par convolution avec le noyau. En dimension spatiale 1 :

(1) f(x,t) = I_R f(x’,0)rhô(x-x’,t)dx’ (I = intégrale)

(2) rhô(x-x’,t) = exp[-(x – x’)²/4Dt]/2(pi.Dt)^1/2

Et je me suis aperçu de la chose suivante :

SI f(x,0) EST UNE FONCTION Dⁿ (DIFFERENTIABLE JUSQU'A L’ORDRE n) OU Cⁿ (CONTINUEMENT DIFFERENTIABLE JUSQU'A L’ORDRE n), SON EXTENSION f(x,t) PRESENTE MEME REGULARITE !

Les sceptiques le vérifieront rapidement. J’en suis resté quelque peu baba… Que fait le noyau gaussien ? Il ajoute des termes en puissances de sigma = 2Dt à f(x,0), qui s’annulent tous en sigma = 0 (donc homogènes). C’EST TOUT !!! 8(((

On me dira que c’est un faux problème, puisque, toute fonction nulle étant indéfiniment dérivable (et même continuement), in fine, f(x,t) PEUT ETRE classée C^oo. Il n’en reste pas moins que les seules dérivées NON NULLES de f(x,0) vont jusqu’à l’ordre n (supposé fini) et qu’il s’avère en être de même pour f(x,t). Aux ordres > n, les dérivées de f(x,0) ET de f(x,t) sont toutes nulles…

J’en suis resté baba, car ceci interpelle : A QUOI sert donc le noyau, sinon à ajouter des termes, étendre la fonction de départ f(x,0) à tout instant t ?

LE NOYAU DISTRIBUTIF NE REGULARISE PAS LA FONCTION

A LAQUELLE IL S’APPLIQUE !!!

La convolution avec un noyau C^oo permet effectivement de calculer des dérivées distributives à tout ordre, mais ne lisse pas la fonction pour autant. La régularisation n’est donc que fictive.

En revanche, il permet de trouver l’expression du champ f(x,t) à tout instant t ne connaissant que sa valeur f(x,0) en t = 0. ça, oui. Mais f(x,t) N’EST PAS C^oo !!!

Donc, il n’est pas régularisé… On s’est tous fait piéger là-dessus.

2EME ASPECT : SUR LA NOTION DE DERIVEE NON ENTIERE.

http://web.univ-pau.fr/~jcresson/cresson-adda1.pdf (entre autres réfs sur le sujet)

L’argument de base est le caractère non local de ce type de dérivée.

Je prends une fonction f(x) de classe C¹. Je peux définir une dérivée d’ordre 1 f’(x), qui sera continue. f(x) est la valeur LOCALE de f au point x, d’accord ? De même, f’(x) est la valeur LOCALE de f’ au point x. Considérons la dérivée d’ordre ½ de f(x), en supposant qu’elle existe. Cette dérivée est forcément comprise entre f(x) et f’(x), toujours d’accord ? Alors, pour quelle raison deviendrait-elle subitement NON locale ?...

Comment peut-on devenir GLOBALE en restant entre 2 bornes LOCALES ?...

Ça me paraît relever du raisonnement (par l’)absurde…

On invoque aussi la formule de Leibnitz. Soit. Et alors ? la dérivée n-ième d’une fonction f, calculée suivant Leibtnitz, RESTE LOCALE…

LA NOTION DE DERIVEE EST UNE NOTION ESSENTIELLEMENT LOCALE.

La dérivée non entière d’une constante doit-elle rester nulle ? Oui : soit f(x) = C, constante, f’(x) = 0 et donc, toute dérivée de f d’ordre compris entre 0 et 1 (exclu) doit être comprise entre f(x) et f’(x), donc entre C et 0, ce qui nous fixe déjà des bornes. Ensuite, une fonction constante n’ayant, par définition et construction, aucune variation, il s’ensuit que la valeur de TOUTES les dérivées d’ordre compris entre 0 et 1 exclu est forcément zéro.

La dérivée non entière de e^x ? Idem : f(x) = e^x => f⁽ⁿ⁾(x) = e^x quel que soit l’entier naturel n. Par conséquent, toute dérivée d’ordre 0 =< a < 1 de f(x) doit être comprise entre f(x) et f’(x) = f(x). Conclusion : f^(a)(x) = e^x.

LA DERIVEE DE TOUTE ORDRE, ENTIER OU NON, DE LA FONCTION EXPONENTIELLE

EST LA FONCTION EXPONENTIELLE ELLE-MEME.

Ceux qui trouvent un résultat différent sont conviés à revoir leur copie… Ou à m’expliquer comment une autre fonction pourrait rester comprise entre e^x et e^x…

S’assurer, en effet, que la dérivée d’une constante était bien nulle était la première chose à faire avant de proposer sa théorie (réf. à Riemann-Liouville)… :)

Sur la COMMUTATIVITé, également. Encore un autre point « fort »… :)

M’expliquer, svp, pourquoi, tout aussi subitement, la composition de dérivées ne serait plus commutative aux ordres non entiers, mais seulement entiers…

Il devrait quand même tomber sous le sens commun que, lorsqu’une théorie aboutit à des résultats pareils, on s’interroge sérieusement sur sa validité…

En plus, la commutativité n’a rien à voir avec la dérivation, ce sont 2 notions à part…

Y a-t-il une connexion, ici ? A-t-on affaire à une variété différentiable ? Non ? Alors ?

On n’est pas chez De Rham, à ce que j’ai compris…

C’est une méthodologie assez générale chez les matheux : le RAFISTOLAGE. On cherche des RUSTINES à appliquer à des modèles SCABREUX… donc, on se BASE sur ces modèles et on les RACCOMODE… bin, non : quand c’est faux, c’est faux. Autant tout recommencer.

On cherche aussi la dérivée d’ordre a de f(x) comme un rapport (différence entre 2 valeurs de f en 2 points infiniment proches)/dx^a. Intuitivement logique. Mais faux.

Parce que f(x + adx) est d’ordre dx^a… Autrement dit, une dilatation/contraction sur le différentiel dx se traduit EN UNE LOI DE PUISSANCE SUR LA FONCTION.

Donc, lim_{y-> +/-x} [f(y) – f(x)]/dx^a CONDUIT A DES INFINIS. Et donc, n’est pas constructible. En effet, posons y = x +/- dx, alors f(y) est une somme continue (intégrale) de monômes de la forme f^(b)(x)dx^b, pour 0 =< b =< a, donc tous < a, sauf le terme dominant en f^(a)(x)dx^a et diviser par dx^a nous conduit inévitablement à des infinis pour dx -> 0…

Et c’est parfaitement normal : on s’inspire d’un modèle FAUX…

En plus, page 6, les auteurs donnent un exemple de fonction höldérienne qui montre on ne peut plus explicitement l’inconstructibilité de leur formulation !!! On trouve sigma/2^k ??? Non. Le passage à la limite me fait tout tendre vers zéro.

La définition de la dérivée fractale locale serait applicable si et seulement si f(x +/- dx) ne comportait que les termes f(x) (ordre 0 de petitesse) et f^(a)(x)dx^a (ordre a de petitesse), ce qui n’est pas vrai. pour commencer, c'est f(x + adx) qui est d'ordre dx^a. D’ailleurs, les formules (19-20-21) page 12 montrent bien que la linéarité des fonctions différentiables a été remplacée par une « quasi-linéarité » de la forme f(x + dx) = f(x) + f^(a)(x)dx^a, ce qui est totalement faux. Quant à la formule de dérivation des fonctions composées (18), essayer simplement de la retrouver aux ordres entiers… lol

Si c’était aussi simple, ça se saurait depuis longtemps…

La propriété (iii) de la proposition (2.4), propriété relative à la dérivation des produits de fonctions ? Impossible… On a déjà une formule de Newton-Leibnitz pour des ordres entiers. Alors, pour des ordres rationnels et a fortiori IRrationnels…

Si on trouve déjà une somme discrète pour des entiers, on doit s’attendre à une somme discrète sur des rationnels pour les rationnels (finis) et à une intégrale pour des irrationnels…

Voila ce qui arrive quand on cherche à sauver des modèles plus anciens.

Mais les autres modèles construits sur des généralisations de Newton-Leibnitz au continu ne sont pas plus fiables, même si on y trouve des intégrales (d’ordre)…

Si Leonhard Euler a su construire sa « fonction gamma » et sa « factorielle généralisée », il aurait sûrement su obtenir des formules de dérivation non entière. Il avait tout à disposition pour cela. S’il ne l’a pas fait et si personne n’y est parvenu depuis, c’est « qu’y a un truc »…

On n’utilise pas plus d’outils mathématiques qu’eux. Pas plus : intégrales, différences finies, limites, récurrences.

Pourquoi ?

Parce que, jusqu’à preuve du contraire, on n’a encore rien d’autre… :)

Commentaires textes : Écrire

blogs.fr: Blog multimédia 100% facile et gratuit

doclabidouille

Blog multimédia 100% facile et gratuit

BLOGS

Modules

Statistiques

doclabidouille

BIDOUILLE 13 : RETOUR SUR LES BIDOUILLES 1, 2 ET 3

BIDOUILLE 12 : L'UNIFICATION DU CLASSIQUE, DU STOCHASTIQUE ET DU QUANTIQUE !

BIDOUILLE 11 : INTERPRETATION

BIDOUILLE 10 : DERIVATION NON LINEAIRE

BIDOUILLE N°9 : CONVOLUTION ET DERIVEE NON ENTIERE

blogs.fr: Blog multimédia 100% facile et gratuit

doclabidouille

Blog multimédia 100% facile et gratuit

BLOGS

Modules

Statistiques

Newsletter

doclabidouille

BIDOUILLE 13 : RETOUR SUR LES BIDOUILLES 1, 2 ET 3

BIDOUILLE 12 : L'UNIFICATION DU CLASSIQUE, DU STOCHASTIQUE ET DU QUANTIQUE !

BIDOUILLE 11 : INTERPRETATION

BIDOUILLE 10 : DERIVATION NON LINEAIRE

BIDOUILLE N°9 : CONVOLUTION ET DERIVEE NON ENTIERE