blogs.fr: Blog multimédia 100% facile et gratuit

doclabidouille

Blog multimédia 100% facile et gratuit

 

BLOGS

Blog dans la catégorie :
Sciences

 

Statistiques

 




Signaler un contenu illicite

 

doclabidouille

BIDOUILLE 11 : INTERPRETATION

Le 06/11/2012

J’ai tenu à vérifier certains points existants relatifs aux notions de calcul discret et bien m’en a pris, car le concept dans lequel s’inscrit la « dérivation non linéaire » de la Bidouille 10 ci-avant est radicalement différent de ce qu’on trouve habituellement, par exemple sur :

http://fr.wikipedia.org/wiki/M%C3%A9thode_des_diff%C3%A9rences_finies

"La résolution des schémas numériques s’appuie en général sur des méthodes algébriques classiques. Cependant d’autres formulations équivalentes peuvent faire appel à des méthodes d'optimisation."

ou : http://fr.wikipedia.org/wiki/Diff%C3%A9rence_finie

Mon approche a beaucoup plus à faire avec la notion d’espaces discrets et, plus exactement encore, quantiques. En tant que telle, elle rejoint la géométrie non commutative de Connes. En effet, il n’est pas question ici d’obtenir des solutions approchées d’équations différentielles dans le continu, ni d’optimiser quoi que ce soit : une équation telle que

 

  1. Dhf(x,h) = a(x,h)f(x,h)

 

ne doit pas être considérée comme une expression discrétisée de l’équation différentielle :

 

  1. Df(x,0) = Df0(x) = a0(x)f0(x)     pour h -> 0

 

 

mais, au contraire, comme une généralisation de (2). L’approche est donc inverse de celle des méthodes d’analyse finie : c’est maintenant (2) qui est considérée comme une forme limite de (1) lorsque h -> 0.

Pour une meilleure vision du contexte, je vais argumenter en termes physiques.

D’abord, nous avons établi que h = dhx était « l’unité », « l’élément de longueur », le « pas » dans le cas d’un réseau ou d’un maillage de points, avec l’identification dhx = dx à la limite du continu h -> 0. On sait qu’en physique, c’est cette limite du continu (le « continuum ») qui devient l’approximation, tandis que la réalité fondamentale s’avère foncièrement discontinue.

La limite h -> 0 correspond donc, soit au macroscopique (physique « classique », déterministe), soit à un « zoom arrière » théoriquement infini. C'est-à-dire que l’observateur s’éloigne « à l’infini » d’une portion d’espace comprise entre un point x et son voisin immédiat x+h (ou x-h). Résultat : notre observateur a l’impression que les points x, x+h et x-h se rapprochent l’un de l’autre, jusqu’à finir par se confondre « à l’infini ». Il ne parvient plus à distinguer la distance élémentaire séparant ces 3 points.

Si l’on « zoom avant », au fur et à mesure qu’on va se rapprocher, on va distinguer de mieux en mieux cet écartement h. Et on va réaliser que ce qu’on prenait pour un « continuum », un espace continu, est en réalité un espace complètement discontinu, un espace « à trous ». Ou encore, discret. Mais alors, entre chaque point, il n’y a rien, puisqu’on ne peut descendre en dessous d’une distance de h. Mathématiquement, cela signifie qu’il n’existe aucune structure, au moins au sens classique, fonctionnel, du terme ; physiquement, cela signifie qu’il y a du vide. Classiquement, le vide, c’est l’absence de tout ; quantiquement, c’est un milieu purement fluctuant. Les points représentent alors l’espace effectivement réalisé, tandis que les vides d’étendue h entre ces points représentent l’espace non encore réalisé, mais réalisable. On sait, en effet, qu’il suffit de polariser le vide quantique pour réaliser des objets, en séparant les paires virtuelles. Nos points représentent des objets physiques, comme des points matériels, par exemples, ou des particules.

Voilà pourquoi (1) généralise (2) : parce que l’observateur peut, en outre, faire varier le pas de résolution h. Plus il diminuera h, plus il s’éloignera du segment [x-h,x+h] : c’est la transition vers le classique, la grande échelle ; plus il augmentera h, plus il se rapprochera du segment [x-h,x+h] : c’est la transition vers le quantique, la petite échelle.

A l’autre extrémité, la limite sera h -> oo.

Peut-il exister des solutions non nulles et finies de (1) à cette limite supérieure ? La réponse est oui. Résolvons déjà :

 

  1. Dhf(x,h) = a(h)f(x,h)

 

Cette équation nous dit que la h-dérivée de f(x,h) lui est proportionnelle et que le coefficient de proportionnalité a(h) dépend explicitement de h. La solution est :

 

  1. f(x,h) = f(0,h)[1 + ha(h)]x/h

 

Plusieurs remarques :

 

  1. la h-dérivée d’une fonction f(x) est TOUJOURS, par construction même, une fonction g(x,h) de x ET de h ;
  2. la h-primitive d’une fonction f(x) est TOUJOURS, par construction même, une fonction F(x,h). Il suffit de former DhF(x,h) = f(x) pour s’en convaincre : on ne peut avoir de résultat indépendant de h que ssi F dépend aussi bien de x que du pas de résolution h ;
  3. c’est pourquoi, d’une manière générale, on considère, non plus DES fonctions ou applications f(x), mais des FAISCEAUX de fonctions ou d’applications f(x,h) ;
  4.  tout coefficient a(h) ne dépendant que de h a une h-dérivée nulle et peut donc être assimilé à une constante, vis-à-vis de cet opérateur ;
  5.  La h-primitive Iha(h) de a(h) est de la forme A(x,h) = a(h)x + b(h) (dériver).

 

L’erreur serait maintenant de considérer la solution (4) comme une fonction ANALYTIQUE et donc, LISSE, de x : C’EST FAUX !

Nous sommes dans un espace discret. La progression d’un point à un autre procède par saut discontinu. En conséquence, si nous partons d’un point x0, les points suivants ne pourront être que des multiples entiers de h : x0, x0 +/- h,…, x0 +/- nh. La variable x n’est plus une variable continue ! Ce n’est qu’à la limite h -> 0 qu’elle le devient ou, plus correctement, qu’elle en prend l’aspect.

Par contre, rien, a priori, n’empêche le faisceau f(x,h) d’être continu en h.

 

Devinette : si nous faisons a(h) = 1 dans (4), qu’obtenons-nous au point x = 1 ?

 

  1. e(h) = (1 + h)1/h = exp{[Ln(1+h)]/h} ,  Limh->0 e(h) = e(0) = e

 

La fonction e(h) généralise l’exponentielle.

Il doit donc logiquement exister une généralisation de log, non ? Effectivement, la fonction :

 

(6)     Ln(h) = h Ln/Ln(1+h) = h Ln1+h   ,   Limh->0 Ln(h) = Ln(0) = Ln

 

généralise le logarithme naturel (ou népérien).

On voit que ces deux fonctions dépendent fortement de l’échelle. En h = 1, par exemple, j’obtiens e(1) = 2 et non plus 2,71828…, ce qui modifie ma fonction puissance et me fait passer d’une solution à l’autre, Ln(1) = Ln2 : je passe de la base e à la base 2…

Les bases numériques diminuent régulièrement, puisque :

 

  1. Limh->oo e(h) = 1

 

Par contre, ln(h) diverge. Ensuite :

 

  1. f(x,h) = f(0,h)exp(h)[Ih{Ln1+h[1 + ha(x,h)]}]

 

est solution de

 

  1. Dhf(x,h) = a(x,h)f(x,h) pour tout h.

 

Preuve : on sait qu’à la limite du continu, la solution de Df0(x) = a0(x)f0(x) est f0(x) = f0(0)exp[I a0(x)dx] avec I = I0 = opérateur intégral. On va donc chercher la solution de (8) sous la forme :

 

f(x,h) = f(0,h)exp(h)[A(x,h) + g(x,h)]

 

où A(x,h) est la h-primitive de a(x,h), avec A(x,0) = I a0(x)dx et g(x,0) = 0 pour tout x. Différencions :

 

dhf(x,h) = f(x+h+,h) – f(x,h) = f(0,h){exp(h)[A(x+h,h) + g(x+h,h)] - exp(h)[A(x,h) + g(x,h)]} = f(0,h)exp(h)[A(x,h) + g(x,h)]{exp(h)[A(x+h+,h) – A(x,h) + g(x+h,h) – g(x,h)] – 1}

= f(x,h){exp(h)[dhA(x,h) + dhg(x,h)] – 1}

 

Or, Ih = Dh-1 => DhA(x,h) = a(x,h) d’où dhA(x,h) = hDhA(x,h) = ha(x,h) et :

 

dhf(x,h) = hDhf(x,h) = f(x,h){exp(h)[ha(x,h) + hDhg(x,h)] – 1} = ha(x,h)f(x,h)

 

en vertu de (8). Il en résulte que :

 

ha(x,h) + hDhg(x,h) = Ln(h)[1 + ha(x,h)]

 

soit :

 

Dhg(x,h) = h-1Ln(h)[1 + ha(x,h)] – a(x,h)

 

En intégrant :

 

g(x,h) = Ih{h-1Ln(h)[1 + ha(x,h)]} – A(x,h)

 

On vérifie facilement que g(x,0) = 0 pour tout x, d’où la solution.

 

En fait, d’une manière assez générale, on recherchera les solutions d’équations discrètes (« quantiques ») comme des extensions des solutions de leurs homologues continues (« classiques »), en gardant toutefois à l’esprit que seul l’opérateur limite I0 = I est une somme continue. Les opérateurs Ih pour h non nul ne sont pas des intégrales.

 

Solution de :

 

  1. [Dh² + a(h)Dh + b(h)Id]f(x,h) = 0 ?

 

Réponse :

 

  1. f(x,h) = c(h)[1 + hX1(h)]x/h + d(h)[1 + hX2(h)]x/h

 

où X1,2(h) sont racines du polynôme caractéristique :

 

  1. X²(h) + a(h)X(h) + b(h) = 0

 

Pour les équations à coeffs constants, c’est facile. La solution de :

 

  1. PN(Dh)f(x,h) = [Sn=0N an(h)Dhn] = 0

 

est :

 

  1. f(x,h) = Sn=0N cn(h)[1 + hXn(h)]x/h

 

où les Xn(h) sont racines du polynôme caractéristique :

 

  1. PN[X(h)] = 0

 

En revanche, pour des coeffs variables (fonctions de x, quoi), on rencontre les mêmes problèmes que dans le cas continu, à savoir qu’à cause des dérivations, les équations d’ordre >= 2 ne se laissent pas exprimer à l’aide d’opérateurs Ih, car il faut encore dériver les coefficients.

 

La prochaine fois, j’analyserai l’application à la mécanique.

 

 

BIDOUILLE 10 : DERIVATION NON LINEAIRE

Le 02/11/2012

Dans cet article, je propose d’étendre les notions linéaires duales de dérivée et de différentielle. Avec, comme toujours, quelques surprises à la clé, certaines de taille.

On part donc de la formule des accroissements finis : soient E et F deux ensembles, f : E -> F une application de E dans F, x un élément de E (un point si E est muni d’une structure d’espace affine) et h > 0 un autre élément de E, distinct de x.

 

Définition 1 : On appelle nombre dérivé de f en x, la quantité :

 

  1. Dhf(x) = [f(x+h) – f(x)]/h

 

Il ne s’agit PLUS d’une approximation linéaire : le nombre Dhf(x) dépend généralement de x et de h de façon NON linéaire. En fait, il mesure le rapport à h de l’écart entre la valeur de f en l’élément x+h et sa valeur en l’élément x. On retrouve l’approximation linéaire en passant à la limite :

 

  1. Limh->0 Dhf(x) = Df(x)

 

Ce que l’on peut écrire en termes d’opérateurs seuls :

 

  1. Limh->0 Dh = D

 

Nous verrons pour les subtilités ensuite. Pour l’instant, établissons des propriétés fort générales. On remarque tout d’abord qu’en remplaçant h par nh dans (1), où n est un entier naturel, on a :

 

  1. Dnhf(x) = [f(x+nh) – f(x)]/nh

 

d’où :

 

  1. f(x+nh) = f(x) + nhDnhf(x)

 

Calculons à présent les dérivées successives de f en x :

 

hf(x) = [f(x+2h) – 2f(x+h) + f(x)]/h²

D3hf(x) = [f(x+3h) – 3f(x+2h) + 3f(x+h) – f(x)]/h3

Dnhf(x) = h-nSk=0n (-1)kCknf[x+(n-k)h]

 

Soit, en utilisant (5) et en termes d’opérateurs :

 

  1. hnDnh = (hDh)n = Sk=0n-1 (-1)kCkn(n-k)hD(n-k)h     (S = somme discrète)

 

Réciproquement, on établit facilement la relation inverse :

 

  1. Id + nhDnh = (Id + hDh)n

 

qui montre qu’une homothétie sur h se traduit en une loi de puissance.

Chose assez étonnante vu le caractère (fortement) non linéaire de Dh, on a encore les propriétés de linéarité suivantes :

 

  • Dh[f(x) + g(x)] = Dhf(x) + Dhg(x) et
  • Dh[af(x)] = aDhf(x) , a un élément du corps considéré (N, Q, R, C, etc.).

 

Il suffit, en effet, de regarder (1) pour s’assurer que, même sur les espaces discrets, Dhf(x) se définit sans ambiguïté dès que f est définie en les points utilisés. Justement, Dhf(x) ne peut exister que si et seulement si f est définie à la fois en x et en x+h, ce qui est loin d’être établi a priori, puisque cela dépend du domaine de définition def(f) de f. De même, D²hf(x) n’est définie que ssi f est définie à la fois en x, x+h et x+2h. Etc. Il s’ensuit que Dnhf(x) ne sera définie que ssi f est définie en x, x+h, x+2h,…, x+nh, ce qui réduit considérablement, non pas def(f), mais def(Dnhf).

On ne trouve pas de telle complication à l’approximation linéaire : dès qu’on fait tendre h vers zéro, à la limite, il suffit que Dnhf soit définie en x, quel que soit l’entier n >=0.

 

Prenons tout de suite un exemple, important en physique et à partir duquel nous établirons une proposition générale et son corollaire : f : R -> R, x -> f(x) = (1 – x²)1/2. Le domaine de définition de f est def(f) = [-1,+1], il est donc borné et même compact. Vis-à-vis de la dérivation usuelle (linéaire), f est clairement Doo et même Coo sur ]-1,+1[, puisque f et toutes ses dérivées sont continues sur cet intervalle ouvert (f est même continue aux extrémités -1 et +1, mais pas ses dérivées). Il n’en est plus de même, loin de là, vis-à-vis de la dérivation non linéaire. Nous venons de voir, en effet que, pour que Dnhf(x) soit définie, il faut et il suffit que les points successifs x, x+h,…, x+nh appartiennent à def(Dnhf), ce qui conduit aux inégalités suivantes :

 

-1 =< x =< +1 , -1 =< x+h =< +1,…, -1 =< x+nh =< +1

 

qui doivent être satisfaites simultanément (ou conjointement, c’est selon), ce qui conduit à l’inégalité unique :

 

  1. -1 =< x =< 1 – nh

 

Il devient alors évident que, pour h > 0 non nul, il apparaît une limite supérieure à l’ordre de dérivation. Cette limite est donnée par l’entier N satisfaisant à :

 

(9)     1 – Nh = -1     d’où     N = E(2/h)

 

Où E(.) désigne la partie entière, puisqu’alors le domaine de définition de DNhf se réduit au singleton {-1}, c'est-à-dire, à un seul point ! Au-dessus, DN+1h n’existe pas car les points x + (N+1)h sortent tous du domaine de définition de f.

Conclusion : pour h > 0 non nul, (1-x²)1/2 est DN sur [-1,+1] avec N = E(2/h) < oo et CN sur ]-1,+1[.

 

CONTRAIREMENT AUX PREJUGéS, LA FONCTION f(x) = (1-x²)1/2 (FACTEUR DE LORENTZ) N’EST PAS LISSE. LE PASSAGE A LA LIMITE h -> 0 (APPROXIMATION LINEAIRE) FAUSSE LE JUGEMENT.

 

Or, cette description, « macroscopique » en physique, est clairement idéaliste. Bien sûr, si h est de l’ordre du rayon de Planck, soit 10-35, N sera de l’ordre de  2x10-35, ce qui est énorme… mais reste néanmoins fini. Au-delà, on n’est plus dérivable. Ce qui change quand même radicalement la nature du mouvement. Et des équations censées le décrire.

Enonçons maintenant notre proposition :

 

PROPOSITION : Soit f : R -> R, x -> f(x) une application telle que def(f) soit borné : def(f) = [x1,x2] avec x1 =< x2 (resp. ]x1,x2], [x1,x2[, ]x1,x2[). Alors, f est de classe DN sur def(f) avec N = E[(x2 – x1)/h]. Si, de plus, f est continue sur def(f), alors f est CN sur def(f).

 

En effet, Dnhf(x) ne sera définie que ssi les inégalités suivantes sont simultanément satisfaites : x1 =< x =< x2, x1 =< x + h =< x2,…, x1 =< x+nh =< x2, ce qui conduit à l’inégalité unique x1 =< x =< x2 – nh. Def(Dnhf) se réduira à {x1}, ultime étape de la dérivabilité de f pour x2 – nh = x1, soit N = E[(x2 – x1)/h], comme annoncé. D’autre part, f est bien de classe DN sur def(f) tout entier, puisque f(x), f(x+h),…, f(x+Nh) sont toutes définies sur def(f). Enfin, la continuité de f se transmet à ses dérivées, comme le montrent (1) et (6).

 

COROLLAIRE : f est Doo (resp. Coo) sur def(f) ssi def(f) est non borné.

 

Dans ce cas, en effet, l’une des extrémités de def(f) est nécessairement rejetée à l’infini (positif ou négatif) et l’entier N = oo.

 

Etablissons d’autres formules de base de la dérivation. Tout d’abord, le produit de deux applications f(x) et g(x). On a :

 

Dh[f(x)g(x)] = [f(x+h)g(x+h) – f(x)g(x)]/h.

 

Utilisons (5) pour n = 1 :

 

(10)     Dh[f(x)g(x)] = {[f(x) + hDhf(x)][g(x) + hDhg(x)] – f(x)g(x)}/h

                                = g(x)Dhf(x) + f(x)Dhg(x) + hDhf(x)Dhg(x)

 

On reconnait bien sûr les deux premiers termes de la dérivée usuelle du produit, D étant remplacée par Dh, mais il apparaît désormais un troisième terme, produit des dérivées, qui s’annule pour h -> 0. Tant mieux d’ailleurs, car c’est surtout ce terme supplémentaire qui exhibe la nature non linéarisante de Dh.

 

(11)     Dh[1/g(x)] = [1/g(x+h) – 1/g(x)]/h = -[g(x+h) – g(x)]/hg(x+h)g(x) =

                             = -Dhg(x)/g(x)[g(x) + hDhg(x)]

 

Eh oui : c’est un petit plus compliqué que lorsque h -> 0…

A partir de cette formule, nous déduisons facilement l’expression de la dérivée d’un quotient :

 

Dh[f(x)/g(x)] = [Dhf(x)]/g(x) + f(x)Dh[1/g(x)] + hDhf(x)Dh[1/g(x)]

                      = [Dhf(x)]/g(x) - f(x)Dhg(x)/g(x)[g(x) + hDhg(x)] - hDhf(x)Dhg(x)/g(x)[g(x) + hDhg(x)]

                      = {[g(x) + hDhg(x)]Dhf(x) - f(x)Dhg(x) - hDhf(x)Dhg(x)}/g(x)[g(x) + hDhg(x)]

 

Soit, en fin de compte :

 

  1. Dh[f(x)/g(x)] = [g(x)Dhf(x) – f(x)Dhg(x)]/g(x)[g(x) + hDhg(x)]

 

Etonnamment, le terme supplémentaire de (10) a disparu : on retrouve au numérateur une forme semblable à celle dans le continu (h -> 0). Comme, pour f(x) = 1, Dhx = 0, on retrouve bien (11).

Donnons quelques exemples pratiques de dérivée non linéaire de fonctions connues.

 

  1. Dh(xn) = [(x+h)n – xn]/h = Sk=0n-1 Cknhn-k-1xk, avec n entier >=0 ;

 

On voit bien, dans cet exemple, la non linéarité de Dh. A la limite h -> 0 ne subsiste plus que le dernier terme k = n-1 qui donne bien nxn-1.

 

  1.  Dh(eax) = [ea(x+h) – eax]/h = eax(eah – 1)/h  , a réel ;

 

Surprise ! Pour a = 1, ex n’est plus égale à sa dérivée ! Ce qui a des conséquences non négligeables sur toute la théorie des EDOs linéaires, puisque le polynôme caractéristique se fonde justement sur cette propriété « universelle » de la fonction exponentielle dans le continu… On ne peut même pas approcher le facteur (eah – 1)/h, puisqu’il peut prendre une valeur arbitraire, voire arbitrairement grande ! Par contre, on a :

 

  1. Dnh(eax) = [(eah – 1)/h]neax , n entier >= 0

 

qui conserve encore une propriété multiplicative.

 

Dh(xa), a réel > 0 ?

 

On utilise la propriété xa = exp(aLnx) ? on n’obtiendra plus grand-chose. On utilise une approximation ? on ne peut pas ! Alors, comment fait-on ? Le « moins pire » me paraît être encore ceci :

 

  1. (x+h)a = I0a Cbaha-bxbdb  ,  Cba = PI(b)/PI(a)PI(a-b) , I = intégrale (somme continue).

 

Alors,

 

  1. Dh(xa) = h-1[I0a Cbaha-bxbdb – xa]

 

Pff… pas le pied. Si quelqu’un trouve mieux, plus en rapport avec la dérivée linéaire, tant mieux.

 

  • Dérivée non linéaire d’une fonction de fonction :

 

Alors, ça, c’est pas beau, comme formule… :( je préviens de suite… :)

 

Dhf[g(x)] = {f[g(x+h)] – f[g(x)]}/h = {f[g(x) + hDhg(x)] – f[g(x)]}/h

 

On effectue les substitutions x -> g(x), h -> hDhg(x) = y(x,h), ce qui donne :

 

  1. Dhf[g(x)] = y(x,h)Dy(x,h)f[g(x)]/h = Dhg(x)Dy(x,h)f[g(x)]

 

On peut expliciter un peu mieux cette formule à l’aide de la notion de différentielle non linéaire, duale de la notion de dérivée non linéaire.

 

DEFINITION 2 : Soit f comme dans la définition 1. On appelle différentielle de f en x la quantité :

 

  1. dhf(x) = hDhf(x)

 

Evidemment, cette différentielle-là n’a plus grand-chose à voir avec un infiniment petit du premier ordre…

On note tout de suite que :

 

  1. dhx = h     et     Limh->0 dh = d

 

qui montre que h est bien la quantité « unité ». La différence est que l’utilisateur se la fixe lui-même en fonction du problème qui se pose à lui : elle n’est plus une grandeur « universelle », « proche de zéro ». Sous forme différentielle, (6) et (7) deviennent :

 

  1. dnh = Sk=0n-1 (-1)kCknd(n-k)h
  2. Id + dnh = (Id + dh)n

 

Dans (18), on aura donc y(x,h) = dhg(x). Cette notation ne devrait pas choquer : dh n’est PLUS un opérateur infinitésimal. C’est à la limite que y(x,0) = dg(x) EST une quantité infinitésimale du premier ordre. Mais, encore une fois, il s’agit d’une approximation, d’une idéalisation. A cette limite, (18) donne Dg(x)Ddg(x)f[g(x)] = Dg(x){f[g(x)+dg(x)] – f[g(x)]}/dg(x) = Dg(x)Df[g(x)]/dg(x), qui est bien l’expression dans le continu.

 

Circonstance importante : pour définir la différentielle non linéaire de f en un point x, on n’a plus besoin que f soit définie au voisinage de ce point, il suffit que f soit définie en x et x + h. Cette condition est aussi nécessaire. En effet, si Dhf(x) est définie, alors dhf(x) sera définie, au point x même. Réciproquement, si dhf(x) existe en x, Dhf(x) = dhf(x)/h existe.

On n’a pas du tout la même chose dans le continu : quand h -> 0, on trouve des dérivées sans différentielles, ce qui conduit quand même à une mise en défaut de la dualité et on a besoin que la fonction considérée soit définie, non seulement au point choisi, mais en son voisinage. Ce qui induit des complications topologiques telles que de considérer partout des boules centrées en des points. Ici, pas de boules. Plus besoin. Quand les valeurs de x+nh sortent du domaine de définition de f, la différentielle n’existe plus, point. Bon ou mauvais voisinage, elle n’existe plus. :)

 

La prochaine fois, je tente l’intégration.

 

 

BIDOUILLE N°9 : CONVOLUTION ET DERIVEE NON ENTIERE

Le 28/10/2012

1ER ASPECT : SUR LA CONVOLUTION DES FONCTIONS.

http://www.johndcook.com/blog/2009/10/25/how-to-differentiate-a-non-differentiable-function/

Au sujet de la derivation des distributions :

 

« We can use this procedure to define as many derivatives of f as we’d like, as long as f is integrable. So f could be some horribly ill-behaved function, differentiable nowhere in the classical sense, and we could define its 37th derivative by repeatedly applying this idea.”

 

C’est tout à fait ce qu’on trouve chez tous les auteurs et notamment Laurent Schwartz. J’ai cependant noté une circonstance bizarre. Reprenant la trop bien connue équation de la chaleur et son noyau gaussien, j’ai fait quelques calculs simples de solutions de cette équation : si f(x,0) est la valeur initiale du champ (i.e. à t = 0), la valeur de ce champ à l’instant t s’obtient par convolution avec le noyau. En dimension spatiale 1 :

 

(1)     f(x,t) = IR f(x’,0)rhô(x-x’,t)dx’               (I = intégrale)

(2)     rhô(x-x’,t) = exp[-(x – x’)²/4Dt]/2(pi.Dt)1/2

 

Et je me suis aperçu de la chose suivante :

 

SI f(x,0)  EST UNE FONCTION Dn (DIFFERENTIABLE JUSQU'A L’ORDRE n) OU Cn (CONTINUEMENT DIFFERENTIABLE JUSQU'A L’ORDRE n), SON EXTENSION f(x,t) PRESENTE MEME REGULARITE !

 

Les sceptiques le vérifieront rapidement. J’en suis resté quelque peu baba… Que fait le noyau gaussien ? Il ajoute des termes en puissances de sigma = 2Dt à f(x,0), qui s’annulent tous en sigma = 0 (donc homogènes). C’EST TOUT !!! 8(((

On me dira que c’est un faux problème, puisque, toute fonction nulle étant indéfiniment dérivable (et même continuement), in fine, f(x,t) PEUT ETRE classée Coo. Il n’en reste pas moins que les seules dérivées NON NULLES de f(x,0) vont jusqu’à l’ordre n (supposé fini) et qu’il s’avère en être de même pour f(x,t). Aux ordres > n, les dérivées de f(x,0) ET de f(x,t) sont toutes nulles…

J’en suis resté baba, car ceci interpelle : A QUOI sert donc le noyau, sinon à ajouter des termes, étendre la fonction de départ f(x,0) à tout instant t ?

 

LE NOYAU DISTRIBUTIF NE REGULARISE PAS LA FONCTION

A LAQUELLE IL S’APPLIQUE !!!

 

La convolution avec un noyau Coo permet effectivement de calculer des dérivées distributives à tout ordre, mais ne lisse pas la fonction pour autant. La régularisation n’est donc que fictive.

En revanche, il permet de trouver l’expression du champ f(x,t) à tout instant t ne connaissant que sa valeur f(x,0) en t = 0. ça, oui. Mais f(x,t) N’EST PAS Coo !!!

Donc, il n’est pas régularisé… On s’est tous fait piéger là-dessus.

 

2EME ASPECT : SUR LA NOTION DE DERIVEE NON ENTIERE.

http://web.univ-pau.fr/~jcresson/cresson-adda1.pdf (entre autres réfs sur le sujet)

L’argument de base est le caractère non local de ce type de dérivée.

Je prends une fonction f(x) de classe C1. Je peux définir une dérivée d’ordre 1 f’(x), qui sera continue. f(x) est la valeur LOCALE de f au point x, d’accord ? De même, f’(x) est la valeur LOCALE de f’ au point x. Considérons la dérivée d’ordre ½ de f(x), en supposant qu’elle existe. Cette dérivée est forcément comprise entre f(x) et f’(x), toujours d’accord ? Alors, pour quelle raison deviendrait-elle subitement NON locale ?...

Comment peut-on devenir GLOBALE en restant entre 2 bornes LOCALES ?...

Ça me paraît relever du raisonnement (par l’)absurde…

On invoque aussi la formule de Leibnitz. Soit. Et alors ? la dérivée n-ième d’une fonction f, calculée suivant Leibtnitz, RESTE LOCALE…

 

LA NOTION DE DERIVEE EST UNE NOTION ESSENTIELLEMENT LOCALE.

 

La dérivée non entière d’une constante doit-elle rester nulle ? Oui : soit f(x) = C, constante, f’(x) = 0 et donc, toute dérivée de f d’ordre compris entre 0 et 1 (exclu) doit être comprise entre f(x) et f’(x), donc entre C et 0, ce qui nous fixe déjà des bornes. Ensuite, une fonction constante n’ayant, par définition et construction, aucune variation, il s’ensuit que la valeur de TOUTES les dérivées d’ordre compris entre 0 et 1 exclu est forcément zéro.

La dérivée non entière de ex ? Idem : f(x) = ex => f(n)(x) = ex quel que soit l’entier naturel n. Par conséquent, toute dérivée d’ordre 0 =< a < 1 de f(x) doit être comprise entre f(x) et f’(x) = f(x). Conclusion : f(a)(x) = ex.

 

LA DERIVEE DE TOUTE ORDRE, ENTIER OU NON, DE LA FONCTION EXPONENTIELLE

EST LA FONCTION EXPONENTIELLE ELLE-MEME.

 

Ceux qui trouvent un résultat différent sont conviés à revoir leur copie… Ou à m’expliquer comment une autre fonction pourrait rester comprise entre ex et ex

S’assurer, en effet, que la dérivée d’une constante était bien nulle était la première chose à faire avant de proposer sa théorie (réf. à Riemann-Liouville)… :)

Sur la COMMUTATIVITé, également. Encore un autre point « fort »… :)

M’expliquer, svp, pourquoi, tout aussi subitement, la composition de dérivées ne serait plus commutative aux ordres non entiers, mais seulement entiers

Il devrait quand même tomber sous le sens commun que, lorsqu’une théorie aboutit à des résultats pareils, on s’interroge sérieusement sur sa validité…

En plus, la commutativité n’a rien à voir avec la dérivation, ce sont 2 notions à part…

Y a-t-il une connexion, ici ? A-t-on affaire à une variété différentiable ? Non ? Alors ?

On n’est pas chez De Rham, à ce que j’ai compris…

C’est une méthodologie assez générale chez les matheux : le RAFISTOLAGE. On cherche des RUSTINES à appliquer à des modèles SCABREUX… donc, on se BASE sur ces modèles et on les RACCOMODE… bin, non : quand c’est faux, c’est faux. Autant tout recommencer.

On cherche aussi la dérivée d’ordre a de f(x) comme un rapport (différence entre 2 valeurs de f en 2 points infiniment proches)/dxa. Intuitivement logique. Mais faux.

Parce que f(x + adx) est d’ordre dxa… Autrement dit, une dilatation/contraction sur le différentiel dx se traduit EN UNE LOI DE PUISSANCE SUR LA FONCTION.

Donc, limy-> +/-x [f(y) – f(x)]/dxa CONDUIT A DES INFINIS. Et donc, n’est pas constructible. En effet, posons y = x +/- dx, alors f(y) est une somme continue (intégrale) de monômes de la forme f(b)(x)dxb, pour 0 =< b =< a, donc tous < a, sauf le terme dominant en f(a)(x)dxa et diviser par dxa nous conduit inévitablement à des infinis pour dx -> 0…

Et c’est parfaitement normal : on s’inspire d’un modèle FAUX…

En plus, page 6, les auteurs donnent un exemple de fonction höldérienne qui montre on ne peut plus explicitement l’inconstructibilité de leur formulation !!! On trouve sigma/2k ??? Non. Le passage à la limite me fait tout tendre vers zéro.

La définition de la dérivée fractale locale serait applicable si et seulement si f(x +/- dx) ne comportait que les termes f(x) (ordre 0 de petitesse) et f(a)(x)dxa (ordre a de petitesse), ce qui n’est pas vrai. pour commencer, c'est f(x + adx) qui est d'ordre dxa. D’ailleurs, les formules (19-20-21) page 12 montrent bien que la linéarité des fonctions différentiables a été remplacée par une « quasi-linéarité » de la forme f(x + dx) = f(x) + f(a)(x)dxa, ce qui est totalement faux. Quant à la formule de dérivation des fonctions composées (18), essayer simplement de la retrouver aux ordres entiers… lol

Si c’était aussi simple, ça se saurait depuis longtemps…

La propriété (iii) de la proposition (2.4), propriété relative à la dérivation des produits de fonctions ? Impossible… On a déjà une formule de Newton-Leibnitz pour des ordres entiers. Alors, pour des ordres rationnels et a fortiori IRrationnels

Si on trouve déjà une somme discrète pour des entiers, on doit s’attendre à une somme discrète sur des rationnels pour les rationnels (finis) et à une intégrale pour des irrationnels…

Voila ce qui arrive quand on cherche à sauver des modèles plus anciens.

Mais les autres modèles construits sur des généralisations de Newton-Leibnitz au continu ne sont pas plus fiables, même si on y trouve des intégrales (d’ordre)…

 

Si Leonhard Euler a su construire sa « fonction gamma » et sa « factorielle généralisée », il aurait sûrement su obtenir des formules de dérivation non entière. Il avait tout à disposition pour cela. S’il ne l’a pas fait et si personne n’y est parvenu depuis, c’est « qu’y a un truc »…

On n’utilise pas plus d’outils mathématiques qu’eux. Pas plus : intégrales, différences finies, limites, récurrences.

Pourquoi ?

Parce que, jusqu’à preuve du contraire, on n’a encore rien d’autre… :)

 

 

BIDOUILLE 8 : REBIDOUILLAGE DANS L'ESPACE DES PRIX

Le 16/10/2012

A présent les problèmes exposés de Bidouille 4 à Bidouille 7, on rebidouille depuis le départ.

Alors… on reprend la loi binomiale (2 états), on appelle P la probabilité d’obtenir un événement quelconque et 1-P celle de ne pas l’obtenir (non événement). On a P + (1-P) = 1. Donc, quel que soit le REEL (positif ou nul) X, on aura [P + (1 – P)]X = 1. Développons suivant la formule du binôme de Newton ETENDUE AU CONTINU :

 

  1. [P + (1-P)]X = S0X CxXPx(1-P)X-xdx = S0X PX(x,P)dx = 1  ,  CxX = PI(X)/PI(x)PI(X-x)  ,  (S = intégrale)

 

PI(.) étant la factorielle d’Euler. La densité de probabilité est maintenant :

 

  1. PX(x,P) = CxXPx(1-P)X-x

 

fonction CONTINUE et même INDEFINIMENT DIFFERENTIABLE de x, puisque 0=< x =< X. X est une quantité DETERMINISTE, x est la VARIABLE STOCHASTIQUE. Un calcul similaire au cas entier montre que la moyenne de x est :

 

  1. <x> = XP

 

tandis que celle de x² est :

 

  1. <x²> = XP + X(X-1)P² = <x>(1-P) + <x>²

 

puisque PI(x) = PI(x-1)x. L’incrément / décrément reste donc de 1. Ce qui n’empêcherait nullement de chercher des moyennes de puissances NON ENTIERES de x, quoique les formules ne soient plus aussi simples, dû au fait que la factorielle d’Euler ne vérifie qu’un petit nombre de propriétés itératives. Décomposons x en sa moyenne <x> et une fluctuation ksi : x = <x> + ksi. Ça se critique, car c’est de l’approche « modèle de champ moyen ». D’après (3) et (4), nous trouvons :

 

  1. <ksi> = 0
  2. <ksi²> = <(x - <x>)²> = <x² - 2x<x> + <x>²>

                     = <x²> - 2<x>² + <x>² = <x²> - <x>² = sigma²

 

La moyenne de la fluctuation est donc nulle, tandis que la moyenne de son carré est égale au carré de l’écart-type ou variance sigma. A l’approximation gaussienne, seules les moyennes des puissances PAIRES de ksi sont non nulles. Dans le cas de la distribution binomiale, seule <ksi> est toujours nulle.

 

On passe dans L’ESPACE DES PRIX. Ici, x est le prix (fluctuant), le plancher est fixé à zéro et le plafond à X. <x> est le prix moyen, ksi est la fluctuation de prix. Il s’agit de savoir dans quelle mesure on peut chercher la VARIATION DU PRIX AU COURS DU TEMPS à l’aide d’une équation DIFFERENTIELLE.

Déjà, x ne suffit pas, il faut passer aux COURBES DE PRIX x(t). ça ne pose pas de problème particulier dans les calculs précédents, où l’on remplacera x par x(t). Mais alors, les moyennes montrent immédiatement que X, P ou les deux à la fois doivent dépendre du temps. Si P varie au cours du temps, la condition de conservation de la probabilité doit être localisée en :

 

(7)     P(t) + [1 – P(t)] = 1     à chaque instant t dans un intervalle [0,T]

 

avec T éventuellement infini. Partant de là, on peut envisager quelque chose. Mais les difficultés techniques ne sont pas terminées, loin s’en faut. Pour qu’on puisse définir au moins dx(t)/dt, il faut (et il suffit) que la courbe x(t) soit C1 sur [0,T]. Si elle n’est que C0, inutile d’aller plus loin. Supposons qu’elle soit C1. Elle possède déjà une certaine régularité. Alors, on peut chercher la variation de prix au cours du temps sous la forme d’un CHAMP :

 

  1. dx(t)/dt = V[x(t),t]

 

Mais attention ! x(t) est désormais une fonction STOCHASTIQUE du temps (déterministe !) et V est une fonctionnelle du temps et de cette fonction stochastique x(t). Sinon, on ne voit pas bien comment on peut construire une relation fonctionnelle qui tienne la route… Ou alors, il faut passer à une équation INTEGRALE de la forme :

 

  1. x(t) = x(t0) + Stot V[x(t’),t’]dt’

 

La différence, c’est que, dans la formulation intégrale, on n’a plus besoin de régularité : il suffit que la fonctionnelle V soit continue en t sur l’intervalle d’intégration. Elle peut même être continue par morceaux, de sorte que la courbe x(t) peut n’être que continue, voire continue par morceaux. Mais l’écriture (7) n’est plus partout équivalente à (8), en raison des discontinuités. (7) peut même ne plus être justifiée du tout ! C’est précisément ce qui se produit lorsque x(t) n’est différentiable NULLE PART…

Pour coller à la généralité, on préfèrera donc l’équation intégrale à l’équa diff.

Et il serait hasardeux d’affirmer que (8) est solution de (7)… : dès que (7) ne peut plus s’écrire, en raison du caractère trop irrégulier de la courbe, (8) en devient complètement indépendante et doit se résoudre par la méthode de Volterra.

Après, la régularité de V en x(t) ne pose pas de problème particulier pour la résolution : si V est CN en x(t), on l’écrira sous la forme :

 

  1. V[x(t),t] = Sn=0n=N Vn(t)xn(t)/n !     (S = somme discrète ici)

 

où les coefficients Vn(t) se calculent comme les dérivées n-ièmes de V au voisinage de la courbe nulle x(t) = 0.

On peut reprendre la décomposition x(t) = <x(t)> + ksi(t) comme ci-avant. <x(t)> est alors le MOYEN MOUVEMENT du prix x(t) et ksi(t), la fluctuation autour de ce moyen mouvement. Il est évident que <x(t)> sera solution d’une équation DETERMINISTE. Mais, due à la non-linéarité de V dans le cas général, l’équation du moyen mouvement dépendra encore des moyennes des puissances de ksi(t) supérieures ou égale à 1. Et puis, on réalise une dichotomie, ce qui est la critique principale formulée à l’encontre des modèles de champ moyen. Mieux vaut encore chercher la résolution de (8) pour le processus stochastique x(t) dans son ensemble, PUIS prendre la moyenne de la solution obtenue. Cette moyenne fournira <x(t)> et la différence x(t) - <x(t)>, la fluctuation ksi(t).

Ceux qui ont du temps à perdre ou qui visent une distinction particulière :) peuvent toujours calculer DIRECTEMENT la moyenne de (8), en utilisant (9). Ça ne les avancera sans doute pas à grand-chose, mais ils obtiendront, à n’en pas douter, une relation intéressante d’un point de vue… scholastique, cette fois. :)

 

Un dernier aspect technique, pour finir : la dérivation TOTALE par rapport au temps.

On trouve dans tous les bons manuels traitant de statistiques et de mouvements aléatoires une construction absolument merveilleuse de la dérivée totale d/dt par rapport au temps pour les processus stochastiques.

Je ne dois pas être bien malin, car je ne suis jamais parvenu à la retrouver. Par contre, elle m’est toujours apparue comme ayant « une bonne tête d’opérateur qui va bien ». Quoiqu’il ne conduise pas pour autant à une propriété de conservation…

J’ai eu beau tourner et retourner la question dans tous les sens, je ne vois toujours pas comment on peut aboutir à :

 

D/dt = d/dt + (dx/dt)d/dx + ½ sigma².d²/dx²

 

(en traduction littérale, i.e. en « oubliant » les dépendances temporelles). Toujours pas. Y a de la magie dans l’air… Qui plus est, même avec dx/dt = 0, on ne retrouve pas l’équation de la chaleur, puisqu’on a alors d/dt + ½ sigma².d²/dx² = 0 et non d/dt - ½ sigma².d²/dx² = 0 comme attendu…

Reprenons notre champ V[x(t),t] et cherchons sa dérivée totale par rapport au temps, SI ELLE EXISTE (déjà…). La moindre des choses pour cela est que V soit C1 en t ET en x(t). Supposons que ce soit le cas. Supposons. Alors,

 

  1. DV[x(t),t]/dt = dV[x(t),t]/dt + {[dx(t)/dt].[d/dx(t)]}V[x(t),t]

                                     = dV[x(t),t]/dt + {V[x(t),t].d/dx(t)}V[x(t),t]

 

AVEC les dépendances fonctionnelles qui s’imposent. C’est la dérivée… d’Euler, toujours les mêmes. Et d’où provient le terme supplémentaire +½ sigma².d²/dx² ? qui s’écrit d’ailleurs +½ sigma²(t)d²/dx²(t). Qu’est-ce qui le justifie ? une approximation C? Et pourquoi donc TOUTE fonctionnelle stochastique devrait-elle être C2 en x(t), même dans le cas gaussien ? Rappelons-le : la gaussienne est DEJA une approximation d’ordre 2…

Une C2 en x(t) conduirait à une équation d’évolution avec second membre en x²(t) : c’est la généralité, ça ?...

L’argument consiste à dire que ce terme supplémentaire apparaît du fait que <ksi²> est non nulle. Et alors ? Même en gaussien, <ksi2n> est non nulle, pour tout n entier positif ou nul. On pourrait donc ajouter des termes supplémentaires ad infinitum, en plus…

C’est fallacieux, comme argumentaire.

Mathématiquement, c’est même incorrect, puisqu’on ajoute un terme du SECOND ORDRE DE PETITESSE à un opérateur du premier ordre : c’est incorrect du point de vue du calcul différentiel… Tout autant qu’écrire, comme j’ai déjà vu, dsigma² = 2Ddt ou, mieux (enfin, pire) l’équation de Boltzmann sous la forme : (différentielle d’ordre 1) = (fonction) !!!

Sans rire. J’ai la réf chez moi. Fallait oser…

Enfin, pourquoi une MOYENNE sigma²(t) = <ksi²(t)> et ce terme seul ? On dérive par rapport au processus x(t) tout entier…

Mystère…

Entre autres…

 

 

BIDOUILLE 7 : ON A ENFIN CERNé LE FOND DU PROBLEME ?

Le 13/10/2012

Oui, je crois avoir enfin cerné le fond du problème.

D’abord, une rectification : l’équation de Boltzmann, que je cite dans Bidouille 6, est du même acabit, puisque la densité de probabilité est fonction des points MOBILES x(t) et p(t) (impulsions associées), ainsi que du temps, sur l’espace des phases du système : la dépendance temporelle subsiste donc.

D’autre part, le calcul d’Ito et al n’est pas en cause, mais résulte de la théorie des « systèmes dynamiques stochastiques » (systèmes dynamiques avec bruits), elle-même issue de la théorie de Langevin. Il faut donc revenir à cette dernière. Et c’est là qu’il y a confusion des genres. En 1908, date à laquelle Paul Langevin publia ses travaux, s’était excusable. Depuis, beaucoup de connaissances ont été accumulées sur le sujet.

On repart donc de l’article :

http://en.wikipedia.org/wiki/Ito_calculus

déjà mentionné dans Bidouille 5.

« In physics, usually stochastic differential equations, also called Langevin equations, are used, rather than general stochastic integrals. A physicist would formulate an Itō stochastic differential equation (SDE) as

dxk(t)/dt = hk + gklksil

where ksil is Gaussian white noise with <ksik(t1)ksil(t2)> = deltakldelta(t1 – t2) and Einstein's summation convention is used.”

On va revoir tout ça. Mais d’abord, on remonte le fil :

http://en.wikipedia.org/wiki/Langevin_equation

“In statistical physics, a Langevin equation (Paul Langevin, 1908) is a stochastic differential equation describing the time evolution of a subset of the degrees of freedom. These degrees of freedom typically are collective (macroscopic) variables changing only slowly in comparison to the other (microscopic) variables of the system. The fast (microscopic) variables are responsible for the stochastic nature of the Langevin equation.”

Non. Les variables microscopiques NE SONT PAS responsables de la nature stochastique du processus.

“The original Langevin equation[1] describes Brownian motion, the apparently random movement of a particle in a fluid due to collisions with the molecules of the fluid”

APPARENT ! Retenir ça pour la suite.

“However, the Langevin equation is used to describe the motion of a "macroscopic" particle at a much longer time scale, and in this limit the δ-correlation and the Langevin equation become exact.”

Approximation, donc. Une de plus. Ça commence à faire beaucoup.

“An essential condition of the derivation is a criterion dividing the degrees of freedom into the categories slow and fast.”

Peut-être, mais la classification en variables lentes et rapides date de la seconde moitié du 19ème siècle, bien avant Langevin : dans toutes les méthodes d’analyse ASYMPTOTIQUE des systèmes dynamiques hamiltoniens, on sépare en variables lentes et variables rapides. C’est Delaunay…

Il est aujourd’hui bien établi, grâce à la théorie du CHAOS DETERMINISTE, que :

LES TRAJECTOIRES DES ELEMENTS D’UN SYSTEME EVOLUTIFS (PARTICULES, COMPOSANTS DE BASE) SONT DETERMINISTES. C’EST L’ECHELLE DE DESCRIPTION MICROSCOPIQUE OU ENCORE LOCALE.

Si un système dynamique se compose de N « points matériels » (1D pour simplifier), l’évolution de la position dans l’espace xi(t) du i-ème élément (i = 1,…,N) obéit à une équation déterministe. A l’opposé :

A L’ECHELLE MACROSCOPIQUE OU ENCORE GLOBALE DU SYSTEME DANS SON ENSEMBLE, LE CHAMP MODELISANT CE SYSTEME OBEIT A UNE EQUATION AUX DERIVEES PARTIELLES DETERMINISTE. C’EST LA DESCRIPTION DITE « PHENOMENOLOGIQUE ».

ENTRE LES DEUX, aux échelles intermédiaires, la description ne peut être que STATISTIQUE, pas seulement (comme on le croyait jusqu’aux années 60) en raison d’une impossibilité de détailler le mouvement individuel de chaque élément du système sur un intervalle de temps donné (fini ou non), mais aussi pour des raisons SYSTEMIQUES, INHERENTES AU SYSTEME LUI-MEME, QUI SE MET A SE COMPORTER DE MANIERE TOTALEMENT IMPREVISIBLE A L’AVANCE. Ceci se produit pour des valeurs bien particulières des coefficients de la partie PERTURBATRICE. Mais le problème mécanique GENERAL ne s’aborde pas du tout de la même manière : il ne « suffit » pas, en effet, d’ajouter un terme de bruit à un ensemble d’équations locales déterministes pour rendre compte du phénomène. Ce qui se produit est ceci :

  • si l’on examine, au « microscope », le mouvement D’UNE particule du système, on observe UNE trajectoire, continue ou pas, peu importe, mais parfaitement déterministe ;
  • si l’on examine, après grossissement (résolution moindre) le système, on observe un FAISCEAU DE TRAJECTOIRES : c’est ce faisceau qui, soit en raison de collisions entre les particules du système (recoupements de trajectoires individuelles), soit en raison d’un changement radical de comportement (transition vers le chaos déterministe), qui ne peut se décrire qu’au moyen de la statistique.

 

C’est Prigogine et non plus Langevin. On cite souvent Langevin dans le cadre de la théorie quantique, en relation avec Fokker-Planck et Feynman : le contexte y est COMPLETEMENT DIFFERENT. En théorie quantique, le mouvement du CORPUSCULE x(t) dans l’espace n’a AUCUNE RAISON D’ETRE STATISTIQUE (en l’absence d’agitation thermique). Seulement, il est MASQUé par le « paquet d’ondes » qui ACCOMPAGNE ce corpuscule. Et ce paquet d’ondes est décrit par la statistique A CAUSE DU PRINCIPE D’INCERTITUDE qui, A TOUT SIGNAL et en particulier, le paquet d’ondes quantique, impose un non-déterminisme : l’impossibilité de mesurer exactement à la fois les caractéristiques du signal et celles de son spectre. C’est parce que la physique quantique se fonde essentiellement sur des mesures SPECTRALES (de niveaux d’énergie entre autres) qu’elle est entachée d’incertitude. Ce n’est pas parce que le corpuscule est « trop petit pour être suivi » : il suffit de regarder les tracés à haute énergie des accélérateurs de particules pour voir que les trajectoires de ces particules sont faciles à suivre… Pourtant, qui dit haute énergie dit forte agitation thermique… Enfin, comme son nom l’indique clairement, le « paquet d’ondes » est un PAQUET : c’est bien du COLLECTIF, plus de L’INDIVIDUEL !

Qu’est-ce qui engendre l’aléatoire, l’indéterminisme, dans les systèmes évoluant au cours du temps ? D’abord, c’est le COUPLAGE, L’INTERACTION, entre les mouvements de chaque composant du système ; ensuite, c’est le caractère FONCIEREMENT NON LINEAIRE DE LA PERTURBATION : dans les systèmes linéaires, point de chaos, point de statistique !

 

En finance, qu’est-ce qui engendre le risque sur l’évolution d’un prix ? Prenons le cas d’une société par actions. L’action a un prix X(t) au temps t. Qu’est-ce qui va rendre le cours de ce prix en partie aléatoire ? La stratégie de la société ? Si c’est le cas, on est mal… La stratégie est généralement PLANIFIEE. Ou la société est plutôt douteuse… Non, c’est le MARCHé EXTERIEUR A LA SOCIETE qui va influer sur la stratégie de la société et donc, sur le cours de son action : il s’agit donc de perturbations EXTERIEURES. Une OPA hostile, par exemple, n’est pas toujours prédictible à l’avance (si elle est bien conduite) et fait généralement chuter le cours. Autrement, le cours de l’action AU SEIN DE LA SOCIETE, EN DEHORS DE TOUTE PERTURBATION EXTERIEURE, est déterministe, puisqu’il résulte d’une planification de la stratégie de l’entreprise sur une durée donnée. Mettez la société sur le marché, vous l’exposez aux LOIS DU MARCHé, son action constitue dès lors un COMPOSANT DE L’ENSEMBLE DES PRIX SUR LE MARCHé (d’actions), son évolution au cours du temps est alors influencée par LES AUTRES PRIX, dans une dynamique de marché D’ENSEMBLE et là, on a un FAISCEAU DE PRIX. Dont l’évolution ne peut plus être décrite que par la statistique.

Voilà la différence.

Langevin : on prend un ensemble d’équations déterministes couplées ou pas, on y rajoute des termes de bruit ;

Prigogine : on prend un ensemble d’équations LOCALES, déterministes, couplées entre elles, puis on passe aux échelles intermédiaires et on décrit un FAISCEAU MESOSCOPIQUE DE TRAJECTOIRES à l’aide d’une fonction de distribution statistique, sans introduire aucun terme de bruit dans les équations locales…

Pourquoi des PROBABILITES ? parce qu’on ne sait pas toujours PREDIRE UN ENSEMBLE DE RESULTATS A L’AVANCE. C’est tout ! Sinon, une fois ces résultats affichés, plus de hasard…

En mécanique quantique, c’est la même chose : une fois UN résultat observé, on peut dire que « la particule a été observée avec UNE ENERGIE E, UNE IMPULSION P ET DANS LA DIRECTION THETA ». Pourquoi chercher à savoir à l’avance ? parce qu’on veut savoir à quoi s’attendre, avec le moins d’erreur possible.

On peut introduire du bruit dans des équations aux dérivées partielles, parce que la position du champ dans l’espace est une donnée INDEPENDANTE du temps. On ne peut pas introduire de bruit dans un système dynamique :

  1. parce que la position des composants de ce système change au cours du temps ;
  2. parce qu’on superpose à une représentation MICROSCOPIQUE des termes apparaissant à un niveau MESOSCOPIQUE et
  3. parce qu’au niveau microscopique, on est INDIVIDUEL, alors que tout bruit résulte d’un comportement COLLECTIF (ensemble de fluctuations).

Il ne faut pas confondre la THERMODYNAMIQUE, où le bruit résulte de fluctuations (thermiques) qui agitent les molécules en tous sens avec la MECANIQUE, où le bruit ne peut se décrire qu’à une échelle GRANDE DEVANT CELLE DES COMPOSANTS DU SYSTEME, MAIS ENCORE PETITE DEVANT CELLE DU SYSTEME TOUT ENTIER.

Si on raisonne « thermo », on dira, en effet, que la nature aléatoire du processus provient de l’échelle microscopique. Mais alors, on raisonne en termes de CHAMPS !

Si l’on décrit des systèmes DYNAMIQUES, on raisonne « MECA ». Et là, on est forcé d’admettre que les mouvements individuels sont foncièrement déterministes et que le bruit ne peut provenir de l’échelle microscopique, mais d’une échelle de description supérieure, où les phénomènes collectifs apparaissent.

Chez Langevin, Ito et al, on écrit des systèmes DYNAMIQUES et on raisonne THERMO… Non...

Chez Fokker-Planck, d’accord : parce qu’on décrit des CHAMPS… Chez Feynman aussi, A CONDITION de rester dans la description en CHAMPS.

D’ailleurs, on appelle « limite THERMODYNAMIQUE » la limite SPATIALE des grands systèmes dont le nombre de composants tend théoriquement vers l’infini… Ceci ne peut se décrire qu’à l’aide de CHAMPS SPATIO-TEMPORELS…

Et on appelle « limite ASYMPTOTIQUE » la limite TEMPORELLE d’un système composé d’un nombre QUELCONQUE d’éléments (petit, grand) dont la DUREE D’EVOLUTION tend vers l’infini… Ceci peut se décrire, soit pour des systèmes dynamiques, soit pour des champs évoluant au cours du temps.

Brown, c’est aussi ça : quand on passe à l’approximation du continu, on fait tendre le nombre N d’éléments du système vers l’infini, ce qui correspond en fait à la limite ASYMPTOTIQUE et non THERMODYNAMIQUE, puisque N = t/tau est un rapport de temps…

On a pourtant coutume de dire, à juste titre, que LA BOURSE EST CHAOTIQUE…

Ça se traite par la théorie du chaos, pas par le mouvement brownien et dérivés.

 

 

Minibluff the card game

Hotels