doclabidouille
BIDOUILLE 10 : DERIVATION NON LINEAIRE
Le 02/11/2012
Dans cet article, je propose d’étendre les notions linéaires duales de dérivée et de différentielle. Avec, comme toujours, quelques surprises à la clé, certaines de taille.
On part donc de la formule des accroissements finis : soient E et F deux ensembles, f : E -> F une application de E dans F, x un élément de E (un point si E est muni d’une structure d’espace affine) et h > 0 un autre élément de E, distinct de x.
Définition 1 : On appelle nombre dérivé de f en x, la quantité :
- Dhf(x) = [f(x+h) – f(x)]/h
Il ne s’agit PLUS d’une approximation linéaire : le nombre Dhf(x) dépend généralement de x et de h de façon NON linéaire. En fait, il mesure le rapport à h de l’écart entre la valeur de f en l’élément x+h et sa valeur en l’élément x. On retrouve l’approximation linéaire en passant à la limite :
- Limh->0 Dhf(x) = Df(x)
Ce que l’on peut écrire en termes d’opérateurs seuls :
- Limh->0 Dh = D
Nous verrons pour les subtilités ensuite. Pour l’instant, établissons des propriétés fort générales. On remarque tout d’abord qu’en remplaçant h par nh dans (1), où n est un entier naturel, on a :
- Dnhf(x) = [f(x+nh) – f(x)]/nh
d’où :
- f(x+nh) = f(x) + nhDnhf(x)
Calculons à présent les dérivées successives de f en x :
D²hf(x) = [f(x+2h) – 2f(x+h) + f(x)]/h²
D3hf(x) = [f(x+3h) – 3f(x+2h) + 3f(x+h) – f(x)]/h3
…
Dnhf(x) = h-nSk=0n (-1)kCknf[x+(n-k)h]
Soit, en utilisant (5) et en termes d’opérateurs :
- hnDnh = (hDh)n = Sk=0n-1 (-1)kCkn(n-k)hD(n-k)h (S = somme discrète)
Réciproquement, on établit facilement la relation inverse :
- Id + nhDnh = (Id + hDh)n
qui montre qu’une homothétie sur h se traduit en une loi de puissance.
Chose assez étonnante vu le caractère (fortement) non linéaire de Dh, on a encore les propriétés de linéarité suivantes :
- Dh[f(x) + g(x)] = Dhf(x) + Dhg(x) et
- Dh[af(x)] = aDhf(x) , a un élément du corps considéré (N, Q, R, C, etc.).
Il suffit, en effet, de regarder (1) pour s’assurer que, même sur les espaces discrets, Dhf(x) se définit sans ambiguïté dès que f est définie en les points utilisés. Justement, Dhf(x) ne peut exister que si et seulement si f est définie à la fois en x et en x+h, ce qui est loin d’être établi a priori, puisque cela dépend du domaine de définition def(f) de f. De même, D²hf(x) n’est définie que ssi f est définie à la fois en x, x+h et x+2h. Etc. Il s’ensuit que Dnhf(x) ne sera définie que ssi f est définie en x, x+h, x+2h,…, x+nh, ce qui réduit considérablement, non pas def(f), mais def(Dnhf).
On ne trouve pas de telle complication à l’approximation linéaire : dès qu’on fait tendre h vers zéro, à la limite, il suffit que Dnhf soit définie en x, quel que soit l’entier n >=0.
Prenons tout de suite un exemple, important en physique et à partir duquel nous établirons une proposition générale et son corollaire : f : R -> R, x -> f(x) = (1 – x²)1/2. Le domaine de définition de f est def(f) = [-1,+1], il est donc borné et même compact. Vis-à-vis de la dérivation usuelle (linéaire), f est clairement Doo et même Coo sur ]-1,+1[, puisque f et toutes ses dérivées sont continues sur cet intervalle ouvert (f est même continue aux extrémités -1 et +1, mais pas ses dérivées). Il n’en est plus de même, loin de là, vis-à-vis de la dérivation non linéaire. Nous venons de voir, en effet que, pour que Dnhf(x) soit définie, il faut et il suffit que les points successifs x, x+h,…, x+nh appartiennent à def(Dnhf), ce qui conduit aux inégalités suivantes :
-1 =< x =< +1 , -1 =< x+h =< +1,…, -1 =< x+nh =< +1
qui doivent être satisfaites simultanément (ou conjointement, c’est selon), ce qui conduit à l’inégalité unique :
- -1 =< x =< 1 – nh
Il devient alors évident que, pour h > 0 non nul, il apparaît une limite supérieure à l’ordre de dérivation. Cette limite est donnée par l’entier N satisfaisant à :
(9) 1 – Nh = -1 d’où N = E(2/h)
Où E(.) désigne la partie entière, puisqu’alors le domaine de définition de DNhf se réduit au singleton {-1}, c'est-à-dire, à un seul point ! Au-dessus, DN+1h n’existe pas car les points x + (N+1)h sortent tous du domaine de définition de f.
Conclusion : pour h > 0 non nul, (1-x²)1/2 est DN sur [-1,+1] avec N = E(2/h) < oo et CN sur ]-1,+1[.
CONTRAIREMENT AUX PREJUGéS, LA FONCTION f(x) = (1-x²)1/2 (FACTEUR DE LORENTZ) N’EST PAS LISSE. LE PASSAGE A LA LIMITE h -> 0 (APPROXIMATION LINEAIRE) FAUSSE LE JUGEMENT.
Or, cette description, « macroscopique » en physique, est clairement idéaliste. Bien sûr, si h est de l’ordre du rayon de Planck, soit 10-35, N sera de l’ordre de 2x10-35, ce qui est énorme… mais reste néanmoins fini. Au-delà, on n’est plus dérivable. Ce qui change quand même radicalement la nature du mouvement. Et des équations censées le décrire.
Enonçons maintenant notre proposition :
PROPOSITION : Soit f : R -> R, x -> f(x) une application telle que def(f) soit borné : def(f) = [x1,x2] avec x1 =< x2 (resp. ]x1,x2], [x1,x2[, ]x1,x2[). Alors, f est de classe DN sur def(f) avec N = E[(x2 – x1)/h]. Si, de plus, f est continue sur def(f), alors f est CN sur def(f).
En effet, Dnhf(x) ne sera définie que ssi les inégalités suivantes sont simultanément satisfaites : x1 =< x =< x2, x1 =< x + h =< x2,…, x1 =< x+nh =< x2, ce qui conduit à l’inégalité unique x1 =< x =< x2 – nh. Def(Dnhf) se réduira à {x1}, ultime étape de la dérivabilité de f pour x2 – nh = x1, soit N = E[(x2 – x1)/h], comme annoncé. D’autre part, f est bien de classe DN sur def(f) tout entier, puisque f(x), f(x+h),…, f(x+Nh) sont toutes définies sur def(f). Enfin, la continuité de f se transmet à ses dérivées, comme le montrent (1) et (6).
COROLLAIRE : f est Doo (resp. Coo) sur def(f) ssi def(f) est non borné.
Dans ce cas, en effet, l’une des extrémités de def(f) est nécessairement rejetée à l’infini (positif ou négatif) et l’entier N = oo.
Etablissons d’autres formules de base de la dérivation. Tout d’abord, le produit de deux applications f(x) et g(x). On a :
Dh[f(x)g(x)] = [f(x+h)g(x+h) – f(x)g(x)]/h.
Utilisons (5) pour n = 1 :
(10) Dh[f(x)g(x)] = {[f(x) + hDhf(x)][g(x) + hDhg(x)] – f(x)g(x)}/h
= g(x)Dhf(x) + f(x)Dhg(x) + hDhf(x)Dhg(x)
On reconnait bien sûr les deux premiers termes de la dérivée usuelle du produit, D étant remplacée par Dh, mais il apparaît désormais un troisième terme, produit des dérivées, qui s’annule pour h -> 0. Tant mieux d’ailleurs, car c’est surtout ce terme supplémentaire qui exhibe la nature non linéarisante de Dh.
(11) Dh[1/g(x)] = [1/g(x+h) – 1/g(x)]/h = -[g(x+h) – g(x)]/hg(x+h)g(x) =
= -Dhg(x)/g(x)[g(x) + hDhg(x)]
Eh oui : c’est un petit plus compliqué que lorsque h -> 0…
A partir de cette formule, nous déduisons facilement l’expression de la dérivée d’un quotient :
Dh[f(x)/g(x)] = [Dhf(x)]/g(x) + f(x)Dh[1/g(x)] + hDhf(x)Dh[1/g(x)]
= [Dhf(x)]/g(x) - f(x)Dhg(x)/g(x)[g(x) + hDhg(x)] - hDhf(x)Dhg(x)/g(x)[g(x) + hDhg(x)]
= {[g(x) + hDhg(x)]Dhf(x) - f(x)Dhg(x) - hDhf(x)Dhg(x)}/g(x)[g(x) + hDhg(x)]
Soit, en fin de compte :
- Dh[f(x)/g(x)] = [g(x)Dhf(x) – f(x)Dhg(x)]/g(x)[g(x) + hDhg(x)]
Etonnamment, le terme supplémentaire de (10) a disparu : on retrouve au numérateur une forme semblable à celle dans le continu (h -> 0). Comme, pour f(x) = 1, Dhx = 0, on retrouve bien (11).
Donnons quelques exemples pratiques de dérivée non linéaire de fonctions connues.
- Dh(xn) = [(x+h)n – xn]/h = Sk=0n-1 Cknhn-k-1xk, avec n entier >=0 ;
On voit bien, dans cet exemple, la non linéarité de Dh. A la limite h -> 0 ne subsiste plus que le dernier terme k = n-1 qui donne bien nxn-1.
- Dh(eax) = [ea(x+h) – eax]/h = eax(eah – 1)/h , a réel ;
Surprise ! Pour a = 1, ex n’est plus égale à sa dérivée ! Ce qui a des conséquences non négligeables sur toute la théorie des EDOs linéaires, puisque le polynôme caractéristique se fonde justement sur cette propriété « universelle » de la fonction exponentielle dans le continu… On ne peut même pas approcher le facteur (eah – 1)/h, puisqu’il peut prendre une valeur arbitraire, voire arbitrairement grande ! Par contre, on a :
- Dnh(eax) = [(eah – 1)/h]neax , n entier >= 0
qui conserve encore une propriété multiplicative.
Dh(xa), a réel > 0 ?
On utilise la propriété xa = exp(aLnx) ? on n’obtiendra plus grand-chose. On utilise une approximation ? on ne peut pas ! Alors, comment fait-on ? Le « moins pire » me paraît être encore ceci :
- (x+h)a = I0a Cbaha-bxbdb , Cba = PI(b)/PI(a)PI(a-b) , I = intégrale (somme continue).
Alors,
- Dh(xa) = h-1[I0a Cbaha-bxbdb – xa]
Pff… pas le pied. Si quelqu’un trouve mieux, plus en rapport avec la dérivée linéaire, tant mieux.
- Dérivée non linéaire d’une fonction de fonction :
Alors, ça, c’est pas beau, comme formule… :( je préviens de suite… :)
Dhf[g(x)] = {f[g(x+h)] – f[g(x)]}/h = {f[g(x) + hDhg(x)] – f[g(x)]}/h
On effectue les substitutions x -> g(x), h -> hDhg(x) = y(x,h), ce qui donne :
- Dhf[g(x)] = y(x,h)Dy(x,h)f[g(x)]/h = Dhg(x)Dy(x,h)f[g(x)]
On peut expliciter un peu mieux cette formule à l’aide de la notion de différentielle non linéaire, duale de la notion de dérivée non linéaire.
DEFINITION 2 : Soit f comme dans la définition 1. On appelle différentielle de f en x la quantité :
- dhf(x) = hDhf(x)
Evidemment, cette différentielle-là n’a plus grand-chose à voir avec un infiniment petit du premier ordre…
On note tout de suite que :
- dhx = h et Limh->0 dh = d
qui montre que h est bien la quantité « unité ». La différence est que l’utilisateur se la fixe lui-même en fonction du problème qui se pose à lui : elle n’est plus une grandeur « universelle », « proche de zéro ». Sous forme différentielle, (6) et (7) deviennent :
- dnh = Sk=0n-1 (-1)kCknd(n-k)h
- Id + dnh = (Id + dh)n
Dans (18), on aura donc y(x,h) = dhg(x). Cette notation ne devrait pas choquer : dh n’est PLUS un opérateur infinitésimal. C’est à la limite que y(x,0) = dg(x) EST une quantité infinitésimale du premier ordre. Mais, encore une fois, il s’agit d’une approximation, d’une idéalisation. A cette limite, (18) donne Dg(x)Ddg(x)f[g(x)] = Dg(x){f[g(x)+dg(x)] – f[g(x)]}/dg(x) = Dg(x)Df[g(x)]/dg(x), qui est bien l’expression dans le continu.
Circonstance importante : pour définir la différentielle non linéaire de f en un point x, on n’a plus besoin que f soit définie au voisinage de ce point, il suffit que f soit définie en x et x + h. Cette condition est aussi nécessaire. En effet, si Dhf(x) est définie, alors dhf(x) sera définie, au point x même. Réciproquement, si dhf(x) existe en x, Dhf(x) = dhf(x)/h existe.
On n’a pas du tout la même chose dans le continu : quand h -> 0, on trouve des dérivées sans différentielles, ce qui conduit quand même à une mise en défaut de la dualité et on a besoin que la fonction considérée soit définie, non seulement au point choisi, mais en son voisinage. Ce qui induit des complications topologiques telles que de considérer partout des boules centrées en des points. Ici, pas de boules. Plus besoin. Quand les valeurs de x+nh sortent du domaine de définition de f, la différentielle n’existe plus, point. Bon ou mauvais voisinage, elle n’existe plus. :)
La prochaine fois, je tente l’intégration.
Commentaires textes : Écrire
BIDOUILLE N°9 : CONVOLUTION ET DERIVEE NON ENTIERE
Le 28/10/2012
1ER ASPECT : SUR LA CONVOLUTION DES FONCTIONS.
http://www.johndcook.com/blog/2009/10/25/how-to-differentiate-a-non-differentiable-function/
Au sujet de la derivation des distributions :
« We can use this procedure to define as many derivatives of f as we’d like, as long as f is integrable. So f could be some horribly ill-behaved function, differentiable nowhere in the classical sense, and we could define its 37th derivative by repeatedly applying this idea.”
C’est tout à fait ce qu’on trouve chez tous les auteurs et notamment Laurent Schwartz. J’ai cependant noté une circonstance bizarre. Reprenant la trop bien connue équation de la chaleur et son noyau gaussien, j’ai fait quelques calculs simples de solutions de cette équation : si f(x,0) est la valeur initiale du champ (i.e. à t = 0), la valeur de ce champ à l’instant t s’obtient par convolution avec le noyau. En dimension spatiale 1 :
(1) f(x,t) = IR f(x’,0)rhô(x-x’,t)dx’ (I = intégrale)
(2) rhô(x-x’,t) = exp[-(x – x’)²/4Dt]/2(pi.Dt)1/2
Et je me suis aperçu de la chose suivante :
SI f(x,0) EST UNE FONCTION Dn (DIFFERENTIABLE JUSQU'A L’ORDRE n) OU Cn (CONTINUEMENT DIFFERENTIABLE JUSQU'A L’ORDRE n), SON EXTENSION f(x,t) PRESENTE MEME REGULARITE !
Les sceptiques le vérifieront rapidement. J’en suis resté quelque peu baba… Que fait le noyau gaussien ? Il ajoute des termes en puissances de sigma = 2Dt à f(x,0), qui s’annulent tous en sigma = 0 (donc homogènes). C’EST TOUT !!! 8(((
On me dira que c’est un faux problème, puisque, toute fonction nulle étant indéfiniment dérivable (et même continuement), in fine, f(x,t) PEUT ETRE classée Coo. Il n’en reste pas moins que les seules dérivées NON NULLES de f(x,0) vont jusqu’à l’ordre n (supposé fini) et qu’il s’avère en être de même pour f(x,t). Aux ordres > n, les dérivées de f(x,0) ET de f(x,t) sont toutes nulles…
J’en suis resté baba, car ceci interpelle : A QUOI sert donc le noyau, sinon à ajouter des termes, étendre la fonction de départ f(x,0) à tout instant t ?
LE NOYAU DISTRIBUTIF NE REGULARISE PAS LA FONCTION
A LAQUELLE IL S’APPLIQUE !!!
La convolution avec un noyau Coo permet effectivement de calculer des dérivées distributives à tout ordre, mais ne lisse pas la fonction pour autant. La régularisation n’est donc que fictive.
En revanche, il permet de trouver l’expression du champ f(x,t) à tout instant t ne connaissant que sa valeur f(x,0) en t = 0. ça, oui. Mais f(x,t) N’EST PAS Coo !!!
Donc, il n’est pas régularisé… On s’est tous fait piéger là-dessus.
2EME ASPECT : SUR LA NOTION DE DERIVEE NON ENTIERE.
http://web.univ-pau.fr/~jcresson/cresson-adda1.pdf (entre autres réfs sur le sujet)
L’argument de base est le caractère non local de ce type de dérivée.
Je prends une fonction f(x) de classe C1. Je peux définir une dérivée d’ordre 1 f’(x), qui sera continue. f(x) est la valeur LOCALE de f au point x, d’accord ? De même, f’(x) est la valeur LOCALE de f’ au point x. Considérons la dérivée d’ordre ½ de f(x), en supposant qu’elle existe. Cette dérivée est forcément comprise entre f(x) et f’(x), toujours d’accord ? Alors, pour quelle raison deviendrait-elle subitement NON locale ?...
Comment peut-on devenir GLOBALE en restant entre 2 bornes LOCALES ?...
Ça me paraît relever du raisonnement (par l’)absurde…
On invoque aussi la formule de Leibnitz. Soit. Et alors ? la dérivée n-ième d’une fonction f, calculée suivant Leibtnitz, RESTE LOCALE…
LA NOTION DE DERIVEE EST UNE NOTION ESSENTIELLEMENT LOCALE.
La dérivée non entière d’une constante doit-elle rester nulle ? Oui : soit f(x) = C, constante, f’(x) = 0 et donc, toute dérivée de f d’ordre compris entre 0 et 1 (exclu) doit être comprise entre f(x) et f’(x), donc entre C et 0, ce qui nous fixe déjà des bornes. Ensuite, une fonction constante n’ayant, par définition et construction, aucune variation, il s’ensuit que la valeur de TOUTES les dérivées d’ordre compris entre 0 et 1 exclu est forcément zéro.
La dérivée non entière de ex ? Idem : f(x) = ex => f(n)(x) = ex quel que soit l’entier naturel n. Par conséquent, toute dérivée d’ordre 0 =< a < 1 de f(x) doit être comprise entre f(x) et f’(x) = f(x). Conclusion : f(a)(x) = ex.
LA DERIVEE DE TOUTE ORDRE, ENTIER OU NON, DE LA FONCTION EXPONENTIELLE
EST LA FONCTION EXPONENTIELLE ELLE-MEME.
Ceux qui trouvent un résultat différent sont conviés à revoir leur copie… Ou à m’expliquer comment une autre fonction pourrait rester comprise entre ex et ex…
S’assurer, en effet, que la dérivée d’une constante était bien nulle était la première chose à faire avant de proposer sa théorie (réf. à Riemann-Liouville)… :)
Sur la COMMUTATIVITé, également. Encore un autre point « fort »… :)
M’expliquer, svp, pourquoi, tout aussi subitement, la composition de dérivées ne serait plus commutative aux ordres non entiers, mais seulement entiers…
Il devrait quand même tomber sous le sens commun que, lorsqu’une théorie aboutit à des résultats pareils, on s’interroge sérieusement sur sa validité…
En plus, la commutativité n’a rien à voir avec la dérivation, ce sont 2 notions à part…
Y a-t-il une connexion, ici ? A-t-on affaire à une variété différentiable ? Non ? Alors ?
On n’est pas chez De Rham, à ce que j’ai compris…
C’est une méthodologie assez générale chez les matheux : le RAFISTOLAGE. On cherche des RUSTINES à appliquer à des modèles SCABREUX… donc, on se BASE sur ces modèles et on les RACCOMODE… bin, non : quand c’est faux, c’est faux. Autant tout recommencer.
On cherche aussi la dérivée d’ordre a de f(x) comme un rapport (différence entre 2 valeurs de f en 2 points infiniment proches)/dxa. Intuitivement logique. Mais faux.
Parce que f(x + adx) est d’ordre dxa… Autrement dit, une dilatation/contraction sur le différentiel dx se traduit EN UNE LOI DE PUISSANCE SUR LA FONCTION.
Donc, limy-> +/-x [f(y) – f(x)]/dxa CONDUIT A DES INFINIS. Et donc, n’est pas constructible. En effet, posons y = x +/- dx, alors f(y) est une somme continue (intégrale) de monômes de la forme f(b)(x)dxb, pour 0 =< b =< a, donc tous < a, sauf le terme dominant en f(a)(x)dxa et diviser par dxa nous conduit inévitablement à des infinis pour dx -> 0…
Et c’est parfaitement normal : on s’inspire d’un modèle FAUX…
En plus, page 6, les auteurs donnent un exemple de fonction höldérienne qui montre on ne peut plus explicitement l’inconstructibilité de leur formulation !!! On trouve sigma/2k ??? Non. Le passage à la limite me fait tout tendre vers zéro.
La définition de la dérivée fractale locale serait applicable si et seulement si f(x +/- dx) ne comportait que les termes f(x) (ordre 0 de petitesse) et f(a)(x)dxa (ordre a de petitesse), ce qui n’est pas vrai. pour commencer, c'est f(x + adx) qui est d'ordre dxa. D’ailleurs, les formules (19-20-21) page 12 montrent bien que la linéarité des fonctions différentiables a été remplacée par une « quasi-linéarité » de la forme f(x + dx) = f(x) + f(a)(x)dxa, ce qui est totalement faux. Quant à la formule de dérivation des fonctions composées (18), essayer simplement de la retrouver aux ordres entiers… lol
Si c’était aussi simple, ça se saurait depuis longtemps…
La propriété (iii) de la proposition (2.4), propriété relative à la dérivation des produits de fonctions ? Impossible… On a déjà une formule de Newton-Leibnitz pour des ordres entiers. Alors, pour des ordres rationnels et a fortiori IRrationnels…
Si on trouve déjà une somme discrète pour des entiers, on doit s’attendre à une somme discrète sur des rationnels pour les rationnels (finis) et à une intégrale pour des irrationnels…
Voila ce qui arrive quand on cherche à sauver des modèles plus anciens.
Mais les autres modèles construits sur des généralisations de Newton-Leibnitz au continu ne sont pas plus fiables, même si on y trouve des intégrales (d’ordre)…
Si Leonhard Euler a su construire sa « fonction gamma » et sa « factorielle généralisée », il aurait sûrement su obtenir des formules de dérivation non entière. Il avait tout à disposition pour cela. S’il ne l’a pas fait et si personne n’y est parvenu depuis, c’est « qu’y a un truc »…
On n’utilise pas plus d’outils mathématiques qu’eux. Pas plus : intégrales, différences finies, limites, récurrences.
Pourquoi ?
Parce que, jusqu’à preuve du contraire, on n’a encore rien d’autre… :)
Commentaires textes : Écrire
BIDOUILLE 8 : REBIDOUILLAGE DANS L'ESPACE DES PRIX
Le 16/10/2012
A présent les problèmes exposés de Bidouille 4 à Bidouille 7, on rebidouille depuis le départ.
Alors… on reprend la loi binomiale (2 états), on appelle P la probabilité d’obtenir un événement quelconque et 1-P celle de ne pas l’obtenir (non événement). On a P + (1-P) = 1. Donc, quel que soit le REEL (positif ou nul) X, on aura [P + (1 – P)]X = 1. Développons suivant la formule du binôme de Newton ETENDUE AU CONTINU :
- [P + (1-P)]X = S0X CxXPx(1-P)X-xdx = S0X PX(x,P)dx = 1 , CxX = PI(X)/PI(x)PI(X-x) , (S = intégrale)
PI(.) étant la factorielle d’Euler. La densité de probabilité est maintenant :
- PX(x,P) = CxXPx(1-P)X-x
fonction CONTINUE et même INDEFINIMENT DIFFERENTIABLE de x, puisque 0=< x =< X. X est une quantité DETERMINISTE, x est la VARIABLE STOCHASTIQUE. Un calcul similaire au cas entier montre que la moyenne de x est :
- <x> = XP
tandis que celle de x² est :
- <x²> = XP + X(X-1)P² = <x>(1-P) + <x>²
puisque PI(x) = PI(x-1)x. L’incrément / décrément reste donc de 1. Ce qui n’empêcherait nullement de chercher des moyennes de puissances NON ENTIERES de x, quoique les formules ne soient plus aussi simples, dû au fait que la factorielle d’Euler ne vérifie qu’un petit nombre de propriétés itératives. Décomposons x en sa moyenne <x> et une fluctuation ksi : x = <x> + ksi. Ça se critique, car c’est de l’approche « modèle de champ moyen ». D’après (3) et (4), nous trouvons :
- <ksi> = 0
- <ksi²> = <(x - <x>)²> = <x² - 2x<x> + <x>²>
= <x²> - 2<x>² + <x>² = <x²> - <x>² = sigma²
La moyenne de la fluctuation est donc nulle, tandis que la moyenne de son carré est égale au carré de l’écart-type ou variance sigma. A l’approximation gaussienne, seules les moyennes des puissances PAIRES de ksi sont non nulles. Dans le cas de la distribution binomiale, seule <ksi> est toujours nulle.
On passe dans L’ESPACE DES PRIX. Ici, x est le prix (fluctuant), le plancher est fixé à zéro et le plafond à X. <x> est le prix moyen, ksi est la fluctuation de prix. Il s’agit de savoir dans quelle mesure on peut chercher la VARIATION DU PRIX AU COURS DU TEMPS à l’aide d’une équation DIFFERENTIELLE.
Déjà, x ne suffit pas, il faut passer aux COURBES DE PRIX x(t). ça ne pose pas de problème particulier dans les calculs précédents, où l’on remplacera x par x(t). Mais alors, les moyennes montrent immédiatement que X, P ou les deux à la fois doivent dépendre du temps. Si P varie au cours du temps, la condition de conservation de la probabilité doit être localisée en :
(7) P(t) + [1 – P(t)] = 1 à chaque instant t dans un intervalle [0,T]
avec T éventuellement infini. Partant de là, on peut envisager quelque chose. Mais les difficultés techniques ne sont pas terminées, loin s’en faut. Pour qu’on puisse définir au moins dx(t)/dt, il faut (et il suffit) que la courbe x(t) soit C1 sur [0,T]. Si elle n’est que C0, inutile d’aller plus loin. Supposons qu’elle soit C1. Elle possède déjà une certaine régularité. Alors, on peut chercher la variation de prix au cours du temps sous la forme d’un CHAMP :
- dx(t)/dt = V[x(t),t]
Mais attention ! x(t) est désormais une fonction STOCHASTIQUE du temps (déterministe !) et V est une fonctionnelle du temps et de cette fonction stochastique x(t). Sinon, on ne voit pas bien comment on peut construire une relation fonctionnelle qui tienne la route… Ou alors, il faut passer à une équation INTEGRALE de la forme :
- x(t) = x(t0) + Stot V[x(t’),t’]dt’
La différence, c’est que, dans la formulation intégrale, on n’a plus besoin de régularité : il suffit que la fonctionnelle V soit continue en t sur l’intervalle d’intégration. Elle peut même être continue par morceaux, de sorte que la courbe x(t) peut n’être que continue, voire continue par morceaux. Mais l’écriture (7) n’est plus partout équivalente à (8), en raison des discontinuités. (7) peut même ne plus être justifiée du tout ! C’est précisément ce qui se produit lorsque x(t) n’est différentiable NULLE PART…
Pour coller à la généralité, on préfèrera donc l’équation intégrale à l’équa diff.
Et il serait hasardeux d’affirmer que (8) est solution de (7)… : dès que (7) ne peut plus s’écrire, en raison du caractère trop irrégulier de la courbe, (8) en devient complètement indépendante et doit se résoudre par la méthode de Volterra.
Après, la régularité de V en x(t) ne pose pas de problème particulier pour la résolution : si V est CN en x(t), on l’écrira sous la forme :
- V[x(t),t] = Sn=0n=N Vn(t)xn(t)/n ! (S = somme discrète ici)
où les coefficients Vn(t) se calculent comme les dérivées n-ièmes de V au voisinage de la courbe nulle x(t) = 0.
On peut reprendre la décomposition x(t) = <x(t)> + ksi(t) comme ci-avant. <x(t)> est alors le MOYEN MOUVEMENT du prix x(t) et ksi(t), la fluctuation autour de ce moyen mouvement. Il est évident que <x(t)> sera solution d’une équation DETERMINISTE. Mais, due à la non-linéarité de V dans le cas général, l’équation du moyen mouvement dépendra encore des moyennes des puissances de ksi(t) supérieures ou égale à 1. Et puis, on réalise une dichotomie, ce qui est la critique principale formulée à l’encontre des modèles de champ moyen. Mieux vaut encore chercher la résolution de (8) pour le processus stochastique x(t) dans son ensemble, PUIS prendre la moyenne de la solution obtenue. Cette moyenne fournira <x(t)> et la différence x(t) - <x(t)>, la fluctuation ksi(t).
Ceux qui ont du temps à perdre ou qui visent une distinction particulière :) peuvent toujours calculer DIRECTEMENT la moyenne de (8), en utilisant (9). Ça ne les avancera sans doute pas à grand-chose, mais ils obtiendront, à n’en pas douter, une relation intéressante d’un point de vue… scholastique, cette fois. :)
Un dernier aspect technique, pour finir : la dérivation TOTALE par rapport au temps.
On trouve dans tous les bons manuels traitant de statistiques et de mouvements aléatoires une construction absolument merveilleuse de la dérivée totale d/dt par rapport au temps pour les processus stochastiques.
Je ne dois pas être bien malin, car je ne suis jamais parvenu à la retrouver. Par contre, elle m’est toujours apparue comme ayant « une bonne tête d’opérateur qui va bien ». Quoiqu’il ne conduise pas pour autant à une propriété de conservation…
J’ai eu beau tourner et retourner la question dans tous les sens, je ne vois toujours pas comment on peut aboutir à :
D/dt = d/dt + (dx/dt)d/dx + ½ sigma².d²/dx²
(en traduction littérale, i.e. en « oubliant » les dépendances temporelles). Toujours pas. Y a de la magie dans l’air… Qui plus est, même avec dx/dt = 0, on ne retrouve pas l’équation de la chaleur, puisqu’on a alors d/dt + ½ sigma².d²/dx² = 0 et non d/dt - ½ sigma².d²/dx² = 0 comme attendu…
Reprenons notre champ V[x(t),t] et cherchons sa dérivée totale par rapport au temps, SI ELLE EXISTE (déjà…). La moindre des choses pour cela est que V soit C1 en t ET en x(t). Supposons que ce soit le cas. Supposons. Alors,
- DV[x(t),t]/dt = dV[x(t),t]/dt + {[dx(t)/dt].[d/dx(t)]}V[x(t),t]
= dV[x(t),t]/dt + {V[x(t),t].d/dx(t)}V[x(t),t]
AVEC les dépendances fonctionnelles qui s’imposent. C’est la dérivée… d’Euler, toujours les mêmes. Et d’où provient le terme supplémentaire +½ sigma².d²/dx² ? qui s’écrit d’ailleurs +½ sigma²(t)d²/dx²(t). Qu’est-ce qui le justifie ? une approximation C2 ? Et pourquoi donc TOUTE fonctionnelle stochastique devrait-elle être C2 en x(t), même dans le cas gaussien ? Rappelons-le : la gaussienne est DEJA une approximation d’ordre 2…
Une C2 en x(t) conduirait à une équation d’évolution avec second membre en x²(t) : c’est la généralité, ça ?...
L’argument consiste à dire que ce terme supplémentaire apparaît du fait que <ksi²> est non nulle. Et alors ? Même en gaussien, <ksi2n> est non nulle, pour tout n entier positif ou nul. On pourrait donc ajouter des termes supplémentaires ad infinitum, en plus…
C’est fallacieux, comme argumentaire.
Mathématiquement, c’est même incorrect, puisqu’on ajoute un terme du SECOND ORDRE DE PETITESSE à un opérateur du premier ordre : c’est incorrect du point de vue du calcul différentiel… Tout autant qu’écrire, comme j’ai déjà vu, dsigma² = 2Ddt ou, mieux (enfin, pire) l’équation de Boltzmann sous la forme : (différentielle d’ordre 1) = (fonction) !!!
Sans rire. J’ai la réf chez moi. Fallait oser…
Enfin, pourquoi une MOYENNE sigma²(t) = <ksi²(t)> et ce terme seul ? On dérive par rapport au processus x(t) tout entier…
Mystère…
Entre autres…
Commentaires textes : Écrire
BIDOUILLE 7 : ON A ENFIN CERNé LE FOND DU PROBLEME ?
Le 13/10/2012
Oui, je crois avoir enfin cerné le fond du problème.
D’abord, une rectification : l’équation de Boltzmann, que je cite dans Bidouille 6, est du même acabit, puisque la densité de probabilité est fonction des points MOBILES x(t) et p(t) (impulsions associées), ainsi que du temps, sur l’espace des phases du système : la dépendance temporelle subsiste donc.
D’autre part, le calcul d’Ito et al n’est pas en cause, mais résulte de la théorie des « systèmes dynamiques stochastiques » (systèmes dynamiques avec bruits), elle-même issue de la théorie de Langevin. Il faut donc revenir à cette dernière. Et c’est là qu’il y a confusion des genres. En 1908, date à laquelle Paul Langevin publia ses travaux, s’était excusable. Depuis, beaucoup de connaissances ont été accumulées sur le sujet.
On repart donc de l’article :
http://en.wikipedia.org/wiki/Ito_calculus
déjà mentionné dans Bidouille 5.
« In physics, usually stochastic differential equations, also called Langevin equations, are used, rather than general stochastic integrals. A physicist would formulate an Itō stochastic differential equation (SDE) as
dxk(t)/dt = hk + gklksil
where ksil is Gaussian white noise with <ksik(t1)ksil(t2)> = deltakldelta(t1 – t2) and Einstein's summation convention is used.”
On va revoir tout ça. Mais d’abord, on remonte le fil :
http://en.wikipedia.org/wiki/Langevin_equation
“In statistical physics, a Langevin equation (Paul Langevin, 1908) is a stochastic differential equation describing the time evolution of a subset of the degrees of freedom. These degrees of freedom typically are collective (macroscopic) variables changing only slowly in comparison to the other (microscopic) variables of the system. The fast (microscopic) variables are responsible for the stochastic nature of the Langevin equation.”
Non. Les variables microscopiques NE SONT PAS responsables de la nature stochastique du processus.
“The original Langevin equation[1] describes Brownian motion, the apparently random movement of a particle in a fluid due to collisions with the molecules of the fluid”
APPARENT ! Retenir ça pour la suite.
“However, the Langevin equation is used to describe the motion of a "macroscopic" particle at a much longer time scale, and in this limit the δ-correlation and the Langevin equation become exact.”
Approximation, donc. Une de plus. Ça commence à faire beaucoup.
“An essential condition of the derivation is a criterion dividing the degrees of freedom into the categories slow and fast.”
Peut-être, mais la classification en variables lentes et rapides date de la seconde moitié du 19ème siècle, bien avant Langevin : dans toutes les méthodes d’analyse ASYMPTOTIQUE des systèmes dynamiques hamiltoniens, on sépare en variables lentes et variables rapides. C’est Delaunay…
Il est aujourd’hui bien établi, grâce à la théorie du CHAOS DETERMINISTE, que :
LES TRAJECTOIRES DES ELEMENTS D’UN SYSTEME EVOLUTIFS (PARTICULES, COMPOSANTS DE BASE) SONT DETERMINISTES. C’EST L’ECHELLE DE DESCRIPTION MICROSCOPIQUE OU ENCORE LOCALE.
Si un système dynamique se compose de N « points matériels » (1D pour simplifier), l’évolution de la position dans l’espace xi(t) du i-ème élément (i = 1,…,N) obéit à une équation déterministe. A l’opposé :
A L’ECHELLE MACROSCOPIQUE OU ENCORE GLOBALE DU SYSTEME DANS SON ENSEMBLE, LE CHAMP MODELISANT CE SYSTEME OBEIT A UNE EQUATION AUX DERIVEES PARTIELLES DETERMINISTE. C’EST LA DESCRIPTION DITE « PHENOMENOLOGIQUE ».
ENTRE LES DEUX, aux échelles intermédiaires, la description ne peut être que STATISTIQUE, pas seulement (comme on le croyait jusqu’aux années 60) en raison d’une impossibilité de détailler le mouvement individuel de chaque élément du système sur un intervalle de temps donné (fini ou non), mais aussi pour des raisons SYSTEMIQUES, INHERENTES AU SYSTEME LUI-MEME, QUI SE MET A SE COMPORTER DE MANIERE TOTALEMENT IMPREVISIBLE A L’AVANCE. Ceci se produit pour des valeurs bien particulières des coefficients de la partie PERTURBATRICE. Mais le problème mécanique GENERAL ne s’aborde pas du tout de la même manière : il ne « suffit » pas, en effet, d’ajouter un terme de bruit à un ensemble d’équations locales déterministes pour rendre compte du phénomène. Ce qui se produit est ceci :
- si l’on examine, au « microscope », le mouvement D’UNE particule du système, on observe UNE trajectoire, continue ou pas, peu importe, mais parfaitement déterministe ;
- si l’on examine, après grossissement (résolution moindre) le système, on observe un FAISCEAU DE TRAJECTOIRES : c’est ce faisceau qui, soit en raison de collisions entre les particules du système (recoupements de trajectoires individuelles), soit en raison d’un changement radical de comportement (transition vers le chaos déterministe), qui ne peut se décrire qu’au moyen de la statistique.
C’est Prigogine et non plus Langevin. On cite souvent Langevin dans le cadre de la théorie quantique, en relation avec Fokker-Planck et Feynman : le contexte y est COMPLETEMENT DIFFERENT. En théorie quantique, le mouvement du CORPUSCULE x(t) dans l’espace n’a AUCUNE RAISON D’ETRE STATISTIQUE (en l’absence d’agitation thermique). Seulement, il est MASQUé par le « paquet d’ondes » qui ACCOMPAGNE ce corpuscule. Et ce paquet d’ondes est décrit par la statistique A CAUSE DU PRINCIPE D’INCERTITUDE qui, A TOUT SIGNAL et en particulier, le paquet d’ondes quantique, impose un non-déterminisme : l’impossibilité de mesurer exactement à la fois les caractéristiques du signal et celles de son spectre. C’est parce que la physique quantique se fonde essentiellement sur des mesures SPECTRALES (de niveaux d’énergie entre autres) qu’elle est entachée d’incertitude. Ce n’est pas parce que le corpuscule est « trop petit pour être suivi » : il suffit de regarder les tracés à haute énergie des accélérateurs de particules pour voir que les trajectoires de ces particules sont faciles à suivre… Pourtant, qui dit haute énergie dit forte agitation thermique… Enfin, comme son nom l’indique clairement, le « paquet d’ondes » est un PAQUET : c’est bien du COLLECTIF, plus de L’INDIVIDUEL !
Qu’est-ce qui engendre l’aléatoire, l’indéterminisme, dans les systèmes évoluant au cours du temps ? D’abord, c’est le COUPLAGE, L’INTERACTION, entre les mouvements de chaque composant du système ; ensuite, c’est le caractère FONCIEREMENT NON LINEAIRE DE LA PERTURBATION : dans les systèmes linéaires, point de chaos, point de statistique !
En finance, qu’est-ce qui engendre le risque sur l’évolution d’un prix ? Prenons le cas d’une société par actions. L’action a un prix X(t) au temps t. Qu’est-ce qui va rendre le cours de ce prix en partie aléatoire ? La stratégie de la société ? Si c’est le cas, on est mal… La stratégie est généralement PLANIFIEE. Ou la société est plutôt douteuse… Non, c’est le MARCHé EXTERIEUR A LA SOCIETE qui va influer sur la stratégie de la société et donc, sur le cours de son action : il s’agit donc de perturbations EXTERIEURES. Une OPA hostile, par exemple, n’est pas toujours prédictible à l’avance (si elle est bien conduite) et fait généralement chuter le cours. Autrement, le cours de l’action AU SEIN DE LA SOCIETE, EN DEHORS DE TOUTE PERTURBATION EXTERIEURE, est déterministe, puisqu’il résulte d’une planification de la stratégie de l’entreprise sur une durée donnée. Mettez la société sur le marché, vous l’exposez aux LOIS DU MARCHé, son action constitue dès lors un COMPOSANT DE L’ENSEMBLE DES PRIX SUR LE MARCHé (d’actions), son évolution au cours du temps est alors influencée par LES AUTRES PRIX, dans une dynamique de marché D’ENSEMBLE et là, on a un FAISCEAU DE PRIX. Dont l’évolution ne peut plus être décrite que par la statistique.
Voilà la différence.
Langevin : on prend un ensemble d’équations déterministes couplées ou pas, on y rajoute des termes de bruit ;
Prigogine : on prend un ensemble d’équations LOCALES, déterministes, couplées entre elles, puis on passe aux échelles intermédiaires et on décrit un FAISCEAU MESOSCOPIQUE DE TRAJECTOIRES à l’aide d’une fonction de distribution statistique, sans introduire aucun terme de bruit dans les équations locales…
Pourquoi des PROBABILITES ? parce qu’on ne sait pas toujours PREDIRE UN ENSEMBLE DE RESULTATS A L’AVANCE. C’est tout ! Sinon, une fois ces résultats affichés, plus de hasard…
En mécanique quantique, c’est la même chose : une fois UN résultat observé, on peut dire que « la particule a été observée avec UNE ENERGIE E, UNE IMPULSION P ET DANS LA DIRECTION THETA ». Pourquoi chercher à savoir à l’avance ? parce qu’on veut savoir à quoi s’attendre, avec le moins d’erreur possible.
On peut introduire du bruit dans des équations aux dérivées partielles, parce que la position du champ dans l’espace est une donnée INDEPENDANTE du temps. On ne peut pas introduire de bruit dans un système dynamique :
- parce que la position des composants de ce système change au cours du temps ;
- parce qu’on superpose à une représentation MICROSCOPIQUE des termes apparaissant à un niveau MESOSCOPIQUE et
- parce qu’au niveau microscopique, on est INDIVIDUEL, alors que tout bruit résulte d’un comportement COLLECTIF (ensemble de fluctuations).
Il ne faut pas confondre la THERMODYNAMIQUE, où le bruit résulte de fluctuations (thermiques) qui agitent les molécules en tous sens avec la MECANIQUE, où le bruit ne peut se décrire qu’à une échelle GRANDE DEVANT CELLE DES COMPOSANTS DU SYSTEME, MAIS ENCORE PETITE DEVANT CELLE DU SYSTEME TOUT ENTIER.
Si on raisonne « thermo », on dira, en effet, que la nature aléatoire du processus provient de l’échelle microscopique. Mais alors, on raisonne en termes de CHAMPS !
Si l’on décrit des systèmes DYNAMIQUES, on raisonne « MECA ». Et là, on est forcé d’admettre que les mouvements individuels sont foncièrement déterministes et que le bruit ne peut provenir de l’échelle microscopique, mais d’une échelle de description supérieure, où les phénomènes collectifs apparaissent.
Chez Langevin, Ito et al, on écrit des systèmes DYNAMIQUES et on raisonne THERMO… Non...
Chez Fokker-Planck, d’accord : parce qu’on décrit des CHAMPS… Chez Feynman aussi, A CONDITION de rester dans la description en CHAMPS.
D’ailleurs, on appelle « limite THERMODYNAMIQUE » la limite SPATIALE des grands systèmes dont le nombre de composants tend théoriquement vers l’infini… Ceci ne peut se décrire qu’à l’aide de CHAMPS SPATIO-TEMPORELS…
Et on appelle « limite ASYMPTOTIQUE » la limite TEMPORELLE d’un système composé d’un nombre QUELCONQUE d’éléments (petit, grand) dont la DUREE D’EVOLUTION tend vers l’infini… Ceci peut se décrire, soit pour des systèmes dynamiques, soit pour des champs évoluant au cours du temps.
Brown, c’est aussi ça : quand on passe à l’approximation du continu, on fait tendre le nombre N d’éléments du système vers l’infini, ce qui correspond en fait à la limite ASYMPTOTIQUE et non THERMODYNAMIQUE, puisque N = t/tau est un rapport de temps…
On a pourtant coutume de dire, à juste titre, que LA BOURSE EST CHAOTIQUE…
Ça se traite par la théorie du chaos, pas par le mouvement brownien et dérivés.
BIDOUILLE 6 : LE GLAS DU MOUVEMENT BROWNIEN POUR LES MODELES FINANCIERS ?
Le 11/10/2012
Suite et sans doute fin du dilemme portant sur les modèles financiers en temps continu basés sur le mouvement brownien et donc les processus de Markov.
Dans toutes les bonnes références techniques sur le sujet, on peut lire que le mouvement brownien entre dans la catégorie des processus de diffusion. NON ! Le mouvement brownien ne fait que S’APPARENTER à un processus de diffusion ! Pourquoi ?
DANS LE MOUVEMENT BROWNIEN,
LES VARIABLES x ET t NE SONT PAS INDEPENDANTES,
MAIS RELIEES ENTRE ELLES DE FAçON LINEAIRE.
Comme il apparaît clairement dans Bidouille 5, qui ne fait que reproduire les textes fondamentaux. Alors que :
DANS LA DIFFUSION STOCHASTIQUE,
LES VARIABLES x ET t SONT COMPLETEMENT INDEPENDANTES.
En effet, ce type de diffusion est, dans le cas gaussien, solution de l’équation dite de la chaleur :
- (ð/Dðt – ð²/ðx²)f(x,t) = Q(x,t)
En dimension spatiale 1, avec source de chaleur Q(x,t) et, dans un cadre plus général, solution de l’équation de Boltzmann.
Hors source, mouvement brownien et diffusion stochastique présentent des noyaux semblables, en l’occurrence,
- rhô(x,t) = (4piDt)-1/2exp(-x²/4Dt)
d’où la méprise. Car, dans le mouvement brownien, x(N) = x(t/tau) = (2n+ - N)l = (2t+ - t)l/tau, comme on l’a vu dans Bidouille 5. A l’opposé, aucune relation fonctionnelle n’est exigée entre x et t dans la diffusion stochastique. Comme souvent, ce n’est pas parce que les mathématiques sont semblables que les problèmes physiques entrent dans la même catégorie…
LE MOUVEMENT BROWNIEN ET, PAR SUITE, LES PROCESSUS DE MARKOV
NE SONT PAS DES PROCESSUS DE DIFFUSION STOCHASTIQUE.
Dans (1), d’abord on a un CHAMP f(x,t) et non un MOUVEMENT x(t), ensuite, les variations SPATIALES de ce champ sont complètement indépendantes de ses variations TEMPORELLES : la variable DE CHAMP est f ; la variable DE POSITION, x et le PARAMETRE TEMPOREL, t. Les rôles sont bien définis et bien séparés.
On peut d’ailleurs avoir de la diffusion PUREMENT SPATIALE A TEMPS CONSTANT, alors que, pour trouver un mouvement brownien indépendant du temps est conceptuellement difficile…
On comprend aussi pourquoi, dans la diffusion, on peut traiter la variable x comme FIXE, alors que c’est tout aussi conceptuellement impossible dans le mouvement brownien.
Par extension et sans discuter le bien-fondé de la méthode qui consiste à passer de la marche aléatoire à l’intégrale de chemins, on peut se poser la question de la LEGITIMITE PHYSIQUE de ce type d’intégrales, puisque l’action qui remplace le x² dans l’exponentielle est une fonctionnelle S[x(t),t] du MOUVEMENT x(t) : la dépendance entre x et t subsiste, elle s’étend du linéaire au non linéaire.
De toute façon, il faudra bien, un jour ou l’autre, trouver une ou des méthode(s) alternative(s) à l’intégrale de Feynman, qui conduit à des calculs aussi longs qu’ardus et à des divergences tant infrarouges qu’ultraviolettes. L’introduction de facteurs de coupure et l’emploi des techniques de renormalisation sont nécessaires pour réduire ces divergences. Mais ces dernières traduisent en fait un PROBLEME D’APPLICABILITé de l’intégrale, tout comme l’intégrale de Riemann présente un problème d’applicabilité dans de nombreux cas, résolu par la théorie de la mesure et l’intégration, plus générale, suivant Lebesgue. Enfin, ces facteurs de coupure n’ont pas grand-chose d’universel, puisqu’ils ne sont pas constants, mais variables : dans QCD, c’est caractéristique, ils dépendent d’un seuil d’énergie… Autrement dit, ils sont plus ADAPTéS à la résolution (scabreuse…) d’une situation problématique qu’introduits comme des grandeurs NATURELLES. Connes, dans sa « géométrie non commutative » a proposé de leur conférer une origine naturelle issue des algèbres d’opérateurs et de la géométrie discrète associée : c’est déjà ça, mais ça reste une approche MATHEMATIQUE qui, à ma connaissance, n’est pas confirmée par un argumentaire PHYSIQUE solide.
Et ça se conçoit : une théorie bien construite se suffit à elle-même, elle ne nécessite aucun « rajout », aucun « apport supplémentaire », aucune… bidouille pour « réparer ses défauts inhérents ». La théorie quantique relativiste du champ n’est toujours pas correctement construite, même son approximation non relativiste (Schrödinger) ne l’est pas…
On a pensé, à juste titre, que l’approche mécanique statistique, étendue à la théorie du champ, répondrait aux principaux problèmes de construction. Mais en partant du principe que la marche au hasard et ses généralisations entraient dans le cadre des processus de diffusion.
Ce qui n’est pas le cas.
On touche là aux FONDEMENTS DES MODELES : ce n’est pas pour autant que les calculs effectués sur cette base sont incorrects, la comparaison avec les résultats expérimentaux tend à prouver le contraire dans la plupart des cas, c’est, encore et toujours, une question de PRINCIPES. Si, un jour, les résultats tombent complètement à côté de la réalité ou prédisent des NON-événements, on ne comprendra pas pourquoi.
C’est ce qui semble se produire, aujourd’hui, avec les modèles financiers basés sur les systèmes d’Ito. On ne parle pas ici de crises PROVOQUEES, mais de crises SYSTEMIQUES : une partie de la crise mondiale actuelle est provoquée, par la spéculation notamment, mais une autre, peut-être moins visible, est « presque sûrement » systémique, i.e. due à l’inadéquation des modèles, elle-même due à des CONFUSIONS DANS LES PRINCIPES DE BASE (à laquelle vient s’ajouter une fâcheuse tendance à confondre fonctions et variables, points fixes et variables).
Tout cela cumulé finit par donner des modèles FAUX car MAL CONSTRUITS, dont les prévisions cadrent de moins en moins avec la réalité quotidienne.
Combien de fois, sur une année comptable, entend-on dire les analystes, en clôture des marchés, que « les résultats attendus sur Untel ou Untel sont MOINS BONS ou MEILLEURS QUE PREVUS »…
A moins qu’Untel dissimule une partie de ses résultats, les résultats fournis sont des FAITS, c’est la REALITE. Les prévisions des analystes sont des PROJECTIONS AVANT PUBLICATION DES RESULTATS. Si ces prévisions s’avèrent différentes des résultats produits, c’est qu’elles sont fausses…
Sur les marchés boursiers d’aujourd’hui, où l’opérateur se fonde de plus en plus sur les prévisions, les conséquences de tels écarts à la réalité sont exponentiels. Si on n’avait pas prévu des verrous de sécurité bloquant la poursuite des transactions en cas de décrochage, les Bourses dévisseraient les unes après les autres…
D’une manière fort générale, la difficulté ne réside pas dans la MODELISATION, ni dans le CALCUL, mais dans l’analyse PROFONDE des PRINCIPES SOUS-JACENTS à tel ou tel mécanisme. On a trouvé que, pour les grands nombres, on avait un exp(-x²/2Dt) : on en a déduit qu’on avait affaire à une diffusion aléatoire. D’abord, ce n’est pas parce que N devient très grand que le passage au continu se justifie pour autant : N, n+ et n- sont des ENTIERS NATURELS ; en tant que tels, ils appartiennent à l’ensemble DISCRET N. Les faire tendre vers l’infini NE CHANGE RIEN : ils feront toujours partie de N ! La preuve :
Soient q+ = n+/N et q- = n-/N. q+ et q- sont donc des RATIONNELS (ensemble Q). L’incrément sur les entiers est de 1. Faisons tendre N vers l’infini, EN LE CONSERVANT DANS SON ENSEMBLE, qui est N. q+ et q- se transforment en réels pour autant ?...
Non, évidemment : ils tendent vers 0, mais restent dans Q. Plus exactement, dans l’intervalle DISCRET [0,1] de Q, où l’incrément est 1/N. Qui tend vers 0 quand N tend vers l’infini, mais reste rationnel…
Pour avoir des réels, il faudrait inclure les IRRATIONNELS. Mais comment construire des irrationnels en partant D’ENTIERS ? on ne peut pas « combler les trous » d’un « ensemble à trous » comme ça, simplement en faisant tendre son nombre total d’éléments vers l’infini : cet infini dont nous parlons est DENOMBRABLE, alors que l’infini réel NE L’EST PLUS.
En physique, l’argument est : « plus les raies spectrales se rapprochent, plus elles prennent la forme d’une bande continue ». APPARENCE !!! La distance qui sépare 2 raies spectrales diminue de plus en plus, mais les raies RESTENT TOUTES SEPAREES LES UNES DES AUTRES… sinon, il y aurait interférences…
Sur le plan purement mathématique, si l’on pouvait construire des irrationnels à partir d’entiers ou de rationnels : 1) ça se saurait depuis longtemps et 2) il deviendrait inutile de se casser la tête à calculer des décimales de plus en plus lointaines de pi, e ou je ne sais quoi d’autre. Si on le fait comme ça, c’est qu’on n’a pas de méthode de calcul direct.
Parce que les irrationnels NE SONT PAS CONSTRUCTIBLES A PARTIR DE NOMBRES APPARTENANT A N OU Q, SAUF EN SERIE INFINIE (décimales illimitées).
Beaucoup de légèretés accumulées qui finissent « par faire que ».
Commentaires textes : Écrire
Lire les commentaires textes
2 remarques.
REMARQUE no1 : on prend le pb de la marche aléatoire à l'envers. Au lieu de définir les entiers N, n+ et n- comme des rapports de temps, comme dans Bidouille 5, on maintient N = t/tau, mais on pose n+ = x+/l et n- = x-/l, rapports de distances. On a alors x = (2n+ - N)l = (n+ - n-)l = x+ - x-, t/tau = (x+ + x-)/l. Avec nu = l/tau comme précédemment, on en déduit x+ = nu.t + x, x- = nu.t - x. x+ (resp. x-) peut être vu comme une AVANCE (resp. un RETARD). On voit bien que x est maintenant COMPLETEMENT INDEPENDANT de t et que le produit nu.t est du genre espace. Mais alors, les points ou sites x sont FIXES et le marcheur les visite au cours de son périple. Le pb reste entier : on ne voit toujours pas comment accorder un bruit gaussien utilisant des points FIXES x avec un MOUVEMENT x(t)...
REMARQUE no2 : on dit que les processus stochastiques sont des processus NON DIFFERENTIABLES et on les décrit ensuite au moyen D'EQUATIONS DIFFERENTIELLES... ça ne choque personne ? Moi si.