doclabidouille
BIDOUILLE 8 : REBIDOUILLAGE DANS L'ESPACE DES PRIX
Le 16/10/2012
A présent les problèmes exposés de Bidouille 4 à Bidouille 7, on rebidouille depuis le départ.
Alors… on reprend la loi binomiale (2 états), on appelle P la probabilité d’obtenir un événement quelconque et 1-P celle de ne pas l’obtenir (non événement). On a P + (1-P) = 1. Donc, quel que soit le REEL (positif ou nul) X, on aura [P + (1 – P)]X = 1. Développons suivant la formule du binôme de Newton ETENDUE AU CONTINU :
- [P + (1-P)]X = S0X CxXPx(1-P)X-xdx = S0X PX(x,P)dx = 1 , CxX = PI(X)/PI(x)PI(X-x) , (S = intégrale)
PI(.) étant la factorielle d’Euler. La densité de probabilité est maintenant :
- PX(x,P) = CxXPx(1-P)X-x
fonction CONTINUE et même INDEFINIMENT DIFFERENTIABLE de x, puisque 0=< x =< X. X est une quantité DETERMINISTE, x est la VARIABLE STOCHASTIQUE. Un calcul similaire au cas entier montre que la moyenne de x est :
- <x> = XP
tandis que celle de x² est :
- <x²> = XP + X(X-1)P² = <x>(1-P) + <x>²
puisque PI(x) = PI(x-1)x. L’incrément / décrément reste donc de 1. Ce qui n’empêcherait nullement de chercher des moyennes de puissances NON ENTIERES de x, quoique les formules ne soient plus aussi simples, dû au fait que la factorielle d’Euler ne vérifie qu’un petit nombre de propriétés itératives. Décomposons x en sa moyenne <x> et une fluctuation ksi : x = <x> + ksi. Ça se critique, car c’est de l’approche « modèle de champ moyen ». D’après (3) et (4), nous trouvons :
- <ksi> = 0
- <ksi²> = <(x - <x>)²> = <x² - 2x<x> + <x>²>
= <x²> - 2<x>² + <x>² = <x²> - <x>² = sigma²
La moyenne de la fluctuation est donc nulle, tandis que la moyenne de son carré est égale au carré de l’écart-type ou variance sigma. A l’approximation gaussienne, seules les moyennes des puissances PAIRES de ksi sont non nulles. Dans le cas de la distribution binomiale, seule <ksi> est toujours nulle.
On passe dans L’ESPACE DES PRIX. Ici, x est le prix (fluctuant), le plancher est fixé à zéro et le plafond à X. <x> est le prix moyen, ksi est la fluctuation de prix. Il s’agit de savoir dans quelle mesure on peut chercher la VARIATION DU PRIX AU COURS DU TEMPS à l’aide d’une équation DIFFERENTIELLE.
Déjà, x ne suffit pas, il faut passer aux COURBES DE PRIX x(t). ça ne pose pas de problème particulier dans les calculs précédents, où l’on remplacera x par x(t). Mais alors, les moyennes montrent immédiatement que X, P ou les deux à la fois doivent dépendre du temps. Si P varie au cours du temps, la condition de conservation de la probabilité doit être localisée en :
(7) P(t) + [1 – P(t)] = 1 à chaque instant t dans un intervalle [0,T]
avec T éventuellement infini. Partant de là, on peut envisager quelque chose. Mais les difficultés techniques ne sont pas terminées, loin s’en faut. Pour qu’on puisse définir au moins dx(t)/dt, il faut (et il suffit) que la courbe x(t) soit C1 sur [0,T]. Si elle n’est que C0, inutile d’aller plus loin. Supposons qu’elle soit C1. Elle possède déjà une certaine régularité. Alors, on peut chercher la variation de prix au cours du temps sous la forme d’un CHAMP :
- dx(t)/dt = V[x(t),t]
Mais attention ! x(t) est désormais une fonction STOCHASTIQUE du temps (déterministe !) et V est une fonctionnelle du temps et de cette fonction stochastique x(t). Sinon, on ne voit pas bien comment on peut construire une relation fonctionnelle qui tienne la route… Ou alors, il faut passer à une équation INTEGRALE de la forme :
- x(t) = x(t0) + Stot V[x(t’),t’]dt’
La différence, c’est que, dans la formulation intégrale, on n’a plus besoin de régularité : il suffit que la fonctionnelle V soit continue en t sur l’intervalle d’intégration. Elle peut même être continue par morceaux, de sorte que la courbe x(t) peut n’être que continue, voire continue par morceaux. Mais l’écriture (7) n’est plus partout équivalente à (8), en raison des discontinuités. (7) peut même ne plus être justifiée du tout ! C’est précisément ce qui se produit lorsque x(t) n’est différentiable NULLE PART…
Pour coller à la généralité, on préfèrera donc l’équation intégrale à l’équa diff.
Et il serait hasardeux d’affirmer que (8) est solution de (7)… : dès que (7) ne peut plus s’écrire, en raison du caractère trop irrégulier de la courbe, (8) en devient complètement indépendante et doit se résoudre par la méthode de Volterra.
Après, la régularité de V en x(t) ne pose pas de problème particulier pour la résolution : si V est CN en x(t), on l’écrira sous la forme :
- V[x(t),t] = Sn=0n=N Vn(t)xn(t)/n ! (S = somme discrète ici)
où les coefficients Vn(t) se calculent comme les dérivées n-ièmes de V au voisinage de la courbe nulle x(t) = 0.
On peut reprendre la décomposition x(t) = <x(t)> + ksi(t) comme ci-avant. <x(t)> est alors le MOYEN MOUVEMENT du prix x(t) et ksi(t), la fluctuation autour de ce moyen mouvement. Il est évident que <x(t)> sera solution d’une équation DETERMINISTE. Mais, due à la non-linéarité de V dans le cas général, l’équation du moyen mouvement dépendra encore des moyennes des puissances de ksi(t) supérieures ou égale à 1. Et puis, on réalise une dichotomie, ce qui est la critique principale formulée à l’encontre des modèles de champ moyen. Mieux vaut encore chercher la résolution de (8) pour le processus stochastique x(t) dans son ensemble, PUIS prendre la moyenne de la solution obtenue. Cette moyenne fournira <x(t)> et la différence x(t) - <x(t)>, la fluctuation ksi(t).
Ceux qui ont du temps à perdre ou qui visent une distinction particulière :) peuvent toujours calculer DIRECTEMENT la moyenne de (8), en utilisant (9). Ça ne les avancera sans doute pas à grand-chose, mais ils obtiendront, à n’en pas douter, une relation intéressante d’un point de vue… scholastique, cette fois. :)
Un dernier aspect technique, pour finir : la dérivation TOTALE par rapport au temps.
On trouve dans tous les bons manuels traitant de statistiques et de mouvements aléatoires une construction absolument merveilleuse de la dérivée totale d/dt par rapport au temps pour les processus stochastiques.
Je ne dois pas être bien malin, car je ne suis jamais parvenu à la retrouver. Par contre, elle m’est toujours apparue comme ayant « une bonne tête d’opérateur qui va bien ». Quoiqu’il ne conduise pas pour autant à une propriété de conservation…
J’ai eu beau tourner et retourner la question dans tous les sens, je ne vois toujours pas comment on peut aboutir à :
D/dt = d/dt + (dx/dt)d/dx + ½ sigma².d²/dx²
(en traduction littérale, i.e. en « oubliant » les dépendances temporelles). Toujours pas. Y a de la magie dans l’air… Qui plus est, même avec dx/dt = 0, on ne retrouve pas l’équation de la chaleur, puisqu’on a alors d/dt + ½ sigma².d²/dx² = 0 et non d/dt - ½ sigma².d²/dx² = 0 comme attendu…
Reprenons notre champ V[x(t),t] et cherchons sa dérivée totale par rapport au temps, SI ELLE EXISTE (déjà…). La moindre des choses pour cela est que V soit C1 en t ET en x(t). Supposons que ce soit le cas. Supposons. Alors,
- DV[x(t),t]/dt = dV[x(t),t]/dt + {[dx(t)/dt].[d/dx(t)]}V[x(t),t]
= dV[x(t),t]/dt + {V[x(t),t].d/dx(t)}V[x(t),t]
AVEC les dépendances fonctionnelles qui s’imposent. C’est la dérivée… d’Euler, toujours les mêmes. Et d’où provient le terme supplémentaire +½ sigma².d²/dx² ? qui s’écrit d’ailleurs +½ sigma²(t)d²/dx²(t). Qu’est-ce qui le justifie ? une approximation C2 ? Et pourquoi donc TOUTE fonctionnelle stochastique devrait-elle être C2 en x(t), même dans le cas gaussien ? Rappelons-le : la gaussienne est DEJA une approximation d’ordre 2…
Une C2 en x(t) conduirait à une équation d’évolution avec second membre en x²(t) : c’est la généralité, ça ?...
L’argument consiste à dire que ce terme supplémentaire apparaît du fait que <ksi²> est non nulle. Et alors ? Même en gaussien, <ksi2n> est non nulle, pour tout n entier positif ou nul. On pourrait donc ajouter des termes supplémentaires ad infinitum, en plus…
C’est fallacieux, comme argumentaire.
Mathématiquement, c’est même incorrect, puisqu’on ajoute un terme du SECOND ORDRE DE PETITESSE à un opérateur du premier ordre : c’est incorrect du point de vue du calcul différentiel… Tout autant qu’écrire, comme j’ai déjà vu, dsigma² = 2Ddt ou, mieux (enfin, pire) l’équation de Boltzmann sous la forme : (différentielle d’ordre 1) = (fonction) !!!
Sans rire. J’ai la réf chez moi. Fallait oser…
Enfin, pourquoi une MOYENNE sigma²(t) = <ksi²(t)> et ce terme seul ? On dérive par rapport au processus x(t) tout entier…
Mystère…
Entre autres…
Commentaires textes : Écrire
BIDOUILLE 7 : ON A ENFIN CERNé LE FOND DU PROBLEME ?
Le 13/10/2012
Oui, je crois avoir enfin cerné le fond du problème.
D’abord, une rectification : l’équation de Boltzmann, que je cite dans Bidouille 6, est du même acabit, puisque la densité de probabilité est fonction des points MOBILES x(t) et p(t) (impulsions associées), ainsi que du temps, sur l’espace des phases du système : la dépendance temporelle subsiste donc.
D’autre part, le calcul d’Ito et al n’est pas en cause, mais résulte de la théorie des « systèmes dynamiques stochastiques » (systèmes dynamiques avec bruits), elle-même issue de la théorie de Langevin. Il faut donc revenir à cette dernière. Et c’est là qu’il y a confusion des genres. En 1908, date à laquelle Paul Langevin publia ses travaux, s’était excusable. Depuis, beaucoup de connaissances ont été accumulées sur le sujet.
On repart donc de l’article :
http://en.wikipedia.org/wiki/Ito_calculus
déjà mentionné dans Bidouille 5.
« In physics, usually stochastic differential equations, also called Langevin equations, are used, rather than general stochastic integrals. A physicist would formulate an Itō stochastic differential equation (SDE) as
dxk(t)/dt = hk + gklksil
where ksil is Gaussian white noise with <ksik(t1)ksil(t2)> = deltakldelta(t1 – t2) and Einstein's summation convention is used.”
On va revoir tout ça. Mais d’abord, on remonte le fil :
http://en.wikipedia.org/wiki/Langevin_equation
“In statistical physics, a Langevin equation (Paul Langevin, 1908) is a stochastic differential equation describing the time evolution of a subset of the degrees of freedom. These degrees of freedom typically are collective (macroscopic) variables changing only slowly in comparison to the other (microscopic) variables of the system. The fast (microscopic) variables are responsible for the stochastic nature of the Langevin equation.”
Non. Les variables microscopiques NE SONT PAS responsables de la nature stochastique du processus.
“The original Langevin equation[1] describes Brownian motion, the apparently random movement of a particle in a fluid due to collisions with the molecules of the fluid”
APPARENT ! Retenir ça pour la suite.
“However, the Langevin equation is used to describe the motion of a "macroscopic" particle at a much longer time scale, and in this limit the δ-correlation and the Langevin equation become exact.”
Approximation, donc. Une de plus. Ça commence à faire beaucoup.
“An essential condition of the derivation is a criterion dividing the degrees of freedom into the categories slow and fast.”
Peut-être, mais la classification en variables lentes et rapides date de la seconde moitié du 19ème siècle, bien avant Langevin : dans toutes les méthodes d’analyse ASYMPTOTIQUE des systèmes dynamiques hamiltoniens, on sépare en variables lentes et variables rapides. C’est Delaunay…
Il est aujourd’hui bien établi, grâce à la théorie du CHAOS DETERMINISTE, que :
LES TRAJECTOIRES DES ELEMENTS D’UN SYSTEME EVOLUTIFS (PARTICULES, COMPOSANTS DE BASE) SONT DETERMINISTES. C’EST L’ECHELLE DE DESCRIPTION MICROSCOPIQUE OU ENCORE LOCALE.
Si un système dynamique se compose de N « points matériels » (1D pour simplifier), l’évolution de la position dans l’espace xi(t) du i-ème élément (i = 1,…,N) obéit à une équation déterministe. A l’opposé :
A L’ECHELLE MACROSCOPIQUE OU ENCORE GLOBALE DU SYSTEME DANS SON ENSEMBLE, LE CHAMP MODELISANT CE SYSTEME OBEIT A UNE EQUATION AUX DERIVEES PARTIELLES DETERMINISTE. C’EST LA DESCRIPTION DITE « PHENOMENOLOGIQUE ».
ENTRE LES DEUX, aux échelles intermédiaires, la description ne peut être que STATISTIQUE, pas seulement (comme on le croyait jusqu’aux années 60) en raison d’une impossibilité de détailler le mouvement individuel de chaque élément du système sur un intervalle de temps donné (fini ou non), mais aussi pour des raisons SYSTEMIQUES, INHERENTES AU SYSTEME LUI-MEME, QUI SE MET A SE COMPORTER DE MANIERE TOTALEMENT IMPREVISIBLE A L’AVANCE. Ceci se produit pour des valeurs bien particulières des coefficients de la partie PERTURBATRICE. Mais le problème mécanique GENERAL ne s’aborde pas du tout de la même manière : il ne « suffit » pas, en effet, d’ajouter un terme de bruit à un ensemble d’équations locales déterministes pour rendre compte du phénomène. Ce qui se produit est ceci :
- si l’on examine, au « microscope », le mouvement D’UNE particule du système, on observe UNE trajectoire, continue ou pas, peu importe, mais parfaitement déterministe ;
- si l’on examine, après grossissement (résolution moindre) le système, on observe un FAISCEAU DE TRAJECTOIRES : c’est ce faisceau qui, soit en raison de collisions entre les particules du système (recoupements de trajectoires individuelles), soit en raison d’un changement radical de comportement (transition vers le chaos déterministe), qui ne peut se décrire qu’au moyen de la statistique.
C’est Prigogine et non plus Langevin. On cite souvent Langevin dans le cadre de la théorie quantique, en relation avec Fokker-Planck et Feynman : le contexte y est COMPLETEMENT DIFFERENT. En théorie quantique, le mouvement du CORPUSCULE x(t) dans l’espace n’a AUCUNE RAISON D’ETRE STATISTIQUE (en l’absence d’agitation thermique). Seulement, il est MASQUé par le « paquet d’ondes » qui ACCOMPAGNE ce corpuscule. Et ce paquet d’ondes est décrit par la statistique A CAUSE DU PRINCIPE D’INCERTITUDE qui, A TOUT SIGNAL et en particulier, le paquet d’ondes quantique, impose un non-déterminisme : l’impossibilité de mesurer exactement à la fois les caractéristiques du signal et celles de son spectre. C’est parce que la physique quantique se fonde essentiellement sur des mesures SPECTRALES (de niveaux d’énergie entre autres) qu’elle est entachée d’incertitude. Ce n’est pas parce que le corpuscule est « trop petit pour être suivi » : il suffit de regarder les tracés à haute énergie des accélérateurs de particules pour voir que les trajectoires de ces particules sont faciles à suivre… Pourtant, qui dit haute énergie dit forte agitation thermique… Enfin, comme son nom l’indique clairement, le « paquet d’ondes » est un PAQUET : c’est bien du COLLECTIF, plus de L’INDIVIDUEL !
Qu’est-ce qui engendre l’aléatoire, l’indéterminisme, dans les systèmes évoluant au cours du temps ? D’abord, c’est le COUPLAGE, L’INTERACTION, entre les mouvements de chaque composant du système ; ensuite, c’est le caractère FONCIEREMENT NON LINEAIRE DE LA PERTURBATION : dans les systèmes linéaires, point de chaos, point de statistique !
En finance, qu’est-ce qui engendre le risque sur l’évolution d’un prix ? Prenons le cas d’une société par actions. L’action a un prix X(t) au temps t. Qu’est-ce qui va rendre le cours de ce prix en partie aléatoire ? La stratégie de la société ? Si c’est le cas, on est mal… La stratégie est généralement PLANIFIEE. Ou la société est plutôt douteuse… Non, c’est le MARCHé EXTERIEUR A LA SOCIETE qui va influer sur la stratégie de la société et donc, sur le cours de son action : il s’agit donc de perturbations EXTERIEURES. Une OPA hostile, par exemple, n’est pas toujours prédictible à l’avance (si elle est bien conduite) et fait généralement chuter le cours. Autrement, le cours de l’action AU SEIN DE LA SOCIETE, EN DEHORS DE TOUTE PERTURBATION EXTERIEURE, est déterministe, puisqu’il résulte d’une planification de la stratégie de l’entreprise sur une durée donnée. Mettez la société sur le marché, vous l’exposez aux LOIS DU MARCHé, son action constitue dès lors un COMPOSANT DE L’ENSEMBLE DES PRIX SUR LE MARCHé (d’actions), son évolution au cours du temps est alors influencée par LES AUTRES PRIX, dans une dynamique de marché D’ENSEMBLE et là, on a un FAISCEAU DE PRIX. Dont l’évolution ne peut plus être décrite que par la statistique.
Voilà la différence.
Langevin : on prend un ensemble d’équations déterministes couplées ou pas, on y rajoute des termes de bruit ;
Prigogine : on prend un ensemble d’équations LOCALES, déterministes, couplées entre elles, puis on passe aux échelles intermédiaires et on décrit un FAISCEAU MESOSCOPIQUE DE TRAJECTOIRES à l’aide d’une fonction de distribution statistique, sans introduire aucun terme de bruit dans les équations locales…
Pourquoi des PROBABILITES ? parce qu’on ne sait pas toujours PREDIRE UN ENSEMBLE DE RESULTATS A L’AVANCE. C’est tout ! Sinon, une fois ces résultats affichés, plus de hasard…
En mécanique quantique, c’est la même chose : une fois UN résultat observé, on peut dire que « la particule a été observée avec UNE ENERGIE E, UNE IMPULSION P ET DANS LA DIRECTION THETA ». Pourquoi chercher à savoir à l’avance ? parce qu’on veut savoir à quoi s’attendre, avec le moins d’erreur possible.
On peut introduire du bruit dans des équations aux dérivées partielles, parce que la position du champ dans l’espace est une donnée INDEPENDANTE du temps. On ne peut pas introduire de bruit dans un système dynamique :
- parce que la position des composants de ce système change au cours du temps ;
- parce qu’on superpose à une représentation MICROSCOPIQUE des termes apparaissant à un niveau MESOSCOPIQUE et
- parce qu’au niveau microscopique, on est INDIVIDUEL, alors que tout bruit résulte d’un comportement COLLECTIF (ensemble de fluctuations).
Il ne faut pas confondre la THERMODYNAMIQUE, où le bruit résulte de fluctuations (thermiques) qui agitent les molécules en tous sens avec la MECANIQUE, où le bruit ne peut se décrire qu’à une échelle GRANDE DEVANT CELLE DES COMPOSANTS DU SYSTEME, MAIS ENCORE PETITE DEVANT CELLE DU SYSTEME TOUT ENTIER.
Si on raisonne « thermo », on dira, en effet, que la nature aléatoire du processus provient de l’échelle microscopique. Mais alors, on raisonne en termes de CHAMPS !
Si l’on décrit des systèmes DYNAMIQUES, on raisonne « MECA ». Et là, on est forcé d’admettre que les mouvements individuels sont foncièrement déterministes et que le bruit ne peut provenir de l’échelle microscopique, mais d’une échelle de description supérieure, où les phénomènes collectifs apparaissent.
Chez Langevin, Ito et al, on écrit des systèmes DYNAMIQUES et on raisonne THERMO… Non...
Chez Fokker-Planck, d’accord : parce qu’on décrit des CHAMPS… Chez Feynman aussi, A CONDITION de rester dans la description en CHAMPS.
D’ailleurs, on appelle « limite THERMODYNAMIQUE » la limite SPATIALE des grands systèmes dont le nombre de composants tend théoriquement vers l’infini… Ceci ne peut se décrire qu’à l’aide de CHAMPS SPATIO-TEMPORELS…
Et on appelle « limite ASYMPTOTIQUE » la limite TEMPORELLE d’un système composé d’un nombre QUELCONQUE d’éléments (petit, grand) dont la DUREE D’EVOLUTION tend vers l’infini… Ceci peut se décrire, soit pour des systèmes dynamiques, soit pour des champs évoluant au cours du temps.
Brown, c’est aussi ça : quand on passe à l’approximation du continu, on fait tendre le nombre N d’éléments du système vers l’infini, ce qui correspond en fait à la limite ASYMPTOTIQUE et non THERMODYNAMIQUE, puisque N = t/tau est un rapport de temps…
On a pourtant coutume de dire, à juste titre, que LA BOURSE EST CHAOTIQUE…
Ça se traite par la théorie du chaos, pas par le mouvement brownien et dérivés.
BIDOUILLE 6 : LE GLAS DU MOUVEMENT BROWNIEN POUR LES MODELES FINANCIERS ?
Le 11/10/2012
Suite et sans doute fin du dilemme portant sur les modèles financiers en temps continu basés sur le mouvement brownien et donc les processus de Markov.
Dans toutes les bonnes références techniques sur le sujet, on peut lire que le mouvement brownien entre dans la catégorie des processus de diffusion. NON ! Le mouvement brownien ne fait que S’APPARENTER à un processus de diffusion ! Pourquoi ?
DANS LE MOUVEMENT BROWNIEN,
LES VARIABLES x ET t NE SONT PAS INDEPENDANTES,
MAIS RELIEES ENTRE ELLES DE FAçON LINEAIRE.
Comme il apparaît clairement dans Bidouille 5, qui ne fait que reproduire les textes fondamentaux. Alors que :
DANS LA DIFFUSION STOCHASTIQUE,
LES VARIABLES x ET t SONT COMPLETEMENT INDEPENDANTES.
En effet, ce type de diffusion est, dans le cas gaussien, solution de l’équation dite de la chaleur :
- (ð/Dðt – ð²/ðx²)f(x,t) = Q(x,t)
En dimension spatiale 1, avec source de chaleur Q(x,t) et, dans un cadre plus général, solution de l’équation de Boltzmann.
Hors source, mouvement brownien et diffusion stochastique présentent des noyaux semblables, en l’occurrence,
- rhô(x,t) = (4piDt)-1/2exp(-x²/4Dt)
d’où la méprise. Car, dans le mouvement brownien, x(N) = x(t/tau) = (2n+ - N)l = (2t+ - t)l/tau, comme on l’a vu dans Bidouille 5. A l’opposé, aucune relation fonctionnelle n’est exigée entre x et t dans la diffusion stochastique. Comme souvent, ce n’est pas parce que les mathématiques sont semblables que les problèmes physiques entrent dans la même catégorie…
LE MOUVEMENT BROWNIEN ET, PAR SUITE, LES PROCESSUS DE MARKOV
NE SONT PAS DES PROCESSUS DE DIFFUSION STOCHASTIQUE.
Dans (1), d’abord on a un CHAMP f(x,t) et non un MOUVEMENT x(t), ensuite, les variations SPATIALES de ce champ sont complètement indépendantes de ses variations TEMPORELLES : la variable DE CHAMP est f ; la variable DE POSITION, x et le PARAMETRE TEMPOREL, t. Les rôles sont bien définis et bien séparés.
On peut d’ailleurs avoir de la diffusion PUREMENT SPATIALE A TEMPS CONSTANT, alors que, pour trouver un mouvement brownien indépendant du temps est conceptuellement difficile…
On comprend aussi pourquoi, dans la diffusion, on peut traiter la variable x comme FIXE, alors que c’est tout aussi conceptuellement impossible dans le mouvement brownien.
Par extension et sans discuter le bien-fondé de la méthode qui consiste à passer de la marche aléatoire à l’intégrale de chemins, on peut se poser la question de la LEGITIMITE PHYSIQUE de ce type d’intégrales, puisque l’action qui remplace le x² dans l’exponentielle est une fonctionnelle S[x(t),t] du MOUVEMENT x(t) : la dépendance entre x et t subsiste, elle s’étend du linéaire au non linéaire.
De toute façon, il faudra bien, un jour ou l’autre, trouver une ou des méthode(s) alternative(s) à l’intégrale de Feynman, qui conduit à des calculs aussi longs qu’ardus et à des divergences tant infrarouges qu’ultraviolettes. L’introduction de facteurs de coupure et l’emploi des techniques de renormalisation sont nécessaires pour réduire ces divergences. Mais ces dernières traduisent en fait un PROBLEME D’APPLICABILITé de l’intégrale, tout comme l’intégrale de Riemann présente un problème d’applicabilité dans de nombreux cas, résolu par la théorie de la mesure et l’intégration, plus générale, suivant Lebesgue. Enfin, ces facteurs de coupure n’ont pas grand-chose d’universel, puisqu’ils ne sont pas constants, mais variables : dans QCD, c’est caractéristique, ils dépendent d’un seuil d’énergie… Autrement dit, ils sont plus ADAPTéS à la résolution (scabreuse…) d’une situation problématique qu’introduits comme des grandeurs NATURELLES. Connes, dans sa « géométrie non commutative » a proposé de leur conférer une origine naturelle issue des algèbres d’opérateurs et de la géométrie discrète associée : c’est déjà ça, mais ça reste une approche MATHEMATIQUE qui, à ma connaissance, n’est pas confirmée par un argumentaire PHYSIQUE solide.
Et ça se conçoit : une théorie bien construite se suffit à elle-même, elle ne nécessite aucun « rajout », aucun « apport supplémentaire », aucune… bidouille pour « réparer ses défauts inhérents ». La théorie quantique relativiste du champ n’est toujours pas correctement construite, même son approximation non relativiste (Schrödinger) ne l’est pas…
On a pensé, à juste titre, que l’approche mécanique statistique, étendue à la théorie du champ, répondrait aux principaux problèmes de construction. Mais en partant du principe que la marche au hasard et ses généralisations entraient dans le cadre des processus de diffusion.
Ce qui n’est pas le cas.
On touche là aux FONDEMENTS DES MODELES : ce n’est pas pour autant que les calculs effectués sur cette base sont incorrects, la comparaison avec les résultats expérimentaux tend à prouver le contraire dans la plupart des cas, c’est, encore et toujours, une question de PRINCIPES. Si, un jour, les résultats tombent complètement à côté de la réalité ou prédisent des NON-événements, on ne comprendra pas pourquoi.
C’est ce qui semble se produire, aujourd’hui, avec les modèles financiers basés sur les systèmes d’Ito. On ne parle pas ici de crises PROVOQUEES, mais de crises SYSTEMIQUES : une partie de la crise mondiale actuelle est provoquée, par la spéculation notamment, mais une autre, peut-être moins visible, est « presque sûrement » systémique, i.e. due à l’inadéquation des modèles, elle-même due à des CONFUSIONS DANS LES PRINCIPES DE BASE (à laquelle vient s’ajouter une fâcheuse tendance à confondre fonctions et variables, points fixes et variables).
Tout cela cumulé finit par donner des modèles FAUX car MAL CONSTRUITS, dont les prévisions cadrent de moins en moins avec la réalité quotidienne.
Combien de fois, sur une année comptable, entend-on dire les analystes, en clôture des marchés, que « les résultats attendus sur Untel ou Untel sont MOINS BONS ou MEILLEURS QUE PREVUS »…
A moins qu’Untel dissimule une partie de ses résultats, les résultats fournis sont des FAITS, c’est la REALITE. Les prévisions des analystes sont des PROJECTIONS AVANT PUBLICATION DES RESULTATS. Si ces prévisions s’avèrent différentes des résultats produits, c’est qu’elles sont fausses…
Sur les marchés boursiers d’aujourd’hui, où l’opérateur se fonde de plus en plus sur les prévisions, les conséquences de tels écarts à la réalité sont exponentiels. Si on n’avait pas prévu des verrous de sécurité bloquant la poursuite des transactions en cas de décrochage, les Bourses dévisseraient les unes après les autres…
D’une manière fort générale, la difficulté ne réside pas dans la MODELISATION, ni dans le CALCUL, mais dans l’analyse PROFONDE des PRINCIPES SOUS-JACENTS à tel ou tel mécanisme. On a trouvé que, pour les grands nombres, on avait un exp(-x²/2Dt) : on en a déduit qu’on avait affaire à une diffusion aléatoire. D’abord, ce n’est pas parce que N devient très grand que le passage au continu se justifie pour autant : N, n+ et n- sont des ENTIERS NATURELS ; en tant que tels, ils appartiennent à l’ensemble DISCRET N. Les faire tendre vers l’infini NE CHANGE RIEN : ils feront toujours partie de N ! La preuve :
Soient q+ = n+/N et q- = n-/N. q+ et q- sont donc des RATIONNELS (ensemble Q). L’incrément sur les entiers est de 1. Faisons tendre N vers l’infini, EN LE CONSERVANT DANS SON ENSEMBLE, qui est N. q+ et q- se transforment en réels pour autant ?...
Non, évidemment : ils tendent vers 0, mais restent dans Q. Plus exactement, dans l’intervalle DISCRET [0,1] de Q, où l’incrément est 1/N. Qui tend vers 0 quand N tend vers l’infini, mais reste rationnel…
Pour avoir des réels, il faudrait inclure les IRRATIONNELS. Mais comment construire des irrationnels en partant D’ENTIERS ? on ne peut pas « combler les trous » d’un « ensemble à trous » comme ça, simplement en faisant tendre son nombre total d’éléments vers l’infini : cet infini dont nous parlons est DENOMBRABLE, alors que l’infini réel NE L’EST PLUS.
En physique, l’argument est : « plus les raies spectrales se rapprochent, plus elles prennent la forme d’une bande continue ». APPARENCE !!! La distance qui sépare 2 raies spectrales diminue de plus en plus, mais les raies RESTENT TOUTES SEPAREES LES UNES DES AUTRES… sinon, il y aurait interférences…
Sur le plan purement mathématique, si l’on pouvait construire des irrationnels à partir d’entiers ou de rationnels : 1) ça se saurait depuis longtemps et 2) il deviendrait inutile de se casser la tête à calculer des décimales de plus en plus lointaines de pi, e ou je ne sais quoi d’autre. Si on le fait comme ça, c’est qu’on n’a pas de méthode de calcul direct.
Parce que les irrationnels NE SONT PAS CONSTRUCTIBLES A PARTIR DE NOMBRES APPARTENANT A N OU Q, SAUF EN SERIE INFINIE (décimales illimitées).
Beaucoup de légèretés accumulées qui finissent « par faire que ».
Commentaires textes : Écrire
BIDOUILLE N°5 : ON EN RAJOUTE UNE (BONNE !) COUCHE SUR BIDOUILLE 4
Le 09/10/2012
Eh oui, pas mal de temps s'est écoulé depuis Bidouille 4, mais je n'ai pas chômé sur la question. Cette fois, c'est même sur l'approche "chemins" que je m'interroge. On remonte aux origines.
La distribution probabiliste de Gauss est une approximation de la loi dite "binomiale". Soit un système à 2 états ou 2 niveaux, peu importe, notés (+) et (-). On suppose que le système est composé de N éléments. Ce nombre N est défini DES LE DEPART (important pour la suite). P+ est la proba de trouver un élément parmi ces N dans l'état (+), P- celle de le trouver dans l'état (-). La proba de trouver n+ éléments dans l’état (+) est P+n+, celle d’en trouver n- dans l’état (-) est P-n-. La proba de trouver n+ éléments en (+) et n- en (-) est donc :
(1) PN(n+,P+) = Cn+NP+n+P-n- avec N = n+ + n- , Cn+N = N !/n+ !(N-n+) ! , P+ + P- = 1
(conservation de la probabilité). Le développement du binôme (P+ + P-)N = 1 conduit à la relation de fermeture :
- Sn+ = 0N PN(n+,P+) = 1
C’est en utilisant l’approximation de Stirling pour les factorielles dans le cas des grands nombres N, puis en développant l’expression obtenue pour PN(n+,P+) au voisinage de n+ - <n+> = n+ - NP+, où <.> est la moyenne calculée sur PN(n+,P+) que l’on trouve l’approximation gaussienne. Et encore, en limitant ce développement à l’ordre 2 ! Avec l’écart-type (variance) :
- <n+²> - <n+>² = V² = NP+P- = NP+(1 – P+)
On trouve la distribution de probabilité, dite « loi des grands nombres » :
- PG(n+,P+) = exp[-(n+ - <n+>)²/2V²]/Vsqr(2pi)
Dans le cas de la marche au hasard (mouvement brownien, processus de Markov), on a donc un marcheur (plutôt un sauteur) qui parcourt N sites fixes de manière aléatoire, en effectuant, soit des sauts en avant, soit des sauts en arrière, successivement. Le graphe est orienté : les sauts en avant sont comptés positivement, ceux en arrière, négativement. La longueur d’un saut est l, le temps effectué pour sauter d’une position à l’autre, tau. L et tau sont des données CONSTANTES fixées par avance. Elles caractérisent le maillage du réseau (en dimension 1 pour simplifier les choses). Le marcheur-sauteur aura visité les N sites au bout d’un temps t = N x tau. La longueur de son périple aura été :
- x = (n+ - n-)l = (2n+ - N)l
Puisque <n+> = NP+ et <N> = N<1> = N, on aura donc <x> = (2<n+> - N)l = (2P+ - 1)Nl. Notons que x peut être positif, négatif ou nul, eu égard à l’orientation du graphe. Il s’ensuit que x - <x> = 2l(n+ - <n+>). Ensuite, <x²> = <4n² - 4Nn+ + N²>l² = 4l²<n²> - 4l²N<n+> + N²l², d’où <x²> - <x>² = 4l²(<n+²> - <n+>²) = 4l²V². Par conséquent,
- (n+ - <n+>)²/2V² = (x - <x>)²/2(<x²> - <x>²)
Autrement dit, il est strictement équivalent de raisonner en variables entières (N,n+) ou en variables (t,x). Pour ce qui est du coefficient de diffusion, la diffusion est TEMPORELLE et ce coeff est donné par (3), puisque :
- V² = NP+P- = (P+P-/tau)t = 2Dt/l² => D = (P+P-)l²/2tau
Il ne dépend que des caractéristiques du réseau et des probabilités. On peut introduire les instants :
- t+ = n+ x tau , t- = n- x tau , t = t+ + t-
Alors, (N déterministe, n+ et n- stochastiques) => (t déterministe, t+ et t- stochastiques). En fait, N étant une borne supérieure dans la sommation (2), t devient une borne supérieure dans une sommation en temps. Le mouvement brownien nous montre alors clairement que la relation entre la distance parcourue x et le temps mis pour parcourir aussi bien les N sites que les n+ sites situés à l’avant est LINEAIRE :
- x = (t+ - t-)l/tau = (2t+ - t)l/tau = (t+ - t-)nu = (2t+ - t)nu
où nu = l/tau est la vitesse, constante, de saut. C’est aussi la vitesse MAXIMALE de progression sur le réseau, puisque :
(10) vmoy = x/t = [(t+ - t-)/(t+ + t-)]nu =< nu en valeur absolue (vitesse pure)
Ceci se conçoit, puisque les sauts en arrière tendent à FREINER la progression.
Tout ça pour démontrer quoi ? Que, dans le cas de la marche au hasard, LES VARIABLES SONT TOUTES DE NATURE TEMPORELLE : n+ -> t+, n- > t-, N -> t. Or, ce sont n+ et n- qui sont les variables dans la loi binomiale. Passer à t+ et t- = t – t+ n’est qu’un changement de variables : au lieu de sommer de 0 à N, on sommera de t+ = 0 à t+ = t par sauts de tau. La linéarité de la relation entre x et t est facile à comprendre : le mouvement s’effectuant par sauts successifs, il est DISCONTINU, donc formé de SEGMENTS DE DROITE. On ne voit donc pas bien de quelle manière on pourrait PARAMETRER CE MOUVEMENT SUIVANT LE TEMPS, i.e. passer de x à x(t). Ceci à cause de l’égalité formelle (6) entre les variables (n+,N) et les variables (x,t) : si n+, n- et N ne sont que des RAPPORTS DE TEMPS, COMMENT ET POURQUOI CHERCHER A ETENDRE LE MODELE EN LOCALISANT EN TEMPS, I.E. EN PARAMETRANT ?
Passer de n+ à n+(t+) ? de n- à n-(t-) ? ou même de N à N(t) ? c’est absurde…
Le problème n’est même pas le passage du discret au continu, il n’est même pas de faire tendre les dimensions du réseau vers zéro en maintenant le rapport l²/tau constant, il est dans la reconnaissance de ce qui est PARAMETRE DU MOUVEMENT et ce qui est VARIABLE DU MOUVEMENT car (6) conduit à :
- (x - <x>)²/2(<x²> - <x>²) = (x - <x>)²/4Dt = (n+ - <n+>)²/2NP+P-
= (t+ - <t+>)²/(2P+P-tau)t = [(t+ - <t+>)²/(t+ + t-)]nu²/4D
qui ne fait on ne peut plus clairement intervenir que des TEMPS…
La SEULE possibilité de décrire correctement un mouvement brownien en variables D’ESPACE et de passer en variables D’ESPACE proprement dites, mais alors on remplace t par x, t+ par x+ et t- par x- et l’x de (5), on est obligé de la remplacer par un phi, linéaire en les LONGUEURS, cette fois ci :
- phi = (2x+ - x)ksi/l , x = Nl , x+ = n+ x l , x- = n- x l
En effet, la longueur l du réseau précédent remplace la durée tau d’un saut, ksi devient la « longueur » entre 2 sites du nouveau réseau, phi, la « longueur » du trajet effectué par le marcheur et x, la « durée » totale de ce mouvement. A ce moment-là, au lieu de trouver un rapport (10) en temps, on le trouve en longueurs. L’écart-type (7) devient :
- V’² = NP+P- = (P+P-/l)x = 2D’x/ksi²
d’où un nouveau coefficient de diffusion, spatiale, cette fois :
- D’ = (P+P-)ksi²/2l
mais qui n’a plus rien à voir avec le 4Dt du mouvement brownien spatio-temporel…
Pour toutes ces raisons, on voit vraiment MAL comment on pourrait établir des équations d’évolution DANS LE TEMPS de systèmes de PRIX X(t) pour lesquels la partie « risque » comporterait une expression BROWNIENNE de la forme [X(t) - <X(t)>]²/4Dt ou même une intégrale de chemins plus compliquée…
Pour bien faire, il faut passer dans un « espace des prix », variables X, et paramétrer en temps, paramètres t. Et puis ?...
BIDOUILLE N°4 : SUR LES MATHS FINANCIERES. SUPER-MEFAIT DU DOC !!!!
Le 07/07/2012
Au programme, aujourd’hui, analyse de plusieurs articles Wikipedia.
http://en.wikipedia.org/wiki/Ito_calculus
« we are integrating with respect to a non-differentiable function”
Au sens des FONCTIONS, sans doute. Mais au sens des DISTRIBUTIONS ? Sans doute pas. Le processus de base est celui de Wiener, qui est gaussien. Or, comme chacun sait, la gaussienne est C00 (C l’infini)… De toute façon, toute FONCTION C0 se laisse étendre, depuis Schwartz, en une DISTRIBUTION, ce qui implique automatiquement une REGULARISATION. Au contraire, il FAUT passer du cadre trop restreint des fonctions à celui, beaucoup plus vaste, des distributions, pour aborder les problèmes de non-régularité, i.e. de non-différentiabilité. Inversé, cela veut dire que la non-différentiabilité des fonctions est un indice de L’INSUFFISANCE de la notion de fonction et de la nécessité à généraliser cette notion. Conséquence :
TOUT PROCESSUS STOCHASTIQUE DEVIENT REGULIER AU SENS DES DISTRIBUTIONS.
« The Itō integral allows one to integrate one stochastic process (the integrand) with respect to another stochastic process (the integrator).”
Non. Nous allons voir pourquoi plus loin.
« It is common for the integrator to be the Brownian motion (also see Wiener process).”
Non plus. Nous allons voir que ce type de processus est “statique” et n’est donc PAS adapté (en un sens, fort général d’ailleurs, que je préciserai) aux processus dynamiques, c’est-à-dire, dépendant d’un paramètre (en général, le temps) de façon CONTINUE.
« Then we are constructing Riemann sums.” Parce que l’intégrale d’Ito “is a generalization of the ordinary concept of a Riemann–Stieltjes integral.”
Pourquoi pas ? Le problème est que ce ne sont PAS les sommes de RIEMANN qui sont adaptées dans le cas C0, mais celles de LEBESGUE (sommation par paquets)…
« It is conceptualized in mathematical finance as that we are first deciding what to do, then observing the change in the prices. The integrand is how much stock we hold, the integrator represents the movement of the prices, and the integral is how much money we have in total including what our stock is worth, at any given moment.”
Je n’en doute pas un seul instant et cela prouve d’ailleurs que, la modélisation selon Riemann n’étant pas adaptée, c’est, en retour, L’APPROCHE DU RAISONNEMENT FINANCIER QUI DOIT ETRE MODIFIEE : tout comme les sommations sont REORDONNEES de Riemann à Lebesgue, eh bien, le raisonnement financier doit être réordonné. Sous peine d’inadéquation entre le raisonnement et sa modélisation.
« Numerous technical details have to be taken care of to show that this limit exists and is independent of the particular sequence of partitions.”
Voici un exemple type de difficultés purement techniques exigées par l’approche “sommes de Riemann”.
« The prices of stocks and other traded financial assets can be modeled by stochastic processes such as Brownian motion or, more often, geometric Brownian motion (see Black–Scholes)”
Apparemment, NON et ceci est contesté par certains analystes financiers, l’explication technique étant que ces actifs financiers EVOLUENT AU COURS DU TEMPS DE FaçON CONTINUE.
« the Itō stochastic integral represents the payoff of a continuous-time trading strategy consisting of holding an amount Ht of the stock at time t. In this situation, the condition that H is adapted corresponds to the necessary restriction that the trading strategy can only make use of the available information at any time. This prevents the possibility of unlimited gains through high frequency trading: buying the stock just before each uptick in the market and selling before each downtick.”
Alors, là, on n’est plus seulement dans le brownien, on entre dans le MARKOVIEN : la « mémoire » du système (connaissance de l’info) se limite à l’instant immédiatement précédent, le système est « sans mémoire ». C’est un cas BIEN PARTICULIER du mouvement brownien. Qui restreint encore plus le cadre. D’après l’explication, le processus en question est alors « adapté », ce qui évite la divergence de l’intégral d’Ito. Autrement dit, DèS QU’ON SE TROUVE EN FACE D’UN SYSTEME A MEMOIRE QUELCONQUE, LA TECHNIQUE D’ITO TOMBE EN DEFAUT…
Ceci, précisément parce que l’intégrale en question est une limite de sommes de Riemann…
Les analystes financiers commencent à froncer les sourcils ? C’est rien à côté de ce qui arrive.
« the integral is often written in differential form dY = H dX, which is equivalent to Y − Y0 = H · X.”
Euh… encore non. (les mecs vont péter les plombs…) Désolé, non : la forme différentielle est essentiellement LOCALE, alors que la forme intégrale, elle, est essentiellement GLOBALE : même si sa borne supérieure est variable, ça reste une SOMMATION SUR UN INTERVALLE A BORNE SUPERIEURE VARIABLE… :)
Si on procédait comme indiqué, alors toute équation intégrale se laisserait ramener à une équation différentielle et ne nécessiterait pas l’élaboration de techniques spécifiques, comme les méthodes de Volterra et al.
« As Itō calculus is concerned with continuous-time stochastic processes, it is assumed that an underlying filtered probability space is given”
HEIN : C’EST PAS MOI QUI LE DIT !
L’intégrale de Riemann-Stieltjes, quant à elle, est définie comme une limite probabiliste de sommes de Riemann. Bon, alors, on effectue une limite sur une notion qui relève de l’intégration selon LEBESGUE, puisqu’on parle de distribution (probabilité = distribution) et on l’applique à l’intégration selon RIEMANN… 8(
Pourquoi faire simple quand on peut compliquer les choses ?...
Les sommes de Riemann ne sont adaptées qu’aux FONCTIONS. OR, on vient de nous expliquer que le calcul d’Ito n’est PAS adapté aux fonctions, puisque celles-ci ne sont PLUS régulières : s’agirait de s’entendre… :))
« An Itō process is defined to be an adapted stochastic process…”
Si on le dit… (ah, mais, je ne critique absolument pas l’auteur de l’article qui, au contraire, fait, à mon goût, un très bon article sur ce qui a été convenu précédemment)
« …which can be expressed as the sum of an integral with respect to Brownian motion and an integral with respect to time”
C’est là que ça devient proprement extraordinaire… :) Parce que, dans la formulation intégrale, il est considéré que la partie stochastique se construit à l’aide de sommes de RIEMANN, tandis que la partie déterministe se construit, elle, à partir de sommes de LEBESGUE… On associe donc les processus DETERMINISTES à l’intégrale de Lebesgue et les processus NON DETERMINISTES à l’intégrale de Riemann-Stieltjes…
Pourquoi ? Lebesgue seule, ça suffit pas ?...
J’avais CRU comprendre que les filtrations probabilistes se construisaient à partir de la notion abstraite de TRIBUS DE BOREL et qu’on utilisait l’intégration selon LEBESGUE, LA PLUS GENERALE DE TOUTES…
Comme disait le géomètre et Médaille Fields Jean-Christophe Yoccoz, dans les années 1990, « le hasard n’existe pas en mathématiques » : en maths, il n’y a pas de concept tel que le « hasard » ; une « probabilité » n’est qu’une « fonction-densité » particulière au milieu d’une infinité d’autres « fonctions-densité »… Il voulait dire par là que le « hasard » N’EST PAS UN OBJET MODELISABLE : ce n’est qu’un processus parmi tant d’autres…
Revenons au sujet. Le lemme d’Ito ne fournit autre que la dérivée TOTALE GAUSSIENNE d’une fonction : c’est la même expression que la dérivée totale par rapport au temps de la distribution de Gauss ; on sait que, pour toute fonctionnelle déterministe f[x(t),t] au moins C1 en x(t), sa dérivée totale par rapport au temps est :
df[x(t),t]/dt = ðf[x(t),t]/ðt + [dx(t)/dt]ðf[x(t),t]/ðx(t)
Notons au passage que cette expression est INCORRECTE pour des fonctions de POINTS FIXES x telles que f(x,t), puisqu’on ne peut alors pas appliquer la règle de dérivation en chaîne. Il faut pour cela une « fonction de fonction », c’est-à-dire, une fonctionnelle. Ce qui change l’espace d’application (et sa dimension).
Pour la gaussienne en dim 1, f(x,t) = exp(-x²/4Dt)/(4pi.Dt)1/2 (attention : points FIXES x !), on a :
ðf(x,t)/ðt = D.ð²f(x,t)/ðx²
L’écart-type étant s² = 2Dt, D = coeff de diffusion. On retrouve bien la dérivée SECONDE, typique des gaussiennes, par rapport à la variable x, de sorte que la dérivée totale par rapport au temps pour des processus tout ou partie gaussiens devient :
d/dt = ð/ðt + [dx(t)/dt]ð/ðx(t) + Dð²/ðx²(t)
Ah, Ah ! Mais il faut alors une FONCTION x(t), d’accord ?... :) Sinon : problèmes de construction…
Qu’à cela ne tienne, on passe de l’espace des x à celui des x(t) et on prend une gaussienne :
f[x(t),t] = exp[-x²(t)/4Dt]/(4pi.Dt)1/2 ?...
Malheureusement, ça ne fonctionne pas comme ça…
« The discontinuities of the stochastic integral are given by the jumps of the integrator multiplied by the integrand”
La notion de SAUTS d’une fonction est justement à la base de l’élaboration du calcul des DISTRIBUTIONS à partir de l’intégrale de LEBESGUE… c’est exactement ça qu’on nous décrit là…
http://en.wikipedia.org/wiki/Stochastic_differential_equation, “Use in probability and mathematical finance”
D’accord sur l’écriture de l’équation différentielle stochastique, tant qu’on reste local, mais pas sur l’écriture de l’équation intégrale correspondante : soit on intègre suivant dBu, comme écrit, et alors on n’a pas le même domaine d’intégration, soit on passe de dBu à (dBu/du)du et on peut utiliser le même domaine d’intégration…
On nous explique qu’on a une partie « normale » (Hollandienne, quoi) mu(Xt,t)delta (pourquoi pas s ? bref), déterministe donc prévisible à l’avance (c’est la moyenne – ça va pas plus haut, non lol –AH BIN, C’EST PAS MOI QUI SUIS A L’ORIGINE DE L’ETHYMOLOGIE !!!) et une partie « anormale » (Sarkozienne, quoi), de variance sigma²(Xt,t).delta (c’est le terme de « gesticulation permanente et imprédictible », puisque c’est la fluctuation…), « independent of the past behavior of the process », tout à fait, Thierry, et qui a même tiré un trait dessus.
« There are also more general stochastic differential equations where the coefficients μ and σ depend not only on the present value of the process Xt, but also on previous values of the process and possibly on present or previous values of other processes too. In that case the solution process, X, is not a Markov process, and it is called an Itō process”
Là, ce seraient aux AUTEURS de s’accorder entre eux sur ce qu’il convient de définir comme un “processus d’Ito”… Y sont même pas d’accords entre eux… :(
http://en.wikipedia.org/wiki/Geometric_Brownian_motion
ça fonctionne (presque) au poil en finance, sauf que… dans la réalité, « there is a higher chance of large price changes ». A part ces « menus détails », tout va bien.
QUEL EST LE PROBLEME ?
Bin, le problème, il est double :
- un problème de construction, comme on l’a vu, et
- un problème d’applicabilité.
On ne peut appliquer de processus de Wiener pour des variables DEPENDANT DU TEMPS DE FAçON CONTINUE : dans la « marche au hasard », le marcheur visite, au cours du temps, des sites FIXES, de manière ALEATOIRE. Lorsque ces sites deviennent MOBILES, comme c’est le cas dans les équa diff stochastiques, cette description n’est PLUS VALIDE et il faut utiliser, on le sait, l’approche « chemins » : à ce moment-là, le marcheur emprunte des CHEMINS DIFFERENTS au cours du temps, de manière ALEATOIRE. Les distributions de proba ne sont plus gaussiennes, les processus de base ne sont donc plus de Wiener et on ne peut plus les utiliser dans une équation d’évolution…
Il est FORMELLEMENT FAUX de changer x²/2Dt en x²(t)/2Dt, parce que, dans x²/2Dt, les sites x sont FIXES, alors que dans x²(t), ces sites (« points ») deviennent des COURBES, on passe d’un espace de POINTS à un espace de COURBES et on ne peut plus utiliser le temps t comme paramètre d’une courbe et dans l’écart-type, parce que t s’écoule SUR LES COURBES et non ENTRE LES COURBES… Dans x²/2Dt, le temps s’écoule ENTRE LES POINTS (d’un point à l’autre).
Le résultat correct, on le sait, est une ACTION, dont la partie cinétique est l’intégrale, sur le temps, de v²(t)/2D, avec v(t) = dx(t)/dt, qu’on peut obtenir intuitivement, en procédant de la manière suivante : x²(t)/2Dt = [x²(t)/2Dt²]t ->[dx²(t)/2Ddt²]dt = v²(t)dt/2D.
Expression TRES DIFFERENTE de celle de Wiener…
C’est tout. Tout le reste en découle.
Lire les commentaires textes
2 remarques.
REMARQUE no1 : on prend le pb de la marche aléatoire à l'envers. Au lieu de définir les entiers N, n+ et n- comme des rapports de temps, comme dans Bidouille 5, on maintient N = t/tau, mais on pose n+ = x+/l et n- = x-/l, rapports de distances. On a alors x = (2n+ - N)l = (n+ - n-)l = x+ - x-, t/tau = (x+ + x-)/l. Avec nu = l/tau comme précédemment, on en déduit x+ = nu.t + x, x- = nu.t - x. x+ (resp. x-) peut être vu comme une AVANCE (resp. un RETARD). On voit bien que x est maintenant COMPLETEMENT INDEPENDANT de t et que le produit nu.t est du genre espace. Mais alors, les points ou sites x sont FIXES et le marcheur les visite au cours de son périple. Le pb reste entier : on ne voit toujours pas comment accorder un bruit gaussien utilisant des points FIXES x avec un MOUVEMENT x(t)...
REMARQUE no2 : on dit que les processus stochastiques sont des processus NON DIFFERENTIABLES et on les décrit ensuite au moyen D'EQUATIONS DIFFERENTIELLES... ça ne choque personne ? Moi si.