Informatie

5.5: Multivariate Brownse beweging (samenvatting) - Biologie


Er zijn ten minste vier methoden om te testen op een evolutionaire correlatie tussen continue karakters: waarschijnlijkheidsverhoudingstest, AIC-modelselectie, PIC's en PGLS. Dit zijn allemaal goede keuzes om te testen op de aanwezigheid van een evolutionaire correlatie in uw gegevens.

1: We willen misschien ook lineaire regressie uitvoeren, die gerelateerd is aan correlatieanalyse, maar duidelijk is. Aan het eind van dit hoofdstuk zullen we voorbeelden van fylogenetische regressie laten zien.

terug naar hoofdtekst

2: Hoewel de gezamenlijke verspreiding van alle soorten voor een enkele eigenschap multivariaat normaal is (zie vorige hoofdstukken), zijn individuele veranderingen langs een bepaalde tak van een boom univariaat.

terug naar hoofdtekst

3: Een andere manier om over regressie door de oorsprong na te denken, is door paren van contrasten over elk knooppunt in de boom te zien als tweedimensionale vectoren. Het berekenen van een vectorcorrelatie is gelijk aan het berekenen van een regressie die door de oorsprong wordt gedwongen.

terug naar hoofdtekst

Referenties

Felsenstein, J. 1985. Fylogenieën en de vergelijkende methode. Ben. nat. 125:1–15.

Garland, T., Jr. 1992. Beoordeel tests voor fenotypische evolutie met behulp van fylogenetisch onafhankelijke contrasten. 140:509-519.

Hansen, T.F. 1997. Stabiliserende selectie en de vergelijkende analyse van aanpassing. Evolutie 51:1341-1351.

Hohenlohe, P.A., en S.J. Arnold. 2008. MIPoD: een hypothese-testraamwerk voor micro-evolutionaire gevolgtrekkingen uit divergentiepatronen. 171:366-385.

Revell, L.J. en L. Harmon. Het testen van kwantitatieve genetische hypothesen over de evolutionaire snelheidsmatrix voor continue karakters. Evol. Ecol. Onderzoek 10:311-331.


Is een vector van onafhankelijke Brownse bewegingen een multivariate Brownse beweging?

Gegeven een gefilterde kansruimte $(Omega, mathcal, wiskundig_, P)$ :

Als $B_1, B_2, dots, B_m $ allemaal echt $mathcal . zijn_t$ Brownse moties, gezamenlijk onafhankelijk. Is de resulterende vector $B = (B_1, B_2, dots, B_m )$ een $mathcal_t$ $m$ -dimensionale Brownse beweging of gewoon een natuurlijke?

Het lijkt mij dat ik niet kan concluderen dat $B_t - B_s$ onafhankelijk is van $mathcal_s$ hoewel alle componenten dat wel zijn.

In feite $P(-B_ <1,s>in Lambda_1>, dots,<>-B_ in Lambda_m>, A)$ voor $Lambda_i$ een boorset, en $A in mathcal_s$ kan niet worden ontbonden, omdat alle gebeurtenissen alleen paarsgewijs onafhankelijk zijn met $A$ .

Mis ik iets of heb ik gelijk?

Samenvattend, als $X$ en $Y$ onafhankelijk zijn, en ook paarsgewijs onafhankelijk van een sigma-algebra $mathcal$ , ik heb dat $sigma(X,Y)$ nodig onafhankelijk van $mathcal$ om de kansen te ontbinden. Of met andere woorden, een willekeurige vector waarvan de componenten onafhankelijk zijn van een sigma-algebra, is niet noodzakelijkerwijs zelf onafhankelijk.


Sectie 3.2: Eigenschappen van Brownse beweging

Het kernidee van dit voorbeeld is dat de beweging van het object het gevolg is van de som van een groot aantal zeer kleine, willekeurige krachten. Dit idee is een belangrijk onderdeel van biologische modellen van evolutie onder Brownse beweging. Het is vermeldenswaard dat, hoewel Brownse beweging verandering met zich meebrengt die een sterke willekeurige component heeft, het onjuist is om Brownse bewegingsmodellen gelijk te stellen aan modellen van pure genetische drift (zoals hieronder in meer detail wordt uitgelegd).

Brownse beweging is een populair model in de vergelijkende biologie omdat het de manier weergeeft waarop eigenschappen kunnen evolueren onder een redelijk breed scala aan scenario's. Maar misschien is de belangrijkste reden voor de dominantie van Brownse beweging als model dat het een aantal zeer handige statistische eigenschappen heeft die relatief eenvoudige analyses en berekeningen aan bomen mogelijk maken. Ik zal enkele eenvoudige simulaties gebruiken om te laten zien hoe het Brownse bewegingsmodel zich gedraagt. Ik zal dan de drie kritische statistische eigenschappen van Brownse beweging opsommen en uitleggen hoe we deze eigenschappen kunnen gebruiken om Brownse bewegingsmodellen toe te passen op fylogenetische vergelijkende bomen.

Wanneer we evolutie modelleren met behulp van Brownse beweging, bespreken we meestal de dynamiek van de gemiddelde tekenwaarde, die we zullen aanduiden als $ar$ , in een populatie. Dat wil zeggen, we stellen ons voor dat u een steekproef van de individuen in een populatie kunt meten en de gemiddelde gemiddelde eigenschapswaarde kunt schatten. We zullen op een gegeven moment de gemiddelde eigenschapswaarde aangeven t als $ar(t)$ . We kunnen de gemiddelde eigenschapswaarde in de tijd modelleren met een Browniaans bewegingsproces.

Brownse bewegingsmodellen kunnen volledig worden beschreven door twee parameters. De eerste is de startwaarde van de populatiegemiddelde eigenschap, $ar(0)$ . Dit is de gemiddelde eigenschapswaarde die wordt gezien in de voorouderlijke populatie aan het begin van de simulatie, voordat er een kenmerkverandering optreedt. De tweede parameter van Brownse beweging is de evolutionaire snelheidsparameter, σ 2 . Deze parameter bepaalt hoe snel eigenschappen willekeurig door de tijd lopen.

De kern van de Brownse beweging is de normale verdeling. U weet misschien dat een normale verdeling kan worden beschreven door twee parameters, het gemiddelde en de variantie. Onder Brownse beweging worden veranderingen in eigenschapwaarden over een tijdsinterval altijd getrokken uit een normale verdeling met gemiddelde 0 en variantie evenredig met het product van de evolutiesnelheid en de tijdsduur (variantie = σ 2 t ). Zoals ik later zal laten zien, kunnen we verandering simuleren onder het Brownse bewegingsmodel door te tekenen uit normale verdelingen. Een andere manier om dit eenvoudiger te zeggen, is dat we altijd kunnen beschrijven hoeveel verandering we kunnen verwachten onder Brownse beweging met behulp van normale verdelingen. Deze normale verdelingen voor verwachte veranderingen hebben een gemiddelde van nul en worden groter naarmate het tijdsinterval dat we beschouwen langer wordt.

Enkele simulaties zullen het gedrag van de Brownse beweging illustreren. Figuur 3.1 toont sets van Brownse beweging die over drie verschillende tijdsperioden lopen (t = 100, 500 en 1000) met dezelfde startwaarde $ar(0) = 0$ en tariefparameter σ 2 = 1 . Elk paneel van de afbeelding toont 100 simulaties van het proces gedurende die periode. U kunt zien dat de fooiwaarden op normale verdelingen lijken. Bovendien neemt de variantie tussen afzonderlijke runs van het proces lineair toe met de tijd. Deze variantie tussen runs is het grootst over de langste tijdsintervallen. Het is deze variantie, de variatie tussen vele onafhankelijke runs van hetzelfde evolutionaire proces, die we in de volgende sectie zullen bespreken.

Figuur 3.1. Voorbeelden van Brownse beweging. Elke grafiek toont 100 replica's van gesimuleerde Brownse beweging met een gemeenschappelijke startwaarde en dezelfde snelheidsparameter σ 2 = 1 . Simulaties werden uitgevoerd voor drie verschillende tijden: (A) 10, (B) 50 en (C) 100 tijdseenheden. De rechterkolom toont een histogram van de verdeling van eindwaarden voor elke set van 100 simulaties. Afbeelding van de auteur, kan worden hergebruikt onder een CC-BY-4.0-licentie.

Stel je voor dat we een Browniaans bewegingsproces vele malen over een bepaald tijdsinterval uitvoeren en de eigenschapwaarden aan het einde van elk van deze simulaties opslaan. We kunnen dan een statistische verdeling van deze karaktertoestanden maken. Het is misschien niet duidelijk uit figuur 3.1, maar de verdelingen van mogelijke karaktertoestanden op elk moment in een Brownse wandeling zijn normaal. Dit wordt geïllustreerd in figuur 3.2, waarin de verdeling van kenmerken uit 100.000 simulaties met σ 2 = 1 en t = 100 . De tiptekens van al deze simulaties volgen een normale verdeling met een gemiddelde gelijk aan de startwaarde, $ar(0) = 0$ , en een variantie van σ 2 t = 100 .

Figuur 3.2. Tekenwaarden van 100.000 Brownse bewegingssimulaties beëindigen met $ar(0) = 0$ , t = 100 , en σ 2 = 1 . Paneel (A) toont een histogram van de uitkomst van deze simulaties, terwijl paneel (B) een normale Q-Q-plot voor deze gegevens toont. Als de gegevens een normale verdeling volgen, moeten de punten in de Q-Q-grafiek een rechte lijn vormen. Afbeelding van de auteur, kan worden hergebruikt onder een CC-BY-4.0-licentie.

Figuur 3.3 laat zien hoe snelheidsparameter σ 2 beïnvloedt de verspreidingssnelheid van Brownse wandelingen. De panelen tonen sets van 100 Brownse bewegingssimulaties die worden uitgevoerd in meer dan 1000 tijdseenheden voor σ 2 = 1 (Paneel A), σ 2 = 5 (paneel B), en σ 2 = 25 (paneel C). U kunt zien dat simulaties met een hogere snelheidsparameter een grotere spreiding van eigenschapwaarden tussen simulaties over dezelfde hoeveelheid tijd creëren.

Figuur 3.3. Voorbeelden van Brownse beweging. Elke grafiek toont 100 replica's van gesimuleerde Brownse beweging met een gemeenschappelijke startwaarde en hetzelfde tijdsinterval t = 100 . De snelheidsparameter: σ 2 varieert over de panelen: (A) σ 2 = 1 (B) σ 2 = 10 , en (C) σ 2 = 25 . De rechterkolom toont een histogram van de verdeling van eindwaarden voor elke set van 100 simulaties. Afbeelding van de auteur, kan worden hergebruikt onder een CC-BY-4.0-licentie.

Als we $ar(t)$ de waarde is van ons karakter op tijdstip t, dan kunnen we drie hoofdeigenschappen van Brownse beweging afleiden. Ik zal ze alle drie opsommen en ze vervolgens om de beurt uitleggen.

  1. $E[ar(t)] = ar(0)$
  2. Elk opeenvolgend interval van de "wandeling" is onafhankelijk
  3. $ar(t) sim N(ar(0),sigma^2 t)$

Eerst $E[ar(t)] = ar(0)$ . Dit betekent dat de verwachte waarde van het teken op elk moment t is gelijk aan de waarde van het teken op tijdstip nul. Hier verwijst de verwachte waarde naar het gemiddelde van $ar(t)$ over vele replica's. De intuïtieve betekenis van deze vergelijking is dat Brownse beweging geen "trends" heeft en gelijkelijk in zowel positieve als negatieve richtingen dwaalt. Als u het gemiddelde neemt van een groot aantal simulaties van Brownse beweging over een willekeurig tijdsinterval, krijgt u waarschijnlijk een waarde in de buurt van $ar(0)$ naarmate je de steekproefomvang vergroot, zal dit gemiddelde de neiging hebben om steeds dichter bij $ar . te komen(0)$ .

Ten tweede is elk opeenvolgend interval van de "wandeling" onafhankelijk. Brownse beweging is een proces in continue tijd, en dus heeft tijd geen afzonderlijke "stappen". Als u het proces echter van tijd 0 tot tijd bemonstert t , en dan nog een keer t + Δt , zal de verandering die optreedt over deze twee intervallen onafhankelijk van elkaar zijn. Dit geldt voor elke twee niet-overlappende intervallen die zijn bemonsterd uit een Brownse wandeling. Het is vermeldenswaard dat alleen de veranderingen onafhankelijk zijn en dat de waarde van de wandeling op tijd t + Δt – wat we kunnen schrijven als $ar(t+Delta t)$ - is niet onafhankelijk van de waarde van de wandeling op het moment t , $ar(t)$ . Maar de verschillen tussen opeenvolgende stappen [bijv. $ar(t)-ar(0)$ en $ar(t+Delta t) - ar(t)$ ] zijn onafhankelijk van elkaar en van $ar(0)$ .

Eindelijk, $ar(t) sim N(ar(0),sigma^2 t)$ .Dat wil zeggen, de waarde van $ar(t)$ wordt getrokken uit een normale verdeling met gemiddelde $ar(0)$ en variantie σ 2 t . Zoals we hierboven hebben opgemerkt, is de parameter σ 2 is belangrijk voor Brownse bewegingsmodellen, omdat het de snelheid beschrijft waarmee het proces door de eigenschapruimte dwaalt. De algemene variantie van het proces is dat tarief maal de hoeveelheid tijd die is verstreken.


Inhoud

Een stochastisch proces St zou een GBM volgen als deze voldoet aan de volgende stochastische differentiaalvergelijking (SDE):

De eerste wordt gebruikt om deterministische trends te modelleren, terwijl de laatste term vaak wordt gebruikt om een ​​reeks onvoorspelbare gebeurtenissen tijdens deze beweging te modelleren.

Voor een willekeurige beginwaarde S0 de bovenstaande SDE heeft de analytische oplossing (onder de interpretatie van Itô):

De afleiding vereist het gebruik van Itô-calculus. Het toepassen van de formule van Itô leidt tot:

Het nemen van de exponentiële en vermenigvuldiging van beide zijden met S 0 > geeft de hierboven geclaimde oplossing.

Ze kunnen worden afgeleid met behulp van het feit dat Z t = exp ⁡ ( σ W t − 1 2 2 t ) < Displaystyle Z_=exp links(sigma W_-<2>>sigma ^<2>t ight)> is een martingaal, en dat

Om de kansdichtheidsfunctie voor GBM af te leiden, moeten we de Fokker-Planck-vergelijking gebruiken om de tijdsevolutie van de PDF te evalueren:

waarbij δ ( S ) de Dirac-deltafunctie is. Om de berekening te vereenvoudigen, kunnen we een logaritmische transformatie introduceren x = log ⁡ ( S / S 0 ) )> , wat leidt tot de vorm van GBM:

Dan wordt de equivalente Fokker-Planck-vergelijking voor de evolutie van de PDF:

Wat leidt tot de nieuwe vorm van de Fokker-Planck-vergelijking:

Dit is echter de canonieke vorm van de warmtevergelijking. die de oplossing heeft die wordt gegeven door de warmtekernel:

Het inpluggen van de originele variabelen leidt tot de PDF voor GBM:

Bij het afleiden van verdere eigenschappen van GBM kan gebruik worden gemaakt van de SDE waarvan GBM de oplossing is, of kan de hierboven genoemde expliciete oplossing worden gebruikt. Beschouw bijvoorbeeld het stochastische proceslog(St). Dit is een interessant proces, omdat het in het Black-Scholes-model gerelateerd is aan het logrendement van de aandelenkoers. Het lemma van Itô gebruiken met F(S) = logboek(S) geeft

Dit resultaat kan ook worden afgeleid door de logaritme toe te passen op de expliciete oplossing van GBM:

Het nemen van de verwachting levert hetzelfde resultaat op als hierboven: E ⁡ log ⁡ ( S t ) = log ⁡ ( S 0 ) + ( μ − σ 2 / 2 ) t log(S_)=log(S_<0>)+(mu -sigma ^<2>/2)t> .

GBM kan worden uitgebreid tot het geval er meerdere gecorreleerde prijspaden zijn.

Elk prijspad volgt het onderliggende proces

Voor het multivariate geval betekent dit dat:

Geometrische Brownse beweging wordt gebruikt om aandelenkoersen te modelleren in het Black-Scholes-model en is het meest gebruikte model voor het gedrag van aandelenkoersen. [3]

Enkele van de argumenten om GBM te gebruiken om aandelenkoersen te modelleren zijn:

  • Het verwachte rendement van GBM is onafhankelijk van de waarde van het proces (aandelenkoers), wat overeenkomt met wat we in werkelijkheid zouden verwachten. [3]
  • Een GBM-proces gaat alleen uit van positieve waarden, net als echte aandelenkoersen.
  • Een GBM-proces vertoont dezelfde soort 'ruwheid' in zijn paden als we zien in reële aandelenkoersen.
  • Berekeningen met GBM-processen zijn relatief eenvoudig.

GBM is echter geen volledig realistisch model, met name op de volgende punten schiet het tekort:

  • In reële aandelenkoersen verandert de volatiliteit in de tijd (mogelijk stochastisch), maar in GBM wordt aangenomen dat de volatiliteit constant is.
  • In het echte leven vertonen aandelenkoersen vaak sprongen veroorzaakt door onvoorspelbare gebeurtenissen of nieuws, maar in GBM is het pad continu (geen discontinuïteit).

In een poging om GBM realistischer te maken als model voor aandelenkoersen, kan men de aanname laten vallen dat de volatiliteit ( σ ) constant is. Als we aannemen dat de volatiliteit een deterministische functie is van de aandelenkoers en tijd, wordt dit een lokaal volatiliteitsmodel genoemd. Als we in plaats daarvan aannemen dat de volatiliteit een eigen willekeur heeft - vaak beschreven door een andere vergelijking die wordt aangedreven door een andere Brownse beweging - wordt het model een stochastisch volatiliteitsmodel genoemd.


Bekijk de video: Samenvatting H11 vwo 6 (November 2021).