Informatie

13.2: Een staatsafhankelijk model van diversificatie - biologie


De modellen die we in dit hoofdstuk zullen beschouwen, omvatten de evolutie van eigenschappen en de daarmee samenhangende afstammingsdiversificatie. In het eenvoudigste geval kunnen we een model overwegen waarin het personage twee toestanden heeft, 0 en 1, en de diversificatiepercentages afhankelijk zijn van die toestanden. We moeten de overgangen tussen deze toestanden modelleren, wat we op dezelfde manier kunnen doen als wat we in hoofdstuk 7 hebben gedaan met behulp van een continu-tijd Markov-model. We drukken dit model uit met behulp van twee koersparameters, een forward rate Q01 en een achterwaarts tarief Q10.

We beschouwen nu het idee dat diversificatiesnelheden kunnen afhangen van de karakterstatus. We nemen aan dat soorten met karaktertoestand 0 een bepaalde soortvormingssnelheid hebben (λ0) en uitstervingspercentage (μ0), en die soorten in 1 hebben potentieel verschillende snelheden van beide soortvorming (λ1) en uitsterven (μ1). Dat wil zeggen, wanneer het karakter evolueert, beïnvloedt het de snelheid van soortvorming en/of uitsterven van de geslachten. We hebben dus een model met zes parameters (Maddison et al. 2007). We nemen aan dat ouderlijnen dochters baren met dezelfde karakterstatus, dat wil zeggen dat karakterstatussen niet veranderen bij soortvorming.

Het is eenvoudig om evolutie te simuleren onder onze staatsafhankelijk model van diversificatie. We gaan op dezelfde manier te werk als bij geboorte-doodmodellen, door wachttijden te tekenen, maar deze wachttijden kunnen wachttijden zijn tot de volgende karakterstatusverandering, soortvorming of uitstervingsgebeurtenis. Stel je vooral voor dat er N afstammingen die op dat moment aanwezig zijn t, en dat k van deze geslachten zijn in staat 0 (en Nk bevinden zich in toestand 1). De wachttijd tot de volgende gebeurtenis zal een exponentiële verdeling volgen met een snelheidsparameter van:

[ρ = k(q_{01} + λ_0 + μ_0)+(n − k)(q_{10} + λ_1 + μ_1) label{13.1}]

Deze vergelijking zegt dat het totale aantal gebeurtenissen de som is van de gebeurtenissen die kunnen gebeuren met afstammelingen met toestand 0 (toestandsverandering naar 1, soortvorming of uitsterven) en de analoge gebeurtenissen die kunnen gebeuren met afstammelingen met toestand 1. Zodra we een wachttijd, kunnen we afhankelijk van de waarschijnlijkheid een gebeurtenistype toewijzen. Bijvoorbeeld, de kans dat de gebeurtenis een karakterverandering is van 0 naar 1 is:

[p_{q_{01}} = (n ⋅ q_{01})/ρlabel{13.2}]

En de kans dat de gebeurtenis het uitsterven is van een afstamming met karakterstatus 1 is:

[p_{μ_1} = dfrac{(n − k)⋅μ_1}{ρ} label{13.3}]

En zo verder voor de andere vier mogelijke gebeurtenissen.

Zodra we een gebeurtenis op deze manier hebben gekozen, kunnen we deze willekeurig toewijzen aan een van de lijnen in de juiste staat, waarbij elke lijn even waarschijnlijk wordt gekozen. Vervolgens gaan we vooruit in de tijd totdat we een dataset hebben met de gewenste grootte of totale tijddiepte.

Een voorbeeldsimulatie wordt getoond in figuur 13.1. Zoals u kunt zien, is onder deze modelparameters de impact van karakterstatussen op diversificatie duidelijk zichtbaar. In de volgende sectie zullen we uitzoeken hoe we die informatie uit onze gegevens kunnen halen.

Figuur 13.1. Simulatie van karakterafhankelijke diversificatie. Gegevens werden gesimuleerd onder een model waarbij de diversificatiesnelheid van toestand nul (rood) aanzienlijk lager is dan die van toestand 1 (zwart; modelparameters q01 = 110 = 0,05,0 = 0,2,1 = 0,8,0 =1 = 0,05). Afbeelding van de auteur, kan worden hergebruikt onder een CC-BY-4.0-licentie.


Staatsafhankelijke diversificatie met HiSSE

BiSSE en MuSSE zijn krachtige benaderingen voor het testen van de associatie van een personage met heterogeniteit in de diversificatiesnelheid. Er is echter aangetoond dat BiSSE vatbaar is voor het ten onrechte identificeren van een positieve associatie wanneer verschuivingen in diversificatiesnelheid worden gecorreleerd met een personage dat niet in het model is opgenomen (Maddison en FitzJohn 2015 Rabosky en Goldberg 2015). Een manier om de mogelijkheid te verkleinen dat een personage ten onrechte wordt geassocieerd met heterogeniteit in de diversificatiesnelheid, is door een tweede, niet-geobserveerd teken in het model op te nemen (d.w.z., een Hidden State-Dependent Speciation and Extinction (HiSSE) model, zie bijvoorbeeld Beaulieu en O'Meara (2016)). De veranderingen in de toestand van het niet-geobserveerde karakter vertegenwoordigen veranderingen in de achtergronddiversificatiesnelheid die niet gecorreleerd zijn met het waargenomen karakter. Zie voor een schematisch overzicht van het HiSSE-model en Tabel 2 voor een uitleg van de HiSSE-modelparameters. Laten we nu een HiSSE-analyse opzetten en uitvoeren in RevBayes.

We houden deze tutorial kort en gaan ervan uit dat je werk hebt door de staatsafhankelijke diversificatie met BiSSE en MuSSE.

Een schematisch overzicht van het HiSSE-model. Elke afstamming heeft een waargenomen binaire toestand: toestand 0 (blauw) of toestand 1 (rood). Verder is er een tweede, niet-geobserveerd (verborgen), binair karakter met toestanden A of B. Het HiSSE-model beschrijft gezamenlijk de evolutie van beide van deze twee karakters. Een afstamming moet zich in een van de vier verschillende toestanden bevinden: 0A, 0B, 1A, of 1B. We schatten afzonderlijke soortenvorming en uitstervingspercentages voor elk van deze vier staten. Merk op dat net zoals BiSSE gemakkelijk kan worden uitgebreid tot MuSSE, RevBayes u in staat stelt om HiSSE-modellen uit te breiden tot voorbij binaire waargenomen en niet-geobserveerde karakters.


Paragraaf 13.2: Een van de staat afhankelijk model van diversificatie

De modellen die we in dit hoofdstuk zullen beschouwen, omvatten de evolutie van eigenschappen en de daarmee samenhangende afstammingsdiversificatie. In het eenvoudigste geval kunnen we een model overwegen waarin het personage twee toestanden heeft, 0 en 1, en de diversificatiepercentages afhankelijk zijn van die toestanden.

We moeten de overgangen tussen deze toestanden modelleren, wat we op dezelfde manier kunnen doen als wat we in hoofdstuk 7 hebben gedaan met behulp van een continu-tijd Markov-model. We drukken dit model uit met behulp van twee koersparameters, een forward rate Q01 en een achterwaarts tarief Q10 .

We beschouwen nu het idee dat diversificatiesnelheden kunnen afhangen van de karakterstatus. We nemen aan dat soorten met karaktertoestand 0 een bepaalde soortvormingssnelheid hebben ( λ0 ) en uitstervingspercentage ( μ0 ), en die soorten in 1 hebben potentieel verschillende snelheden van beide soortvorming ( λ1 ) en uitsterven ( μ1 ). Dat wil zeggen, wanneer het karakter evolueert, beïnvloedt het de snelheid van soortvorming en/of uitsterven van de geslachten. We hebben dus een model met zes parameters (Maddison et al. 2007). We nemen aan dat ouderlijnen dochters baren met dezelfde karakterstatus, dat wil zeggen dat karakterstatussen niet veranderen bij soortvorming.

Het is eenvoudig om evolutie te simuleren onder ons toestandsafhankelijke model van diversificatie. We gaan op dezelfde manier te werk als voor geboorte-doodmodellen, door wachttijden te tekenen, maar deze wachttijden kunnen wachttijden zijn tot de volgende karakterstatusverandering, soortvorming of uitstervingsgebeurtenis. Stel je vooral voor dat er N afstammingen die op dat moment aanwezig zijn t , en dat k van deze geslachten zijn in staat 0 (en Nk bevinden zich in toestand 1). De wachttijd tot de volgende gebeurtenis zal een exponentiële verdeling volgen met een snelheidsparameter van:

Deze vergelijking zegt dat het totale aantal gebeurtenissen de som is van de gebeurtenissen die kunnen gebeuren met afstammelingen met toestand 0 (toestandsverandering naar 1, soortvorming of uitsterven) en de analoge gebeurtenissen die kunnen gebeuren met afstammelingen met toestand 1. Zodra we een wachttijd, kunnen we afhankelijk van de waarschijnlijkheid een gebeurtenistype toewijzen. Bijvoorbeeld, de kans dat de gebeurtenis een karakterverandering is van 0 naar 1 is:

En de kans dat de gebeurtenis het uitsterven is van een afstamming met karakterstatus 1 is:

En zo verder voor de andere vier mogelijke gebeurtenissen.

Zodra we een gebeurtenis op deze manier hebben gekozen, kunnen we deze willekeurig toewijzen aan een van de lijnen in de juiste staat, waarbij elke lijn even waarschijnlijk wordt gekozen. Vervolgens gaan we vooruit in de tijd totdat we een dataset hebben met de gewenste grootte of totale tijddiepte.

Een voorbeeldsimulatie wordt getoond in figuur 13.1. Zoals u kunt zien, is onder deze modelparameters de impact van karakterstatussen op diversificatie duidelijk zichtbaar. In de volgende sectie zullen we uitzoeken hoe we die informatie uit onze gegevens kunnen halen.

Figuur 13.1. Simulatie van karakterafhankelijke diversificatie. Gegevens werden gesimuleerd onder een model waarbij de diversificatiesnelheid van toestand nul (rood) aanzienlijk lager is dan die van toestand 1 (zwarte modelparameters Q01 = 110 = 0.05 , λ0 = 0.2 , λ1 = 0.8 , μ0 = μ1 = 0,05). Afbeelding van de auteur, kan worden hergebruikt onder een CC-BY-4.0-licentie.


Andere bestanden en links

  • APA
  • Standaard
  • Harvard
  • Vancouver
  • Auteur
  • BIBTEX
  • RIS

In: Systematische Biologie, Vol. 68, nr. 2, 03.2019, p. 317-328.

Onderzoeksoutput : Bijdrage aan tijdschrift › Artikel › peer-review

T1 - Detectie van de afhankelijkheid van diversificatie van meerdere eigenschappen van fylogenetische bomen en eigenschapgegevens

N1 - Dit werk werd financieel ondersteund door Consejo Nacional de Ciencia y Tecnologia (CVU 385304 LH-A.), de Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO-VICI-subsidie ​​toegekend aan RSE) en de Faculty of Science and Engineering en het Groningen Institute for Evolutionaire Levenswetenschappen aan de Rijksuniversiteit Groningen (Adaptive Life Program PVE).

N2 - Diversificatie van soorten kan worden bepaald door veel verschillende variabelen, waaronder de kenmerken van de diversifiërende lijnen. Het state-dependent speciation and extinction (SSE) raamwerk bevat methoden om de afhankelijkheid van diversificatie van deze eigenschappen te detecteren. Voor de analyse van eigenschappen met meerdere toestanden is MuSSE (multiple-states dependance speciation and extinction) ontwikkeld. Het is echter aangetoond dat MuSSE en andere SSE-modellen valse positieven opleveren, omdat ze differentiële diversificatiesnelheden niet kunnen scheiden van afhankelijkheid van diversificatie van de waargenomen eigenschappen. De recent geïntroduceerde methode HiSSE (hidden-state-dependent speciation and extinction) lost dit probleem op door toe te staan ​​dat een verborgen staat de diversificatiepercentages beïnvloedt. Helaas staat HiSSE geen eigenschappen toe met meer dan twee toestanden, en, misschien nog interessanter, de gelijktijdige werking van meerdere eigenschappen op diversificatie. Hierin introduceren we een R-pakket (SecSSE: verschillende onderzochte en verborgen toestandsafhankelijke soortvorming en uitsterven) dat de kenmerken van HiSSE en MuSSE combineert om gelijktijdig toestandsafhankelijke diversificatie af te leiden over twee of meer onderzochte (geobserveerde) eigenschappen of toestanden, rekening houdend met de rol van een mogelijk verborgen (verborgen) eigenschap. Bovendien heeft SecSSE ook verbeterde functionaliteit in vergelijking met zijn twee 'ouders'. Ten eerste zorgt het ervoor dat een waargenomen eigenschap zich in twee of meer toestanden tegelijk bevindt, wat bijvoorbeeld handig is wanneer een taxon een generalist is of wanneer de exacte toestand niet precies bekend is. Ten tweede biedt het de juiste waarschijnlijkheid wanneer het is geconditioneerd op niet-uitsterven, wat onjuist is geïmplementeerd in HiSSE en andere SSE-modellen. Om onze methode te illustreren, passen we SecSSE toe op zeven eerdere onderzoeken die MuSSE gebruikten, en ontdekken dat in vijf van de zeven gevallen de conclusies die op MuSSE zijn getrokken voorbarig waren. We testen met simulaties of SecSSE statistische kracht opoffert om het hoge Type I-foutprobleem van MuSSE te vermijden, maar we vinden dat dit niet het geval is: voor de meeste simulaties waarbij de waargenomen eigenschappen diversificatie beïnvloeden, detecteert SecSSE dit.

AB - Diversificatie van soorten kan worden bepaald door veel verschillende variabelen, inclusief de kenmerken van de diversifiërende lijnen. Het state-dependent speciation and extinction (SSE) raamwerk bevat methoden om de afhankelijkheid van diversificatie van deze eigenschappen te detecteren. Voor de analyse van eigenschappen met meerdere toestanden werd MuSSE (multiple-states dependance speciation and extinction) ontwikkeld. Het is echter aangetoond dat MuSSE en andere SSE-modellen valse positieven opleveren, omdat ze differentiële diversificatiesnelheden niet kunnen scheiden van afhankelijkheid van diversificatie van de waargenomen eigenschappen. De recent geïntroduceerde methode HiSSE (hidden-state-dependent speciation and extinction) lost dit probleem op door toe te staan ​​dat een verborgen staat de diversificatiepercentages beïnvloedt. Helaas staat HiSSE geen eigenschappen toe met meer dan twee toestanden, en, misschien nog interessanter, de gelijktijdige werking van meerdere eigenschappen op diversificatie. Hierin introduceren we een R-pakket (SecSSE: verschillende onderzochte en verborgen toestandsafhankelijke soortvorming en uitsterven) dat de kenmerken van HiSSE en MuSSE combineert om gelijktijdig toestandsafhankelijke diversificatie af te leiden over twee of meer onderzochte (geobserveerde) eigenschappen of toestanden, rekening houdend met de rol van een mogelijk verborgen (verborgen) eigenschap. Bovendien heeft SecSSE ook verbeterde functionaliteit in vergelijking met zijn twee 'ouders'. Ten eerste zorgt het ervoor dat een waargenomen eigenschap zich in twee of meer toestanden tegelijk bevindt, wat bijvoorbeeld handig is wanneer een taxon een generalist is of wanneer de exacte toestand niet precies bekend is. Ten tweede biedt het de juiste waarschijnlijkheid wanneer het is geconditioneerd op niet-uitsterven, wat onjuist is geïmplementeerd in HiSSE en andere SSE-modellen. Om onze methode te illustreren, passen we SecSSE toe op zeven eerdere onderzoeken die MuSSE gebruikten, en ontdekken dat in vijf van de zeven gevallen de conclusies op basis van MuSSE voorbarig waren. We testen met simulaties of SecSSE statistische kracht opoffert om het hoge Type I-foutprobleem van MuSSE te vermijden, maar we vinden dat dit niet het geval is: voor de meeste simulaties waarbij de waargenomen eigenschappen diversificatie beïnvloeden, detecteert SecSSE dit.


Verborgen toestandsmodellen verbeteren de geschiktheid van toestandsafhankelijke diversificatiebenaderingen met behulp van empirische bomen, inclusief biogeografische modellen

De toestandsafhankelijke soortvormings- en uitstervingsmodellen (SSE) zijn onlangs bekritiseerd vanwege hun hoge percentages van "vals-positieve" resultaten en veel onderzoekers hebben gepleit voor het vermijden van SSE-modellen ten gunste van andere "niet-parametrische" of "semi-parametrische" benaderingen . De verborgen Markov-modellering (HMM) -benadering biedt een gedeeltelijke oplossing voor de problemen van modelgeschiktheid die zijn gedetecteerd met SSE-modellen. De opname van "verborgen toestanden" kan de heterogeniteit van de snelheid verklaren die wordt waargenomen in empirische fylogenieën en maakt detectie mogelijk van echte signalen van toestandsafhankelijke diversificatie of diversificatieverschuivingen onafhankelijk van het kenmerk van belang. De acceptatie van HMM in andere klassen van SSE-modellen werd echter belemmerd door de interpretatieve uitdagingen van wat precies een "verborgen staat" vertegenwoordigt, die we hierin verduidelijken. We laten zien dat HMM-modellen in combinatie met een model-middeling benadering natuurlijk rekening houden met verborgen eigenschappen bij het onderzoeken van de betekenisvolle impact van een vermoedelijke "driver" van diversificatie. We breiden de HMM ook uit tot het model voor geografische toestandafhankelijke soortvorming en uitsterven (GeoSSE). We testen de werkzaamheid van onze "GeoHiSSE" -extensie met zowel simulaties als een empirische dataset. Over het algemeen laten we zien dat verborgen toestanden een algemeen raamwerk zijn dat in het algemeen heterogene effecten van diversificatie kan onderscheiden die worden toegeschreven aan een focaal karakter.

Bijdragen van auteurs

JMB en BCO bedachten de verborgen Markov-benadering die werd toegepast op SSE-modellen. DSC, BCO en JMB ontwierpen simulaties, afgeleide modellen, geïmplementeerde modelmiddeling en R-code. DSC voerde simulaties uit. JMB heeft empirische analyses uitgevoerd. DSC, BCO en JMB schreven het manuscript.


Verborgen staatsmodellen verbeteren staatsafhankelijke diversificatiebenaderingen, inclusief biogeografische modellen

De toestandsafhankelijke soortvorming en uitsterven (SSE) modellen zijn onlangs bekritiseerd vanwege hun hoge percentage "vals-positieve" resultaten. Veel onderzoekers hebben gepleit voor het vermijden van SSE-modellen ten gunste van andere "niet-parametrische" of "semiparametrische" benaderingen. De verborgen Markov-modellering (HMM) -benadering biedt een gedeeltelijke oplossing voor de problemen van modelgeschiktheid die zijn gedetecteerd met SSE-modellen. De opname van "verborgen toestanden" kan de heterogeniteit van de snelheid verklaren die wordt waargenomen in empirische fylogenieën en zorgt voor een betrouwbare detectie van toestandsafhankelijke diversificatie of diversificatieverschuivingen onafhankelijk van het kenmerk van belang. De adoptie van HMM werd echter belemmerd door de interpretatieve uitdagingen van wat precies een "verborgen staat" vertegenwoordigt, die we hierin verduidelijken. We laten zien dat HMM's in combinatie met een model-middeling benadering natuurlijk verantwoordelijk zijn voor verborgen eigenschappen bij het onderzoeken van de betekenisvolle impact van een vermoedelijke "driver" van diversificatie. We breiden de HMM ook uit tot het model voor geografische toestandafhankelijke soortvorming en uitsterven (GeoSSE). We testen de werkzaamheid van onze "GeoHiSSE" -extensie met zowel simulaties als een empirische dataset. Over het algemeen laten we zien dat verborgen toestanden een algemeen raamwerk zijn dat heterogene effecten van diversificatie kan onderscheiden die worden toegeschreven aan een focaal karakter.

Tabel S1: Beschrijving van scenario's en parameterwaarden die worden gebruikt om de gegevens te simuleren.

Tabel S2: Extra 17 modellen gebruikt in empirische studie van coniferen.

Tabel S3: Beschrijving van scenario's en parameterwaarden die worden gebruikt om fylogenetische bomen en bereikverdelingen te simuleren onder het GeoSSE+extirpatiemodel.

Figuur S1: Schema van de overgangstarieven tussen tariefklassen (RC0 tot RC4) gebruikt voor de simulatiescenario's met meerdere tariefklassen (Sims B, C en D).

Figuur S2: Aandeel van wijdverbreide afstammingslijnen op bomen gesimuleerd onder scenario's E en F.

Figuur S3: Samenvatting van modelondersteuning voor gesimuleerde scenario's A tot D.

Figuur S4: Samenvatting van modelondersteuning voor gesimuleerde scenario's E tot H.

Figuur S5: Nauwkeurigheid van schattingen van omzet en extinctiefractie voor simulatiescenario's A tot D.

Figuur S6: Nauwkeurigheid van schattingen van nettodiversificatie voor simulatiescenario's A tot D.

Afbeelding S7: Resultaten voor relatieve netto diversificatiepercentages en Akaike-modelgewichten (AICw) voor simulatiescenario's B en C.

Figuur S8: Verdeling van Akaike-gewichten voor de modelset die is aangepast aan simulatiescenario's ext_A tot ext_D.

Figuur S9: Verdeling van parameterwaarden over 100 simulatiereplicaties voor elk van de scenario's ext_A tot ext_D.

Let op: De uitgever is niet verantwoordelijk voor de inhoud of functionaliteit van eventuele ondersteunende informatie die door de auteurs wordt aangeleverd. Alle vragen (behalve ontbrekende inhoud) moeten worden gericht aan de corresponderende auteur van het artikel.


Verborgen staatsmodellen verbeteren staatsafhankelijke diversificatiebenaderingen, inclusief biogeografische modellen

De toestandsafhankelijke soortvorming en uitsterven (SSE) modellen zijn onlangs bekritiseerd vanwege hun hoge percentage "vals-positieve" resultaten. Veel onderzoekers hebben gepleit voor het vermijden van SSE-modellen ten gunste van andere "niet-parametrische" of "semiparametrische" benaderingen. De verborgen Markov-modellering (HMM) -benadering biedt een gedeeltelijke oplossing voor de problemen van modelgeschiktheid die zijn gedetecteerd met SSE-modellen. De opname van "verborgen toestanden" kan de heterogeniteit van de snelheid verklaren die wordt waargenomen in empirische fylogenieën en zorgt voor een betrouwbare detectie van toestandsafhankelijke diversificatie of diversificatieverschuivingen onafhankelijk van het kenmerk van belang. De adoptie van HMM werd echter belemmerd door de interpretatieve uitdagingen van wat precies een "verborgen staat" vertegenwoordigt, die we hierin verduidelijken. We laten zien dat HMM's in combinatie met een model-middeling benadering natuurlijk verantwoordelijk zijn voor verborgen eigenschappen bij het onderzoeken van de betekenisvolle impact van een vermoedelijke "driver" van diversificatie. We breiden de HMM ook uit tot het model voor geografische toestandafhankelijke soortvorming en uitsterven (GeoSSE). We testen de werkzaamheid van onze "GeoHiSSE" -extensie met zowel simulaties als een empirische dataset. Over het algemeen laten we zien dat verborgen toestanden een algemeen raamwerk zijn dat heterogene effecten van diversificatie kan onderscheiden die worden toegeschreven aan een focaal karakter.

Tabel S1: Beschrijving van scenario's en parameterwaarden die worden gebruikt om de gegevens te simuleren.

Tabel S2: Extra 17 modellen gebruikt in empirische studie van coniferen.

Tabel S3: Beschrijving van scenario's en parameterwaarden die worden gebruikt om fylogenetische bomen en bereikverdelingen te simuleren onder het GeoSSE+extirpatiemodel.

Figuur S1: Schema van de overgangstarieven tussen tariefklassen (RC0 tot RC4) gebruikt voor de simulatiescenario's met meerdere tariefklassen (Sims B, C en D).

Figuur S2: Aandeel van wijdverbreide afstammingslijnen op bomen gesimuleerd onder scenario's E en F.

Figuur S3: Samenvatting van modelondersteuning voor gesimuleerde scenario's A tot D.

Figuur S4: Samenvatting van modelondersteuning voor gesimuleerde scenario's E tot H.

Figuur S5: Nauwkeurigheid van schattingen van omzet en extinctiefractie voor simulatiescenario's A tot D.

Figuur S6: Nauwkeurigheid van schattingen van nettodiversificatie voor simulatiescenario's A tot D.

Figuur S7: Resultaten voor relatieve netto diversificatiepercentages en Akaike-modelgewichten (AICw) voor simulatiescenario's B en C.

Figuur S8: Verdeling van Akaike-gewichten voor de modelset die is aangepast aan simulatiescenario's ext_A tot ext_D.

Figuur S9: Verdeling van parameterwaarden over 100 simulatiereplicaties voor elk van de scenario's ext_A tot ext_D.

Let op: De uitgever is niet verantwoordelijk voor de inhoud of functionaliteit van eventuele ondersteunende informatie die door de auteurs wordt aangeleverd. Alle vragen (behalve ontbrekende inhoud) moeten worden gericht aan de corresponderende auteur van het artikel.


Vergelijk de tariefschattingen

Vergelijk de geschatte tarieven wanneer de activiteitstijd het centrale karakter is versus wanneer eenzaamheid het afhankelijke karakter is. Dit doe je door te openen beide bestanden in hetzelfde tracervenster. Als het je is gelukt om alle parameters dezelfde naam te geven, is het mogelijk om de schattingen in het Tracer-venster te vergelijken door beide bestanden te markeren.

Verken de schattingen van de verschillende parameters. Zijn er verschillende? Zijn er dezelfde?

Waarom denk je dat je dit patroon ziet?


Referenties

Freeling M, Scanlon MJ, Fowler JE. Fractionering en subfunctionalisatie na genoomduplicaties: mechanismen die de inhoud van genen en hun gevolgen aansturen. Curr Opin Genet Dev. 201535:110–8. https://doi.org/10.1016/j.gde.2015.11.002.

Soltis PS, Soltis DE. Oude WGD-evenementen als aanjagers van belangrijke innovaties in angiospermen. Curr Opin Plant Biol. 201630:159-65. https://doi.org/10.1016/j.pbi.2016.03.015.

Tank DC, Eastman JM, Pennell MW, Soltis PS, Soltis DE, Hinchliff CE, et al. Geneste stralingen en de puls van diversificatie van angiospermen: verhoogde diversificatiesnelheden volgen vaak op duplicaties van het hele genoom. Nieuwe fytol. 2015207(2):454-67. https://doi.org/10.1111/nph.13491.

Van de Peer Y, Mizrachi E, Marchal K. De evolutionaire betekenis van polyploïdie. Nat Rev Genet. 201718(7):411-24. https://doi.org/10.1038/nrg.2017.26.

Zhang K, Wang XW, Cheng F. Plantenpolyploïdie: oorsprong, evolutie en de invloed ervan op de domesticatie van gewassen. Tuinbouwinstallatie J. 20195:231–9.

Cheng F, Wu J, Cai X, Liang J, Freeling M, Wang X. Genretentie, fractionering en subgenoomverschillen in polyploïde planten. Nat Planten. 20184:258-68.

Jackson S, Chen ZJ. Genomische en expressieplasticiteit van polyploïdie. Curr Opi Plant Biol. 201013(2):153–9. https://doi.org/10.1016/j.pbi.2009.11.004.

Renny-Byfield S, Gong L, Gallagher JP, Wendel JF. Persistentie van subgenomen in paleopolyploïde katoen na 60 jaar evolutie. Mol Biol Evol. 201532(4):1063-71. https://doi.org/10.1093/molbev/msv001.

Cheng F, Sun C, Wu J, Schnable J, Woodhouse MR, Liang JL, et al. Epigenetische regulatie van subgenoomdominantie na verdrievoudiging van het hele genoom in Brassica rapa. Nieuwe fytoloog. 2016211:288-99.

Li AL, Liu DC, Wu J, Zhao XB, Hao M, Geng SF, et al. mRNA en kleine RNA-transcriptomen onthullen inzichten in dynamische homologe regulatie van allopolyploïde heterosis in ontluikende hexaploïde tarwe. Plantaardige cel. 201426(5):1878–900. https://doi.org/10.1105/tpc.114.124388.

Thomas BC, Pedersen B, Freeling M. Na tetraploïdie in een Arabidopsis-voorouder werden genen bij voorkeur verwijderd van één homeoloog, waardoor clusters werden achtergelaten die waren verrijkt met dosisgevoelige genen. Genoom onderzoek. 200616(7):934-46. https://doi.org/10.1101/gr.4708406.

Wang JL, Tian L, Lee HS, Wei NE, Jiang HM, Watson B, et al. Genoombrede niet-additieve genregulatie in Arabidopsis allotetraploïden. Genetica. 2006172(1):507–17. https://doi.org/10.1534/genetics.105.047894.

Alger EI, Edger PP. Eén subgenoom om ze allemaal te beheersen: onderliggende mechanismen van subgenoomdominantie. Curr Opin Plant Biol. 202054:108–13. https://doi.org/10.1016/j.pbi.2020.03.004.

Freeling M, Woodhouse MR, Subramaniam S, Turco G, Lisch D, Schnable JC. Fractioneringsmutagenese en soortgelijke gevolgen van mechanismen die overbodig of minder tot expressie gebracht DNA in planten verwijderen. Curr Opin Plant Biol. 201215:131–9.

Edger PP, Smith R, McKain MR, Cooley AM, Vallejo-Marin M, Yuan YW, et al. Subgenoomdominantie in een interspecifieke hybride, synthetische allopolyploïde en een 140 jaar oude natuurlijk gevestigde neo-allopolyploïde apenbloem. Plantaardige cel. 201729(9):2150-67. https://doi.org/10.1105/tpc.17.00010.

Cheng F, Wu J, Fang L, Sun SL, Liu B, Lin K, et al. Bevooroordeelde genfractionering en dominante genexpressie tussen de subgenomen van Brassica rapa. Plos één. 20127(5):e36442. https://doi.org/10.1371/journal.pone.0036442.

Pfeifer M, Kugler KG, Sandve SR, Zhan BJ, Rudi H, Hvidsten TR, et al. Genoom samenspel in het graantranscriptoom van hexaploïde broodtarwe. Wetenschap. 2014345(6194):1250091. https://doi.org/10.1126/science.1250091.

Bird KA, VanBuren R, Puzey JR, Edger PP. De oorzaken en gevolgen van subgenoomdominantie in hybriden en recente polyploïden. Nieuwe fytol. 2018220(1):87-93. https://doi.org/10.1111/nph.15256.

Chalhoub B, Denoeud F, Liu SY, Parkin IAP, Tang HB, Wang XY, et al. Vroege allopolyploïde evolutie in het post-neolithicum Brassica napus genoom van oliezaden. Wetenschap. 2014345(6199):950-3. https://doi.org/10.1126/science.1253435.

Levin DA, Soltis DE. Factoren die polyploïde persistentie en diversificatie bevorderen en diploïde soortvorming tijdens het K-Pg-intermezzo beperken. Curr Opin Plant Biol. 201842:1–7. https://doi.org/10.1016/j.pbi.2017.09.010.

Salman-Minkov A, Sabath N, Mayrose I. Duplicatie van het hele genoom als een sleutelfactor bij de domesticatie van gewassen. NatPlanten. 20162(8). https://doi.org/10.1038/nplants.2016.115.

Vanneste K, Maere S, Van de Peer Y. Verstrikt in twee: een uitbarsting van genoomduplicaties aan het einde van het Krijt en de gevolgen voor de evolutie van planten. Philos Trans R Soc B Biol Sci. 2014369 (1648):20130353. https://doi.org/10.1098/rstb.2013.0353.

Leitch AR, Leitch IJ. Genomische plasticiteit en de diversiteit van polyploïde planten. Wetenschap. 2008320(5875):481–3. https://doi.org/10.1126/science.1153585.

Cheng F, Sun RF, Hou XL, Zheng HK, Zhang FL, Zhang YY, et al. Parallelle selectie van subgenoom wordt geassocieerd met morfotypediversificatie en convergente gewasdomesticatie in Brassica rapa en Brassica oleracea. Nat Genet. 201648(10):1218–24. https://doi.org/10.1038/ng.3634.

Renny-Byfield S, Rodgers-Melnick E, Ross-Ibarra J. Genfractionering en functie in de oude subgenomen van maïs. Mol Biol Evol. 201734(8):1825–32. https://doi.org/10.1093/molbev/msx121.

Wang M, Tu L, Lin M, Lin Z, Wang P, Yang Q, et al. Asymmetrische subgenoomselectie en cis-regulerende divergentie tijdens de domesticatie van katoen. Nat Genet. 201749(4):579–87. https://doi.org/10.1038/ng.3807.

Liu YC, Du HL, Li PC, Shen YT, Peng H, Liu SL, et al. Pangenoom van wilde en gekweekte sojabonen. Cel. 2020182:162.

Song JM, Guan ZL, Hu JL, Guo CC, Yang ZQ, Wang S, et al. Acht hoogwaardige genomen onthullen pan-genoomarchitectuur en ecotypedifferentiatie van Brassica napus. Nat Planten. 20206:34.

Yang X, Lee WP, Ye K, Lee C. Eén referentiegenoom is niet genoeg. Genoom Biol. 201920(1):104. https://doi.org/10.1186/s13059-019-1717-0.

Yu JY, Golicz AA, Lu K, Dossa K, Zhang YX, Chen JF, et al. Inzicht in de evolutie en functionele kenmerken van de pan-genoomassemblage van sesamlandrassen en moderne cultivars. Plant Biotechnol J. 201917:881-92.

Zhang L, Cai X, Wu J, Liu M, Grob S, Cheng F, et al. Verbeterd Brassica rapa referentiegenoom door single-molecule sequencing en chromosoom conformatie capture-technologieën. Tuinbouw Res. 20185(1):50. https://doi.org/10.1038/s41438-018-0071-9.

Langs M, Wang X, Benoit M, Soyk S, Pereira L, Zhang L, et al. Grote effecten van wijdverbreide structurele variatie op genexpressie en gewasverbetering bij tomaat. Cel. 2020182:145–61 e123.

Golicz AA, Bayer PE, Barker GC, Edger PP, Kim H, Martinez PA, et al. Het pangenoom van een agronomisch belangrijke gewasplant Brassica oleracea. Nat Comm. 20167(1):13390. https://doi.org/10.1038/ncomms13390.

Hubner S, Bercovich N, Todesco M, Mandel JR, Odenheimer J, Ziegler E, et al. Zonnebloempan-genoomanalyse toont aan dat hybridisatie het gengehalte en ziekteresistentie veranderde. Nat Planten. 20195(1):54-62. https://doi.org/10.1038/s41477-018-0329-0.

Maretty L, Jensen JM, Petersen B, Sibbesen JAN, Liu SY, Villesen P, et al. Sequentie en de novo verzameling van 150 genomen uit Denemarken als populatiereferentie. Natuur. 2017548:87.

Medini D, Donati C, Tettelin H, Massignani V, Rappuoli R. Het microbiële pan-genoom. Curr Opin Genet Dev. 200515(6):589-94. https://doi.org/10.1016/j.gde.2005.09.006.

Tettelin H, Massignani V, Cieslewicz MJ, Donati C, Medini D, Ward NL, et al. Genoomanalyse van meerdere pathogene isolaten van Streptococcus agalactiae: implicaties voor het microbiële "pangenoom". Proc Natl Acad Sci V.S. 2005102(39):13950–5. https://doi.org/10.1073/pnas.0506758102.

Gao L, Gonda I, Sun HH, Ma QY, Bao K, Tieman DM, et al. Het pan-genoom van tomaten onthult nieuwe genen en een zeldzaam allel dat de fruitsmaak reguleert. Nat Genet. 201951:1044.

Zhao Q, Feng Q, Lu HY, Li Y, Wang A, Tian QL, et al. Pan-genoomanalyse benadrukt de mate van genomische variatie in gecultiveerde en wilde rijst. Nat Genet. 201850:279.

Jiao WB, Schneeberger K. Samenstellingen op chromosoomniveau van meerdere Arabidopsis-genomen onthullen hotspots van herschikkingen met veranderde evolutionaire dynamiek. Nat Comm. 20202011(1):989. https://doi.org/10.1038/s41467-020-14779-y.

Gordon SP, Contreras-Moreira B, Woods DP, Marais DLD, Burgess D, Shu SQ, et al. Uitgebreide variatie in geninhoud in het Brachypodium distachyon pan-genoom correleert met populatiestructuur. Nat Comm. 20178(1):2184. https://doi.org/10.1038/s41467-017-02292-8.

Nagaharu U. Genoomanalyse in Brassica met speciale aandacht voor de experimentele vorming van B. napus en eigenaardige wijze van bevruchting. Jpn J Bot. 19357: 389-452.

Wang XW, Wang HZ, Wang J, Sun RF, Wu J, Liu SY, et al. Het genoom van de mesopolyploïde gewassoort Brassica rapa. Nat Genet. 201143(10):1035–U1157. https://doi.org/10.1038/ng.919.

Cheng F, Mandakova T, Wu J, Xie Q, Lysak MA, Wang XW. Het ontcijferen van het diploïde voorouderlijke genoom van de mesohexaploïde Brassica rapa. Plantaardige cel. 201325(5):1541–54. https://doi.org/10.1105/tpc.113.110486.

Lye ZN, Purugganan MD. Kopie aantal variatie in domesticatie. Trends Plant Sci. 201924(4):352-65. https://doi.org/10.1016/j.tplants.2019.01.003.

Wu J, Wei K, Cheng F, Li S, Wang Q, Zhao J, et al. Een natuurlijk voorkomende InDel-variatie in BraA.FLC.b (BrFLC2) geassocieerd met variatie in bloeitijd in Brassica rapa. BMC Plant Biol. 201212(1):151. https://doi.org/10.1186/1471-2229-12-151.

Belser C, Istace B, Denis E, Dubarry M, Baurens FC, Falentin C, et al. Chromosoom-schaal assemblages van plantengenomen met behulp van nanopore lange uitlezingen en optische kaarten. Nat Planten. 20184(11):879–87. https://doi.org/10.1038/s41477-018-0289-4.

Li PR, Su TB, Zhao XY, Wang WH, Zhang DS, Yu YJ, Bayer PE, Edwards D, Yu SC, Zhang FL. Assemblage van het niet-rubriek pak choi genoom en vergelijking met de genomen van rubriek Chinese kool en het oliezaad gele sarson. Plant Biotechnol J. 2021. https://doi.org/10.1111/pbi.13522.

Boutte J, Maillet L, Chaussepied T, Letort S, Aury JM, Belser C, et al. Variatie in genoomgrootte en vergelijkende genomica onthullen intraspecifieke diversiteit in Brassica rapa. Voorplant Sci. 202011. https://doi.org/10.3389/fpls.2020.577536.

Dudchenko O, Batra SS, Omer AD, Nyquist SK, Hoeger M, Durand NC, et al. nieuw assemblage van het Aedes aegypti-genoom met behulp van Hi-C levert chromosoomlengte-steigers op. Wetenschap. 2017356(6333):92–5. https://doi.org/10.1126/science.aal3327.

Cai X, Wu J, Liang J, Lin R, Zhang K, Cheng F, et al. Verbeterd Brassica oleracea JZS-assemblage onthult significante verandering van LTR-RT-dynamiek in verschillende morfotypen. Theor Appl Genet. 2020133(11):3187-99. https://doi.org/10.1007/s00122-020-03664-3.

Sun SL, Zhou YS, Chen J, Shi JP, Zhao HM, Zhao HN, et al. Uitgebreide intraspecifieke genvolgorde en genstructurele variaties tussen Mo17 en andere maïsgenomen. Nat Genet. 201850:1289.

Teale WD, Paponov IA, Palme K. Auxin in actie: signalering, transport en controle van plantengroei en -ontwikkeling. Nat Rev Mol Cell Biol. 20067(11):847–59. https://doi.org/10.1038/nrm2020.

Murat F, Louis A, Maumus F, Armero A, Cooke R, Quesneville H, et al. Inzicht in de evolutie van de Brassicaceae door middel van reconstructie van het voorouderlijke genoom. Genoom Biol. 201516(1):262. https://doi.org/10.1186/s13059-015-0814-y.

Cheng F, Liang JL, Cai CC, Cai X, Wu J, Wang XW. Genoomsequencing ondersteunt een multi-vertex-model voor Brassiceae-soorten. Curr Opin Plant Biol. 201736:79–87. https://doi.org/10.1016/j.pbi.2017.01.006.

Liu SY, Liu YM, Yang XH, Tong CB, Edwards D, Parkin IAP, Zhao MX, Ma JX, Yu JY, Huang SM, et al. De Brassica oleracea genome reveals the asymmetrical evolution of polyploid genomes. Nat Comm. 20145(3930):3930. https://doi.org/10.1038/ncomms4930.

Perumal S, Koh CS, Jin L, Buchwaldt M, Higgins EE, Zheng C, et al. A high-contiguity Brassica nigra genome localizes active centromeres and defines the ancestral Brassica genoom. Nat Plants. 20206(8):929–41. https://doi.org/10.1038/s41477-020-0735-y.

Zhang X, Yue Z, Mei S, Qiu Y, Yang X, Chen X, et al. EEN de novo genome of a Chinese radish cultivar. Horticultural Plant J. 20151:155–64.

Gao LW, Lyu SW, Tang J, Zhou DY, Bonnema G, Xiao D, et al. Genome-wide analysis of auxin transport genes identifies the hormone responsive patterns associated with leafy head formation in Chinese cabbage. Sci Rep. 20177:42229. https://doi.org/10.1038/srep42229.

Schnable JC, Springer NM, Freeling M. Differentiation of the maize subgenomes by genome dominance and both ancient and ongoing gene loss. Proc Natl Acad Sci U S A. 2011108(10):4069–74. https://doi.org/10.1073/pnas.1101368108.

Paterson AH, Wendel JF, Gundlach H, Guo H, Jenkins J, Jin DC, et al. Repeated polyploidization of Gossypium genomes and the evolution of spinnable cotton fibres. Natuur. 2012492:423.

Emery M, Willis MMS, Hao Y, Barry K, Oakgrove K, Peng Y, et al. Preferential retention of genes from one parental genome after polyploidy illustrates the nature and scope of the genomic conflicts induced by hybridization. PLoS Gen. 201814(3):e1007267. https://doi.org/10.1371/journal.pgen.1007267.

Byrne ME. Networks in leaf development. Curr Opin Plant Biol. 20058(1):59–66. https://doi.org/10.1016/j.pbi.2004.11.009.

Husbands AY, Chitwood DH, Plavskin Y, Timmermans MCP. Signals and prepatterns: new insights into organ polarity in plants. Genen Dev. 200923(17):1986–97. https://doi.org/10.1101/gad.1819909.

Kidner CA, Timmermans MCP. Mixing and matching pathways in leaf polarity. Curr Opin Plant Biol. 200710(1):13–20. https://doi.org/10.1016/j.pbi.2006.11.013.

Townsley BT, Sinha NR. A new development: evolving concepts in leaf ontogeny. Ann Rev Plant Biol. 201263:535–62.

Ge Y, Ramchiary N, Wang T, Liang C, Wang N, Wang Z, et al. Mapping quantitative trait loci for leaf and heading-related traits in chinese cabbage (Brassica rapa L. ssp pekinesis). Horticulture Environ Biotechnol. 201152:494–501.

Inoue T, Kubo N, Kondo T, Hirai M. Detection of quantitative trait loci for heading traits in Brassica rapa using different heading types of Chinese cabbage. J Horticultural Sci Biotechnol. 201590(3):311–7. https://doi.org/10.1080/14620316.2015.11513188.

Allen GC, Flores-Vergara MA, Krasnyanski S, Kumar S, Thompson WF. A modified protocol for rapid DNA isolation from plant tissues using cetyltrimethylammonium bromide. Nat Protoc. 20061:2320–5.

Pendleton M, Sebra R, Pang AW, Ummat A, Franzen O, Rausch T, et al. Assembly and diploid architecture of an individual human genome via single-molecule technologies. Nat methoden. 201512(8):780–6. https://doi.org/10.1038/nmeth.3454.

Grob S, Schmid MW, Grossniklaus U. Hi-C Analysis in Arabidopsis Identifies the KNOT, a Structure with Similarities to the flamenco Locus of Drosophila. Mol Cell. 201455:678–93.

Zimin AV, Puiu D, Luo MC, Zhu TT, Koren S, Marcais G, et al. Hybrid assembly of the large and highly repetitive genome of Aegilops tauschii, a progenitor of bread wheat, with the MaSuRCA mega-reads algorithm. Genoom onderzoek. 201727(5):787–92. https://doi.org/10.1101/gr.213405.116.

Waterhouse RM, Seppey M, Simao FA, Manni M, Ioannidis P, Klioutchnikov G, et al. BUSCO applications from quality assessments to gene prediction and phylogenomics. Mol Biol Evol. 201835:543–8.

Durand NC, Shamim MS, Machol I, Rao SSP, Huntley MH, Lander ES, et al. Juicer provides a one-click system for analyzing loop-resolution Hi-C experiments. Cell Syst. 20163(1):95–8. https://doi.org/10.1016/j.cels.2016.07.002.

Robinson JT, Turner D, Durand NC, Thorvaldsdottir H, Mesirov JP, Aiden EL. Juicebox.js provides a cloud-based visualization system for Hi-C data. Cell Syst. 20186:256.

Kurtz S, Phillippy A, Delcher AL, Smoot M, Shumway M, Antonescu C, et al. Versatile and open software for comparing large genomes. Genoom Biol. 20045(2):R12. https://doi.org/10.1186/gb-2004-5-2-r12.

Ou S, Su W, Liao Y, Chougule K, Agda JRA, Hellinga AJ, et al. Benchmarking transposable element annotation methods for creation of a streamlined, comprehensive pipeline. Genoom Biol. 201920(1):275. https://doi.org/10.1186/s13059-019-1905-y.

Tarailo-Graovac M, Chen N. Using RepeatMasker to identify repetitive elements in genomic sequences. Curr Protoc Bioinformatics. 2009Chapter 4(Unit 4):10.

Besemer J, Borodovsky M. GeneMark: web software for gene finding in prokaryotes, eukaryotes and viruses. Nucleïnezuren Res. 200533(Web Server):W451–4. https://doi.org/10.1093/nar/gki487.

Birney E, Clamp M, Durbin R. GeneWise and genomewise. Genoom onderzoek. 200414(5):988–95. https://doi.org/10.1101/gr.1865504.

Grabherr MG, Haas BJ, Yassour M, Levin JZ, Thompson DA, Amit I, et al. Full-length transcriptome assembly from RNA-Seq data without a reference genome. Nat Biotechnologie. 201129(7):644–U130. https://doi.org/10.1038/nbt.1883.

Haas BJ, Delcher AL, Mount SM, Wortman JR, Smith RK, Hannick LI, et al. Improving the Arabidopsis genome annotation using maximal transcript alignment assemblies. Nucleïnezuren Res. 200331(19):5654–66. https://doi.org/10.1093/nar/gkg770.

Haas BJ, Salzberg SL, Zhu W, Pertea M, Allen JE, Orvis J, et al. Automated eukaryotic gene structure annotation using EVidenceModeler and the Program to Assemble Spliced Alignments. Genoom Biol. 20089(1):R7. https://doi.org/10.1186/gb-2008-9-1-r7.

Hunter S, Apweiler R, Attwood TK, Bairoch A, Bateman A, Binns D, et al. InterPro: the integrative protein signature database. Nucleïnezuren Res. 200937(Database):D211–5. https://doi.org/10.1093/nar/gkn785.

Emms DM, Kelly S. OrthoFinder: phylogenetic orthology inference for comparative genomics. Genoom Biol. 201920(1):238. https://doi.org/10.1186/s13059-019-1832-y.

Chen CJ, Chen H, Zhang Y, Thomas HR, Frank MH, He YH, et al. TBtools: an integrative toolkit developed for interactive analyses of big biological data. Mol Plant. 202013:1194–202.

Xu Z, Wang H. LTR_FINDER: an efficient tool for the prediction of full-length LTR retrotransposons. Nucleïnezuren Res. 200735(Web Server):W265–8. https://doi.org/10.1093/nar/gkm286.

Ou SJ, Jiang N. LTR_retriever: a highly accurate and sensitive program for identification of long terminal repeat retrotransposons. Plant Physiol. 2018176(2):1410–22. https://doi.org/10.1104/pp.17.01310.

Katoh K, Kuma K, Toh H, Miyata T. MAFFT version 5: improvement in accuracy of multiple sequence alignment. Nucleïnezuren Res. 200533(2):511–8. https://doi.org/10.1093/nar/gki198.

Talavera G, Castresana J. Improvement of phylogenies after removing divergent and ambiguously aligned blocks from protein sequence alignments. Syst Biol. 200756(4):564–77. https://doi.org/10.1080/10635150701472164.

Stamatakis A. RAxML version 8: a tool for phylogenetic analysis and post-analysis of large phylogenies. Bio-informatica. 201430(9):1312–3. https://doi.org/10.1093/bioinformatics/btu033.

Cingolani P, Platts A, Wang LL, Coon M, Nguyen T, Wang L, et al. A program for annotating and predicting the effects of single nucleotide polymorphisms, SnpEff: SNPs in the genome of Drosophila melanogaster strain w(1118) iso-2 iso-3. Fly. 20126(2):80–92. https://doi.org/10.4161/fly.19695.

Chen SF, Zhou YQ, Chen YR. Gu J: fastp: an ultra-fast all-in-one FASTQ preprocessor. Bio-informatica. 201834:884–90.

Li H, Durbin R. Fast and accurate short read alignment with Burrows-Wheeler transform. Bio-informatica. 200925(14):1754–60. https://doi.org/10.1093/bioinformatics/btp324.

Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, et al. The sequence alignment/map format and SAMtools. Bio-informatica. 200925(16):2078–9. https://doi.org/10.1093/bioinformatics/btp352.

Eggertsson HP, Jonsson H, Kristmundsdottir S, Hjartarson E, Kehr B, Masson G, et al. Graphtyper enables population-scale genotyping using pangenome graphs. Nat Genet. 201749:1654.

Kronenberg ZN, Fiddes IT, Gordon D, Murali S, Cantsilieris S, Meyerson OS, et al. High-resolution comparative analysis of great ape genomes. Wetenschap. 2018360:1085.

Garrison E, Siren J, Novak AM, Hickey G, Eizenga JM, Dawson ET, et al. Variation graph toolkit improves read mapping by representing genetic variation in the reference. Nat Biotechnologie. 201836:875.

Goel M, Sun HQ, Jiao WB, Schneeberger K. SyRI: finding genomic rearrangements and local sequence differences from whole-genome assemblies. Genoom Biol. 201920(1):277. https://doi.org/10.1186/s13059-019-1911-0.

Kim D, Landmead B, Salzberg SL. HISAT: a fast spliced aligner with low memory requirements. Nat methoden. 201512(4):357–U121. https://doi.org/10.1038/nmeth.3317.

Kovaka S, Zimin AV, Pertea GM, Razaghi R, Salzberg SL, Pertea M. Transcriptome assembly from long-read RNA-seq alignments with StringTie2. Genoom Biol. 201920(1):278. https://doi.org/10.1186/s13059-019-1910-1.

Marcais G, Delcher AL, Phillippy AM, Coston R, Salzberg SL, Zimin A. MUMmer4: A fast and versatile genome alignment system. PLoS Computat Biol. 201814(1):e1005944. https://doi.org/10.1371/journal.pcbi.1005944.

Li H. Minimap2: pairwise alignment for nucleotide sequences. Bio-informatica. 201834:3094–100.

Cheng F, Wu J, Fang L, Wang XW. Syntenic gene analysis between Brassica rapa and other Brassicaceae species. Front Plant Sci. 20123. https://doi.org/10.3389/fpls.2012.00198.

Akey JM, Zhang G, Zhang K, Jin L, Shriver MD. Interrogating a high-density SNP map for signatures of natural selection. Genoom onderzoek. 200212(12):1805–14. https://doi.org/10.1101/gr.631202.

Xu X, Liu X, Ge S, Jensen JD, Hu FY, Li X, et al. Resequencing 50 accessions of cultivated and wild rice yields markers for identifying agronomically important genes. Nat Biotechnologie. 201230(1):105–U157. https://doi.org/10.1038/nbt.2050.

Sabeti PC, Varilly P, Fry B, Lohmueller J, Hostetter E, Cotsapas C, et al. Genoombrede detectie en karakterisering van positieve selectie in menselijke populaties. Natuur. 2007449(7164):913–U912. https://doi.org/10.1038/nature06250.

Danecek P, Auton A, Abecasis G, Albers CA, Banks E, DePristo MA, et al. The variant call format and VCFtools. Bio-informatica. 201127(15):2156–8. https://doi.org/10.1093/bioinformatics/btr330.

Cai X, Chang L, Zhang T, Chen H, Zhang L, Lin R, et al. Impacts of allopolyploidization and structural variation on intraspecific diversification in Brassica rapa. Dataset NCBI. 2021 https://www.ncbi.nlm.nih.gov/bioproject/PRJNA730930.

Zhang Z, Zhao WM, Xiao JF, Bao YM, Wang F, Hao LL, et al. Database resources of the BIG Data Center in 2019. Nucleic Acids Res. 201947:D8–D14.

Cai et al. Genome assemblies and annotations of Brassica rapa accessions. 2021. https://doi.org/10.6084/m9.figshare.14571297.v1.

Review history

The review history is available as Additional file 6.

Peer review information

Wenjing She was the primary editor of this article and managed its editorial process and peer review in collaboration with the rest of the editorial team.


Hidden state models improve state-dependent diversification approaches, including biogeographical models

The state-dependent speciation and extinction (SSE) models have recently been criticized due to their high rates of “false positive” results. Many researchers have advocated avoiding SSE models in favor of other “nonparametric” or “semiparametric” approaches. The hidden Markov modeling (HMM) approach provides a partial solution to the issues of model adequacy detected with SSE models. The inclusion of “hidden states” can account for rate heterogeneity observed in empirical phylogenies and allows for reliable detection of state-dependent diversification or diversification shifts independent of the trait of interest. However, the adoption of HMM has been hampered by the interpretational challenges of what exactly a “hidden state” represents, which we clarify herein. We show that HMMs in combination with a model-averaging approach naturally account for hidden traits when examining the meaningful impact of a suspected “driver” of diversification. We also extend the HMM to the geographic state-dependent speciation and extinction (GeoSSE) model. We test the efficacy of our “GeoHiSSE” extension with both simulations and an empirical dataset. On the whole, we show that hidden states are a general framework that can distinguish heterogeneous effects of diversification attributed to a focal character.

Table S1: Description of scenarios and parameter values used to simulate the data.

Tabel S2: Additional 17 models used in empirical study of conifers.

Tabel S3: Description of scenarios and parameter values used to simulate phylogenetic trees and range distributions under the GeoSSE+extirpation model.

Figuur S1: Scheme of the transition rates between rate classes (RC0 to RC4) used for the simulation scenarios with multiple rate classes (Sims B, C, and D).

Figuur S2: Proportion of widespread lineages on trees simulated under scenarios E and F.

Figure S3: Summary of model support for simulated scenarios A to D.

Figure S4: Summary of model support for simulated scenarios E to H.

Figure S5: Accuracy of turnover and extinction fraction estimates for simulations scenarios A to D.

Figure S6: Accuracy of net diversification estimates for simulations scenarios A to D.

Figure S7: Results for relative net diversification rates and Akaike model weights (AICw) for simulation scenarios B and C.

Figure S8: Distribution of Akaike weights for the model set fitted to simulation scenarios ext_A to ext_D.

Figure S9: Distribution of parameter values across 100 simulation replicates for each of the scenarios ext_A to ext_D.

Let op: De uitgever is niet verantwoordelijk voor de inhoud of functionaliteit van eventuele ondersteunende informatie die door de auteurs wordt aangeleverd. Alle vragen (behalve ontbrekende inhoud) moeten worden gericht aan de corresponderende auteur van het artikel.