Informatie

Hoe bereken je de effectieve populatiegrootte ($N_e$) met overlappende generaties?


Uit deze bron: Als generaties elkaar overlappen, is de effectieve populatiegrootte $N_e$ niet gelijk aan de populatiegrootte $N$.

Ik ken wiskundige formules om de effectieve populatiegrootte $N_e$ te vinden wanneer de geslachtsverhouding vertekend is $left(N_e = frac{4N_mN_f}{N_m+N_f} ight)$ of wanneer de populatieomvang cyclisch varieert door tijd $left(N_e = frac{n}{sum_{i=1}^nfrac{1}{N_i}} ight)$.

Wat is de effectieve populatiegrootte in een populatie met overlappende generaties?


Er zijn veel verschillende manieren om dit te doen, afhankelijk van de aannames die je maakt over b.v. stabiele leeftijdsstructuur, verdeling van nakomelingen, haploïdie/diploïdie, bevolkingsgroei enz. Zoals u waarschijnlijk weet, zijn er ook twee hoofdbenaderingen voor effectieve populatiegroottes, namelijk gebaseerd op:

  1. de mate van inteelt ($N_{e,i}$)
  2. de toename in variantie van allelfrequenties ($N_{e,v}$), en ze kunnen soms een beetje van elkaar verschillen.

Een vroege poging om de effectieve populatieomvang te berekenen met overlappende generaties komt van Felsenstein (1971), die is gebaseerd op informatie over de levenstafel. Dit artikel bevat verschillende afleidingen, zowel over inteelt $N_e$ als variantie $N_e$. Als voorbeeld is de formule van inteelt $N_e$ voor een diploïde populatie:

$N_e = frac{N_1T}{1 + sum_i^inf l_i s_id_i v_{i+1}^2}$

Hier is $T$ de generatietijd, $l_i$ is de overleving tot leeftijd i, $s_i$ is de overleving vanaf leeftijd i, $d_i$ is de kans op overlijden aan het einde van leeftijd i (dwz 1-$ s_i$), en $v_{i+1}$ is de reproductieve waarde van individuen in stadium i+1. Dit veronderstelt echter een constante populatieomvang en een stabiele leeftijdsverdeling, dus enkele nogal restrictieve aannames. Het artikel bevat ook modellen voor haploïde populaties, en ik heb het niet zorgvuldig doorgenomen.

Een paar recentere artikelen die $ N_e $ berekenen voor overlappende generaties zijn Engen et al. (2005) en Engen et al. (2007). Deze artikelen gebruiken diffusiebenaderingen om verschillende formules voor $ N_e $ af te leiden onder verschillende veronderstellingen, voor leeftijdsgestructureerde dichtheidsonafhankelijke populaties. Een model voor een haploïde populatie in een fluctuerende omgeving is:

$$egin{align} N_e & = frac{N}{sigma_d^2T} ext{, met} sigma_d^2 & approx sum_{i=0}^k frac{lambda ^{-2}}{u_i} left[left(frac{deltalambda}{delta b_i} ight)^2sigma_i^2 + left(frac{deltalambda}{ delta s_i} ight)^2 s_i(1-s_i) + 2left(frac{deltalambda}{delta b_i} ight)left(frac{deltalambda}{delta s_i} ight) c_i ight] end{align}$$

waarbij $T$ de generatietijd is en $sigma_d^2$ de demografische variantie is. In de onderste vergelijking is $lambda$ de deterministische groeisnelheid (dominante eigenwaarde), $u_i$ is het aandeel van de bevolking in stadium i (een onderdeel van de stabiele leeftijdsverdeling), $b_i$ is het verwachte aantal nakomelingen met variantie $sigma_i^2$, is $s_i$ de overlevingskans van stadium i (met binominale variantie), en is $c_i$ de covariantie tussen reproductie en overleving. Je moet echt in deze artikelen duiken om volledig te begrijpen hoe deze vergelijkingen worden afgeleid en hoe de variabelen worden gedefinieerd (neemt hier veel te veel ruimte in beslag). In de kern gebruikt het echter een diffusiebenadering op een allel op een selectief neutrale locus.

Er zijn veel andere artikelen die effectieve populatiegroottes afleiden, onder verschillende veronderstellingen en beperkingen, maar de hierboven genoemde zouden een goed startpunt moeten zijn, en door naar citaten van en naar deze te kijken, zou je een goed overzicht van het onderwerp moeten krijgen. Veel leerboeken behandelen ook manieren om effectieve populatiegroottes te berekenen met overlappende generaties, b.v. Hedrick (2011) en Felsenstein (2013, gratis pdf).


Effectieve berekening van de populatieomvang

Als een populatie bestaat uit fokkende mannetjes en fokkende vrouwtjes, wordt de effectieve populatiegrootte gegeven door

Waarbij Nm het werkelijke aantal fokkende mannetjes is en Nf het werkelijke aantal fokkende vrouwtjes.
Oefenprobleem: 1
In een populatie van 500 met een geslachtsverhouding van 50:50 en alle individuen fokken echter 250 vrouwtjes met 10 mannetjes. Wat zal dan de effectieve populatieomvang zijn?

Antwoord geven:
De vergelijking toepassen

Nm (Aantal fokmannetjes) = 10
NF (Aantal fokkende vrouwtjes) = 250
NE- Effectieve populatiegrootte = (4 x 10 x 250) / (10 +250)
= 10000 / 260
NE= 38.5


Referenties

Braude S, Templeton AR. (2009). Inzicht in de meerdere betekenissen van 'inteelt' en 'effectieve grootte' voor genetisch beheer van populaties Afrikaanse neushoorns. Afrikaanse J Ecol 47: 546–555.

Coscia I, Chopelet J, Waples RS, Mann BQ, Mariani S: Geslachtsverandering en effectieve populatieomvang: implicaties voor populatiegenetische studies bij zeevissen. Erfelijkheid e-pub voor print 10 augustus 2016 doi:10.1038/hdy.2016.50.

Cousseau L, Husemann M, Foppen R, Vangestel C, Lens L.: Een longitudinaal genetisch onderzoek identificeert tijdelijke verschuivingen in de populatiestructuur van Nederlandse huismussen. Erfelijkheid (Edinb) e-pub voor print 8 juni 2016 doi:10.1038/hdy.2016.38.

Ferchaud A-L, Perrier C, April J, Hernandez C, Dionne M, Bernatchez L. : De relaties tussen Ne, Nb en Nc begrijpen voor het definiëren van instandhoudingsdrempels voor Atlantische zalm (Salmo salar. Erfelijkheid e-pub voor print 17 augustus 2016 doi:10.1038/hdy.2016.62.

Habel JC, Husemann M, Finger A, Danley PD, Zachos FE. (2014). De relevantie van tijdreeksen in moleculaire ecologie en conservatiebiologie. Biol Rev Camb Philos Soc 89: 484–492.

Hollenbeck CM, Portnoy DS, Gold JR. : Een methode voor het detecteren van recente veranderingen in de hedendaagse effectieve populatieomvang van koppelingsonevenwichtigheid op gekoppelde en niet-gekoppelde loci. Erfelijkheid (Edinb) e-pub voor print 11 mei 2016 doi:10.1038/hdy.2016.30.

Jones AT, Ovenden JR, Wang Y-G. : Verbeterde betrouwbaarheidsintervallen voor de koppelingsonevenwichtsmethode voor het schatten van de effectieve populatieomvang. Erfelijkheid e-pub voor print 23 maart 2016 doi:10.1038/hdy.2016.19.

Laikre L, Olsson F, Jansson E, Hössjer O, Ryman N: Metapopulatie effectieve grootte en instandhouding genetische doelen voor de Fennoscandian wolf (Canis lupus) populatie. Erfelijkheid e-pub voor print 22 juni 2016 doi:10.1038/hdy.2016.44.

Mueller A-K, Chakarov N, Krüger O, Hoffman JI: Effectieve populatiedynamiek op lange termijn van een intensief gecontroleerde gewervelde populatie. Erfelijkheid doi:10.1038/hdy.2016.67.

Nunney L : Het effect van buurtomvang op effectieve bevolkingsomvang in theorie en praktijk. Erfelijkheid doi:10.1038/hdy.2016.76.

Wang J, Santiago E, Caballero A: voorspelling en schatting van de effectieve populatieomvang. Erfelijkheid e-pub voor print 29 juni 2016 doi:10.1038/hdy.2016.43.

Waples RK, Larson WA, Waples RS: schatting van de hedendaagse effectieve populatiegrootte bij niet-modelsoorten met behulp van koppelingsonevenwicht over duizenden loci. Erfelijkheid e-pub vóór print 24 augustus 2016 doi:10.1038/hdy.2016.60.

Wapels RS. : Levensgeschiedeniskenmerken en effectieve populatiegrootte bij soorten met overlappende generaties herzien: het belang van volwassen sterfte. Erfelijkheid (Edinb) e-pub voor print 8 juni 2016 doi:10.1038/hdy.2016.29.


Schatting van effectieve populatiegroottes op basis van gegevens over genetische markers

De effectieve populatiegrootte (Ne) is een belangrijke parameter in ecologie, evolutionaire biologie en conservatiebiologie. Het is echter notoir moeilijk in te schatten, voornamelijk vanwege de zeer stochastische aard van de processen van inteelt en genetische drift waarvoor Ne wordt meestal gedefinieerd en gemeten, en vanwege de vele factoren (zoals tijd- en ruimtelijke schalen, systematische krachten) die dergelijke processen verstoren. In de afgelopen drie decennia zijn er veel methoden ontwikkeld om de huidige, vroegere en oude effectieve populatiegroottes te schatten met behulp van verschillende informatie die is geëxtraheerd uit sommige genetische markers in een steekproef van individuen. Dit document geeft een overzicht van de voorgestelde methoden voor het schatten van Ne van genetische gegevens met behulp van informatie over heterozygotie-overschot, koppelingsonevenwicht, tijdelijke veranderingen in allelfrequentie en patroon en hoeveelheid genetische variatie binnen en tussen populaties. Voor elke methodologie beschrijf ik voornamelijk de logica en het genetische model waarop deze is gebaseerd, de benodigde gegevens en gebruikte informatie, de interpretatie van de verkregen schatting, enkele resultaten van toepassingen tot gesimuleerde of empirische datasets en toekomstige ontwikkelingen die nodig zijn.

Referenties

Anderson EC, Williamson EG & Thompson E.A

. 2000 Monte Carlo-evaluatie van de waarschijnlijkheid van Ne van tijdelijk gespreide samples. Genetica . 156, 2109-2118. PubMed, Google Scholar

. 2003 Demografische en genetische schattingen van de effectieve populatieomvang (Ne) onthult genetische compensatie bij steelhead forel . Mol. Ecol . 12, 35-49. Crossref, PubMed, Google Scholar

. 2000 Gevolgtrekking uit genenbomen in een onderverdeelde populatie. Theor. Populair. Biol . 57, 79-95. Crossref, PubMed, Google Scholar

Bartley D, Bagley M, Gall G& Bentley M

. 1992 Gebruik van koppelingsonevenwichtsgegevens om de effectieve grootte van broederijen en natuurlijke vispopulaties te schatten. behouden. Biol . 6, 365-375. Crossref, ISI, Google Scholar

. 1998 Waarom seks en recombinatie? . Wetenschap . 281, 1986-1990. Crossref, PubMed, ISI, Google Scholar

. 1999 Detectie van bevolkingsuitbreiding en -afname met behulp van microsatellieten. Genetica . 153, 2013-2029. PubMed, ISI, Google Scholar

Behoud genetica. Handboek statistische genetica

, Balding D.J, Bishop M& Cannings C

2e ed. 2003a blz. 751-766. Ed. Londen: Wiley. Google geleerde

Schatting van bevolkingsgroei of -afname in genetisch gecontroleerde populaties. Genetica . 164, 2003b 1139-1160. PubMed, ISI, Google Scholar

. 1999 Maximale waarschijnlijkheidsschatting van migratiesnelheden en effectieve bevolkingsaantallen in twee populaties met behulp van een coalescentiebenadering. Genetica . 152, 763-773. PubMed, ISI, Google Scholar

. 2001 Maximale waarschijnlijkheidsschatting van een migratiematrix en effectieve populatiegroottes in N subpopulaties met behulp van een coalescentiebenadering. Proc. Natl Acad. Wetenschap. VS . 98, 4563-4568. Crossref, PubMed, ISI, Google Scholar

Berthier P, Beaumont MA, Cornuet J.M& Luikart G

. 2002 Op waarschijnlijkheid gebaseerde schatting van de effectieve populatieomvang met behulp van tijdelijke veranderingen in allelfrequenties: een genealogische benadering. Genetica . 160, 741-751. PubMed, Google Scholar

. 1994 Ontwikkelingen in de voorspelling van effectieve populatieomvang. Erfelijkheid . 73, 657-679. Crossref, PubMed, ISI, Google Scholar

Caballero A, Keightley PD & Hill W.G

. 1991 Strategieën voor het vergroten van de fixatiekansen van recessieve mutaties. Genet. Onderzoek . 58, 129-138. Crossref, Google Scholar

Chakraborty R& Schwartz R.J

. 1990 Selectieve neutraliteit van achternaamdistributie in een immigrantengemeenschap in Houston, Texas. Ben. J. Hum. Biol . 2, 1-15. Crossref, PubMed, Google Scholar

Chakraborty R, Kimmel M, Stivers DN, Davison L.J & Deka R

. 1997 Relatieve mutatiesnelheden op di-, tri- en tetranucleotide microsatelliet loci. Proc. Natl Acad. Wetenschap. VS . 94, 1041-1046. Crossref, PubMed, Google Scholar

Charlesworth B, Charlesworth D& Barton N.H

. 2003 De effecten van genetische en geografische structuur op neutrale variatie. Ann. ds. Ecol. Syst . 34, 99–125. Crossref, Google Scholar

. 2001 Genomische verschillen tussen mensen en andere hominoïden en de effectieve populatiegrootte van de gemeenschappelijke voorouder van mensen en chimpansees. Ben. J. Hum. Genet . 68, 444-456. Crossref, PubMed, ISI, Google Scholar

Chesser RK, Rhodes OE, Sugg D.W& Schnabel A

. 1993 Effectieve maten voor onderverdeelde populaties. Genetica . 135, 1221-1232. PubMed, Google Scholar

Een inleiding tot de theorie van populatiegenetica. 1970 New York: Harper en Row. Google geleerde

Di Rienzo A, Peterson A.C, Garza J.C, Valdes A.M, Slatkin M& Freimer N.B

. 1994 Mutatieprocessen van eenvoudige sequentieherhalingsloci in menselijke populaties. Proc. Natl Acad. Wetenschap. VS . 91, 3166-3170. Crossref, PubMed, Google Scholar

Di Rienzo A, Donnelly P, Toomajian C, Sisk B, Hill A, Petzl-Erler M.L, Haines G.K& Barch D.H

. 1998 Heterogeniteit van microsatellietmutaties binnen en tussen loci en implicaties voor menselijke demografische geschiedenissen. Genetica . 148, 1269-1284. PubMed, Google Scholar

Drummond A.J, Nicholls G.K, Rodrigo A.G& Solomon W

. 2002 Gelijktijdige schatting van mutatieparameters, populatiegeschiedenis en genealogie op basis van temporeel gespreide sequentiegegevens. Genetica . 161, 1307-1320. PubMed, ISI, Google Scholar

. 1972 De bemonsteringstheorie voor selectief neutrale allelen. Theor. Populair. Biol . 3, 87-112. Crossref, PubMed, Google Scholar

. 1982 Over het concept van effectieve populatieomvang. Theor. Populair. Biol . 21, 373-378. Crossref, Google Scholar

. 1971 Inteelt en variantie effectieve aantallen in populaties met overlappende generaties. Genetica . 68, 581-597. PubMed, ISI, Google Scholar

. 1992 Schatting van de effectieve populatiegrootte op basis van steekproeven van sequenties - inefficiëntie van paarsgewijze en segregerende plaatsen in vergelijking met fylogenetische schattingen. Genet. Onderzoek . 59, 139-147. Crossref, PubMed, Google Scholar

De genetische theorie van natuurlijke selectie. 1930 Oxford University Press. Google geleerde

. 1995 Conserveringsgenetica. Ann. Rev. Genet . 29, 305-327. Crossref, PubMed, ISI, Google Scholar

Een fylogenetische schatter van effectieve populatiegrootte of mutatiesnelheid. Genetica . 136, 1994a 685-692. PubMed, Google Scholar

Het schatten van de effectieve populatieomvang of mutatiesnelheid met behulp van de frequenties van mutaties van verschillende klassen in een monster van DNA-sequenties. Genetica . 138, 1994b 1375-1386. PubMed, Google Scholar

. 1993 Maximale waarschijnlijkheidsschatting van populatieparameters . Genetica . 134, 1261-1270. PubMed, Google Scholar

. 1991 Over het concept van effectief nummer. Theor. Populair. Biol . 40, 269-283. Crossref, PubMed, Google Scholar

Simulatie van kansverdelingen in de coalescentie. Theor. Populair. Biol . 46, 1994a 131-159. Crossref, Google Scholar

Bemonsteringstheorie voor neutrale allelen in een wisselende omgeving. Fil. Trans. R. Soc. B . 344, 1994b 403-410. Link, Google Scholar

. 1995 Ongewortelde genealogische boomkansen in het oneindig veel-sites-model. Wiskunde. biosci . 127, 77-98. Crossref, PubMed, Google Scholar

Hayes BJ, Visscher P.M, McPartlan H.C& Goddard M.E

. 2003 Nieuwe multilocus-meting van koppelingsonevenwicht om de effectieve populatiegrootte in het verleden te schatten. Genoom Res . 13, 635-643. Crossref, PubMed, Google Scholar

. 2004 Multilocus-methoden voor het schatten van populatiegroottes, migratiesnelheden en divergentietijd, met toepassingen op de divergentie van Drosophila pseudoobscura en D. persimilis . Genetica . 167, 747-760. Crossref, PubMed, ISI, Google Scholar

. 1972 Effectieve omvang van populaties met overlappende generaties. Theor. Populair. Biol . 3, 278-289. Crossref, PubMed, ISI, Google Scholar

. 1974 Schatting van koppelingsonevenwicht in willekeurig parende populaties. Erfelijkheid . 33, 229-239. Crossref, PubMed, Google Scholar

Niet-willekeurige associatie van neutraal gekoppelde genen in eindige populaties. Populatiegenetica en ecologie

. 1976 blz. 339-376. Ed. New York: Academische pers. Google geleerde

. 1979 Een opmerking over de effectieve populatieomvang met overlappende generaties. Genetica . 92, 317-322. PubMed, ISI, Google Scholar

. 1981 Schatting van de effectieve populatieomvang op basis van gegevens over koppelingsonevenwicht. Genet. Onderzoek . 38, 209-216. Crossref, ISI, Google Scholar

. 1968 Linkage onevenwichtigheid in eindige populaties. Theor. Toepasselijk Genet . 38, 226-231. Crossref, PubMed, Google Scholar

. 1985 De steekproefverdeling van koppelingsonevenwicht onder het oneindige allelmodel zonder selectie. Genetica . 109, 611-631. PubMed, Google Scholar

. 1992 Genbomen, soortenbomen en de segregatie van voorouderlijke allelen. Genetica . 131, 509-512. PubMed, ISI, Google Scholar

. 1995 Verandering in temporele allelfrequentie en schatting van de effectieve grootte in populaties met overlappende generaties. Genetica . 139, 1077-1090. PubMed, ISI, Google Scholar

Evolutie van eiwitmoleculen. Zoogdier eiwitmetabolisme

. 1969 blz. 21-123. Ed. New York: Academische pers. Crossref, Google Scholar

. 1969 Het aantal heterozygote nucleotideplaatsen dat in een eindige populatie wordt gehandhaafd als gevolg van een gestage stroom van mutaties. Genetica . 61, 893–903. PubMed, Google Scholar

. 1980 Een eenvoudige methode voor het schatten van evolutionaire snelheden van basesubstituties door middel van vergelijkende studies van nucleotidesequenties. J. Mol. Evol . 16, 111-120. Crossref, PubMed, Google Scholar

. 1963 De meting van het effectieve bevolkingsaantal. Evolutie . 17, 279-288. Crossref, Google Scholar

. 1964 Het aantal allelen dat in een eindige populatie kan worden gehandhaafd. Genetica . 49, 725-738. Crossref, PubMed, ISI, Google Scholar

De samensmelting. Stoch. Proc. Appl . 13, 1982a 235-248. Crossref, Google Scholar

Over de genealogie van grote populaties. J. Appl. waarschijnlijk . 19, 1982b 27-43. Crossref, Google Scholar

. 1971 De genetica van Dacus oleae. V. Veranderingen van esterasepolymorfisme in een natuurlijke populatie na insecticidecontrole: selectie of drift? . Evolutie . 25, 454-460. Crossref, PubMed, Google Scholar

Kuhner MK, Yamato J& Felsenstein J

. 1995 Schatting van de effectieve populatiegrootte en mutatiesnelheid op basis van sequentiegegevens met behulp van Metropolis-Hastings-steekproeven. Genetica . 140, 1421-1430. PubMed, Google Scholar

Kuhner MK, Yamato J& Felsenstein J

. 1998 Maximale waarschijnlijkheidsschatting van bevolkingsgroei op basis van de coalescentie. Genetica . 149, 429-434. PubMed, ISI, Google Scholar

Kuhner MK, Beerli P, Yamato J& Felsenstein J

Nut van gegevens over polymorfisme van één nucleotide voor het schatten van populatieparameters. Genetica . 156, 2000a 439-447. PubMed, Google Scholar

Kuhner MK, Yamato J& Felsenstein J

Maximale waarschijnlijkheidsschatting van recombinatiesnelheden uit populatiegegevens. Genetica . 156, 2000b 1393-1401. PubMed, ISI, Google Scholar

Langley CH, Ito K& Voelker RA

. 1977 Koppelingsonevenwicht in natuurlijke populaties van Drosophila melanogaster . Genetica . 86, 447-454. PubMed, Google Scholar

Langley C.H, Smith D.B& Johnson FM

. 1978 Analyse van koppelingsonevenwicht tussen allozyme loci in natuurlijke populaties van Drosophila melanogaster . Genet. Onderzoek . 32, 215-229. Crossref, PubMed, Google Scholar

Laval G, San Cristobal M& Chevalet C

. 2003 Maximum-likehhood en Markov-keten Monte Carlo-benaderingen om inteelt en effectieve grootte te schatten op basis van veranderingen in allelfrequentie. Genetica . 164, 1189-1204. PubMed, Google Scholar

. 1973 Verdeling van genfrequentie als test van de theorie van de selectieve neutraliteit van polymorfismen. Genetica . 74, 175-195. PubMed, Google Scholar

. 1999 Schatting van het effectieve aantal fokkers uit heterozygote overmaat in nakomelingen. Genetica . 151, 1211-1216. PubMed, ISI, Google Scholar

Lynch M, Conery J& Burger R

. 1995 Mutatieaccumulatie en het uitsterven van kleine populaties. Ben. nat . 146, 489-518. Crossref, ISI, Google Scholar

. 1975 Zwervende distributies en het elektroforetische profiel. Theor. Populair. Biol . 8, 318-330. Crossref, PubMed, Google Scholar

Moleculaire evolutionaire genetica. 1987 New York: Columbia University Press. Google geleerde

. 1981 Genetische drift en schatting van de effectieve populatieomvang. Genetica . 98, 625-640. PubMed, Google Scholar

. 1997 Een waarschijnlijkheidsbenadering van populatiemonsters van microsatellietallelen. Genetica . 146, 711-716. PubMed, Google Scholar

. 2000 Schatting van populatieparameters en recombinatiesnelheden van enkelvoudige nucleotidepolymorfismen. Genetica . 154, 931–942. PubMed, ISI, Google Scholar

. 2001 Migratie onderscheiden van isolatie: een Monte Carlo-benadering van de Markov-keten. Genetica . 158, 885-896. PubMed, Google Scholar

. 1973 Een mutatiemodel dat geschikt is om het aantal elektroforetisch detecteerbare allelen in een eindige populatie te schatten. Genet. Onderzoek . 22, 201-204. Crossref, PubMed, Google Scholar

. 1983 Een nieuwe methode voor het schatten van de effectieve populatiegrootte op basis van veranderingen in de allelfrequentie. Genetica . 104, 531-548. PubMed, Google Scholar

. 2002 Eigenwaarde effectieve bevolkingsaantallen voor populaties die cyclisch in omvang variëren. Wiskunde. biosci . 177, 11–24. Crossref, PubMed, Google Scholar

Pudovkin A.I, Zaykin D.V& Hedgecock D

. 1996 Over het potentieel voor het schatten van het effectieve aantal fokkers van heterozygote overmaat in nakomelingen. Genetica . 144, 383-387. PubMed, ISI, Google Scholar

. 2003 Bayes schatting van soorten divergentie tijden en voorouderlijke populatiegroottes met behulp van DNA-sequenties van meerdere loci. Genetica . 164, 1645-1656. PubMed, Google Scholar

. 1961 Inteelt in kunstmatige selectieprogramma's. Genet. Onderzoek . 2, 189-194. Crossref, Google Scholar

. 1965 De interpretatie van genotypische verhoudingen in populaties van huisdieren. dier. Prod . 7, 319-324. Crossref, Google Scholar

. 1997 Moleculaire fylogenie van de hominoïden: gevolgtrekkingen uit meerdere onafhankelijke DNA-sequentiegegevenssets. Mol. Biol. Evol . 14, 248-265. Crossref, PubMed, ISI, Google Scholar

Schwartz M.K, Tallman D.A& Luikart G

. 1999 Herziening van op DNA gebaseerde volkstelling en effectieve schatters van de populatiegrootte. dier. behouden . 1, 293-299. Crossref, Google Scholar

Seo TK, Thorne JL, Hasegawa M& Kishino H

. 2002 Schatting van de effectieve populatieomvang van HIV-1 binnen een gastheer: een benadering met pseudomaximale waarschijnlijkheid. Genetica . 160, 1283-1293. PubMed, Google Scholar

. 1983 Evolutionaire relatie van DNA-sequenties in eindige populaties. Genetica . 105, 437-460. PubMed, ISI, Google Scholar

. 1986 Een poging om de effectieve grootte te schatten van de voorouderlijke soorten die gemeenschappelijk zijn voor 2 bestaande soorten waarvan homologe genen worden gesequenced. Genet. Onderzoek . 48, 187-190. Crossref, PubMed, Google Scholar

Pre-speciatie-coalescentie en de effectieve grootte van voorouderlijke populaties. Ontwikkelingen in theoretische populatiegenetica

. 2002 Oxford University Press. Google geleerde

Takahata N, Satta Y& Klein J

. 1995 Divergentietijd en populatiegrootte in de afstamming die leidt tot de moderne mens. Theor. Populair. Biol . 48, 198-221. Crossref, PubMed, Google Scholar

Tallmon D.A, Luikart G& Beaumont M.A

. 2004 Vergelijkende evaluatie van een nieuwe effectieve schatting van de populatiegrootte op basis van geschatte Bayesiaanse berekening. Genetica . 167, 977-988. Crossref, PubMed, Google Scholar

. 1984 Afstammingslijn en genealogische processen, en hun toepassingen in populatiegenetica-modellen. Theor. Populair. Biol . 26, 119-164. Crossref, PubMed, Google Scholar

. 2001 Schatting van de effectieve populatieomvang en migratiesnelheid op basis van een- en tweelokale identiteitsmetingen. Genetica . 157, 911-925. PubMed, Google Scholar

. 1997 Schatting van voorouderlijke populatieparameters. Genetica . 145, 847-855. PubMed, Google Scholar

. 2003 Schatting van voorouderlijke populatiegroottes en divergentietijden. Genetica . 163, 395-404. PubMed, Google Scholar

. 1996 Afwijking van Hardy-Weinberg-verhoudingen in eindige populaties. Genet. Onderzoek . 68, 249-257. Crossref, Google Scholar

Effectieve grootte en F-statistieken van onderverdeelde populaties. 1. Eenhuizige soorten. Genetica . 146, 1997a 1453-1463. PubMed, Google Scholar

Effectieve grootte en F-statistieken van onderverdeelde populaties. 2. Tweehuizige soorten. Genetica . 146, 1997b 1465-1474. PubMed, Google Scholar

. 2001 Een pseudo-waarschijnlijkheidsmethode voor het schatten van de effectieve populatiegrootte op basis van tijdelijke steekproeven. Genet. Onderzoek . 78, 243-257. Crossref, PubMed, ISI, Google Scholar

. 2004 Toepassing van de regel van één migrant per generatie op behoud en beheer. behouden. Biol . 18, 332-343. Crossref, Google Scholar

. 1999 Ontwikkelingen in het voorspellen van de effectieve omvang van onderverdeelde populaties. Erfelijkheid . 82, 212-226. Crossref, ISI, Google Scholar

. 2003 Schatting van de effectieve populatieomvang en migratiesnelheden van genetische monsters in ruimte en tijd. Genetica . 163, 429-446. PubMed, ISI, Google Scholar

. 1989 Een algemene benadering voor het schatten van de effectieve populatiegrootte op basis van tijdelijke veranderingen in de allelfrequentie. Genetica . 121, 379-391. PubMed, ISI, Google Scholar

. 1991 Genetische methoden voor het schatten van de effectieve grootte van walvisachtigenpopulaties. Rep. Int. Walvisvaart Comm. (Speciale uitgave) . 13, 279-300. Google geleerde

. 1975 Over het aantal segregerende plaatsen in genetische modellen zonder recombinatie. Theor. Populair. Biol . 7, 256-276. Crossref, PubMed, ISI, Google Scholar

. 1979 Inferentie over koppelingsonevenwicht. Biometrie . 35, 235–254. Crossref, PubMed, Google Scholar

. 1980 Effect van paringsstructuur op variatie in koppelingsonevenwicht. Genetica . 95, 477-488. PubMed, Google Scholar

. 1997 De effectieve omvang van een onderverdeelde populatie. Genetica . 146, 427-441. Crossref, PubMed, ISI, Google Scholar

. 1999 Maximale waarschijnlijkheid gebruiken om de populatiegrootte te schatten op basis van temporele veranderingen in allelfrequenties. Genetica . 152, 755-761. PubMed, Google Scholar

. 1998 Genealogische gevolgtrekking uit microsatellietgegevens. Genetica . 150, 499-510. PubMed, Google Scholar

Wilson I.J, Weale M.E& Balding D.J

. 2003 Inferenties uit DNA-gegevens: populatiegeschiedenissen, evolutionaire processen en forensische matchkansen. J.R. Stat. Soc. ser. EEN . 166, 155–188. Crossref, Google Scholar

. 1931 Evolutie in Mendeliaanse populaties. Genetica . 16, 97-159. Crossref, PubMed, Google Scholar

. 1951 De genetische structuur van populaties. Ann. Eugen . 15, 323-354. Crossref, PubMed, Google Scholar

Wright S.I, Lauga B& Charlesworth D

. 2003 Onderverdeling en haplotypestructuur in natuurlijke populaties van Arabidopsis lyrata . Mol. Ecol . 12, 1247-1263. Crossref, PubMed, Google Scholar

. 1991 Gevolgen van soortenfylogenie in relatie tot segregatie van oude polymorfismen. Genetica . 127, 429-435. PubMed, ISI, Google Scholar

. 2004 Schatting van de effectieve populatieomvang of mutatiesnelheid met microsatellieten. Genetica . 166, 555-563. Crossref, PubMed, Google Scholar

. 1997 Over de schatting van de voorouderlijke populatiegroottes van de moderne mens. Genet. Onderzoek . 69, 111-116. Crossref, PubMed, Google Scholar

. 2002 Waarschijnlijkheid en Bayes schatting van voorouderlijke populatiegroottes in hominoïden met behulp van gegevens van meerdere loci. Genetica . 162, 1811-1823. PubMed, Google Scholar

Zhivotovsky L.A& Feldman M.W

. 1995 Microsatellietvariabiliteit en genetische afstanden. Proc. Natl Acad. Wetenschap. VS . 92, 11 549-11 552. Crossref, Google Scholar


De formule voor de effectieve populatiegrootte begrijpen

Ik zou een pittige titel voor dit bericht hebben, met een grote moraal om van toepassing te zijn op de toekomst, maar ik heb besloten dat ik je gewoon ga beschrijven wat er gisteren gebeurde toen ik probeerde wat genetica te leren. Je ziet wat je kunt leren van mijn ervaring.

Gisteren hielp ik mee bij de workshops voor de cursus Veterinary/Animal/Plant Science '8220Genes and Inheritance'8221. Tijdens deze workshop gebruikten ze onder meer de volgende formule:

De formule was mooi groot op het whiteboard geschreven en was min of meer zinloos voor mij. Ik herinner me dat ik het zag toen ik me ongeveer een maand geleden voor de workshop voorbereidde en tegen mezelf zei dat ik het in de collegeaantekeningen moest opzoeken, maar ik moet bekennen dat ik dat nooit heb gedaan.

Ik ging naar een van de workshopleiders en vroeg haar of ze me kon vertellen wat elk onderdeel van de formule betekende. Ik wees naar elk symbool en vroeg wat het was.

Dane stond voor “effectieve populatiegrootte”. OK. Dit moet een manier zijn om de werkelijke populatieomvang om te rekenen naar een andere grootte om ze op de een of andere manier te kunnen vergelijken. Ik besloot te wachten tot ik meer te weten kwam over de rest van de formule voordat ik uitzoek waarom we dat doen.

De s stond voor … well I gedachte ze zei maat, en dus vroeg ik “the size of what?”. Na een vragende blik van haar, en wat heen en weer gewisseld te hebben, realiseerde ik me dat het woord eigenlijk '8220sires'8221 was, zoals in het aantal fokmannetjes. Ik denk dat ik zoiets had kunnen verwachten. De d stond voor '8220moeders'8221, wat blijkbaar het corresponderende woord is voor fokkende vrouwtjes.

OK. De berekening gebruikt dus het aantal mannen en vrouwen in een populatie om een ​​nieuwe '8220effectieve populatieomvang'8221 te berekenen. Ik vroeg wat deze effectieve populatiegrootte ons vertelde over de genetica, en kreeg te horen dat kleine effectieve populaties indicaties zijn voor een grote hoeveelheid inteelt. Ja, ik veronderstel dat dat logisch is - een kleine populatie zou veel inteelt moeten hebben.

Dus ik begreep waar de formule over ging.

Alleen hoe meer ik ernaar keek, hoe minder ik begreep. Waarom staat er vermenigvuldiging bovenaan en optelling onderaan? Waarom staat daar een 4? Waarom levert dit de effectieve populatiegrootte op? Wat betekent 'effectieve populatiegrootte' eigenlijk?

Dit bleef me tijdens de eerste workshop aan en uit puzzelen, maar vooral uit, omdat ik studenten hielp met de rest van de vragen, en het werd uit mijn gedachten verdreven door iets anders dat me opviel: de zorgwekkende neiging van studenten om een ​​formule te gebruiken, terwijl je het probleem zou kunnen oplossen door een snelle afbeelding/tabel te tekenen en een beetje te redeneren. Ze vroegen me, "welke van deze is p en welke is q?", en ik antwoordde dat ik het niet echt wist, ik deed gewoon mijn berekeningen op basis van waar de getallen in mijn tekening waren , niet gebaseerd op een formule met specifieke letters. Toen ik ging zitten om erachter te komen welk ding overeenkwam met welk deel van hun formule, waren de meesten blij verrast dat de formules die hen eerder geen informatie hadden gegeven, hen plotseling een verhaal vertelden over de structuur van de genetica.

Nadat dit voor de vijfde keer was gebeurd, realiseerde ik me dat dit precies mijn probleem was met de formule voor effectieve populatiegrootte: het was zinloos. Het vertelde me geen verhalen over genetica, maar vertelde me gewoon hoe ik iets moest berekenen.

Tegen die tijd had ik studenten de formule zien gebruiken en me nuttige dingen zien vertellen die ze erover wisten. Ze vertelden me bijvoorbeeld dat als er hetzelfde aantal stieren en moeders zou zijn, de effectieve populatieomvang hetzelfde zou zijn als de werkelijke populatieomvang. En ze vertelden me ook dat een ongelijke verdeling van mannen en vrouwen zou resulteren in een lagere effectieve populatieomvang.

Ik kon het ding over de gelijke maten zien met een snel stukje algebra:

Maar nogmaals, het vertelde me nauwelijks waarom de formule er in de eerste plaats was. Er zijn een aantal formules die die truc kunnen doen!

De eigenlijke vraag waaraan ze moesten werken, hield in dat ze moesten uitzoeken hoeveel stieren er zouden moeten zijn om N . te krijgene = 50, als je wist dat er 10 keer zoveel moeders als stieren waren. Dit zette me aan het denken dat je de formule misschien zou kunnen herschikken om te gaan over het aandeel mannen en vrouwen in plaats van het ruwe aantal. Wat gepruts leverde me dit op:

Dus jij kon herschrijf de formule in termen van de verhouding tussen mannen en vrouwen, en de nieuwe formule had een soort aangename eenvoud. Er stond zelfs dat Ne was een veelvoud van N, wat overeenkwam met wat mij werd verteld dat het kleiner was dan N.

Ik heb de workshopleiders hiernaar gevraagd en ze hadden nog nooit zoiets gezien. Een van hen zei echter te kunnen verklaren waarom de sd in de oorspronkelijke formule zat: het ging over het aantal man-vrouw koppelingen in de populatie. Als er s mannetjes en d vrouwtjes zijn, en elk mannetje kan bij elk vrouwtje, dan zijn er sd mogelijke koppelingen. Ze wees er ook op dat het iets te maken had met het feit dat de effectieve populatieomvang de werkelijke populatieomvang is wanneer er hetzelfde aantal stieren is als moeders. Dus misschien moeten we vergelijken met een populatie van dezelfde grootte, maar met gelijke proporties!

Als ik aan mijn eigen formule denk, als s en d gelijk zouden zijn, dan zouden de verhoudingen 1/2 en 1/2 zijn, dus als je ze vermenigvuldigt, krijg je een 1/4, wat netjes de 4 zou opheffen. Deze berekening gevolgd:

Dat had veel zin. Maar de koppelingen zaten me dwars, dus ik deed ook dit:


Dus dat werkte ook! Kortom, ik vergeleek het aantal koppelingen in de populatie met het aantal koppelingen in dezelfde populatie, maar gelijk verdeeld, en de geproduceerde fractie is hoe ik mijn populatiegrootte aanpas om de effectieve populatiegrootte te krijgen.

Ik controleerde het met een numeriek voorbeeld: probeer s=10, d=20, en als het gelijk verdeeld was, zouden ze allebei 15 zijn. Dus&8230

Dat is eigenlijk best cool. En niet alleen dat, het is iets dat ik me kan herinneren omdat het voor mij logisch is.

Ik wilde echter nog steeds de verhoudingsversie begrijpen, en ik was geïnteresseerd als iemand het vaak uitlegde in termen van paren. Dus toen ik thuiskwam ging ik online op zoek. Ik heb veel zoektermen geprobeerd en vond geen plaatsen waar de afleiding van de gebruikelijke formule werd gegeven. Ik leerde gaandeweg dat “sex ratio” de meest gebruikte terminologie was voor dit concept van het aantal mannen en vrouwen dat de effectieve populatiegrootte beïnvloedt. Bovendien verwijzen de meeste naar Nm en NF in plaats van s en d.

Na meer graven en scannen van echte onderzoeksdocumenten die in de praktijk de effectieve populatiegrootte gebruikten, vond ik enkele verwijzingen naar Ne/N. Dit leek veelbelovend, aangezien mijn versie van de formule op die manier zou kunnen worden ingericht. Interessant is dat ondanks dat mensen N . willen berekenene/N, niemand heeft er direct een formule voor gegeven, wat ik het meest ongewoon vond.

Finally, I found a book with an explanation, though wildly different to the one I was looking for! This one was all about the probability two of your four grandparents actually being the same person, and of your half-brother-and-sister parents passing on repeated genetic information to you. The 1/4 comes about because of the 1 in 2 chance of getting your common-grandparent genes from each parent. And the formula is actually a rearrangement of 1/Ne = 1/4(1/s+1/d), and I still can’t find any explanations using couplings.

At the moment, the best I have is that the proportions version is just a relocation of the N’s in the raw-numbers version.

Standardising to proportions is not such a bad explanation, though it would be super awesome if there was a better explanation.

I’ll take the ones I have though:

(PS: If anyone can think of a useful moral for this tale, please do let me know!)


Resultaten

Based on life-history data for our four primary scenarios, generation length (tG) ranged from 2.91 to 4.035, Ne ranged from 213.8 to 378.8, and NB ranged from 85 to 367 (Table 1). Generation length was much longer for sturgeon and mussel life histories (14.15 and 13.621), and effective sizes per generation were 6210.3/349.3 (large Ne/small Ne) and 499.7, respectively. In these same scenarios, NB values were substantially lower than per-generation effective sizes, at 3691/207 (large Ne/small Ne) for sturgeon and 360 for mussels. The performance of the LD Ne estimator depended on the underlying life history, the sampling strategy, and the magnitude of Ne. In large Ne sturgeon simulations, estimates lacked precision and were frequently negative (Fig. 1), implying very large Ne (Waples and Do 2010 ). For this reason, we focused our analyses on the other scenarios, where Ne was simulated at values <500. Estimates from the three allele exclusion criteria employed in LD Ne were similar (Appendices A and B) thus, we used a Pcrit value of 0.02 for all subsequent figures.

In general, estimates of Ne were biased downwards, while estimates of NB were biased upwards across a large region of parameter space (Appendices A and B). Additionally, estimates of NB appeared to be highly influenced by the underlying life history. Scenarios A–C showed very little bias in estimates of NB (<5%), while simulations for sturgeon, mussels, and scenario D life histories had bias ranging from 14% to 36% (Appendices A and B). In scenarios A, B, and C (Figs 2, S1 and 3), patterns across sampling designs were highly consistent with one another. Newborn samples provided accurate estimates of NB, while estimates of Ne were most accurate when random samples of all age classes, or of only reproductively mature individuals, were considered. The patterns in scenario D simulations were substantially different from those in scenarios A–C newborn samples yielded estimates of NB that were biased upwards by approximately 36% (Appendix A), and the most accurate estimates of per-generation Ne were given by samples that included equal numbers of individuals in each age class (Fig. S2). The large relative bias in NB estimates in scenario D simulations was not solely due to the smaller true NB in these simulations absolute bias in this case was approximately threefold greater than in estimates from scenarios A, B, and C. Results from sturgeon (Fig. 4) and mussel (Fig. S3) simulations matched those of scenarios A–C more closely, although estimates of NB showed an upwards bias similar to that seen in scenario D. Additionally, all simulated scenarios where reproductive effort was skewed to later age classes (C, D, sturgeon, mussel) showed a consistent pattern for smaller estimated Ne when newborns were included in random mixed-age samples (Appendices A and B). Across our simulated life histories and sampling strategies, bias was less than approximately 15% for mixed-age samples of reproductively mature adults.

To further assess the influence of sampling design on Ne estimates, we examined cases where the entire population could not be sampled. In these cases, the bias in our estimates changed direction for simulations under scenarios A and C (Figs S4 and S5 Appendix A). For sturgeon (Fig. 5) and mussel (Fig. S6) simulations, samples of consecutive age classes gave estimates with greater accuracy (bias <5%) than those including nonconsecutive age classes (bias 10–20%). With the exception of the mussel life history, greater accuracy was attained when the samples included a large number of age classes (Appendices A and B).

We used the CV to assess precision of our estimates of effective size. This measure may not be perfectly suited for this use, particularly when the distribution of estimates is skewed upwards (Waples and Do 2010 ). For this reason, in Appendices A and B, we report the observed CV, the expected CV from eqn 3 of Waples and Do ( 2010 ), and the 2.5% and 97.5% quantiles of the distribution of estimated effective sizes for each simulated sampling scheme x life history combination. Despite the inflation of the CV because of upwards skew, coefficients of variation in our estimates were typically between 0.2 and 0.4 (Appendices A and B). Several exceptions to this trend were apparent newborn samples from scenario A and samples of the two oldest age classes in this scenario both had CV > 0.9 (Appendix A). In these cases, the lack of precision was because of extreme outliers for the newborn samples, six datasets (from 1000 replicates) produced estimates of NB > 1000 (Fig. 2). When only the two oldest age classes were considered, 61 simulated datasets estimated Ne > 1000. An additional six datasets (not included in the CV or shown in Fig. S4) gave negative estimates (down to Ne = −84 000). Extreme positive values inflated CV for these sampling strategies. For samples that did not include all age classes, precision increased with the number of classes sampled in scenarios A and C (Figs S4 and S5), but not for sturgeon (Fig. 5) and mussel (Fig. S6) life histories. Estimates provided by subsamples of the mussel age classes were also relatively imprecise when compared with other life histories (Fig. S6). This was most likely due to the larger Ne in these simulations. From our simulations, and as previously noted (Waples and Do 2010 ), it was apparent that precision decreased as effective size increased (compare Figs 1 and 4).

When precision was assessed using the 2.5% and 97.5% quantiles for estimates provided by Pcrit = 0.02, it was apparent that (across our simulated life histories and sampling schemes) 95% of the estimated values for a combination were generally distributed in a range with a width between 70% and 140% of the true (simulated) effective size (Appendices A and B). For instance, 95% of the estimated Ne values for adult samples under life-history scenario C were between 195.5 and 519.1 (simulated Ne = 302.7). Wider ranges of estimates were found when only subsets of the population were sampled (e.g., the two oldest age classes for scenarios A and C Appendix A).


Inhoud

Effective population size may be defined in two ways, variance effective size and inbreeding effective size. These are closely linked, and derived from F-statistics.

Variance effective size

In an idealized population, the variance in allele frequency (P) is given by:

Inbreeding effective size

Alternatively, the effective population size may be defined by noting how the inbreeding coefficient changes from one generation to the next, and then defining Ne as the size of the idealized population that has the same change in inbreeding. The presentation follows Kempthorne (1957).

For the idealized population, the inbreeding coefficients follow the recurrence equation

Using Panmictic Index (1-F) instead of inbreeding coefficient, we get the approximate reccurrence equation

The difference per generation is

The inbreeding effective size can be found by solving

although researchers rarely use this equation directly.


An empirical evaluation of effective population size estimators

The purpose of this study was to evaluate demographic and genetic methods of estimating the effective population size of a population. Effective population size (Ne) describes how populations lose genetic variation due to random genetic drift. Reduced genetic variation increases inbreeding, which, increases the expression of deleterious traits, prevents a population from responding to environmental changes, or can initiate a mutational meltdown. Given the consequences, it is important to have accurate estimates of N e. Molecular markers allow direct examination of the genetic change, but not all molecular markers work equally well. Based on a review of the literature, microsatellites were shown to produce more intuitive estimates of local effective population size and appear to work on an ecological time scale. Allozymes produce estimates more appropriate for the species level or the effective size across evolutionary time. Several demographic methods, of varying complexity, also exist to estimate effective population size. Demographic based estimates of effective population size were compared to the actual genetic change in microsatellite allele frequencies over time in a metapopulation of kangaroo rats (Dipodomys spectabilis). The most accurate and precise demographic estimator of Ne across a single generation accounted for sex ratio, standardized variance in reproductive success, and overlapping generations. When estimating Ne across multiple generations it was most important to account for fluctuating population size. It is also possible to detect population bottlenecks based on changes in allele frequencies over time. Bottlenecked populations show an excess of heterozygosity compared to that expected at drift-mutation equilibrium as well as a shift in the modal allele frequency class. It was not possible to detect known bottlenecks using the excess heterozygosity method. When the infinite allele model was used some of the known bottlenecks were detected but a high number of false positives were also generated. The mode-shift method performed better, detecting more of the known bottlenecks and returning a lower number of false positives. The superior performance of the mode-shift method is probably related to the small initial population size of the founded populations and the small number of loci used.


Methoden:

Ethical statement

The current study was carried out under a Project License from the INIA Scientific Ethic Committee. Animal manipulations were performed according to the Spanish Policy for Animal Protection RD1201/05, which meets the European Union Directive 86/609 about the protection of animals used in experimentation. We hereby confirm that the INIA Scientific Ethic Committee, which is the named IACUC for the INIA, specifically approved this study.

Samples and SNP genotypes

Data used in this study originated from pigs from the Guadyerbas strain that represents one of the original strains of Iberian pigs [18]. It has been kept isolated in an experimental closed herd established from 24 founders (4 males and 20 females) in 1944. Management of the herd has implied avoidance of matings between relatives. Very accurate and complete pedigree data have been recorded since the time of the foundation of the herd until 2011 (26 generations). The complete genealogy includes 1,178 animals.

Genotypic data from the Illumina Porcine SNP60 BeadChip v1 were available for 227 Guadyerbas animals born between 1992 and 2011 in the herd. This implies that genotypes were available for all the animals belonging to the last 6 generations (generations 21 to 26). The Illumina Porcine SNP60 BeadChip v1 contains 62,163 probes that are distributed along 18 autosomal and two sex chromosomes, according to the latest version of the porcine map (Sscrofa 10.2). DNA samples, extracted from blood samples were hybridized with the chip and images were scanned by an external service (Universidad Autónoma de Barcelona, Spain). Genotype calls were obtained with the Genotyping Module of the GenomeStudio Data Analysis software (Illumina Inc.). Quality control criteria used were those described in Saura et al. [19]. In brief, a total of 468 samples (227 Guadyerbas and 241 samples from other strains of the Iberian breed) were used to check the quality of genotyping data. SNPs that did not satisfy the following quality control criteria were removed: Call Frequency <𠂐.99, GenTrainScore < 0.70, AB R Mean <𠂐.35, MAF =𠂐 and number of inconsistencies with the genealogy >𠂙. Unmapped SNPs and SNPs mapped to sex chromosomes were also excluded. After filtering SNPs, the data were reanalysed and samples with a Call Rate <𠂐.96 and with a large number of inconsistencies with the genealogy were removed. The final number of autosomal SNPs and Guadyerbas samples available for the analysis were 219 and 35,519, respectively. The number of SNPs segregating was 19,145. Further information about estimates of genetic variability in this herd can be found in Fernández et al. [20] and Saura et al. [19]. The number of genotyped animals per generation was 35, 52, 42, 27, 15 and 48 for generations 21, 22, 23, 24 25 and 26, respectively.

Estimation of Ne across time from pedigree data

Pedigree-based estimates of Ne per generation were obtained from the rate of inbreeding per generation (ΔF) as Ne = (2) −𠂑 and ΔF was estimated from individual long-term contributions to the last generation [21�] i.e., Δ F = ∑ i = 1 N t c i 2 / 4 , where Cl 2 is the squared long-term contributions of individual l en Nt is the number of individuals that form generation t. The long-term genetic contribution of an ancestor [22,ꀤ, 25] is the ultimate proportional contribution of the ancestor to generations in the distant future [26]. Thus, the effective population size at generation t was obtained as N e t = 2 / ∑ i = 1 N t c i 2 . Long-term contributions were computed using a Fortran software provided by DM Howard (The Roslin Institute, personal communication). An example of the calculation of long-term contributions is provided in the Additional file 1.

The generation interval (L) is defined as the turnover time of genes which equal to the time in which genetic contributions sum to unity i.e., the genetic contribution summed over all ancestors entering the population over a time period of L years equals unity: (∑Cl) = 1 [26]. Here, the sum of long-term contributions is taken over those born over the time unit (years).

LD estimation

schattingen van Ne were obtained on a per generation basis. Given that we are dealing with overlapping generations, a given generation included a number of consecutive cohorts that was roughly equal to L. According to this and given that genotypes for the last six generations were available, we built six replicates of the same population and each replicate corresponded to one generation. This design of splitting the data into replicates has never been considered before. It allowed us to evaluate the error of the Ne estimates.

For each replicate (i.e., for each generation), autosome pairwise LD was computed as the squared correlation between pairs of SNPs (R 2 ) [15] using the formula

waar NS = PAB − PEENPB, PAB is the frequency of the genotype AB (coupling phase) and PEEN, Peen, PB en PB are the frequencies of alleles EEN, een, B en B, respectievelijk. Waarden voor R 2 were obtained using the software provided by R Pong-Wong (The Roslin Institute, personal communication) which implements an EM algorithm [27] to estimate haplotype frequencies. To enable a clear presentation of results showing LD in relation to physical distance between markers, SNP pairs were divided into three distance classes: (l) 0 to 2 Mb, (ii) 2 to 5 Mb and (iii) 5 to 50 Mb. Distance bins of 0.05, 0.20 and 5.00 Mb were used for classes (l), (ii) and (iii), respectively, and average R 2 values for each bin were plotted against physical distance. Also, in order to determine the background LD (i.e., the LD expected by chance), R 2 was calculated for a random selection of non-syntenic SNPs that included 30 SNPs per autosome, following Khatkar et al. [28]. Thus, 137,700 pairwise independent correlations were computed.

Estimation of Ne across time from LD

The well known relationship between LD and Ne was derived by Sved [29] and it was based on the work of Hill and Robertson [15]. However, Sved’s equation did account neither mutation nor the effect of sample size. The consequence of ignoring mutation is that even with physical linkage, the expected association between loci is incomplete and leads to an underestimation of R 2 . This effect increases as historical time increases. The consequence of ignoring sample size is that the magnitude of R 2 can be overestimated in samples of small size as a consequence of spurious associations. This effect increases as historical time decreases [11]. Taking into account both mutation and sample size leads to a more general expression:

waar α is a parameter related to mutation, C is the recombination rate and the term 1/N is an adjustment for sample size [30]. Note that 4Ne corresponds to the slope and α to the intercept of the regression equation. Parameter α can be set to a fixed value (1 in the absence of mutation or 2 when mutation is considered) [31, 32] but can also be estimated from the data. When haplotypes are unknown (i.e. coupling and repulsion double heterozygotes cannot be distinguished), N equals the number of diploid individuals sampled (N) [30], whereas when haplotypes are known without error N equals 2N [33]. Here, the effect of correcting for mutation and sample size was investigated by comparing results from six different models that varied in α and 1/N as shown in Table  1 .

Tafel 1

Description of the statistical models assumed to estimate N e based on LD

ModelαSample size correction
eenGeschatteGeen
BGeschatte1/2N
CGeschatte1/N
NSFixed to 2Geen
eFixed to 21/2N
FFixed to 21/N

Six different models differing in mutation and sample size adjustments are indicated

For predicting Ne at any generation in the past, we have to consider R 2 between SNP pairs at a specific linkage distance in Morgans (NS). This distance yields a prediction of the time since the gametes are expected to have coalesced 1/(2C) generations ago [34, 35]. Dus,

waar Ne(t) is the effective population size t generations ago and RNS 2 is the mean value of R 2 for markers NS Morgans apart. Based on this equation a non-linear least squares approach was implemented to statistically model the observed R 2 . With the aim to avoid dependence between LD and linkage distance estimated from the same data, we used estimates of recombination rates for each chromosome from a different study in the same species. Specifically, we used estimates from Tourtereau et al. [36] who described a high density recombination map for the pig using the Porcine SNP60 BeadChip. They built this map using information from four independent pedigrees coming from F2 crosses involving five breeds (Berkshire, Duroc, Meishan, Yorkshire and Landrace). Therefore, for each SNP pair in LD separated by a particular physical distance (Mb), an equivalent linkage distance (Morgans) was calculated as the product of the recombination rate for a particular chromosome obtained from Tourtereau et al. [36] and the physical distance.

We investigated the evolution of Ne across the period between 1944 (year of the foundation of the herd) and 2011 (the last year for which data were available hereinafter referred to as ‘the present’), a period comprising 26 generations. To estimate Ne at the time of the foundation of the herd (i.e. 26 generations ago) from the relationship between t en NS, we had to consider SNP pairs at a linkage distance of approximately 0.019 Morgans which in this population corresponded to 2.5 Mb. In the same way, to calculate the Ne at the present, the corresponding physical distance between the SNP pairs corresponded approximately to 66 Mb. However, non-syntenic levels of LD might be taken into account, as they are not a function of the distance. Otherwise Ne estimates will be biased. In particular, the maximum distance between SNP pairs that can provide informative estimates of Ne needs to be lower than the distance determining non-syntenic levels of LD. In addition, to ensure that sufficient SNP pairwise comparisons are available to obtain estimates of R 2 with acceptable precision, we used a maximum distance between SNPs of 15 Mb (from which 180 LD measures were obtained), which translated into 5 generations in the past.

We segmented the interval between 2.5 and 15.0 Mb into 63 distance categories (i.e. from 2.5 Mb and increasing by 0.2 Mb consecutive categories up to 15.0 Mb) and performed an equivalent number of regressions to estimate Ne(t) at different times. We applied this procedure on each of the six scenarios differing in mutation and sample size adjustments and on each of the six replicates.


Estimation of census and effective population sizes: the increasing usefulness of DNA-based approaches

Population census size (N C) and effective population sizes (N e) are two crucial parameters that influence population viability, wildlife management decisions, and conservation planning. Genetic estimators of both N C en N e are increasingly widely used because molecular markers are increasingly available, statistical methods are improving rapidly, and genetic estimators complement or improve upon traditional demographic estimators. We review the kinds and applications of estimators of both N C en N e, and the often undervalued and misunderstood ratio of effective-to-census size (N e /N C). We focus on recently improved and well evaluated methods that are most likely to facilitate conservation. Finally, we outline areas of future research to improve N e en N C estimation in wild populations.

Dit is een voorbeeld van abonnementsinhoud, toegang via uw instelling.


Bekijk de video: DINAMIKA POPULASI DAN PENDUGAAN STOK Analisis Kohort, Pertumbuhan, YR dan Mortalitas (Januari- 2022).