Informatie

$F_{ST}$ bij het overwegen van een multi-allelische locus


Sewall Wright definieerde de $F_{ST}$ in een metapopulatie als zijnde:

$$F_{ST} = frac{ ext{Var}(p)}{ar p (1-ar p)}$$

, waarbij $p$ een vector is van frequenties van een bepaald allel en $ar p$ en $ ext{Var}(p)$ het gemiddelde en de variantie van deze vector zijn.

Beschouw bijvoorbeeld een metapopulatie die bestaat uit 4 subpopulaties. De allelfrequenties in deze 4 subpopulaties zijn p=[0,2, 0,5, 0,8, 0,3]. $ar p$ is het gemiddelde van $p$ ($ar p = 0.45$) en $ ext{Var}(p)$ is de variantie van $p$ ($ ext{Var}(p )= 0,07 spatie$).

Vraag

Kunnen we $F_{ST}$ definiëren voor een locus met meerdere allel? Of moet $F_{ST}$ voor elk allel afzonderlijk worden gedefinieerd?


Kort antwoord: ja, mensen hebben manieren geformuleerd om te schatten $F_{ST}$ voor multiallelische loci, b.v. microsatellieten. Voor een recensie, zie hier.

In het bijzonder zou Nei kunnen definiëren: $F_{ST}$ voor meerdere allelen als

$F_{ST} = frac{(H_t - H_s)}{H_t}$,

dat wil zeggen het aandeel van de totale heterozygotie dat over de populatie heen is in plaats van binnen populaties. Dit is agnostisch voor het aantal allelen, omdat het alleen gebruik maakt van heterozygotie. Ik geloof dat er ook andere formuleringen zijn.

Er bestaan ​​alternatieve statistieken zoals: $G_{ST}$ en $R_{ST}$ (links onder elk) die specifiek zijn ontworpen voor het multiallelische probleem, zie ook de review voor verdere bespreking. Kortom, microsatellieten hebben hoge mutatiesnelheden, zodat ze de statistiek leeg laten lopen; dit zal waarschijnlijk het geval zijn voor de meeste multiallelische loci.

Het is echter niet duidelijk welke statistiek in de praktijk het beste werkt, voor zover ik kan nagaan.


Ongelijke allelfrequenties op de zelf-incompatibiliteitslocus binnen lokale populaties van Prunus avium L.: een effect van bevolkingsopbouw?

In dit artikel hebben we de genetische structuur en distributie van allelfrequenties op de gametofytische zelf-incompatibiliteitslocus onderzocht in drie populaties van Prunus avium L. In overeenstemming met theoretische voorspellingen bij het balanceren van selectie, was de genetische structuur op de zelf-incompatibiliteitslocus bijna drie keer lager dan bij zeven niet-gekoppelde microsatellieten. Verder vonden we dat S-allelfrequenties in wilde kersenpopulaties significant afweken van de verwachte isoplethische verdeling waar naar verwachting balancerende selectie allelfrequenties zal sturen (d.w.z. identieke frequentie gelijk aan het omgekeerde van het aantal allelen in de populatie). Om te beoordelen of deze afwijking kan worden veroorzaakt door alleen drift of door populatiestructuur, hebben we numerieke simulaties gebruikt om onze waarnemingen te vergelijken met verwachte allelische frequentieverdelingen: (1) binnen een enkele deme van een onderverdeelde populatie met verschillende differentiatieniveaus en (2 ) binnen een eindige panmictische populatie met identieke allelische diversiteit. We onderzochten ook de effecten van steekproefomvang en mate van populatiestructuur op tests om af te wijken van het isopletisch evenwicht. Over het algemeen lieten onze resultaten zien dat de waargenomen allelfrequentieverdelingen consistent waren met een model van een onderverdeelde populatie met domeinen gekoppeld aan een matige migratiesnelheid.


Abstract

Honderden varianten van kopienummers zijn complex en multi-allelisch, in die zin dat ze veel structurele allelen hebben en meerdere keren zijn herschikt in de voorouders die chromosomen hebben bijgedragen aan de huidige mens. Niet alleen zijn de relaties van deze multi-allele CNV's (mCNV's) tot fenotypes over het algemeen onbekend, maar veel mCNV's zijn nog niet beschreven op de basisniveaus - allelen, allelfrequenties, structurele kenmerken - die genetisch onderzoek ondersteunen. Tot op heden zijn de meeste gerapporteerde ziekteassociaties met deze varianten vastgesteld door middel van kandidaat-genstudies. In veel cohorten hebben echter slechts enkele verenigingen het acceptatieniveau bereikt dat wordt gedefinieerd door duurzame replicaties. Dit komt waarschijnlijk voort uit langdurige uitdagingen bij het maken van nauwkeurige moleculaire metingen van de allelen die individuen op deze loci hebben. De benaderingen voor mCNV-analyse verbeteren echter snel en enkele van de unieke kenmerken van mCNV's kunnen toekomstige associatiestudies helpen. Hun verschillende structurele allelen hebben waarschijnlijk verschillende groottes van effect, waardoor een natuurlijke allelische reeks van groeiende fenotypische impact ontstaat en onderzoekers een reeks natuurlijke voorspellingen en toetsbare hypothesen krijgen over de mate waarin elk allel van een mCNV vatbaar is voor een fenotype. Ook kan de lage tot bescheiden correlatie van mCNV's met individuele single-nucleotide polymorfismen (SNP's) het gemakkelijker maken om onderscheid te maken tussen mCNV's en nabijgelegen SNP's als de aanjagers van een associatiesignaal, en misschien maken het mogelijk om kandidaat-loci voorlopig te screenen, of het hele genoom, voor de vele mCNV-ziekterelaties die nog moeten worden ontdekt.


Invoering

Het afleiden van populatieconnectiviteit uit moleculaire gegevens binnen een genetisch populatiekader kan licht werpen op de evolutionaire en ecologische processen die patronen van genetische diversiteit vormen (Clobert et al. 2012). Populatiegenetische benaderingen bieden handige methoden om de snelheid en schaal van verspreiding (of migratie) te evalueren wanneer de beweging van individuen niet op andere manieren kan worden beoordeeld, zoals veldexperimenten met herovering. Dit probleem is met name acuut in het mariene milieu, waar de verspreidings- en migratieroutes van organismen onder het oppervlak van de oceanen voor het menselijk oog verborgen zijn (Hellberg 2009 Selkoe en Toonen 2011 ). Het potentieel van genetische methoden, geïllustreerd door succesvolle studies bij rifsoorten (Selkoe et al. 2010 Puebla et al. 2012 ), heeft geleid tot verhoogde verwachtingen voor het afleiden van mariene connectiviteitspatronen uit moleculaire markers, vooral voor instandhoudings- en beheerdoeleinden.

De meeste mariene soorten vertonen echter combinaties van levensgeschiedeniskenmerken (bijv. hoge vruchtbaarheid, grote populatieomvang, hoog verspreidingspotentieel, vaak gecombineerd met complexe levenscycli) die zwakke patronen van genetische differentiatie of zelfs helemaal geen differentiatie produceren (Ward et al. 1994 Waples 1998 Palumbi 2003 Hedgecock et al. 2007). Een gebrek aan genetische differentiatie kan het gevolg zijn van een reeks situaties, variërend van bijna volledige demografische onafhankelijkheid onder grote populaties tot het bestaan ​​van een unieke panmictische populatie (Palumbi 2003 Waples en Gaggiotti 2006 Waples et al. 2008) (Fig. 1). Ruimtelijke genetische homogeniteit kan dus een grote diversiteit aan scenario's verbergen met betrekking tot de hedendaagse snelheden van demografische uitwisselingen tussen groepen individuen die verschillende delen van een soortenreeks bewonen. Dit is met name zorgwekkend omdat het aantal migranten per generatie, dat voldoende is om te leiden tot schijnbare genetische panmixie, mogelijk niet hoog genoeg is om demografische connectiviteit en reddingseffecten te garanderen (Waples 1998 Lowe en Allendorf 2010 ). Deze discrepantie tussen de doelstelling om demografische connectiviteit af te leiden voor conserveringsbiologie en beheerdoeleinden en de beperkingen die inherent zijn aan de meeste populatiegenetische benaderingen, heeft verschillende beoordelingen in het veld gemotiveerd (Waples en Gaggiotti 2006 Broquet en Petit 2009 Hellberg 2009 Lowe en Allendorf 2010). Ons doel hier is niet om een ​​nieuwe synthese te bieden van bestaande methoden om connectiviteit af te leiden, die in die beoordelingen grondig zijn behandeld. We streven er eerder naar om de nieuwe perspectieven te overwegen die worden geboden door het toenemende aantal markers in populatiegenomische studies, met een speciale focus op het gebruik van loci die worden beïnvloed door selectie. De snelle verspreiding van op de volgende generatie sequencing (NGS) gebaseerde genotyperingsmethoden in de gereedschapskist van moleculair ecologen heeft ons vermogen om genetische variatie uit populatiemonsters te identificeren en te karakteriseren aanzienlijk verbeterd (Davey et al. 2011 ). Toch blijft het onduidelijk welke benaderingen het meest zullen profiteren van deze enorme hoeveelheid sequentiegegevens. Een direct voordeel van het analyseren van duizenden markers is een grotere precisie bij het meten van genetische differentiatie en een groter statistisch vermogen om kleine genetische verschillen tussen populaties te detecteren (Waples 1998). Populaties met grote effectieve omvang, hoge migratiesnelheden of beide kunnen echter vrijwel ongedifferentieerd blijven, en dus kan het vermenigvuldigen van neutrale markers in dergelijke gevallen nog steeds niet het huidige niveau van demografische connectiviteit onthullen.

Een andere belangrijke prestatie van NGS-benaderingen is het vergemakkelijken van de ontdekking van genetische markers die worden beïnvloed door selectie (Allendorf et al. 2010 Stapley et al. 2010). Deze uitbijterloci kunnen genetische differentiatiepatronen onthullen op de plaats waar neutrale markers vaak niet-informatief blijven, en daarom is gesuggereerd dat het signaal van uitbijterloci zou kunnen worden gebruikt om lokaal aangepaste bestanden af ​​​​te bakenen en instandhoudingseenheden opnieuw te definiëren (Nielsen et al. 2009 , 2012 Funk et al. 2012 ). Deze benadering is aantrekkelijk omdat selectie veel efficiënter kan zijn dan drift in het tegengaan van het homogeniserende effect van migratie, vooral wanneer populaties grote effectieve grootten hebben. Uitbijter loci kunnen echter ontstaan ​​door een grote verscheidenheid aan evolutionaire mechanismen, afgezien van lokale aanpassing, wat het primaire doelwit is van de meeste genoomscanstudies die op zoek zijn naar adaptieve variatie (Bierne et al. 2013). Deze evolutionaire mechanismen moeten dus worden geïdentificeerd voordat uitbijterloci worden gebruikt om connectiviteit te evalueren.

Verschuivingen in allelfrequentie op uitbijterloci zullen naar verwachting geconcentreerd zijn in bepaalde geografische regio's waar sterke ecologische gradiënten lokale aanpassing bevorderen (Schmidt et al. 2008). Hotspots van genetische differentiatie kunnen ook ontstaan ​​door het opsluiten van spanningszones door natuurlijke barrières voor verspreiding (Barton 1979a), of door de koppeling tussen exogene en endogene reproductieve barrières (Bierne et al. 2011). Deze voorspellingen worden bevestigd door bekende hotspots van genetische differentiatie in de zee (bijvoorbeeld het Almeria-Oran-front, de Siculo-Tunesische zeestraat, Cape Agulhas, Cape Cod, Oresund, Point Conception, enz.). Problemen met het behoud en het beheer van de zee vereisen echter vaak maatregelen van connectiviteit in gebieden buiten deze specifieke zones. In een laatste sectie onderzoeken we alternatieve mechanismen die onevenwichtigheid genereren op neutrale liftersloci, zelfs buiten de cline van de geselecteerde locus zelf. Deze indirecte effecten van selectie kunnen een cryptische genetische structuur onthullen binnen schijnbaar goed gemengde gebieden. Deze effecten zijn van twee soorten: (i) gradiënten van introgressie (of introgressiestaarten) afkomstig van een geografisch verre contactzone (Gagnaire et al. 2011 ) en (ii) liftende lijnen die tijdelijk worden gegenereerd tijdens de voortplanting van een selectieve zwaai ( Bieren 2010). Genomische datasets van grote populaties bieden moleculaire ecologen nu de middelen om deze patronen te gebruiken om mariene connectiviteit te bestuderen. Daarom is er goede hoop dat het verzamelen van theoretische achtergrond met deze nieuwe gegevens het onderzoek in het veld verder zal katalyseren.


Kandidaat-genstudies van mCNV-associaties

Tot op heden zijn de meeste gerapporteerde ziekte-naar-mCNV-associaties vastgesteld door middel van kandidaat-genstudies. Als gevolg hiervan heeft een handvol genen de meeste onderzoeksaandacht gekregen, waarschijnlijk vanwege hun reeds bekende of veronderstelde rol bij interessante ziekten. Deze genen omvatten: FCGR3B (bindt het Fc-gebied van gamma-immunoglobulinen), CCL3L1 [ligand van de co-receptor voor het humaan immunodeficiëntievirus (hiv)], bètadefensines (cluster van microbicide en cytotoxische peptiden), HBA1/2 (α-keten van hemoglobine) en C4 (onderdeel van de complementroute) [18-31]. De cohortgroottes in deze onderzoeken varieerden van 50 tot 2807, met een trend in de richting van de eerste onderzoeken met minder monsters en de pogingen tot replicatie met meer (tabel 1).

Opmerkelijke mCNV-ziekteassociaties en hun replicatiestudies

Opmerkelijke mCNV-ziekteassociaties en hun replicatiestudies

Tot op heden lijkt de studie van mCNV-naar-ziekte-associaties op de studie van single-nucleotide polymorphism (SNP) -associaties in het pre-genoombrede associatiestudie (GWAS) -tijdperk. Vóór ongeveer 2005 waren SNP-onderzoeken gericht op kandidaatgenen en varianten die in kleine cohorten werden getypt. Dergelijke studies hadden een ontnuchterende staat van dienst: duizenden associaties werden gerapporteerd, maar slechts een handvol werd gerepliceerd in andere kandidaat-genstudies of in latere goed gepowerde genoombrede associatiestudies [32-34]. Achteraf bezien was de wetenschap niet goed in het raden welke genen bijdragen aan genetisch complexe fenotypes. Er waren onbevooroordeelde genoombrede onderzoeken nodig om dergelijke genen te identificeren. Uiteindelijk maakten publicatiebias (met name de grotere waarschijnlijkheid van publicatie en zichtbaarheid voor positieve resultaten, in vergelijking met negatieve resultaten), gecombineerd met bescheiden statistische drempels en grote aantallen hypothesen die in het veld werden getest, het waarschijnlijk dat veel studies nominale niveaus van associatie, zelfs als er geen echte onderliggende genetische relaties zijn. Deze ontnuchterende lessen zijn het overwegen waard bij het nadenken over het traject van ziekte-mCNV-analyse.

Net als SNP-kandidaat-genstudies tien jaar geleden, hebben slechts een handvol mCNV-naar-ziekte-associaties het acceptatieniveau bereikt dat wordt gedefinieerd door replicaties in onafhankelijke cohorten door onafhankelijke groepen onderzoekers [20, 23, 27, 28, 35]. Een overtuigend voorbeeld van de uitdagingen van replicatie is te vinden in de Wellcome Trust Case Control (WTCCC) -studie, die een array-gebaseerde CNV-genotyperingstechnologie gebruikte om een ​​GWAS van duizenden CNV's bij acht veel voorkomende ziekten uit te voeren. Ondanks goede metingen van het aantal kopieën (zoals hieronder besproken) en een grotere steekproefomvang dan eerdere onderzoeken (ongeveer 2000 gevallen), repliceerde het WTCCC-onderzoek geen drie eerder gepubliceerde associaties (FCGR3B op reumatoïde artritis, CCL3L1 op reumatoïde artritis en β-defensines op de ziekte van Crohn). Non-replicatie heeft ook andere associaties geërgerd, een ander voorbeeld is: CCL3L1’s impact op hiv-gerelateerde fenotypes [25].

Casestudy in replicatie: CCL3L1 en HIV

Een van de meest bekende mCNV-associaties werd in 2005 gerapporteerd in Wetenschap [ 25]. CCL3L1, een gen dat codeert voor een ligand voor de co-receptor voor het HIV-virus, bleek te variëren van 0 tot 14 kopieën in diploïde genomen. Het hebben van een lager dan gemiddeld CCL3L1-kopieaantal bleek geassocieerd te zijn met verhoogde HIV-gevoeligheid en snellere progressie van HIV+-status naar verworven immuundeficiëntiesyndroom (AIDS) [25]. Na publicatie probeerden veel vervolgonderzoeken de resultaten te repliceren en uit te breiden (tabel 2). Nieuwe fenotypes werden getest in dezelfde cohorten en nieuwe cohorten werden getest op dezelfde associaties, elk met een enigszins beperkt succes, wat resulteerde in een gecompliceerd patroon van replicatie en niet-replicatie dat de uiteindelijke interpretatie belemmert [11, 36-49]. Afzonderlijke studies hebben geprobeerd de oorzaken van de uiteenlopende resultaten op te sporen, waarbij werd geconcludeerd dat bepaalde analytische praktijken - zoals genotypering van gevallen en controles afzonderlijk en het afronden van ruwe kopie-aantalmetingen op het dichtstbijzijnde gehele getal - waarschijnlijk vals-positieve associaties hebben gegenereerd [48– 53]. Onze eigen analyse suggereert een bijkomend patroon: studies die positieve associaties vonden, zijn zichtbaar gepubliceerd en vele malen geciteerd, terwijl studies die negatieve associaties vonden (indien gepubliceerd) minder zichtbaar waren. Debat over CCL3L1’s impact op hiv zal waarschijnlijk aanhouden, en voorbeelden zoals: CCL3L1 benadrukken de behoefte aan experimentele methoden en ontwerpen die duurzame associatieresultaten garanderen.

Resultaten van onderzoeken die beoordelen of: CCL3L1 kopieaantal beïnvloedt hiv-gerelateerde fenotypes

Resultaten van onderzoeken die beoordelen of: CCL3L1 kopieaantal beïnvloedt hiv-gerelateerde fenotypes


Populatie genomische en fenotype diversiteit van invasieve Drosophila suzukii op Hawaii

In de context van de evolutietheorie biedt invasiebiologie een fantastisch raadsel: hoe overleeft een soort met beperkte permanente genetische variatie en past hij zich aan aan een nieuwe omgeving? Verminderde genetische diversiteit wordt meestal geassocieerd met een lage fitheid en evolutionair potentieel, maar sommige geïntroduceerde soorten hebben bewezen succesvolle indringers te zijn, ondanks het feit dat ze een genetisch knelpunt ondergingen tijdens de vroege stadia van kolonisatie. Ons doel in deze studie was het karakteriseren van populatiegenomische en fenotype diversiteit van invasieve Drosophila suzukii (Diptera: Drosophilidae) sinds ze de Hawaiiaanse archipel al in de jaren tachtig koloniseerden. Vleugelfenotype-analyse onthulde dat populaties op grote hoogte significant grotere vleugels bezaten dan populaties op lage hoogte, wat de hypothese ondersteunt dat insecten omgaan met omgevingen op grote hoogte door grotere vleugels te ontwikkelen. Hoewel we een lage genetische diversiteit en differentiatie in alle Hawaï-populaties ontdekten, werden drie unieke genetische clusters gedetecteerd met een modelvrije, multivariate statistische benadering. We identificeerden 23 kandidaat-loci onder selectie met behulp van twee complementaire analyses om te detecteren FNS uitschieters in het genoom. Voor 12 van deze loci zijn voorspelde eiwitten geassocieerd met Drosophila spp. chemosensatie, aminozuur- en natriumionentransport, een Ras-effectorroute en cytidinedeaminering. Ondanks een genetisch knelpunt, adventief D. suzukii populaties beginnen te differentiëren over de Hawaiiaanse archipel en de selectie voor belangrijke gedrags- en cellulaire processen is waarschijnlijk aan de gang.

Dit is een voorbeeld van abonnementsinhoud, toegang via uw instelling.


Abstract

Forensische DNA-profilering maakt momenteel de identificatie mogelijk van personen die al bekend zijn bij onderzoeksinstanties. Recente ontwikkelingen hebben nieuwe soorten genetische markers opgeleverd met het potentieel om enkele belangrijke beperkingen van de huidige DNA-profileringsmethoden te overwinnen. Bovendien maken andere ontwikkelingen het mogelijk om volledig nieuwe soorten forensisch relevante informatie uit biologische monsters te halen. Deze omvatten nieuwe moleculaire benaderingen voor het vinden van individuen die voorheen onbekend waren voor onderzoekers, en nieuwe moleculaire methoden om verbanden tussen forensische monsterdonoren en criminele handelingen te ondersteunen. Dergelijke vorderingen in de genetica, genomica en moleculaire biologie zullen in de nabije toekomst waarschijnlijk het forensisch onderzoek van de mens verbeteren.


Toepassing op gegevens

We illustreren de grenzen op F, m, en Ht voor een reeks voorbeelden met behulp van menselijke polymorfismegegevens van Rosenberg et al. (2005) en Li et al. (2008). Voor elk voorbeeld, voor elke locus, nemen we aan dat de allelfrequenties in de datasets parametrische allelfrequenties zijn. De parametrische allelfrequenties worden verkregen in elk van een paar populaties, en ze worden vervolgens gemiddeld om parametrische allelfrequenties voor de totale populatie te verkrijgen. F, m, en Ht worden dan berekend. De dataset van Rosenberg et al. (2005) beschouwt 1048 individuen gegenotypeerd voor 783 microsatellieten, en de dataset van Li et al. (2008) beschouwt 938 niet-verwante individuen gegenotypeerd voor single-nucleotide polymorphisms (SNP's) voor alle analyses, we beperken onze aandacht tot de 935 individuen die in beide datasets worden gevonden. voor de Li et al. (2008), onderzoeken we alleen 640.034 SNP's die door Pemberton zijn bestudeerd et al. (2012).

Voorbeeld 1: Afrikanen en indianen

Ons eerste voorbeeld beschouwt microsatellieten bij 101 Afrikanen en 63 inheemse Amerikanen, en het is gekozen om een ​​relatief breed scala aan waarden van F, m, en Ht. Figuur 7 toont F en m, waaruit blijkt dat voor de vergelijking van Afrikanen en indianen, F < 0,1 voor de meeste 783 loci. De gemiddelde waarde van F is 0,05 met standaarddeviatie 0,06, en de gemiddelde waarde van m is 0,37 met standaarddeviatie 0,11.

F en de frequentie van het meest voorkomende allel (m) voor 101 Afrikanen en 63 indianen. Op elk van 783 microsatellietloci worden allelfrequenties afzonderlijk berekend voor de twee bevolkingsgroepen, en de totale allelfrequentie is het gemiddelde van de twee groepsfrequenties. Elke bak heeft een afmeting van 0,01 × 0,01 en de bovengrens op F als functie van m ter vergelijking getoond.

Evenzo plot figuur 8 F en Ht voor de 783 loci. De betekenis Ht is 0,25 met standaarddeviatie 0,08. In beide figuren 7 en 8 naderen relatief weinig loci de bovengrens op F.

F en homozygotie (Ht) voor 101 Afrikanen en 63 indianen. Op elk van 783 microsatellietloci worden allelfrequenties afzonderlijk berekend voor de twee bevolkingsgroepen, en de totale allelfrequentie is het gemiddelde van de twee groepsfrequenties. Elke bak heeft een afmeting van 0,01 × 0,01 en de bovengrens op F als functie van Ht ter vergelijking getoond.

Voorbeeld 2: Populaties met hoge en lage diversiteit

De grenzen op F als functie van m en Ht geven aan dat genetische diversiteit in een paar populaties een sterk effect heeft op de waarde van F tussen hen. Om dit punt te illustreren, vergelijken we de waarden van F verkregen uit twee populaties met elk een hoge diversiteit binnen de populatie tot die verkregen uit twee populaties met een lagere diversiteit binnen de populatie.

De Yoruba- en Mbuti Pygmy-populaties zijn twee Afrikaanse populaties met een hoge genetische diversiteit, de Colombiaanse en Pima-populaties zijn Indiaanse populaties met een lagere diversiteit. Figuur 9A toont F en m berekend op basis van de Yoruba- en Mbuti Pygmy-populaties, en figuur 9B toont: F en Ht. De gemiddelde waarde van F is 0,04 met standaarddeviatie 0,03, de gemiddelde waarde van m is 0,35 met standaarddeviatie 0,11 en de gemiddelde waarde van Ht is 0,24 met standaarddeviatie 0,08.

relaties tussen F, m, en Ht, voor paren van Afrikaanse en Indiaanse populaties. (EEN) F en m voor 21 Yoruba en 15 Mbuti Pygmy individuen. (B) F en Ht voor 21 Yoruba en 15 Mbuti Pygmy individuen. (C) F en m voor 7 Colombiaanse en 14 Pima-individuen. (NS) F en Ht voor 7 Colombiaanse en 14 Pima-individuen. In elke plot worden op elk van 783 microsatellietloci allelfrequenties afzonderlijk berekend voor de twee populaties, en de totale allelfrequentie is het gemiddelde van de twee populatiefrequenties. Elke bak heeft een afmeting van 0,01 × 0,01 en de bovengrens op F ter vergelijking getoond.

Daarentegen, in overeenkomstige plots voor de minder diverse Colombiaanse en Pima-populaties, zijn hogere waarden van F, m, en Ht zijn duidelijk (Figuur 9, C en D). In het bijzonder, omdat m en Ht hebben de neiging om dichter bij 1/2 te zijn, grotere waarden van F zijn mogelijk. De gemiddelde waarden van m en Ht zijn veel dichter bij 1/2 dan in de Afrikaanse groepen het gemiddelde m is 0,50 met standaarddeviatie 0,15, en het gemiddelde Ht is 0,38 met standaarddeviatie 0,15. Zoals wordt gesuggereerd door het feit dat F kan zijn grootste waarden bereiken wanneer: m en Ht liggen in de buurt van 1/2, de gemiddelde waarde van F voor de Indiaanse groepen is bijna twee keer zo hoog als in de Afrikaanse groepen (gemiddelde 0,07, standaarddeviatie 0,07).

Voorbeeld 3: Single-nucleotide polymorfismen

Ons derde voorbeeld beschouwt SNP's in dezelfde set van Afrikanen en indianen waarvoor microsatellieten werden onderzocht in figuren 7 en 8. Figuur 10 toont de gezamenlijke verdeling van F en m evenals het gemiddelde en de mediaan van F voor intervallen van m variërend van 1/2 tot 1 met een breedte van 0,01. gemiddelde waarden van F afnemen met m voor m ε (1/2, 1), en deze afname is gecorreleerd met de afnemende waarde van de grens aan F als functie van m (R = 0,94). Vergeleken met het gemiddelde, is de mediane waarde van F is minder gecorreleerd met de waarde van de binding, hoewel het ook afneemt met toenemende m (R = 0.77).

Afgevlakte spreidingsdiagram van F als functie van m voor 101 Afrikanen en 63 indianen, met behulp van SNP-gegevens. De arcering weerspiegelt een tweedimensionale schatting van de kerndichtheid met behulp van een Gauss-kernel met bandbreedte ingesteld op 0,007, de dichtheid was ingesteld op 0 buiten de grenzen op F als functie van m. Voor elk van 640.034 SNP-loci worden allelfrequenties afzonderlijk berekend voor de twee bevolkingsgroepen, en de totale allelfrequentie is het gemiddelde van de twee groepsfrequenties. Het gemiddelde en de mediaan van F worden berekend voor 50 bakken met een breedte van 0,01 variërend van m = 1/2 tot m = 1. De bovengrens op F als functie van Ht ter vergelijking getoond.

Voor biallele markers, voor m > 1/2, minimaal één van de twee allelen moet voorkomen in beide populaties, en de bovengrens op F treedt op wanneer een van de populaties slechts één allel heeft. In figuur 10, voor hoge waarden van m, naderen meer SNP's de bovengrens op F dan voor lage waarden van m. Dit resultaat geeft aan dat SNP's met hoge waarden van m hebben meer kans om een ​​allel te hebben dat in de ene populatie wordt gevonden, maar niet in de andere van de twee populaties.


Inhoud

In het genoom van een organisme bevindt elk gen zich op een specifieke plaats die de locus voor dat gen wordt genoemd. Allelische variaties op deze loci veroorzaken fenotypische variatie binnen soorten (bijvoorbeeld haarkleur, oogkleur). De meeste allelen hebben echter geen waarneembare invloed op het fenotype. Binnen een populatie sterven nieuwe allelen die door mutatie worden gegenereerd uit of verspreiden ze zich over de populatie. Wanneer een populatie wordt opgesplitst in verschillende geïsoleerde populaties (door geografische of ecologische factoren), zullen mutaties die optreden na de splitsing alleen aanwezig zijn in de geïsoleerde populatie. Willekeurige fluctuatie van allelfrequenties produceert ook genetische differentiatie tussen populaties. Dit proces staat bekend als genetische drift. Door de verschillen tussen allelfrequenties tussen de populaties te onderzoeken en de genetische afstand te berekenen, kunnen we schatten hoe lang geleden de twee populaties gescheiden waren. [5]

Hoewel het eenvoudig is om genetische afstand te definiëren als een maat voor genetische divergentie, zijn er verschillende statistische maatregelen voorgesteld. Dit is gebeurd omdat verschillende auteurs verschillende evolutionaire modellen in overweging namen. De meest gebruikte zijn Nei's genetische afstand, [5] Cavalli-Sforza en Edwards meten, [6] en Reynolds, Weir en Cockerham's genetische afstand, [7] hieronder vermeld.

Nei's standaard genetische afstand Bewerken

In 1972 publiceerde Masatoshi Nei wat bekend werd als Nei's standaard genetische afstand. Deze afstand heeft de mooie eigenschap dat als de snelheid van genetische verandering (aminozuursubstitutie) per jaar of generatie constant is, Nei's standaard genetische afstand (NS) neemt evenredig toe met de divergentietijd. Deze maat gaat ervan uit dat genetische verschillen worden veroorzaakt door mutatie en genetische drift. [5]

De standaardafstand van Nei kan dan worden geschreven als [5]

Cavalli-Sforza akkoordafstand Bewerken

In 1967 publiceerden Luigi Luca Cavalli-Sforza en A.W.F. Edwards deze maatregel. Het gaat ervan uit dat genetische verschillen alleen ontstaan ​​door genetische drift. Een groot voordeel van deze maatregel is dat de populaties worden weergegeven in een hypersfeer, waarvan de schaal één eenheid per gensubstitutie is. De akkoordafstand in de hyperdimensionale bol wordt gegeven door [2] [6]

Genetische afstand van Reynolds, Weir en Cockerham

In 1983 werd deze maatregel gepubliceerd door John Reynolds, Bruce Weir en C. Clark Cockerham. Deze maatregel gaat ervan uit dat genetische differentiatie alleen plaatsvindt door genetische drift zonder mutaties. Het schat de verwantschapscoëfficiënt Θ < Displaystyle Theta > die een maat voor de genetische divergentie geeft door: [7]

Andere maatregelen Bewerken

Veel andere maatregelen van genetische afstand zijn voorgesteld met wisselend succes.

Nei's NSEEN afstand 1983 Bewerken

Deze afstand veronderstelt dat genetische verschillen ontstaan ​​als gevolg van mutatie en genetische drift, maar het is bekend dat deze afstandsmaat betrouwbaardere populatiebomen oplevert dan andere afstanden, met name voor microsatelliet-DNA-gegevens. [9] [10]

Euclidische afstand

Goldstein afstand 1995 Edit

Nei's minimale genetische afstand 1973

Deze maat gaat ervan uit dat genetische verschillen ontstaan ​​door mutatie en genetische drift. [13]

Roger's afstand 1972 Bewerken

Fixatie-index Bewerken

Een veelgebruikte maat voor genetische afstand is de fixatie-index (FNS) die varieert tussen 0 en 1. Een waarde van 0 geeft aan dat twee populaties genetisch identiek zijn (minimale of geen genetische diversiteit tussen de twee populaties), terwijl een waarde van 1 aangeeft dat twee populaties genetisch verschillend zijn (maximale genetische diversiteit tussen de twee populaties) ). Er wordt geen mutatie verondersteld. Grote populaties waartussen veel migratie is, bijvoorbeeld, hebben de neiging om weinig gedifferentieerd te zijn, terwijl kleine populaties waartussen weinig migratie is, vaak sterk gedifferentieerd zijn. FNS is een geschikte maatstaf voor deze differentiatie, en als resultaat FNS en gerelateerde statistieken behoren tot de meest gebruikte beschrijvende statistieken in populatie- en evolutionaire genetica. Maar FNS is meer dan een beschrijvende statistiek en maatstaf voor genetische differentiatie. FNS is direct gerelateerd aan de variantie in allelfrequentie onder populaties en omgekeerd naar de mate van gelijkenis tussen individuen binnen populaties. Als FNS klein is, betekent dit dat allelfrequenties binnen elke populatie erg op elkaar lijken, als het groot is, betekent dit dat allelfrequenties heel verschillend zijn.


Materialen en methodes

Monsters

In totaal 572 Europese witvis (Coregonus lavaretus sensu lato) individuen bemonsterd tussen 1979 en 2013 uit Estland, Finland, Rusland en Zweden werden geanalyseerd (Tabel 1, Fig. 1). Specimens werden voornamelijk bemonsterd door lokale vissers op 15 locaties in de Oostzee (12 monsters van het in de zee paaiende ecotype, inclusief tijdelijke replica's van Tengsöda) en in de riviermondingen van de Oostzee (vier monsters van het rivierpaaiende ecotype) tijdens de paaiperiode (Oktober november). Bovendien werden de exemplaren van twee witvispopulaties verzameld in de meren Ladoga (Rusland) en Saadjärv (Estland), en de laatste populatie werd in de jaren zestig opgericht door witvis uit het Peipusmeer (Estland/Rusland) uit te zetten.


Bekijk de video: M3T3B8: Lokus + persilangan (December 2021).