Informatie

Wat is het verschil tussen fixatie en verlies van allelen in een populatie?


Bij het uitvoeren van een simulatie in PopG, met parameters:

  • Bevolkingsgrootte: 100
  • AA-fitness: 1.0
  • Aa-fitness: 1.0
  • aa fitness: 1.0
  • Mutatie A naar a: 1.0E-6
  • Mutatie a naar A: 1.0E-6
  • Migratiesnelheid tussen populaties: 0.001
  • Initiële frequentie van A: 0,5
  • Generaties om te rennen: 1000
  • Populaties die gelijktijdig evolueren: 100
  • Willekeurig nummer zaad: automatisch genereren

Ik krijg het resultaat dat 20 populaties worden hersteld en 10 populaties verloren gaan. Het is duidelijk dat, aangezien dit een simulatie is, deze resultaten elke run zullen variëren; maar wat ik moeilijk begrijp, is dat verloren populaties slechts een fixatie zijn van het recessieve allel?


Ja, 'verloren' lijkt te verwijzen naar de fixatie van het a-allel in dit programma, waar de uitspraken 'vast' en 'verloren' specifiek verwijzen naar het A-allel. Conceptueel beschrijven 'vast' en 'verloren' hetzelfde in dit specifieke geval (omdat je maar twee allelen in de populatie hebt) - het verlies van één allel in een populatie.

Merk op dat zodra de grafiek van de genfrequentiekrommen de rechterkant van de grafiek bereikt, het programma daar het aantal populaties afdrukt dat opgelost voor het A-allel (eindigde met een frequentie van 1,0) en het getal dat dit allel kwijt.

(mijn nadruk, van http://evolution.gs.washington.edu/popgen/popg.html)


Verloren versus vaste populatie

Ik weet niet zeker of ik uw vraag begrijp. Het lijkt een kwestie van definitie. De term verloren en vaste populaties klinkt nogal verkeerd. Ik heb nog nooit PopG gebruikt. Gebruikt de PopG-handleiding deze termen zonder ze te definiëren?

Waarschijnlijkheid van verlies en waarschijnlijkheid van fixatie

Gezien uw parameters, zult u duidelijk verwachten dat, als fixatie optreedt, het even waarschijnlijk is dat het allel a herstelt dan het allel A herstelt. Met andere woorden, de kans op verlies en de kans op fixatie voor een neutrale locus zijn gelijk als je begint bij frequentie 0,5.

Zei je recessief allel?

Merk op dat er in je simulatie geen recessief allel is in termen van fitness (maar je hebt waarschijnlijk geen expliciet fenotype dat achteraf toch gekoppeld is aan deze fitnesswaarden), aangezien alle genotypen dezelfde fitness hebben.

Extra info: $F_{ST}$

Als ik je parameters goed begrijp, simuleer je een eilandmodel met constante migratie tussen twee populaties met D=100 populaties. In dergelijke omstandigheden moet de $F_{ST}$ $$F_{ST}=frac{1}{1+4N(m+mu)left(frac{D}{D-1} ight) zijn ^2}$$ wat ongeveer gelijk is aan $frac{1}{1+4Nm}$, waarbij $m$ en $mu$ respectievelijk de migratie- en mutatiesnelheid zijn.

Vanwege migratie zou je niet verwachten dat de hele populatie op elk moment voor een of ander allel zou zijn vastgesteld.


Allelische rijkdom na populatie-oprichtingsgebeurtenissen - een stochastisch modelleringsraamwerk met genstroom en genetische drift

Affiliations Department of Solar Energy and Environmental Physics, The Jacob Blaustein Institutes for Desert Research, Ben-Gurion University of the Negev, Midreshet Ben-Gurion, Israël, Mitrani Department of Desert Ecology, The Jacob Blaustein Institutes for Desert Research, Ben-Gurion University van de Negev, Midreshet Ben-Gurion, Israël

Aansluitingen Afdeling Biologie, Washington University, St. Louis, Missouri, Verenigde Staten van Amerika, Instituut voor Evolutie, en Afdeling Evolutionaire en Milieubiologie, Universiteit van Haifa, Haifa, Israël

Affiliation Department of Solar Energy and Environmental Physics, The Jacob Blaustein Institutes for Desert Research, Ben-Gurion University of the Negev, Midreshet Ben-Gurion, Israël

Affiliatie Mitrani Afdeling Woestijnecologie, The Jacob Blaustein Institutes for Desert Research, Ben-Gurion Universiteit van de Negev, Midreshet Ben-Gurion, Israël


Vergelijkingstabel: genetische drift vs. Natuurlijke selectie

Genetische drift is een mechanisme van evolutie waarbij allelfrequenties van een populatie veranderen over generaties als gevolg van toeval.

Het kan resulteren in het verlies van sommige allelen (inclusief gunstige) en de fixatie, of stijgen tot 100% frequentie van andere allelen.

Allelen zijn gewoon de verschillende versies van hetzelfde gen die zich op dezelfde locus van een chromosoom bevinden. En de allelfrequentie verwijst naar hoe vaak een allel in een populatie voorkomt.

Genetische drift laat zien dat evolutie (meestal micro-evolutie) toevallig kan plaatsvinden, wat te wijten kan zijn aan natuurlijke selectie of een ander evolutionair mechanisme.

Genetische drift is een evolutiemechanisme dat in de loop van de tijd willekeurige veranderingen in allelfrequenties in een populatie produceert in plaats van selectiegestuurd.

Genetische drift wordt nauwkeuriger waargenomen in kleine populaties binnen een korte tijdsperiode over generaties, hoewel het ook kan gebeuren in grote populaties, maar het duurt lang omdat de populatie groot is.

Genetische drift alleen kan geen enkele vorm van aanpassing in een organisme veroorzaken, omdat het een willekeurige gebeurtenis is. Maar wanneer natuurlijke selectie, mutatie en genenstroom ook samen met genetische drift plaatsvinden, dan vindt aanpassing zeker plaats in de loop van de tijd.

Het optreden van genetische drift kan schadelijk of gunstig zijn voor het organisme. Het hangt af van de verandering in allelfrequenties.

Als een gunstig allel dominant wordt in een populatie dan is het goed, en als een schadelijk (dodelijk) allel dominant wordt in een populatie dan kan dit op termijn de dood veroorzaken.

Bijvoorbeeld: In een muizenpopulatie is de allelfrequentie van het dominante B-allel (zwarte vacht) 40% en de allelfrequentie van het recessieve b-allel (bruine vacht) 60%. Hieruit blijkt dat er meer bruinbontmuizen in de populatie aanwezig zijn dan de zwartbontmuizen. Dit is het bewijs dat de muizenpopulatie evolueert als gevolg van genetische drift.


CONCLUSIE

De genetische stabiliteit van een gesloten broederijpopulatie hangt af van de N . van de populatiee. Zoals het geval was bij gemiddelde inteelt, is genetische drift omgekeerd evenredig met Ne. Bijgevolg kunnen kleine broederijpopulaties willekeurige veranderingen in de genfrequentie veroorzaken. Het ultieme effect van een kleine Ne is het verlies van allelen via genetische drift. Zeldzame allelen gaan gemakkelijker verloren, maar ook gewone allelen kunnen verloren gaan. Het verlies van genetische variantie kan onomkeerbare schade aan de genenpool van een populatie veroorzaken. Dit verlies kan toekomstige verbeteringen via selectie voorkomen, en het kan de levensvatbaarheid verminderen van populaties die in meren en rivieren zijn opgeslagen.


Verwantschap berekenen

Hoe kunnen we verwantschap berekenen in inteelt-, gemengde of haplodiploïde families? De procedure is in wezen hetzelfde als bij reguliere diploïde families. We kunnen genen van generatie op generatie traceren en de kans berekenen dat ze worden gedeeld of we kunnen een grafische techniek gebruiken die vergelijkbaar is met die hierboven. We kunnen echter niet langer aannemen dat alle stappen de verwantschap met een factor 2 verminderen (vermenigvuldigen met ½). In plaats daarvan moeten we bij elke stap onze stamboom labelen met de bekende verwantschap. Terwijl je je pad door de boom baant, schrijf je bij elke stap de verwantschap op. Vermenigvuldig aan het einde alle r-waarden om de verwantschapscoëfficiënt te verkrijgen. De vier onderstaande bomen illustreren dit voor niet-verwante, ingeteelde, gemengde en haplodiploïde gevallen.

Niet gerelateerd. Deze boom voegt gewoon de verwantschap van ½ toe tussen ouders en nakomelingen en tussen broers en zussen als er geen inteelt is.

Inteelt. A was verwant aan zijn partner door ½ (broers en zussen) en B was verwant aan zijn partner door ⅛ (eerste neven). Er zijn geen andere ouders verwant.

Gemengd. In deze boom delen B en C slechts één ouder, A, wat hun verwantschap met ¼ vermindert. Evenzo delen D en E slechts één ouder, B.

Haplodiploïde. Deze boom toont een wespenfamilie met meerdere koninginnen. Alleen G is mannelijk, alle anderen zijn vrouwelijk. (Niet-reproductieve vrouwtjes worden niet getoond.)

Wat is bijvoorbeeld de verwantschap tussen D en G in de Inteeltboom? Via het pad D-B-C-G kruisen we verwantschappen van 9 &frasl16, ¾ en ½, met een verwantschap van 27 &frasl128 (ongeveer 0,211). Ter vergelijking: D en G zijn gerelateerd door ⅛ (0.125) in de niet-verwante boom. Hoe zijn D en K gerelateerd aan de gemengde boom? Het pad D-E-K heeft ¼ en ½, voor een verwantschap van ⅛. Probeer voor meer oefening de onderstaande problemen, die verwijzen naar de stambomen hierboven, tenzij anders aangegeven. (Voor andere families moet je aangepaste bomen tekenen met behulp van de ouder-nakomelingen en broers en zussen die eerder in deze tutorial zijn gegeven.)


De grenzen van theoretische populatiegenetica

HET doel hier is om de grenzen van de theoretische populatiegenetica te bespreken. Dit 100 jaar oude veld ligt nu dicht bij het hart van de moderne biologie. Theoretische populatiegenetica is het raamwerk voor studies van de menselijke geschiedenis (Reich et al. 2002) en de stichting voor associatiestudies, die tot doel hebben de genen die ziekten bij de mens veroorzaken in kaart te brengen (J orde 1995). Misschien wel belangrijker, theoretische populatiegenetica ligt ten grondslag aan onze kennis van variatie binnen soorten over de hele wereld en voor alle soorten leven. In het licht van zijn vele incarnaties en passend bij zijn banden met evolutionaire biologie, wordt erkend dat de grenzen van de theoretische populatiegenetica in de loop van de tijd veranderen, met een aantal nieuwe paden die moeten worden gevolgd. Om deze toekomst te betreden, zal het belangrijk zijn om nieuwe benaderingen te ontwikkelen die nieuwe gegevens weerspiegelen en om goed aanvaarde modellen de mogelijkheden niet te laten verminderen.

Het is waardevol om dit veld eng te definiëren. Theoretische populatiegenetica is de wiskundige studie van de dynamiek van genetische variatie binnen soorten. Het belangrijkste doel is om de manieren te begrijpen waarop de krachten van mutatie, natuurlijke selectie, willekeurige genetische drift en populatiestructuur op elkaar inwerken om de complexe patronen van genetische variatie te produceren en te behouden die gemakkelijk worden waargenomen bij individuen binnen een soort. Er is enorm veel bekend over de werking van organismen in hun omgeving en over interacties tussen soorten. Idealiter, met constante verwijzing naar deze feiten - waarvan het grootste deel ongetwijfeld nog moet worden ontdekt - begint de theoretische populatiegenetica met het distilleren van alles tot een werkbaar wiskundig model van genetische overdracht binnen een soort.

Het nemen van deze enge visie sluit de toepassing van theoretische populatiegenetica op studies van evolutionaire verschijnselen op de lange termijn uit. Dit is in plaats daarvan de reikwijdte van de evolutietheorie. Voor theoretische populatiegenetica zijn processen over langere tijdschalen alleen van belang voor zover ze direct van invloed zijn op waarneembare variatiepatronen binnen soorten. De focus op de huidige genetische variatie kwam naar voren in de jaren zeventig en tachtig met de ontwikkeling van de coalescentietheorie (Kingman 1982, 2000), of de wiskunde van genealogieën. E wens (1990) bespreekt deze overgang van de voorwaartse-tijdbenadering van klassieke populatiegenetica naar de nieuwe, achterwaartse-tijdbenadering. Zowel in het klassieke werk (Fisher 1922 W rechts 1931) als in de coalescentietheorie (Kingman 1982 H udson 1983 T ajima 1983), die beide hieronder worden beschouwd, kan worden gezien dat het tijdsbestek waarover de modellen van de theoretische populatie genetica van toepassing is binnen een bepaalde soort is een klein veelvoud van Ntotaal generaties, waar? Ntotaal is de totale populatiegrootte, of de telling van alle individuen van de soort. Als we bijvoorbeeld naar genealogieën bij mensen kijken, lijkt het erop dat dit ongeveer 104 tot 106 jaar betekent (H arris en Hey 1999).

Dit stelt ons in staat te veronderstellen dat de parameters die van invloed zijn op de soorten die we willen modelleren, relatief constant zijn gebleven in de tijd, vergeleken met de situatie in de evolutietheorie. Beschouw voor discussiedoeleinden het volgende eenvoudige model dat, met verfraaiingen, zou kunnen dienen om elke soort te beschrijven van: Homo sapiens tot Bacillus subtilis. De soort is onderverdeeld in: NS subeenheden, elk van grootte N, zodat de totale populatiegrootte is Ntotaal = ND. Overeenkomstig de hierboven genoemde verschijnselen, zijn de andere parameters van het model de per locus, per generatie kans op mutatie jij, het selectieve voordeel of nadeel, s, van een bepaald type ten opzichte van een ander type in de populatie, en een parameter, m, die de omvang van de bevolkingsstructuur bepaalt.

De subeenheden in het model worden hieronder gebruikt om NS diploïde individuen, zodat N = 2 is het aantal kopieën van elk chromosoom binnen elk individu. Merk op dat dit afwijkt van de gebruikelijke notatie, waarin: N is het aantal diploïde individuen. De reden voor dit vertrek is om de overeenkomsten tussen het diploïde model en andere modellen van populatiestructuur te benadrukken. Dus hetzelfde model wordt gebruikt om een ​​populatie weer te geven die is onderverdeeld in: NS lokale bevolking, of demes (G ilmour en G regor 1939), elk met: N individuele organismen.

In dit model zijn omwille van de eenvoud veel details buiten beschouwing gelaten. Mutatie is bijvoorbeeld een complex proces, dat verschillende soorten recombinatie omvat, en het is evenmin waarschijnlijk dat natuurlijke selectie zo eenvoudig is dat een enkele parameter al zijn fijne kneepjes vastlegt. Bovendien omvat de algemene term "bevolkingsstructuur" tweeënheid, ploïdieniveau, leeftijdsstructuur, reproductiepatronen zoals gedeeltelijk zelfbestuiving, evenals de verschillende vormen van geografische structuur en verspreiding. Tot slot, zoals hierboven vermeld, wordt aangenomen dat alle parameters in de loop van de tijd niet veranderen. Met enige flexibiliteit in de interpretaties van parameters kan dit model echter worden gebruikt om de grenzen van theoretische populatiegenetica te illustreren.

De bereiken van de parameters zijn van nature beperkt. specifiek, NS en N zijn gehele getallen, waarvan het natuurlijk is om aan te nemen dat ze ≥1 zijn. De andere parameters kunnen continu variëren, maar hebben ook een natuurlijk bereik: 0 ≤ jij ≤ 1, s ≥ −1 en 0 ≤ m ≤ 1. De laatste twee vereisen enige context. Laten m de fractie zijn van elke subeenheid (waarvan er zijn NS) die wordt vervangen door nakomelingen die elke generatie willekeurig uit de hele populatie worden bemonsterd. Dit is het eilandmodel van bevolkingsverdeling en migratie, geïntroduceerd door Wright (1931), maar het kan ook worden gebruikt om andere vormen van structuur weer te geven. Onderverdeling is op zijn minst wanneer m = 1 en is op zijn hoogst wanneer m = 0. Selectie is denkbaar tussen twee typen, één met fitness 1 en de andere met fitness 1 + s, en s ≥ −1 sluit negatieve fitnesswaarden uit. Bij selectie uit meer dan twee typen wordt de geschiktheid van één ervan gelijk gesteld aan één en dit bepaalt de relatieve selectiecoëfficiënten (waarden van s) van de anderen.

De huidige en historische grenzen van de theoretische populatiegenetica kunnen worden begrepen aan de hand van het onderzoeksobject, namelijk genetische variatie binnen soorten, maar ook in termen van methodologie. Het belachelijk vereenvoudigde model dat zojuist is beschreven, heeft al vijf parameters. Zelfs met de bovenstaande beperkingen is er een enorme vijfdimensionale ruimte die alle mogelijke soorten soorten onder het model definieert: <(NS, N, jij, s, m) NS ≥ 1, N ≥ 1, 0 ≤ jij ≤ 1, s ≥ −1, 0 ≤ m 1>. Theoretische populatiegenetici verkrijgen voorspellende vergelijkingen door dergelijke gecompliceerde modellen te vereenvoudigen, opnieuw idealiter met veel aandacht voor de biologische relevantie van eventuele gemaakte aannames. Formeel gebeurt dit door wiskundige limieten te nemen. De hoop is dat door dit te doen, d.w.z.Door de reeksen van parameters verder te beperken, kunnen hanteerbare analytische resultaten of eenvoudige benaderingen van het model worden verkregen, wat zowel nuttig als verhelderend zal zijn.

Het eerste beperkende resultaat werd onafhankelijk vastgesteld door Hardy (1908) en W einberg (1908) voor het geval van twee allelen, EEN en een, met frequenties P en Q = 1 − P, respectievelijk, in een populatie van diploïde, eenhuizige organismen, zie C row (1988) voor een perspectief op dit belangrijke resultaat. In dit geval vertegenwoordigen de subeenheden in het model de organismen (N = 2), wordt verondersteld dat de populatie oneindig is (NS = ∞), zonder mutatie (jij = 0) of selectie (s = 0), en nakomelingen worden gevormd door willekeurige paring of willekeurige vereniging van gameten (m = 1). Vervolgens stelt de wet van Hardy-Weinberg dat de frequenties van de genotypen AA, Aa, en aa zal gelijk zijn aan p 2 , 2pq, en Q 2 na een enkele generatie, ongeacht de initiële genotypefrequenties, en dat ze voor altijd in deze frequenties zullen blijven. Provine (1971) bespreekt de belangrijke historische rol van de wet van Hardy-Weinberg in de evolutionaire biologie, die moest aantonen dat het mechanisme van overerving zelf niet zou veroorzaken dat de variatie waarop selectie inwerkt in een populatie wordt uitgeput.

De eenvoud van de wet van Hardy-Weinberg is een gevolg van de zeer strikte veronderstellingen. Het bestaat alleen in het speciale geval waarin de waarden van alle parameters vast zijn en gegeven door (NS = ∞, N = 2, jij = 0, s = 0, m = 1). Visser (bijv., 1930) en H aldane (bijv., 1932), en een groot aantal arbeiders die hun voorbeeld volgden, waren tevreden met de aanname van een oneindige bevolkingsomvang. Ze probeerden de dynamiek van allelfrequenties vast te stellen in een uitgebreide Hardy-Weinberg-populatie die mutatie en selectie omvatte. Als gevolg hiervan vindt veel van de klassieke populatiegenetica plaats in de beperkte parameterruimte waar <(NS, N, jij, s, m) NS = ∞, N = 2, 0 ≤ jij ≤ 1, s ≥ −1, m = 1>. De overgrote meerderheid van de resultaten is echter afgeleid onder de aanvullende veronderstelling dat: jij en s zijn klein.

Hoewel elke populatie eindig is, zodat NS = ∞ kan nooit waar zijn, deze klassieke voorspellingen zijn waardevol omdat ze tendensen aan het werk stellen in populaties van elke omvang (bijv., zal de frequentie van een favoriet allel in de loop van de tijd toenemen). Verder zouden deze klassieke voorspellingen bijna waar moeten zijn als de populatie "groot genoeg" is. Het is natuurlijk alleen door een eindige populatie te beschouwen dat deze twee uitspraken kunnen worden onderzocht en geverifieerd. Bovendien kunnen sommige vitale fenomenen eenvoudigweg niet worden bestudeerd met behulp van een oneindig populatiemodel. Vragen over de fixatie of het verlies van allelen uit de populatie of, meer in het algemeen, vragen over het gedrag van allelen in een laag aantal kopieën vallen buiten de grenzen van de klassieke theorie van oneindige populatiegrootte.

Geen enkele populatie is zo groot dat de eindige grootte kan worden genegeerd als een factor die bijdraagt ​​aan patronen van genetische variatie binnen een soort. In een oneindige populatie met mutatie maar zonder selectie, zal bijvoorbeeld elk mogelijk alleltype aanwezig zijn met de frequentie die wordt bepaald door het patroon en de snelheid van mutatie. Maar zelfs een stuk van 100 nucleotiden heeft 4 100 ≈ 10 60 mogelijke allelen, en geen enkele populatie komt zelfs maar in de buurt van deze grote. Verder beschouwd zijn de gevolgen van reproductie in eindige populaties nogal verbazingwekkend. Allereerst zonder mutatie (en in de veronderstelling dat er op zijn minst enige vermenging is: m > 0), zal alle variatie uiteindelijk uit elke populatie verloren gaan. Meer subtiel, reproductie met enige redelijke getrouwheid, die wordt verzekerd door universeel kleine mutatiesnelheden (D rake et al. 1998), veroorzaakt dat identieke of verwante allelen zich ophopen in de populatie, ook al zijn ze uiteindelijk allemaal kortstondig (W atterson 1976).

Willekeurige genetische drift is de term die wordt gebruikt om de stochastische effecten van reproductie in een eindige populatie te beschrijven. Historisch gezien werd de noodzaak om willekeurige genetische drift op te nemen in genetische populatiemodellen gemotiveerd door observaties van JT Gulick en anderen met betrekking tot geografische variatie binnen soorten zonder duidelijke selectieve oorzaken - zie Provine (1986) voor een grondige compilatie van de geschiedenis - en door de scherpe argument van H agedoorn en H agedoorn (1921), die de noodzaak aantoonden om de willekeurige effecten van reproductie in eindige populaties te begrijpen. Het resultaat was het Wright-Fisher-model van willekeurige genetische drift.

Om concreet te zijn, overweeg het populatiemodel zoals het hierboven werd gebruikt om de wet van Hardy-Weinberg te illustreren in een oneindige populatie van diploïde organismen, maar elimineer de aanname van oneindige populatiegrootte. Dit laat <(NS, N, jij, s, m) NS ≥ 1, N = 2, 0 ≤ jij ≤ 1, s ≥ 1, m = 1> voor de parameterruimte. De totale bevolkingsomvang is Ntotaal = ND = 2NS en is eindig. Het Wright-Fisher-model van willekeurige genetische drift stelt dat de NS diploïde individuen die generatie vormen t + 1 worden verkregen door het willekeurig bemonsteren van paren gameten, met vervanging, van de volwassenen van de generatie t. Generaties overlappen elkaar niet, dus alle volwassenen sterven en worden vervangen door nakomelingen. Als er momenteel l kopieën van allel EEN onder gameten, dan de frequentie van het allel EEN nu is P = l/(2NS), en de waarschijnlijkheid Pij dat er zijn J = 0, 1, … , 2NS kopieën van allel EEN aan het begin van de volgende generatie wordt gegeven door de bekende binomiale verdeling met parameters 2NS en P = l/(2NS).

Fisher gebruikte het bovenstaande model van genetische drift impliciet, waarbij hij in veel gevallen uitging van een Poisson-verdeling van het aantal nakomelingen met het gemiddelde gelijk aan één per individu, wat de grootste is.NS benadering van de bovenstaande binominale verdeling met l = 1. Wright gebruikte het model expliciet als een nulmodel voor de dynamiek van een willekeurig parende populatie van eindige grootte. Fisher en Wright toonden onder andere aan dat de snelheid van verlies van heterozygotie in een populatie gelijk is aan 1/Ntotaal = 1/(2NS). Dit illustreert de stelling hierboven dat de tijdschaal waarop theoretische populatiegenetica dingen beschouwt een klein veelvoud is van Ntotaal generaties.

Het Wright-Fisher-model van willekeurige genetische drift is een discrete tijd, discrete allelfrequentiemodel. Tijd wordt gemeten in aantallen generaties en Pij beschrijft veranderingen in het aantal allelen. Dit model is verrassend moeilijk te analyseren en er zijn weinig exacte resultaten beschikbaar. Al vroeg beschouwden Fisher (1922) en Wright (1931) een continue tijd-, continue allelfrequentiebenadering van het model, waardoor veel resultaten van biologisch belang konden worden afgeleid. Hun resultaten waren gebaseerd op een diffusiebenadering van het discrete model (K omolgorov 1931). M al é cot (1944) (1946) gebruikte dezelfde ideeën en rigoureuze methoden om de toepassing van diffusieresultaten in populatiegenetica aanzienlijk uit te breiden. Feller (1951) verschafte het algemene wiskundige raamwerk voor deze modellen, en K imura (1955a)(b) verkreeg de volledige oplossing van de tijdsafhankelijke verdeling van allelfrequenties in een populatie.

De overgang van het discrete model naar het continue model vindt plaats in de limiet, aangezien de populatieomvang naar oneindig neigt, maar het is gebaseerd op heel andere veronderstellingen over de andere parameters dan in klassiek deterministisch werk. Dit model, dat vaak wordt genoemd de diffusielimiet van populatiegenetica, bestaat in de limiet als NS neigt naar oneindig en gaat ervan uit dat limNS→∞ 4doe = θ en limNS→∞ 4Ds = σ zijn eindig. De tijd wordt opnieuw geschaald zodat deze wordt gemeten in eenheden van Ntotaal = ND = 2NS generaties. Het continue model houdt de limiet in stand omdat enkele generaties en enkele kopieën van allelen respectievelijk oneindig kleine hoeveelheden tijd op de nieuwe tijdschaal en oneindig kleine verschillen in allelfrequentie vertegenwoordigen. Dit is de juiste diffusiebenadering wanneer 1/NS, jij, en s zijn allemaal klein en verschillen niet al te veel in grootte. Ten slotte wordt de limiet genomen met de allelfrequentie l/(2NS) verondersteld vast te zijn (d.w.z., constant) in de limiet als NS neigt naar oneindig, wat betekent dat voor de meeste doeleinden - maar zie Bürger en E wens (1995) - dit model niet geschikt is wanneer het aantal kopieën van een allel in de populatie niet groot is.

Merk op dat de schijnbare afhankelijkheid van de parameters jij en s Aan NS in de aannames limNS→∞ 4doe = θ en limNS→∞ 4Ds = is geen uitspraak over biologie. Het model veronderstelt bijvoorbeeld niet dat als de populatie zou verdubbelen, de mutatiesnelheid en de selectiecoëfficiënt met de helft zouden afnemen. De standaard diffusielimiet is gewoon een wiskundige benadering van het gedrag van een grote populatie waarin de kans op mutatie en de selectiecoëfficiënt(en) klein zijn. Zoals de klassieke (NS = ∞) resultaten, het is van toepassing in een bepaald gebied van de parameterruimte, een waarin NS → ∞ maar waar de effecten van willekeurige genetische drift niet te verwaarlozen zijn. Een ander mogelijk punt van verwarring is de extra factor twee in de parameters θ en σ ten opzichte van de manier waarop de tijd wordt herschaald. Deze praktijk is geërfd van Wright en Fisher, en het weerspiegelt eenvoudig de grote zorg van biologen voor heterozygotie, of polymorfisme tussen een paar chromosomen.

Bijna alle moderne populatiegenetica is gebaseerd op dit standaard diffusiemodel, hoewel het vaak impliciet wordt gebruikt. Het is de bron van de gebruikelijke praktijk van het vereenvoudigen van uitdrukkingen die zijn verkregen uit een discreet model door alleen termen te houden die betrekking hebben op: jij, s, en 1/NS en het weggooien van "kleine" termen zoals jij 2 , s 2 , 1/NS 2 , u/D, etc. In dit geval is het duidelijk waarom 1/NS, jij, en s mogen niet te veel verschillen in grootte. Bijvoorbeeld, als NS = 10 4 en jij = 10 −8 , het heeft geen zin om termen met 1 . te negeren/NS 2 maar houd de voorwaarden met betrekking tot jij. Technisch gezien geldt de standaarddiffusie voor elke σ en θ, zolang deze eindig blijven als NS neigt naar oneindig. Het standaard diffusiemodel kan dus worden gebruikt om zwakke selectie en mutatie te modelleren door σ en klein te maken en om sterke selectie en mutatie te modelleren door σ en θ groot te maken. Het risico daarbij is dat de fout bij het gebruik van deze resultaten om de resultaten voor een eindige populatie te benaderen groot kan zijn, tenzij: NS is erg groot (E thier en N orman 1977).

Er zijn geschiktere benaderingen dan de standaarddiffusie, zelfs andere diffusiebenaderingen, als men populaties moet modelleren die in andere regio's van de parameterruimte vallen (Feller, 1951, K arlin en M c G regor, 1964). Een die algemeen bekend is en redelijk goed is gebruikt om vragen over fixatiewaarschijnlijkheden te beantwoorden sinds Fisher (1922) en Haldane (1927) is de benadering van het vertakkingsproces voor het aantal kopieën van een allel. De tellingen van een allel kunnen worden benaderd door een vertakkingsproces (zonder verwijzing naar de rest van de populatie) in de limiet als NS neigt naar oneindig voor vaste waarden van jij en s maar waar het aantal exemplaren van het allel niet groot is. Dit is een aanvulling op het klassieke deterministische model, dat dezelfde aannames maakt over: NS, jij, en s, maar is alleen van toepassing wanneer het aantal allelen erg groot is. Zie voor een recent voorbeeld W ahl en D e H aan (2004).

Een andere benadering, de Gauss-diffusie, zit tussen het standaard diffusiemodel en de klassieke deterministische resultaten. In een enigszins verwaarloosd artikel - maar zie N agylaki (1990) en Gillespie (2001) - bewees N orman (1975) dat met s → 0 en jij → 0, maar Ds → en doe → ∞, de banen van allelfrequenties zouden sterk neigen naar de deterministische voorspellingen, maar met kleine afwijkingen. Verder neigen deze stochastische afwijkingen in allelfrequenties naar nul als NS wordt veel groter dan 1/s en 1/u. Dus, als NS is veel groter dan 1/s en 1/u, en de laatste groot zijn, zijn de deterministische vergelijkingen bijna correct (zolang het aantal exemplaren van elk allel groot is). Dergelijke zorgen liggen ten grondslag aan het gebruik van een stochastische behandeling van allelfrequenties dicht bij nul of één en een deterministische behandeling in het interieur, bijvoorbeeld door Kaplan et al. (1989) en Gillespie (1991).

Terugkerend naar de alomtegenwoordigheid van de standaard diffusiebenadering, de toevoeging van een enkele veronderstelling, dat de steekproefomvang N constant is, zodat n.v.t → 0, als NS neigt naar oneindig (ruwweg: NNS), levert de coalescentietheorie op (Kingman 1982 H udson 1983 T ajima 1983 K rone en N euhauser 1997 N euhauser en K rone 1997). Coalescentietheorie beschrijft de genetische voorouders van een monster en biedt de tools voor de analyse van moleculaire gegevens binnen de soort. N ordborg (2001) geeft een recent grondig overzicht van dit veld. K ingman (2000) geeft een historisch perspectief, met lof voor Gustave Malécot voor het oorspronkelijke idee om afstammingslijnen te herleiden tot gemeenschappelijke voorouders, zie ook Nagylaki (1989). Toepassingen van de coalescentietheorie op de problemen van de moderne biologie zijn er in overvloed, van de geografische oorsprong van Plasmodium falciparum (Vreugde et al. 2003) en de dynamiek van hiv bij geïnfecteerde personen (D rummond et al. 2002) tot de mate van gene flow tussen recent gescheiden cichlidensoorten (H ey et al. 2004).

De standaard diffusiebenadering heeft het veld zo grondig doordrongen dat het de manier bepaalt waarop arbeiders denken over de genetica van populaties. Hier zitten positieve kanten aan. Bijvoorbeeld de parameters θ = 4doe en σ = 4Ds leg het belangrijke en fascinerende feit vast dat zelfs een zeer zwakke mutatie en selectie een sterk effect kan hebben als de populatieomvang groot is. Dit illustreert de potentieel belangrijke rol van de populatieomvang bij het bepalen van de tijdschaal van genetische verandering in de populatie. Echter, in termen van het algemene model met parameterruimte <(NS, N, jij, s, m) NS ≥ 1, N ≥ 1, 0 ≤ jij ≤ 1, s ≥ −1, 0 ≤ m ≤ 1>, kan het standaard diffusiemodel alleen worden gezien als een model van zwakke mutatie en zwakke selectie. Voor selectie kan de term 'sterk' het beste worden gereserveerd voor gevallen waarin: s is ofwel dicht bij -1 of veel groter dan nul (bijv., s = 10), terwijl het typische gebruik is om ruwweg te zeggen dat |σ| > 10 vormt een sterke selectie.

Het is problematisch wanneer conclusies die worden getrokken uit een speciaal geval van een algemeen model normatieve uitspraken worden die naar andere situaties worden overgedragen. Onder de aannames van het standaard diffusiemodel, waarin: NS → ∞ terwijl θ en σ vast blijven, hangt alles alleen af ​​van de producten doe en Ds. Dit beperkende resultaat is verantwoordelijk voor het idee dat het onmogelijk is om in te schatten NS en jij, bijvoorbeeld afzonderlijk en dat alleen θ kan worden geschat. Dit is echter eenvoudig een gevolg van de aannames van het model, waarvan kan worden verwacht dat ze kapot gaan in gevallen buiten het gebied van de parameterruimte waarin de standaarddiffusie geschikt is. Het valt bijvoorbeeld uiteen voor zeer grote monsters in een coalescentiemodel (n.v.tx als NS → ∞), beide toestaan NS en jij te schatten (W akeley en Takahashi 2003). Hoewel het waar kan zijn dat er weinig vermogen is om te schatten NS en jij apart kunnen vragen hierover zelfs niet gesteld worden in het kader van de standaard coalescentie.

Een parallelle reeks problemen doet zich voor bij de studie van gestructureerde populaties. Het eenvoudige model dat hier is aangenomen, omvat het eilandmodel van Wright (1931) van populatieverdeling en migratie, dat hij voorstelde om niet-adaptieve verschillen tussen verschillende subeenheden van een soort te helpen verklaren - denk aan de waarnemingen van Gulick - en dat onderdeel werd van zijn verschuivende balans evolutietheorie (Provine 1986). Wright introduceerde de diffusiebenadering om de evenwichtsverdeling van allelfrequenties op een enkel eiland te verkrijgen onder de aanname van een constante allelfrequentie onder migranten. Dus, naast θ = limN→∞ 4Nu en σ = limN→∞ 4NS, die Wright definieerde voor het enkele eiland N diploïde organismen in plaats van voor de totale populatie, heeft het eilandmodel een geschaalde migratieparameter, m = limN→∞ 4Nm. De parameter m legt het idee vast dat kleine hoeveelheden migratie over de tijdschaal van N generaties kunnen een zeer groot effect hebben, zie ook Nagylaki (1980). Net als bij θ en σ, is de relevantie van de parameter m in het limietmodel moet niet worden opgevat dat het onmogelijk is om afzonderlijk te schatten N en m in andere gevallen - zie Vitalis en Couvet (2001) - of dat de dynamiek van elke onderverdeelde populatie alleen afhangt van het product Nm.

Wright gaf twee mogelijke rechtvaardigingen voor de aanname van een constante allelfrequentie onder migranten: (1) dat migranten afkomstig zijn uit een oneindig grote, ongestructureerde populatie, zoals degene die de wet van Hardy-Weinberg hierboven gaf, of (2) dat migranten afkomstig zijn uit een oneindig grote verzameling eilanden, waarvan het brandpuntseiland een enkel voorbeeld is. Deze tweede mogelijkheid kan gemakkelijk worden weergegeven met behulp van het huidige model. It is obtained by assuming that NS = ∞, so that allele frequencies in the total population remain constant, as they do under the Hardy-Weinberg law described above. The assumptions of diploidy (N = 2) and random mating (m =1) need to be relaxed so the demes can be of any size (N ≥ 1) and receive migrants at any biologically reasonable rate (0 ≤ m ≤ 1).

Described in this way, it is helpful to think of Wright's infinite-island model as a classical population genetic model for idealized N-ploid organisms (the demes), with complications such as double reduction ignored. Reproduction is a little more complicated than in the classical diploid model—newborn individuals receive a fraction, m, of their gametes from the total parental population's pool of gametes and a fraction, 1 − m, from a single parent's gamate pool—but these models share many features. It is clear, for example, that the allele frequencies in the total population will remain constant only if there is no selection and no mutation otherwise they should change according to something like the classical deterministic theory. In addition, the infinite-island model suffers the same restrictions as the classical model: questions about stochastic trajectories of allele frequencies in the total population (bijv., the fixation or loss of alleles) cannot be addressed.

By assuming a fixed, finite number of demes, M aruyama (1970), L atter (1973), and others studied the finite-island model and obtained results for fixation probabilities and other properties of the population. Without making any assumptions about the parameters, the finite island model is represented by the general version of the present model, with parameter space <(NS, N, jij, s, m) NS ≥ 1, N ≥ 1, 0 ≤ jij ≤ 1, s ≥ −1, 0 ≤ m ≤ 1>. There are difficulties in analyzing the finite island model, as there are in the case of the Wright-Fisher model of an unstructured finite population. In fact, the difficulties are greater because subdivision, d.w.z., wanneer m < 1, increases the complexity of the system substantially. Because there are more parameters, there are more choices as to how the parameters might be related or restricted in approximations to the model.

The best known of these limits is the one that underlies the structured coalescent process (N otohara 1990 W ilkinson -H erbots 1998). This is the finite-island model with N → ∞ and with parameters scaled as W right (1931) did originally. This model frames most work on populations structured by migration. It is a model of a relatively small number of very large populations connected by limited migration, with weak mutation and, in nearly all cases, no selection. Another limit, which is to the island model what the standard diffusion is to the unstructured model, is the many-demes limit with weak mutation and selection, and any m > 0 and N ≥ 1 (W akeley 2003). Allele frequencies in the total population change according to the standard diffusion, but on a time scale that depends on N en m. At the same time, relatively strong migration and drift within demes keeps the collection of demes close to the kind of equilibrium described by W right (1931), which is the analog in this model of Hardy-Weinberg genotype frequencies in the diploid model. It hardly needs stating at this point that neither the finite-NS, N → ∞ diffusion nor this finite-N, NS → ∞ diffusion should be applied or accepted without attention to its restrictions.

Why all this attention to the arcane subject of diffusion theory, which may seem to have peaked with Kimura's work in the 1950s? Possibly the most exciting new direction in theoretical population genetics is the study of a coupled (backward and forward) process that promises to unite diffusion theory and coalescent theory, while fully incorporating natural selection into the latter. This relates population genetic models to bodies of more abstract mathematics, such as the theory of interacting particle systems (L iggett 1985). The approach was introduced into population genetics by D onnelly (1984), developed further by K rone and N euhauser (1997), and can also be seen in D arden et al. (1989). Recent articles include D onnelly and K urtz (1999) and B arton et al. (2004). The challenge is to develop from this work a set of tools for making inferences from genetic data that can be applied in the way that the standard coalescent is being applied now.

Due to recent developments in biotechnology, the theory and methodology of population genetics are lagging behind the collection of data. The abundance of data now available, and soon to be available, holds the promise that it will finally be possible to infer the current and historical characteristics of populations with a high degree of precision. There is already a huge store of results in the historical literature of theoretical population genetics, which can be mined for present-day aims. However, at least since the introduction of coalescent theory 20 years ago, theoretical population genetics has developed closely in response to newly available data, and now is the time to push the boundaries of the field.

A number of new limits are just over the horizon. For example, high-throughput genotyping techniques have increased sample sizes in two directions: the number of individuals and the number of base pairs per individual. Simplifications of complex models may arise in the limit as the number of individuals sampled tends to infinity or as the length of sequence per sample tends to infinity. If history is any guide, then looking back in a few years it will be apparent how new directions such as these will have shaped the way in which we think about patterns of genetic variation and the processes that conspire to maintain them.


What is Allele Frequency

The allele frequency is the frequency of the two forms of a particular allele in a population. They are dominant and recessive alleles . Each allele frequency can be calculated by dividing the number of individuals with the allele form by the total number of individuals in the population . Here, the p represents the dominant allele frequency of the population while the q allele represents the recessive allele frequency. Also, the sum of the allele frequencies in a population is equal to 1.

Figure 2: Inheritance of Dominant and Recessive Alleles


Outlook and concluding remarks

Loss-of-function alleles were once often held up as a paragon of deleterious genetic variation. Today a more nuanced appreciation for their potential role in adaptation has emerged. This new paradigm inspires investigations into deeper questions about the causes and consequences of adaptation by genetic loss of function. For example: Do species or populations differ in their capacity to adapt via loss of function, and if so, why? Does the high effective mutation rate of loss-of-function alleles lead to bias in the probabilities of different evolutionary outcomes? What is the contribution of adaptive loss of function to the phenomena of antagonistic pleiotropy and reproductive isolation? How does adaptation by loss of function affect long term evolutionary trajectories of populations and future evolvability? Ongoing technical breakthroughs promise to scale up the study of loss-of-function alleles experiencing positive selection for population genomic research to address these questions. More broadly, these lines of research provide paths toward advancing tools and concepts that facilitate a continued synthesis between functional molecular genomics and classic population genetic theory.


Mechanismen van evolutie

Natural selection, genetic drift, and gene flow can cause allele frequencies in a population to change over time.

fenotype: Observable characteristics that are determined by the genotype.

Individuals differ from one another in part because they have different alleles for genes.

Different alleles arise by mutatie : Change in DNA.

Mutations can result from copying errors during cell division, mechanical damage, exposure to chemicals (mutagens) or high-energy radiation.

Formation of new alleles is critical to evolution.

If mutation did not produce new alleles, all members of a population would have identiek genotypes and evolution could not occur.

recombinatie also produces different genotypes within a population.

Offspring have combinations of alleles that differ from those of their parents. echter recombinatie en mutatie are not responsible for the short term evolutionary changes that we observe

Three types of natural selection:

  • Directionele selectie: Individuals at one phenotypic extreme (e.g., large size) are favored.

Example: Drought favored large beak size in medium ground finches.

  • Stabiliserende selectie: Individuals with an intermediate phenotype are favored.

Example: Parasitic wasps select for small gall size of Eurosta flies while birds select for large gall size.

  • Disruptieve selectie: Individuals at both phenotypic extremes are favored.

Example: African seedcrackers (birds) have two food sources—hard seeds that large beaks are needed to crack, and smaller, softer seeds that smaller beaks are more suited to.

Natural selection can result in populations in which all individuals have the favored allele: 100% and the allele is gemaakt.

Genetische drift occurs when chance events determine which alleles are passed to the next generation. It is significant only for small populations.

Genetic drift has four effects on small populations:

1. It acts by chance alone, thus causing allele frequencies to fluctuate at random. Some may disappear, other may reach 100% frequency (fixation).

2. Because some alleles are lost, genetic variation of the population is reduced.

3. Frequency of harmful alleles can increase, if the alleles have only mildly deleterious effects.

4. Differences between separate populations of the same species can increase.

2. and 3. can have dire consequences.

***Loss of genetic variation reduces the ability of the population to respond to changing environmental conditions.

****Increase of harmful alleles can reduce survival and reproduction. These effects are important for species that are near extinction.

Genenstroom: Alleles move between populations via movement of individuals or gametes.


Running the Gamut

Multiple genes and, therefore, multiple alleles, affect continuous, or quantitative, traits. Because they are caused by more than one gene, they are also referred to as polygenic traits. Gene expression is complex, and continuous traits can also be influenced by environmental factors. Continuous traits are common in humans, who show a wide range of possibilities in characteristics such as height, skin color, learning ability and blood pressure. These traits are frequently seen in agriculture, as well. Combination of genetics and environment is readily apparent in crop yield, percentage of fat in animals, animal weight gain, and resistance to certain diseases.


Bekijk de video: Wat is het verschil tussen is en eens? (December 2021).