Informatie

Waarom is een erfelijkheidscoëfficiënt geen index van hoe "genetisch" iets is?


Op zijn blog schrijft Eric Turkheimer:

[T]aken als een getal, een analyse-eenheid, erfelijkheidscoëfficiënten zijn grappige dingen om op zo'n enorm niveau te aggregeren. Wat moeten we precies denken van het feit dat tweelingenstudies in het domein van de oogheelkunde de hoogste erfelijkheidswaarden opleverden? Moeten oogartsen, in tegenstelling tot dermatologen, zich haasten naar het genetica-lab omdat hun eigenschap erfelijker blijkt te zijn? Nee. Wat een erfelijkheidsgraad ook mag zijn, het is geen index van hoe 'genetisch' iets is. Het is bijvoorbeeld geen bruikbare indicator van hoe succesvol pogingen om genen te vinden waarschijnlijk zullen zijn. Als er niets anders is, worden verschillen in meetbetrouwbaarheid in de war gebracht met elke erfelijkheid die hier wordt geteld. Mijn punt is dit - hoewel het leuk is om te weten dat gemiddeld alles voor 50% erfelijk is, is het moeilijk om veel betekenis te hechten aan het getal zelf, of vooral aan afwijkingen van dat getal, aan het feit dat oogaandoeningen erfelijkheidsgraden hebben van rond de .7 en houdingen rond .3. Het hebben van twee armen heeft een erfelijkheidsgraad van 0.

Zoals ik dit begrijp, is een van de redenen waarom Turkheimer gelooft dat erfelijkheidscoëfficiënten geen index zijn van hoe genetisch een eigenschap is, is dat ze worden verward door verschillende niveaus van meetfouten. Dus misschien zijn de relatief lage erfelijkheidsgraden van huidaandoeningen in vergelijking met oogaandoeningen misschien omdat er meer meetfouten zijn met betrekking tot huidaandoeningen.

Turkheimer impliceert dat er andere redenen zijn waarom het niet gepast is om te zeggen dat een erfelijkheidscoëfficiënt een index is van "hoe genetisch" iets is. Wat zijn die andere redenen?


In plaats van te bespreken wat erfelijkheid niet is door middel van langdradige zinnen, laten we het gewoon hebben over wat erfelijkheid is is. Er zijn twee "soorten erfelijkheid":

  • Erfelijkheid in brede zin
  • Erfelijkheid in enge zin.

Ik zal een paar concepten bespreken en langzaam het concept van erfelijkheid in beide betekenissen introduceren.

fenotypische eigenschap

Het fenotype is het gevolg van het genotype op de wereld. Kortom, een fenotypische eigenschap is elke eigenschap waaruit een individu bestaat!

Kwantitatieve eigenschap

Een kwantitatieve eigenschap is elke eigenschap die je kunt meten en ordineren, dat is elke eigenschap die je kunt meten met getallen. Lengte is bijvoorbeeld een kwantitatieve eigenschap, zoals je kunt zeggen dat individuEENis groter dan individuBdie zelf groter is dan die persoonC.

Variantie van een kwantitatieve eigenschap

In een populatie kunnen verschillende individuen verschillende waarden hebben voor een bepaalde fenotypische eigenschap $x$. Omdat we het hebben over kwantitatieve eigenschappen kunnen we de variantie van de eigenschap in de populatie berekenen. Laten we dit variantie noemen $V_P$ zoals

$$V_P=frac{1}{N}sum_i (x_i - ar x)^2$$

In de bovenstaande vergelijking, $x_i$ is de waarde van de fenotypische eigenschap $x$ van individuele $i$. $N$ is de populatiegrootte (er zijn $N$ individuen in de populatie) en $ar x$ is de gemiddelde fenotypische eigenschap $x$ bij de bevolking.

$$ar x = frac{1}{N}sum_i x_i$$

Wat veroorzaakt fenotypische variantie?

Waarom zou een populatie een fenotypische variantie vertonen? Waarom zouden we er niet precies hetzelfde uitzien? Wat verklaart deze verschillen?

Voor sommige eigenschappen zien we heel weinig variantie. Om het voorbeeld te beschouwen dat het OP in de post gaf, vertoont het aantal armen in de menselijke populatie zeer weinig variatie. Er is echter nogal wat variatie in termen van het aantal IQ, in termen van lengte of gewicht.

Er zijn twee (hoofd)bronnen van variantie die ten grondslag liggen aan deze fenotypische variantie. De eerste is de genetische variantie en de tweede is de omgevingsvariantie. We noemen de genetische variantie $V_G$ en de omgevingsvariantie $V_E$.

Als mensen in een populatie sterk variëren in het aantal hamburgers dat ze eten, dan is er een niet te verwaarlozen $V_E$ ten grondslag liggen aan de fenotypische variantie $V_P$ voor gewicht. Als er in een populatie veel variatie is in genen die van invloed zijn op het gewicht, dan is er een niet te verwaarlozen $V_G$ ten grondslag liggen aan de fenotypische variantie $V_P$ voor gewicht.

Trouwens, een gen (of een andere niet-coderende sequentie) dat polymorf is (d.w.z. met meer dan 1 allel in de populatie) en dat een deel van de variantie in de fenotypische kwantitatieve eigenschap verklaart, wordt een Quantitative Trait Locus (QTL) genoemd. Een locus is een sequentie (van elke lengte) op het genoom.

Wiskundige herinnering

Varianten van niet-gecorreleerde variabelen kunnen eenvoudig worden toegevoegd! Voor de eenvoud gaan we er voorlopig van uit dat we niet-gecorreleerde variabelen in overweging nemen. Als gevolg hiervan kunnen we de fenotypische variantie uitdrukken $V_P$ als een som van de fenotypische variantie die te wijten is aan omgevingsvariantie $V_E$ en de fenotypische variantie die te wijten is aan genetische variantie $V_G$

$$V_P=V_E+V_G$$

Deze vergelijking is enigszins vereenvoudigd en dit heeft invloed op de onderstaande berekeningen. Zie de sectie Andere bronnen van fenotypische variantie voor meer informatie.

We kunnen nu praten over erfelijkheid!

Erfelijkheid in brede zin

Erfelijkheid in brede zin $h_B$ wordt gedefinieerd als de fractie van fenotypische variantie $V_P$ dat wordt verklaard door genetische variantie $V_G$. In de vergelijking geeft het:

$$h_B=frac{V_G}{V_P} = frac{V_G}{V_E+V_G}$$

Erfelijkheid in enge zin

Erfelijkheid in enge zin $h_N$ maakt nog een truc. We moeten bedenken dat de genetische variantie $V_G$ die aan de fenotypische variantie ten grondslag ligt, kan zelf worden ontleed in een som van varianties. De afwijkingen die we graag beschouwen als de additieve genetische variantie $V_{G,A}$ en de dominantie genetische variantie $V_{G,D}$.

De additieve genetische variantie is de genetische variantie die het gevolg is van additieve interactie tussen allelen. De dominantie van genetische variantie is te wijten aan niet-additieve interacties tussen allelen.

We kunnen de erfelijkheidsgraad nu in enge zin definiëren $h_N$ aangezien de wordt gedefinieerd als de fractie van fenotypische variantie $V_P$ dat wordt verklaard door de additieve genetische variantie $V_{G,A}$. In de vergelijking geeft het:

$$h_N=frac{V_{G,A}}{V_P} = frac{V_{G,A}}{V_E+V_G} = frac{V_{G,A}}{V_E+V_{G ,A}+V_{G,D}}$$

In het speciale geval, wanneer alle genetische variantie $V_G$ wordt uitsluitend gedaan door middel van additieve interacties, dan $V_{G,D} = 0$ en $V_{G,A}=V_G$ en daarom $h_N=h_B$

Interpretatie van de erfelijkheid

Als alle fenotypische variantie te wijten is aan genetische oorzaken (en ongeacht of er veel of weinig variantie is), dan $h_B=1$. Als alle fenotypische variantie te wijten is aan omgevingsvariantie, dan $h_B=0$.

Dus wat doet een $h_B=0.3$ middelen?

Het betekent dat 30% van de fenotypische variantie wordt verklaard door genetische variantie en dat 70% van de fenotypische variantie te wijten is aan omgevingsvariantie.

Dus, wat als er geen fenotypische variantie in de populatie is? indien $V_P=0$, dan is de erfelijkheidsgraad ongedefinieerd (zoals delen door nul ongedefinieerd is). Over het algemeen hebben we echter de neiging om te denken dat er altijd een klein beetje variatie in de omgeving is en de meeste mensen zouden gewoon doorgaan met te zeggen dat erfelijkheid 0 is wanneer $V_P=0$.

Wat is van invloed op de erfelijkheidsgraad?

Een maatstaf voor erfelijkheid is waar voor één populatie, in één omgeving.

Als je de populatie verandert, bijvoorbeeld een paar mutaties toevoegt, zou je een polymorfe locus kunnen creëren die een of andere fenotypische variantie veroorzaakt. Als je dezelfde populatie in een andere omgeving plaatst, zou je plotseling meer of minder fenotypische variatie kunnen hebben als gevolg van omgevingsvariantie. Als u de erfelijkheidsgraad meet in het laboratorium in een gecontroleerde en constante omgeving, dan overschat u de erfelijkheidsgraad waarschijnlijk (zoals u onderschat $V_e$) in vergelijking met dezelfde populatie die in een zeer heterogene omgeving leeft.

Wat erfelijkheid niet is!

Als een eigenschap een lage erfelijkheidsgraad heeft, betekent dit NIET dat het een aanpassing is (of niet). Het betekent alleen dat er geen genetische variantie is die de fenotypische variantie verklaart.

Waarom vinden we erfelijkheid belangrijk?

Als er geen genetische variantie is voor een eigenschap, betekent dit dat de enige manier waarop deze eigenschap in de loop van de tijd kan veranderen, is door de omgeving te veranderen (of door een genetische variantie te creëren die niet nul is door mutaties). Als er een genetische variantie is die niet nul is en als er een verschil in fitheid is tussen individuen met een verschillende eigenschapswaarde, dan valt de eigenschap onder natuurlijke selectie.

De meest gebruikte index van erfelijkheid in de erfelijkheidsgraad in enge zin $h_N. $Waarom geven we om $h_N$?

Laten $ar x_t$ de gemiddelde fenotypische waarde van de eigenschap zijn $x$ op tijd $t$. Een generatie later, dat is op tijd $t+1$, de gemiddelde fenotypische waarde is $ar x_{t+1}$. Laten we de reactie van selectie definiëren $R$ als het verwachte verschil tussen deze twee grootheden, dat $R=E[ar x_{t+1} - ar x_t]$. Laten we de kracht van selectie definiëren $S$ en de erfelijkheidsgraad in enge zin $h_N$, dan

$$R=h_N cdot S$$

Als gevolg daarvan weten $h_N$ stelt ons in staat om het effect van selectie op een bepaalde eigenschap te voorspellen.

Deze vergelijking wordt de fokkersvergelijking genoemd (zie dit bericht over de interpretatie ervan).

Andere bronnen van fenotypische variantie

Gezegde $V_P=V_G+V_E$ is een beetje te simplistisch. In werkelijkheid zijn er andere bronnen van fenotypische variatie, zoals variantie als gevolg van epigenetische veranderingen $V_I$ en variantie als gevolg van ontwikkelingsruis $V_{DN}$ bijvoorbeeld. Het is soms ook erg belangrijk om de covariantie tussen elk paar van dergelijke variantie te overwegen. Dus de vergelijking zou correcter zijn als deze wordt vermeld als:

$$V_P = V_G + V_E + V_I + V_{DN} + COV(V_G, V_E) + COV(V_G, V_I) + COV(V_G, V_{DN}) + COV(V_E, V_I) + COV(V_E, V_{DN}) + COV(V_I, V_{DN})$$

Merk op dat iedereen vrij is om elk van de bovenstaande varianties verder te ontleden in een som van varianties, zoals we hierboven hebben gedaan voor de genetische variantie. Bijvoorbeeld de omgevingsvariant $V_E$ kan worden ontleed in de som van de fenotypische variantie als gevolg van variantie in temperatuur $V_T$ en de fenotypische variantie als gevolg van variantie in neerslag $V_{ ext{neerslag}}$ ervan uitgaande dat de andere soorten omgevingsvariaties verwaarloosbaar zijn.


In het kort, omdat remi.b hier veel goed detail over geeft in zijn antwoord, is (enge zin) erfelijkheid in wezen een maatstaf voor hoeveel van de fenotypische variantie wordt verklaard door (additieve) genetische variantie. Fenotype (P) in een individu is het resultaat van genetische (G) en omgevingseffecten (E).

$P = G + E$

Dus de variantie binnen de populatie in fenotype is:

$V_P = V_G + V_E$

Genetische variantie valt verder uiteen in additief (A), dominantie (D) en interactie/epistatische variantie (I).

$V_G = V_A + V_D + V_I$

Eng-zintuiglijke erfelijkheid ($h^2$) is dan

$h^2 = frac{V_A}{V_P}$

Additieve genetische variantie en, als resultaat, de enge zin erfelijkheid kan om twee redenen nul zijn.

Ten eerste, als geen genen een effect hebben op uw eigenschap, dan is de additieve genetische variantie nul.

Ten tweede, als de allelen op de loci die de eigenschap beïnvloeden gefixeerd zijn binnen de populatie, zal de additieve genetische variantie nul zijn.

Daarom heeft Eric Turkheimer gelijk als hij zegt dat erfelijkheid geen maatstaf is voor hoe genetisch iets is. Echter, een erfelijkheidsgraad van nul betekent niet dat iets niet genetisch wordt gecontroleerd, alleen dat er geen variatie is in de effecten van genen.

Om het voorbeeld van het hebben van twee armen te volgen, is het duidelijk dat het hebben van armen genetisch wordt gecontroleerd, het is een erfelijke eigenschap, maar het aantal armen heeft weinig/geen genetische variatie. Zeer weinig mensen hebben >2 of <2 armen, dus elk allel daarvoor lijkt uitzonderlijk zeldzaam te zijn (de allelen die bepalen dat er twee armen worden geproduceerd zijn min of meer vast, $p circa 1$, waarbij p de frequentie is van de allelcodering voor twee armen).

De volgende grafiek toont het effect van allelfrequentie op additieve genetische variantie, additieve genetische variantie is nul wanneer de locus een vast allel heeft en gemaximaliseerd wanneer de frequentie van beide allelen (een model met twee allelen) 0,5 is. In praktische termen, wanneer p = 0,5, is de helft van de populatie heterozygoot, een kwart homozygoot voor allel 1 en een kwart homozygoot voor allel 2.

In deze studie toonden we bijvoorbeeld aan dat genetische variantie op het Y-chromosoom slechts ~0,4% van de variatie in levensduur verklaarde, wat zou kunnen zijn omdat zeer weinig van de genen die de levensduur beïnvloeden zich op de Y bevinden (waarschijnlijk omdat de Y zeer weinig genen, terwijl de levensduur zeer polygeen is) en/of de genen op de Y die de levensduur beïnvloeden, hebben een laag polymorfisme (waarschijnlijk omdat de Y onderhevig is aan verschillende processen die de moleculaire variatie binnen de populatie sterk verminderen, in vergelijking met andere chromosomen).

Erfelijkheid en additieve genetische variantie zijn belangrijk om te begrijpen omdat ze de snelheid bepalen waarmee aanpassing (evolutie als reactie op selectie) kan plaatsvinden. Volgens de fundamentele stelling van Fisher, en zoals getoond in de fokkersvergelijking ($r = h^2s$ waarbij r het antwoord is en s selectie), wanneer $V_A = 0$ de $r = 0$.


Erfelijkheid is geen maatstaf voor hoe genetisch een eigenschap is. Het is een maat voor hoeveel van de variatie in de eigenschap is te wijten aan variatie bij genetica.

Ik zal proberen dit duidelijk te maken met een verhaal, als aanvulling op de antwoorden die meer afhankelijk zijn van wiskunde.

Ter referentie: technisch gezien is het de fractie van fenotypische variantie wat te wijten is aan variatie in genetische effecten: $H^2=frac{V_G}{V_P}$ (als je het hebt over erfelijkheid in brede zin); of, het is de fractie van fenotypische variantie die te wijten is aan variantie in fokwaarden: $h^2 = frac{V_A}{V_P}$ (als je het hebt over erfelijkheid in enge zin). $V_A$ wordt ook vaak genoemd additieve genetische variantie.


Stel dat we twee eilanden naast elkaar hebben. Op beide eilanden zijn sommige mensen langer dan andere.

Toevallig weten we (God vertelde ons) dat er een bepaald gen is dat een verschil kan maken voor je lengte: als al het andere gelijk is, EENs zijn een voet groter dan eens. Het komt ook voor dat we weten (God vertelde ons) dat koffie je groei belemmert; Als al het andere gelijk is, zijn mensen die thee drinken een voet groter dan mensen die koffie drinken.

(We weten toevallig ook dat er op dit moment geen andere factoren zijn die bijdragen aan variatie in hoogte. Handig!)

Nu naar onze eilanden.

Op het blauwe eiland, zien we dat sommige mensen langer zijn dan anderen. We doen wat testen, en we ontdekken dat op dit eiland sommige mensen zijn EEN en anderen zijn een. Daarentegen vinden we ook dat iedereen op dit eiland drinkt thee en niemand drinkt koffie.

Er is variatie in hoogte: alle daarvan is te wijten aan variatie in genen, en geen hiervan is te wijten aan variatie in de drankkeuze. Erfelijkheid = 1.

Maar dat betekent niet dat de omgeving in dit geval niet relevant is voor de hoogte. Integendeel, we weten toevallig (God vertelde ons) dat als ze allemaal koffie zouden drinken, ze allemaal een voet korter zouden zijn.

Op het rode eiland, zien we dat sommige mensen langer zijn dan anderen. We doen wat testen en ontdekken dat alle van hen zijn een's; geen van hen zijn EENs. Daarentegen drinken sommigen koffie en sommigen thee.

Er is variatie in hoogte: geen daarvan is te wijten aan variatie in genen, en alle hiervan is te wijten aan variatie in de drankkeuze. Erfelijkheid = 0.

Maar dat betekent niet dat genetica in dit geval niet relevant is voor lengte. Integendeel, we weten (God vertelde ons) dat als ze allemaal... EENs in plaats daarvan, dan zouden ze allemaal een voet groter zijn.


De meest overtuigende manier om jezelf eraan te herinneren waarom erfelijkheid niet gaat over "hoe genetisch een eigenschap is", vind ik, is te onthouden dat als iedereen het gen heeft, dan varieert het gen niet en draagt ​​het niet bij aan variatie; maar dat betekent niet dat het gen niet relevant is!

Voor zover ik weet is er bijvoorbeeld geen genetische variatie voor "een hart hebben". Iedereen wordt geboren met een hart. Mensen zonder hart missen harten vanwege omgevingsfactoren zoals deze:

Dus het hebben van een hart heeft een lage erfelijkheidsgraad, maar dat betekent niet dat genen niet betrokken zijn bij het bouwen van harten!

Evenzo betekent een hoge erfelijkheidsgraad niet dat omgevingseffecten niet belangrijk zijn voor het kenmerk; het betekent gewoon dat verschillen in het milieu dragen momenteel niet bij aan verschillen in de eigenschap.

Het betekent ook niet dat toekomst omgevingsfactoren misschien niet belangrijk worden. Zo was de erfelijkheidsgraad van het gezichtsvermogen vermoedelijk wat hoog. Maar dat weerhield degene die het deed er niet van een bril uitvinden!

Dus dat is weer een les. Erfelijkheid is geen constante. Natuurlijke selectie heeft de neiging om erfelijkheidsgraden naar beneden te duwen (omdat het de slechtere genen verwijdert); en als de omgeving verandert, kan de erfelijkheidsgraad omhoog of omlaag gaan.


Er zijn zeer goede recensies van het algemene concept gepost, maar ik zou me willen concentreren op de zachte vraag op welke manieren erfelijkheid niet weerspiegelt "hoe genetisch" iets is. Dat is natuurlijk niet echt een technisch gedefinieerde verklaring en in sommige opzichten is het doet, maar laten we het bij de vraag houden:

  • Milieubijdragen variëren. Overweeg longfibrose. Een bepaald laag percentage familiale longfibrose zal altijd aanwezig zijn vanwege genetica. Maar in een stad gebouwd rond een kolenmijn, verwacht je een veel hoger niveau van idiopathische longfibrose. Je zou de semantiek kunnen betwisten, maar waarschijnlijk zijn eigenschappen die verband houden met deze aandoening niet "meer genetisch" in de steden zonder kolenmijnen.
  • Genetische bijdragen zijn afhankelijk van de omgeving. De correlatie van cognitieve stoornissen met allelen van fenylketonurie is onder sommige omstandigheden vrij hoog, maar met de juiste voeding en supplementen hebben deze genen veel minder invloed - "verminderde penetrantie", zou je kunnen zeggen. Is PKU "minder genetisch" afhankelijk van voeding? Misschien zal eye-tracking-software volgend jaar leiden tot een nieuw soort gamen, en als "oogleden" tegenslagen lijden, zal de erfelijkheid van sommige oogheelkundige eigenschappen kelderen, maar betekent dat dat de genen zwakker zijn?
  • Niet alle genetische bijdragen zijn bekend. Vóór de hiv-pandemie zou niet zijn erkend dat delta32 CCR5 een effect heeft op immunosuppressie (althans niet op die manier). Dus we begrijpen misschien niet echt de genetische component die mogelijk bestaat zelfs na grondige studie van de eigenschap onder de huidige omstandigheden.

"Als alle fenotypische variantie te wijten is aan genetische oorzaken (en ongeacht of er veel of weinig variantie is), dan is hB = 1hB = 1. Als alle fenotypische variantie te wijten is aan omgevingsvariantie, dan is hB = 0hB =0.

Dus wat betekent een hB=0.3hB=0.3?

Het betekent dat 30% van de fenotypische variantie wordt verklaard door genetische variantie en dat 70% van de fenotypische variantie te wijten is aan omgevingsvariantie.

Dus, wat als er geen fenotypische variantie in de populatie is? als VP=0VP=0, dan is de erfelijkheidsgraad ongedefinieerd (aangezien delen door nul ongedefinieerd is). Over het algemeen hebben we echter de neiging om te denken dat er altijd een klein beetje variatie in de omgeving is en de meeste mensen zouden gewoon doorgaan met te zeggen dat erfelijkheidsgraad 0 is wanneer VP=0VP=0.”

Dus de omgevingsfactoren die worden vermeld in combinatie met de genetische factoren, is een poging om erfelijke factoren te verklaren die niet het gevolg zijn van wijzigingen in de DNA-sequentie of epigenetische factoren. Ik denk dat dit de reden is waarom erfelijkheidscoëfficiënten die worden gebruikt in de zin dat ze alleen de enige bruikbare variabele zijn om erfelijkheid aan te tonen, een probleem is. De huidige statistische modellen die worden gebruikt om omgevingsvariantie af te bakenen houden geen rekening met (zoals de hierboven getoonde) en hoewel dit de beste modellen zijn die we op dit moment hebben, nemen ze geen variabelen op die mogelijk van invloed kunnen zijn op epigenetische factoren zoals zoals DNA-reparatie, celcycli of DNA-methylatie.