Informatie

Wat is de verdeling van genpolymorfismeniveaus over menselijke genen?


Van de ongeveer 19.000 menselijke genen, hoeveel hebben er ongeveer één allel dat met aanzienlijke frequentie voorkomt in de huidige menselijke populatie, hoeveel hebben er twee, enzovoort? (Met "aanzienlijke frequentie" bedoel ik, laten we zeggen, wordt gevonden in ten minste 1% van de bevolking, wat de vuistregel lijkt te zijn voor het classificeren van een gen als polymorf in de populatie.)

Ik ben niet op zoek naar een exacte uitsplitsing voor elk aantal allelvarianten - ik ben gewoon nieuwsgierig, heeft het typische menselijke gen slechts één (vaak gevonden) allel? Of twee, zoals vaak wordt gesuggereerd in teksten over elementaire genetica? Of vijf, of 10, of 100? Hoe ziet de geschatte verdeling eruit?

Volgens het Wikipedia-artikel dat hierboven is gelinkt, zijn de meest bekende polymorfe genen die coderen voor het Major Histocompatibility Complex (MHC), waarbij de HLA-B HLA-DRB1-loci 200 significante allelen hebben, dus ik denk dat 200 het bovenste uiteinde van het spectrum is . (Hoewel ik niet weet of "de HLA-B HLA-DRB1-loci" verwijst naar een enkel gen of meerdere, dus misschien is 200 allelen hoger dan een enkel gen heeft.)


Polymorfisme (biologie)

In de biologie, polymorfisme [1] is het voorkomen van twee of meer duidelijk verschillende morphs of formulieren, ook wel alternatief genoemd fenotypes, in de populatie van een soort. Om als zodanig te worden geclassificeerd, moeten morphs tegelijkertijd dezelfde habitat bezetten en behoren tot een panmictische populatie (een met willekeurige paring). [2]

Simpel gezegd, polymorfisme is wanneer er twee of meer mogelijkheden zijn voor een eigenschap op een gen. Er is bijvoorbeeld meer dan één mogelijke eigenschap in termen van de huidskleur van een jaguar, ze kunnen licht of donker zijn. Omdat er meer dan één mogelijke variatie voor dit gen is, wordt het 'polymorfisme' genoemd. Als de jaguar echter maar één mogelijke eigenschap voor dat gen heeft, zou het "monomorf" worden genoemd. Als er bijvoorbeeld maar één mogelijke huidskleur was die een jaguar zou kunnen hebben, zou dit monomorf worden genoemd.

De term polyfenisme kan worden gebruikt om te verduidelijken dat de verschillende vormen voortkomen uit hetzelfde genotype. Genetisch polymorfisme is een term die enigszins anders wordt gebruikt door genetici en moleculair biologen om bepaalde mutaties in het genotype te beschrijven, zoals polymorfismen van één nucleotide die niet altijd overeenkomen met een fenotype, maar altijd overeenkomen met een tak in de genetische boom. Zie onder.

Polymorfisme komt veel voor in de natuur en is gerelateerd aan biodiversiteit, genetische variatie en aanpassing. Polymorfisme functioneert meestal om de verscheidenheid aan vormen te behouden in een populatie die in een gevarieerde omgeving leeft. [3] : 126 Het meest voorkomende voorbeeld is seksueel dimorfisme, dat in veel organismen voorkomt. Andere voorbeelden zijn mimetische vormen van vlinders (zie mimiek), en menselijke hemoglobine en bloedgroepen.

Volgens de evolutietheorie is polymorfisme het resultaat van evolutionaire processen, net als elk aspect van een soort. Het is erfelijk en wordt gewijzigd door natuurlijke selectie. Bij polyfenisme zorgt de genetische samenstelling van een individu voor verschillende morphs, en het schakelmechanisme dat bepaalt welke morph wordt getoond, is de omgeving. Bij genetisch polymorfisme bepaalt de genetische samenstelling de morph.

De term polymorfisme verwijst ook naar het voorkomen van structureel en functioneel meer dan twee verschillende soorten individuen, zooiden genaamd, binnen hetzelfde organisme. Het is een karakteristiek kenmerk van cnidarians. [2] Bijvoorbeeld Obelia heeft voedende individuen, de gastrozooids de individuen die alleen in staat zijn tot ongeslachtelijke voortplanting, de gonozooids, blastostyles en vrijlevende of seksueel reproducerende individuen, de medusae.

Evenwichtig polymorfisme verwijst naar het behoud van verschillende fenotypes in de populatie.


Achtergrond

Autismespectrumstoornis (ASS) is een neurologische ontwikkelingsziekte met verstoorde sociale en emotionele communicatie, leerproblemen, angst, epilepsie, taalgebrek en beperkend gedrag [1, 2]. Al deze klinische manifestaties kunnen worden gerelateerd aan de verminderde grootte van cellen in de hippocampus en het limbische systeem en een verhoogd aantal prefrontale cortexneuronen [3]. ASS-patiënten hebben ook een ongebruikelijke ontwikkeling van de temporale en frontale kwab en minder amygdala-volume en grijze stof in MRI-resultaten, wat wijst op een beperkte hersenontwikkeling bij deze patiënten [4]. De prevalentie van ASS is respectievelijk ongeveer 2,47%, 0,06% en 0,36% in de VS, Iran en Azië [1, 5]. Het bereik van ASS-prevalentie is gerapporteerd tussen 0,14 en 2,9 procent in Perzische Golfpopulaties [6]. Verschillende genetische en omgevingsfactoren zijn betrokken bij de progressie van ASS. Koorts en infecties bij de moeder, zinktekort, prenatale inname van foliumzuur en luchtvervuiling behoren tot de belangrijke omgevingsrisicofactoren van ASS [7]. De hoge leeftijd van moeder en vader en mitochondriale disfunctie zijn ook de risicofactoren van ASS [8, 9]. Ongeveer 800 genen die betrokken zijn bij de synapsfunctie, chromatinemodificatie en corticale ontwikkeling zijn geassocieerd met autisme [10]. NL3-, HOXA1-, ANK2 MECP2- en ITGB3-mutaties waren geassocieerd met hersenmorfologie en -functie. CNTNAP2 speelt een sleutelrol in verbeterde frontale kwabconnectiviteit en activering van AKT/mTOR-route [1]. Bovendien is 10% van alle ASS-gevallen gerelateerd aan andere genetische aandoeningen zoals het fragiele X-, Noonan- en Rett-syndroom [11]. Single nucleotide polymorphisms (SNP), variaties in het aantal kopieën en epigenetische modificaties zijn de meest voorkomende genetische veranderingen bij ASS-patiënten [12, 13]. De meest significante gevoeligheidslocus geassocieerd met ASS bevindt zich op chromosoom 7, met name 7q31, dat FOXP2-, RAY1/ST7- en IMMP2L-genen omvat [14]. Bovendien spelen epigenetische dereguleringen zoals DNA-methylatie en histonmodificatie een cruciale rol tijdens de progressie van ASS [11]. Aangezien het recidiefpercentage van ASS hoger is in gezinnen met één getroffen kind, speelt erfelijkheidsadvies een belangrijke rol bij het voorkomen van de geboorte van andere getroffen kinderen. Vroege diagnose kan ook de kwaliteit van leven van kinderen met ASS verbeteren. Vanwege de heterogeniteit van ASS zijn hele exome-sequencing, ASD/ID-panel en chromosomale microarray-analyse voorgesteld voor ASS-diagnose [9]. Gedragstherapietechnieken zoals peerfeedback en videomodellering worden gesuggereerd om de kwaliteit van leven en leren en sociale relaties bij deze patiënten te verbeteren [15]. Psychiaters gebruiken routinematig medicijnen zoals anticonvulsiva, alfa-2-agonisten, antidepressiva en antipsychotica voor de behandeling van patiënten met een autismespectrum [16]. Met betrekking tot de stijgende trend van ASS-incidenties in landen in het Midden-Oosten, is het nodig om de moleculaire biologie van ASS op dit gebied te beoordelen. In dit overzicht hebben we voor het eerst ter wereld alle significante genetische variaties die verband houden met ASS in de bevolking van het Midden-Oosten samengevat (Fig. 1, Tabel 1). Voor de dataverzameling is gebruik gemaakt van PubMed, Scopus, Embase en Web of Science. De zoekstrategie in PubMed was gebaseerd op MeSH: “Autism Spectrum Disorder and Genetic” in landen in het Midden-Oosten tot november 2020. Deze review verduidelijkt de genetische en moleculaire biologie van ASS en maakt de weg vrij voor de introductie van een populatiegebaseerd panel van genetische markers voor de vroege detectie en een beter beheer van ASS onder de bevolking van het Midden-Oosten.

Alle genetische afwijkingen die betrokken zijn bij ASS-progressie onder de bevolking van het Midden-Oosten. Blauwe, groene en zwarte kleuren verwijzen respectievelijk naar de afwijkende expressie, promotormethylering en polymorfismen


Download en print dit artikel voor uw persoonlijke wetenschappelijke, onderzoeks- en educatieve doeleinden.

Koop een los nummer van Wetenschap voor slechts $ 15 USD.

Wetenschap

Vol 317, uitgave 5836
20 juli 2007

Artikel Gereedschap

Log in om een ​​waarschuwing voor dit artikel toe te voegen.

Door Richard M. Clark, Gabriele Schweikert, Christopher Toomajian, Stephan Ossowski, Georg Zeller, Paul Shinn, Norman Warthmann, Tina T. Hu, Glenn Fu, David A. Hinds, Huaming Chen, Kelly A. Frazer, Daniel H. Huson, Bernhard Schölkopf, Magnus Nordborg, Gunnar Rätsch, Joseph R. Ecker, Detlef Weigel

Wetenschap 20 juli 2007 : 338-342

Uitgebreide variatie in de genoomsequenties van 20 stammen van Arabidopsis thaliana wijzen op een prominente rol voor biotische interacties bij het vormgeven van de genetische diversiteit.


MATERIALEN EN METHODES

Computationele analyses: Sequentie-uitlijningen voor de identificatie van Alu-subfamilies werden gemaakt met behulp van MegAlign-software (DNAStar-versie 3.1.7 voor Windows 3.2). Screening van de GenBank niet-redundante (nr), de high-throughput genoomsequentie (htgs) en de genomische onderzoekssequentie (gss) databases werd uitgevoerd met behulp van de geavanceerde basiszoekfunctie voor lokale uitlijning 2.0 (BLAST A ltschul et al. 1990) verkrijgbaar bij het National Center for Biotechnology Information (http://www.ncbi.nlm.nih.gov/). Databasezoekopdrachten voor Yb8-consensus Alus toonde een veel voorkomende variant met één base genaamd Yb9. De databases werden doorzocht op overeenkomsten met de 289 basen van de Yb9-consensussequentie (zoals afgeleid uit de vorige Yb8-analyse) of de 281 basen van de Alu Y-consensus met de verwachte waarde (reëel) ingesteld op −e 1.0e −150 en −e 1.0e −140 , respectievelijk, in de geavanceerde BLAST-opties. Alleen Alu Yb9-elementen met alle negen diagnostische mutaties werden geselecteerd. Een soortgelijk type zoekprocedure werd uitgevoerd met de Yc1- en Yc2-consensussequenties of met een oligonucleotide-querysequentie die complementair was aan de diagnostische baseposities van de subfamilie. Alleen Alu Ycl/Yc2-elementen met 100% identiteit met de oligonucleotide-querysequenties of de volledige subfamiliespecifieke consensussequentie werden gebruikt voor verdere analyse. Om de kopieaantallen van de Yb9-subfamilie te schatten, hebben we de conceptsequentie van het menselijk genoom doorzocht (Lander et al. 2001), met behulp van een subfamilie-specifieke probe die zowel de Yb9-specifieke mutatie als de insertie in de Yb8-subfamilie bevatte. Een volledige lijst van de Alu-elementen die zijn geïdentificeerd uit de GenBank-zoekopdracht is verkrijgbaar bij M.A. Batzer of P.L. Deininger.

DNA-monsters: Menselijke DNA-monsters van de Europese, Afro-Amerikaanse, Alaskan Native, Egyptische en Aziatische bevolkingsgroepen werden geïsoleerd uit perifere bloedlymfocyten (A usubel et al. 1996) die beschikbaar waren uit eerdere studies (Roy et al. 1999).

Oligonucleotide-primerontwerp en PCR-amplificatie: Flankerende unieke DNA-sequenties naast elke Alu-herhaling werden gebruikt om primers te ontwerpen voor de Yb9-, Yc1- en Yc2 Alu-elementen (Tabel 1). PCR-primers en reacties werden uitgevoerd zoals eerder beschreven (Roy et al. 1999). De heterozygotie geassocieerd met elk element werd bepaald door de amplificatie van 20 individuen uit elk van de vier populaties (Afro-Amerikaanse, Alaskan inheemse of Aziatische, Europese en Egyptische 160 totale chromosomen). De chromosomale locatie voor elementen geïdentificeerd uit willekeurig gesequenced anonieme klonen met grote inserts werd bepaald door PCR zoals eerder beschreven (Roy et al. 1999).


Discussie

Een algemene verwachting met betrekking tot geconserveerde orthologe genen is dat ze dezelfde of zeer vergelijkbare functies vervullen in verschillende soorten en dat de functies van de genen in de ene soort dus kunnen worden afgeleid naar een andere, vooral wanneer dergelijke functies cruciaal zijn voor evolutionaire geschiktheid [20- 22]. Verschillende experimenten in het verleden hebben een overeenkomst gerapporteerd in de functie van orthologe genen bij verschillende soorten, hoewel deze studies zich richtten op genen die mendeliaanse aandoeningen veroorzaken, zie [23] voor een overzicht. Voor een zeer polygene eigenschap zoals lengte is het nog niet vastgesteld of de vele genen die aan de eigenschap ten grondslag liggen in verschillende soorten in hun functie behouden blijven, en of met lengte geassocieerde genen in één soort kunnen worden gebruikt als voorafgaande informatie om de genen te identificeren die van invloed zijn op hoogte in een andere soort. In deze studie hebben we geprobeerd vast te stellen of menselijke lengte-geassocieerde orthologe genen, met mutaties die de lengte beïnvloeden, geïdentificeerd via GWAS, kunnen worden gebruikt als voorafgaande informatie om de genen en gen-geassocieerde varianten te identificeren die de gestalte bij runderen beïnvloeden.

Door LD leidt GWAS niet altijd tot de identificatie van de causale varianten en/of genen voor een bepaalde eigenschap. In veel gevallen zijn varianten die geïdentificeerd zijn als significant geassocieerd met een eigenschap proxies van onbekende causale varianten. Een manier om kandidaatgenen te valideren die uit GWAS zijn geïdentificeerd, is om te testen of de genen ook geassocieerd zijn met dezelfde eigenschap in een andere soort, aangezien het LD-patroon en dus de impact van LD op GWAS bij verschillende soorten anders is. In ons onderzoek identificeerden we een aanzienlijk deel (

39%) van de rundvee-geassocieerde orthologe genen die ook geassocieerd zijn met menselijke lengte. Gezien het feit dat ze voorkomen als kandidaat-genen voor lengte in twee soorten die zich over de

90 miljoen jaar geleden [24] kunnen de 30 overlappende genen niet worden beschouwd als een artefact van een cryptische populatiestructuur. We ontdekten dat 6 van de 30 genen: ADAM12, SIK3, AXL, INSR, SPRED1 en PAPPA2 betrokken zijn bij de signalering door Receptor Tyrosine Kinases-route, een route die verantwoordelijk is voor de signalering van het groeihormoon (GH) [25]. Twee van de overlappende genen ADAMTS17 en ADAMTSL4 nemen deel aan de route: Defecte B3GALTL veroorzaakt het Peters-plus-syndroom (PpS). Het Peters-plus syndroom is een recessieve aandoening die onder andere resulteert in een kleine gestalte en vertraging in de groei [26]. Al met al suggereert bewijs dat lengte bij mensen en gestalte bij rundvee biologisch vergelijkbare eigenschappen zijn en dat de orthologe genen die geassocieerd zijn met lengte bij mensen als gevalideerd kunnen worden beschouwd als ze ook geassocieerd worden met gestalte bij rundvee.

Met betrekking tot de identificatie van genen en gen-geassocieerde varianten die de gestalte bij runderen beïnvloeden, suggereren onze resultaten dat voorafgaande informatie tussen soorten (resultaten van GWAS voor menselijke lengte) minder informatief is dan voorafgaande informatie binnen de soort (resultaten van GWAS voor runderen). gestalte). Er zijn waarschijnlijk twee redenen die aan deze bevinding ten grondslag liggen. Ten eerste was het vee (binnen de soort) GWAS [12] voor een eigenschap die zeer erfelijk is. Het is voor GWAS gemakkelijker om de signalen te identificeren die ten grondslag liggen aan een zeer erfelijke eigenschap zoals gestalte dan voor een laag erfelijke eigenschap, b.v. vruchtbaarheid, aangezien er bij een lage erfelijkheidsgraad een groter omgevingseffect is in het fenotype, dat als ruis rond de genetische effecten fungeert. In die zin wordt verwacht dat het voordeel van het gebruik van eerdere informatie van mensen om genen en gen-geassocieerde varianten voor complexe eigenschappen bij runderen te identificeren groter zal zijn voor laag erfelijke eigenschappen van runderen dan voor zeer erfelijke eigenschappen. Bijvoorbeeld Costilla et al. [27] schatte de proportie van additieve genetische variantie voor leeftijd in de puberteit bij runderen verklaard door SNP's in en rond runderen orthologe genen die werden geassocieerd met leeftijd bij menarche bij mensen. Ze toonden aan dat de SNP's in en rond de kandidaatgenen 11,2% van de totale additieve genetische variantie verklaarden voor leeftijd in de puberteit bij runderen, wat ongeveer het dubbele was van de variantie die werd verklaard door SNP's in willekeurige genensets van vergelijkbare grootte en SNP-nummer.

Ten tweede was de GWAS binnen de soort groot in termen van steekproefomvang en daarom krachtig genoeg zodat de menselijke voorafgaande informatie geen aanvullende informatie verschaft. De GWAS-studie van [12] is echter een uitzonderlijke samenwerking en het delen van gegevens in de genetische gemeenschap van vee. Een belangrijke factor voor het succes van de samenwerking was dat statuur over het algemeen niet als een economisch kenmerk wordt beschouwd en in die zin zijn gegevens over statuur minder gevoelig om te delen. Studies zo groot als die van [12] voor economisch belangrijke eigenschappen, vooral die welke moeilijk of duur te meten zijn, komen minder vaak voor. Voor dit soort eigenschappen zal GWAS hoogstwaarschijnlijk ondermaats zijn, aangezien ze worden uitgevoerd op populatieniveau, waar in de meeste gevallen de steekproefomvang beperkt is. Identificatie van de genen en gen-geassocieerde varianten die dergelijke eigenschappen beïnvloeden, zal worden geholpen door de integratie van de enorme middelen, namelijk GWAS-resultaten die openbaar beschikbaar zijn voor complexe eigenschappen bij mensen. Bovendien, voor eigenschappen bij runderen waar krachtige GWAS om welke reden dan ook niet mogelijk zijn, zal het gebruik van eerdere informatie van menselijke GWAS van vergelijkbare eigenschappen waarschijnlijk helpen bij de identificatie van de onderliggende genen en de bijbehorende varianten.

De methode om de genen te bepalen die ten grondslag liggen aan de lengte bij mensen is erg belangrijk, omdat dit kan bepalen of de orthologen de lengte bij andere soorten beïnvloeden. In deze studie hebben we ons gericht op twee sets orthologe genen waarvan werd vastgesteld dat ze een effect hebben op de menselijke lengte. De COJO-genenset is degene die prioriteit kreeg als omvattende of dicht bij de top GWAS-signalen voor lengte bij mensen van [10]. De rundveeorthologen van deze genen waren meer verrijkt voor signalen van de gestalte van rundvee en vingen meer genetische variantie voor gestalte op dan een willekeurige steekproef van genen in het rundgenoom. De tweede set genen waren de genen die werden geprioriteerd op basis van de op samenvatting gebaseerde mendeliaanse randomisatie-analyse (SMR) in [10]. Dit zijn genen waarvan wordt aangenomen dat de expressieniveaus en associatie met lengte worden gecontroleerd door dezelfde causale variant, en in die zin wordt aangenomen dat ze de functioneel meest relevante genen zijn voor menselijke lengte. In onze analyse waren de rundvee-orthologen van de op SMR gebaseerde menselijke genen echter niet meer verrijkt voor GWAS-signalen van de gestalte van rundvee dan willekeurige sets genen uit het rundgenoom. Er zijn twee mogelijke verklaringen voor deze observatie. Ten eerste is van sommige genen bekend dat ze weefselspecifieke genexpressie vertonen [28]. Voor hun SMR-analyse, Yengo et al. [10] gebruikte de GTEx-v7-database [29] die expressiegegevens bevat van verschillende genen in meerdere weefsels, niet noodzakelijkerwijs aan lengte gerelateerde weefsels. Het is daarom mogelijk dat sommige genen een differentieel niveau van genexpressie vertoonden alleen in specifieke weefsels die niet gerelateerd zijn aan de menselijke lengte. De orthologen van dergelijke genen hebben minder kans om de hoogte bij andere soorten te beïnvloeden. Daarentegen hebben genen met consistente differentiële expressie in meerdere weefsels meer kans om hun effect over soorten te behouden. Ons resultaat, hoewel slechts marginaal significant (p = 0,02), suggereert dat dit het geval is. Aangezien de specifieke weefsels die relevant zijn voor specifieke kenmerken van belang niet altijd bekend zijn, moeten de resultaten van SMR-analyse die genexpressiegegevens in slechts een enkel weefsel gebruikt, met de nodige voorzichtigheid worden genomen. De tweede mogelijke verklaring zou kunnen zijn dat de vee-meta-GWAS-analyse van Bouwman et al. [12] was niet krachtig genoeg om belangrijke varianten van de gestalte van runderen te detecteren binnen de orthologen van de op SMR gebaseerde menselijke genen.

Mogelijk kan GWAS voor complexe eigenschappen bij mensen worden gebruikt om nauwkeurige genomische voorspelling bij vee te ondersteunen. Zo kan kennis over de positie van kandidaatgenen van GWAS bij mensen of het aandeel van genetische variantie voor het kenmerk dat wordt verklaard door varianten in of rond de kandidaatgenen, worden gebruikt om priors voor genomische voorspellingsmodellen in vee te specificeren. Een niet-lineair genomisch voorspellingsmodel dat hiervoor gebruikt kan worden is het BayesR by segment (BayesRS) model [30]. In BayesRS wordt aangenomen dat variante effecten behoren tot een mengsel van vier normale verdelingen, waarbij de verschillende verdeling de verschillende verhoudingen van genetische variantie weerspiegelt die worden verklaard door verschillende genomische segmenten. In feite kan het BayesRS-model zodanig worden gespecificeerd dat de eerdere waarschijnlijkheid voor een bepaalde variant afhangt van of het zich binnen of in de buurt van een belangrijk gen bevindt dat is geïdentificeerd door een menselijke GWAS. Een uitgebreid BayesRS-model is het BayesRC-model [31], dat ook de expliciete integratie van voorkennis in GP mogelijk maakt. In BayesRC kan informatie over genen of varianten van een op mensen gebaseerde GWAS worden gebruikt om varianten in twee of meer klassen (C) in te delen. Andere methoden voor het gebruik van informatie van GWAS bij mensen voor genomische voorspelling bij vee omvatten verschillende wegingsvarianten op basis van informatie van menselijke GWAS bij de constructie van GRM's, b.v. [32, 33], en het passen van meerdere GRM's in BLUP, waarbij de verschillende GRM's gemaakt zijn van verschillende klassen markers, b.v. [34–36].

Al met al suggereren onze resultaten dat de menselijke lengte en de gestalte van het vee biologisch vergelijkbare eigenschappen zijn. Met het oog op het identificeren van de genen en gen-geassocieerde varianten die de gestalte bij runderen beïnvloeden, biedt eerdere informatie van de huidige GWAS op menselijke hoogte niet meer voordeel dan wat een krachtige GWAS voor de statuur van runderen al biedt. We moeten zeggen dat onze bevindingen niet gemakkelijk kunnen worden gegeneraliseerd naar andere complexe eigenschappen. Dit is met name het geval voor eigenschappen die sterk kunstmatig zijn geselecteerd bij runderen, aangezien dergelijke eigenschappen zich mogelijk anders en sneller hebben ontwikkeld dan bij mensen. Meer onderzoek is nodig om een ​​dergelijke generalisatie te maken.


Abstract

Doelstelling- C-reactief proteïne (CRP)-concentraties zijn voorspellend voor hart- en vaatziekten, en niveaus zijn gedeeltelijk erfelijk. We identificeerden nieuwe polymorfismen in het CRP-gen en evalueerden hun invloed op het CRP-niveau.

Methoden en resultaten— CRP werd gemeten bij 250 mannelijke legerrekruten voor en na zware inspanning en perioperatief bij 193 coronaire bypass-transplantaat (CABG) patiënten. Twee nieuwe polymorfismen werden geïdentificeerd in het CRP-gen, −717G>A in de promotor en +1444C>T in het 3′UTR. Onder legerrekruten was de CRP hoger bij +1444TT-homozygoten dan bij +1444 C-alleldragers bij baseline (1,04±0,38 versus 0,55±0,06, P= 0,014) en op alle tijdstippen na inspanning (2,35 ± 0,68 versus 1,07 ± 0,12, 2,11 ± 0,53 versus 0,88 ± 0,09 en 1,77 ± 0,44 versus 0,71 ± 0,09, P=0.034, P=0,007, en P= 0,013, respectievelijk 2, 48 en 96 uur na inspanning). Bij de CABG-patiënten steeg de gemiddelde CRP (mg/l) van 1,97 ± 0,36 bij baseline tot 167,2 ± 5,0 72 uur postoperatief. Het genotype had geen invloed op CRP bij baseline, maar de piek CRP-waarden na CABG waren hoger bij +1444TT-homozygoten vergeleken met +1444C-alleldragers (198±17 versus 164±5, P=0.03).

conclusies— Het CRP-gen +1444C>T-variant beïnvloedt het basale en gestimuleerde CRP-niveau. Deze bevindingen hebben implicaties voor zowel de voorspelling als de pathogenese van coronaire hartziekten.

Ontsteking is belangrijk bij de initiatie, progressie en klinische uitkomst van atherosclerose. 1 Prospectieve studies wijzen op een verband tussen de niveaus van C-reactief proteïne (CRP) en het langetermijnrisico op hart- en vaatziekten. 2-10 Bij gezonde proefpersonen in de steady state zijn de CRP-concentraties 100 tot 1000 maal lager dan die gevonden tijdens acute infectie en ontsteking en liggen ze in het bereik van 0,1 tot 10 mg/l. Steady-state CRP-concentraties zijn ongeveer 2 keer hoger bij patiënten met stabiele coronaire hartziekte (CHD), 11,12 maar wanneer een acuut coronair syndroom optreedt, stijgen de CRP-concentraties acuut, waarbij het bereikte niveau de kans op een extra CHD-voorspelling voorspelt op korte tot middellange termijn. 13–17 CRP is aanwezig in atherosclerotische plaques, 18 waar het verschillende potentiële pro-inflammatoire en atherogene effecten kan uitoefenen, waaronder de binding van geoxideerd LDL-cholesterol, 19 inductie van expressie van adhesiemoleculen, 20 activering van complement, 18 en stimulering van de productie van weefselfactor door monocyten. 21 Deze waarnemingen suggereren dat CRP meer kan zijn dan alleen een marker van ontsteking en dat het ook een integrale rol kan spelen in de pathogenese van atherosclerose.

Hoewel CRP een belangrijke rol kan spelen in de pathogenese en voorspelling van CHD, zijn de factoren die van invloed zijn op het basale niveau en de concentraties die tijdens ontsteking worden bereikt, onvolledig begrepen. Interleukine-6 ​​(IL-6) is de belangrijkste inflammatoire cytokinestimulus voor CRP. 22 Bij afwezigheid van acute ontsteking is de concentratie van CRP stabiel 23 waarbij het absolute niveau wordt beïnvloed door leeftijd, 24,25 geslacht, 26 roken, 7 en body mass index (BMI). 24,25 Familiestudies hebben ook gesuggereerd dat CRP-niveau een erfelijke eigenschap is,26 maar de genen die bij deze regulatie betrokken zijn, zijn onbekend. In deze studie hebben we de hypothese getest dat het menselijke CRP-gen zelf gemeenschappelijke functionele polymorfismen bevat die het CRP-niveau basaal en tijdens ontsteking beïnvloeden.

Methoden:

Studiegroepen en protocollen

Studies werden uitgevoerd bij rekruten van het Britse leger die bij aanvang en na 48 uur inspannende fysieke activiteit (die een milde ontstekingsreactie induceert) en patiënten met CHD rond de tijd van coronaire bypass-transplantaat (CABG) -chirurgie, die een belangrijke ontstekingsreactie uitlokt, werden uitgevoerd.

Leger Vrijwilligerswerk Studie

Na het verkrijgen van ethische goedkeuring van het Defense Medical Services Clinical Research Committee, werden rekruten bij het Army Training Regiment, Bassingbourn, VK, ingeschreven aan het begin van een basisopleiding van 11 weken. Aan het einde van deze periode begonnen de rekruten aan een intensieve 48-uur durende laatste militaire uithoudingsoefening (FME) waarvan is aangetoond dat ze een acute ontstekingsreactie veroorzaakt. 27,28 In totaal werden 250 opeenvolgende blanke proefpersonen gerekruteerd. Veneuze bloedmonsters werden afgenomen van de antecubitale ader bij inductie tot basistraining en vervolgens bij 3 gelegenheden (2, 48 en 96 uur) na terugkeer van de FME. Monsters werden gecentrifugeerd (3500G, 10 minuten), en plasma en cellen werden gescheiden en tot analyse bij -20°C ingevroren.

Coronaire bypass-studie

De studie had goedkeuring van de ethische commissie van het ziekenhuis en van alle deelnemers werd schriftelijke geïnformeerde toestemming verkregen. Alle patiënten die voor het eerst een CABG-operatie ondergingen in het Middlesex Hospital (Londen, VK) werden uitgenodigd om deel te nemen aan het onderzoek. Proefpersonen met bewijs van een reeds bestaande inflammatoire toestand of onstabiele coronaire hartziekte werden uitgesloten. Proefpersonen werden ook uitgesloten die leden aan potentieel verwarrende infectieuze postoperatieve complicaties of falen van de bloedsomloop waarvoor inotrope ondersteuning nodig was. Aspirine werd 10 dagen voor de operatie routinematig weggelaten. Bloedmonsters werden preoperatief en vervolgens opnieuw dagelijks afgenomen gedurende de eerste 5 postoperatieve dagen. Deze werden direct gecentrifugeerd (3500G, 10 minuten), en plasma en cellen werden gescheiden en tot analyse bij -20 °C ingevroren.

Testen van CRP, Interleukine-6 ​​en Fibrinogeen

C-reactief proteïne werd gemeten op een BN Prospec (Dade Behring). De variatiecoëfficiënten voor interassay en intraassay waren respectievelijk <4% en <2%, met een detectielimiet van 0,20 mg/L. De IL-6-concentratie werd gemeten met behulp van een commerciële test (R&D Systems) door personeel dat blind was voor alle gegevens van het onderwerp. Interassay- en intraassay-variatiecoëfficiënten waren respectievelijk 5% en 3%, met een detectielimiet van 0,70 pg/ml. De fibrinogeenconcentratie werd bepaald door een halfautomatische Clauss-assay in een MDA-180-coagulometer (Organon Teknika) met behulp van de reagentia van de fabrikant en gekalibreerd met de 7e British Standard (NIBSC).

Polymorfismescreening van het menselijke CRP-gen

Polymorfismen werden geïdentificeerd door enkelstrengs conformatiepolymorfismeanalyse van door warmte gedenatureerde DNA-fragmenten gegenereerd door polymerasekettingreactie (PCR) amplificatie van overlappende fragmenten van het gen van 32 niet-verwante individuen (primers in online gegevenssupplement). Mobiliteitsverschuivingen werden bevestigd door sequencing op een ABI 377-sequencer.

Genotypering van polymorfismen

Twee nieuw geïdentificeerde polymorfismen (−717G>A en +1444C>T) werden gegenotypeerd door PCR en restrictiefragment-lengte polymorfismeanalyse met behulp van primerparen 5′-ACTGGACTTTTACTGTCAGGGC-3′/5′-ATTCCCATCTAT-GAGTGAGAACCT-3′ en SacII voor −717G>A en 5′-AGCTCGTTAACTATGCTGGGGCA-3′/5′-CTTCTCAGCTCTT-GCCTTATGAGT-3′ en Bsp 1286I voor +1444C>T (zie online gegevenssupplement). In beide gevallen was 1 van de primersequenties niet passend om een ​​allelspecifieke restrictie-enzymplaats in het PCR-product te forceren. Bovendien werd een eerder geïdentificeerd stil polymorfisme in exon 2 (+1059G>C)29 gegenotypeerd met behulp van de gepubliceerde methode.

Statistische analyse

Niet-normale gegevens werden log-getransformeerd vóór analyse, maar gegevens worden voor de duidelijkheid gepresenteerd als geometrische gemiddelden en benaderende SD's. Verschillen in CRP tussen genotypen werden beoordeeld door ANOVA en door Student's t tests voor ongepaarde gegevens. Eenmalige ANCOVA werd ook uitgevoerd met leeftijd, geslacht, BMI (kg/m 2 ), roken, diabetische status, therapie met statines of angiotensine-converterende enzymremmers, duur van cardiopulmonale bypass, operatieduur en aorta-kruisklemtijd als covariaten in de CABG-dataset en leeftijd, BMI en rookstatus als covariaten in de legergroep. Een χ2-test werd gebruikt om te testen op het Hardy-Weinberg-evenwicht. Koppelingsonevenwicht tussen locaties werd geschat met behulp van de methode van Chakravarti et al. 30 P<0,05 werd als statistisch significant beschouwd. Alle gegevens zijn geanalyseerd met SPSS voor Windows versie 9.

Resultaten

Identificatie van polymorfismen

Ongeveer 4,5 kb van het CRP-gen vanaf 2075 bp stroomopwaarts van de transcriptiestartplaats tot 996 bp stroomafwaarts van exon 2 werd gescreend. Er werden twee nieuwe polymorfismen geïdentificeerd, een −717G>A-substitutie in de genpromoter en een +1444C>T-variant in de 3'UTR (de laatste met verwijzing naar GenBank-sequentie M11880). Deze varianten zijn respectievelijk aangeduid als rs2794521 en rs1130864 in de NCBI SNP-database (http://www.ncbi.nlm.nih.gov/SNP, geraadpleegd op 21 april 2003). Op dit scherm werden geen coderende regio-polymorfismen geïdentificeerd, hoewel eerder een stil +1059G>C-polymorfisme is gerapporteerd. 29

Demografische kenmerken van studiegroepen

Leger rekruten

Tweehonderdvijftig blanke mannelijke legerrekruten werden met succes ingeschreven. Demografische kenmerken van de basislijn van de studiedeelnemers worden getoond in Tabel 1. Afgezien van een iets hoger basaal IL-6-niveau onder +1444TT-homozygoten, waren er geen systematische verschillen tussen individuen met een verschillend CRP-genotype.

TABEL 1. Demografische factoren bij baseline in legercohort volgens CRP +1444C>T-genotype

CABG-patiënten

Er waren 349 electieve eerste CABG-gevallen, waarvan 275 werden uitgenodigd om deel te nemen en op 5 na waren ze het daar allemaal mee eens. Gegevens van 27 proefpersonen werden verwijderd vóór analyse (13 ontbraken baselinemonsters, 9 hadden aanvullende chirurgische procedures op het moment van CABG, 2 operaties werden uitgevoerd zonder cardiopulmonale bypass en 3 patiënten ondergingen geen operatie). Tweehonderddrieënveertig proefpersonen werden met succes gerekruteerd voor het onderzoek. Honderdnegenenzestig (69%) gebruikten een statine en 69 (28%) een angiotensine-converterende enzymremmer. De klinische kenmerken van de patiënten zijn samengevat in Tabel 2. Er was geen significant verschil in leeftijd, geslacht, BMI, roken, lipidenprofiel of operatieve details tussen de onderzochte CRP-genotypen. De aanwezigheid van diabetes was de enige klinische factor die de duur van de ziekenhuisopname beïnvloedde (8,2 ± 1,0 dagen voor diabetici versus 6,4 ± 0,3 dagen voor niet-diabetici, P=0.016).

TABEL 2. Basislijn patiëntkenmerken en operatieve details volgens CRP +1444C>T genotype

Van de 243 patiënten die aanvankelijk waren geworven, werden in totaal 50 patiënten vervolgens uitgesloten van analyse vanwege postoperatieve complicaties (20 hadden perioperatieve infecties, 10 hadden ademhalingscomplicaties, 3 hadden episoden van postoperatieve bloeding, 2 hadden gastro-intestinale bloedingen, 6 hadden bloedsomloop nodig, 4 required ultrafiltration, and 5 had perioperative ischemic events). A total of 5 patients died during the early postoperative period, leaving a final group of 193 subjects. There was no difference in genotype distribution between the 50 individuals excluded from the study and the 193 patients with uncomplicated CABG. Similarly, duration of intensive care or total in-hospital stay was independent of genotype.

Allele and Genotype Frequencies

The allele and genotype frequencies were in Hardy-Weinberg equilibrium in both the army recruits and CABG patients (Tables 3 and 4 ). There was evidence of significant allelic association between the −717G>A and +1444C>T polymorphisms (Δ=−0.37, P<0.005 in the army group and Δ=−0.39, P<0.0005 in the CABG patients). Homozygotes for the +1444T allele were more common among CABG patients (11.8%) than the army recruits (5.7%), χ 2 =4.9, P=0.02. However, there was no significant difference in allele frequency or genotype distribution between the CABG and army groups for the −717G>A and +1059G>C polymorphisms.

TABLE 3. CRP Genotype Distributions and Rare Allele Frequencies in the Healthy Volunteer Group

TABLE 4. CRP Genotype Distributions and Rare Allele Frequency in CABG Patients

Acute-Phase Response

Acute-Phase Response After Final Military Exercise

Summary data for the CRP, IL-6, and fibrinogen and responses to exercise are presented in Figure 1A. At baseline, mean levels of IL-6, fibrinogen, and CRP were 0.66±0.04 pg/mL, 2.65±0.04g/L, and 0.59±0.04 mg/L, respectively. After the 48-hour intensive FME, there was evidence of an acute-phase response reflected by significant increases in all 3 markers. Changes in IL-6 and CRP were the most marked, with peak increases of approximately 2-fold after return from exercise. There were significant correlations between the peak levels of IL-6 and CRP (R=0.27, P<0.0005) and IL-6 and fibrinogen (R=0.34, P<0.0005).

Figuur 1. A, Summary data for the CRP, IL-6, and fibrinogen response to exercise. B, Summary data for the response to CABG. Fn indicates fibrinogen.

Acute-Phase Response After CABG Surgery

Mean IL-6 (pg/mL) reached a peak 6 hours after surgery, increasing more than 50-fold from 4.5±0.2 to 232±14 (P<0.0005) (Figure 1B). IL-6 levels remained significantly elevated throughout the sampling period (mean IL-6 96 hours after CABG, 28.0±6.4, P<0.0005 versus baseline). Mean CRP (mg/L) rose 83-fold from 1.97±0.36 preoperatively to a peak of 167.2±5.0 72 hours after surgery (P<0.0005). There were significant correlations between peak CRP and peak IL-6 levels (R=0.10, P=0.0015). CRP levels declined after this time point, although they remained significantly higher than baseline by the final sampling point (mean CRP day 5 post-CABG, 78.5±4.0, P<0.0005 versus baseline). Mean fibrinogen levels reached a peak of 7.4±0.2 g/L on the fourth postoperative day. Fibrinogen remained significantly elevated up to the time of hospital discharge compared with baseline (6.9±0.5 versus 3.7±0.1, P<0.0005).

Effect of CRP Genotype on Basal and Stimulated CRP Level

Army Volunteer Exercise Study

Before training, subjects homozygous for the +1444T allele had significantly higher CRP values than +1444C-allele carriers, P=0.014 (Figure 2A). CRP values were 0.54±0.05, 0.56±0.07, and 1.04±0.38 mg/L for CC, CT, and TT genotypes, respectively. Similarly, at all time points after FME, +1444TT homozygotes also had higher CRP concentrations than the C-allele carriers (P=0.034, P=0.007, and P=0.013 at 2, 48, and 96 hours after FME, respectively). The association between +1444C>T genotype and CRP levels persisted after adjustment for age, sex, BMI, smoking, and IL-6 as well as genotypes for the −717G>A and +1059G>C CRP polymorphisms (ANCOVA, P=0.023, P=0.005, P=0.007, and P=0.013 at baseline and 2, 48, and 96 hours after FME). In a multiple regression analysis age, BMI, smoking status, and the +1444C>T polymorphism influenced CRP level. The +1444C>T polymorphism accounted for 3.7%, 2.0%, 4.0%, and 4.5% of the total CRP variance at baseline and 2, 48, and 96 hours after FME. In contrast, baseline CRP levels were not influenced by −717G>A or +1059G>C genotype, nor was there any significant association between these 2 polymorphisms and postexercise CRP. Although initial analysis indicated that +1059GG homozygotes had a higher CRP 2 hours after FME than +1059C-allele carriers, this effect was lost after multivariate analysis and was accounted for by the observation that all +1059 GG homozygotes were also homozygous for the +1444T allele.

Figure 2. A, Postexercise CRP levels by CRP +1444C>T genotype. B, Post-CABG CRP levels by CRP +1444C>T genotype.

CABG Study

Preoperative CRP levels were higher for +1444TT homozygotes than +1444C-allele carriers, although this difference was not statistically significant. CRP values were 1.9±0.4, 2.0±0.8, and 2.9±0.9 mg/L for CC, CT, and TT genotypes, respectively. However, at all times beyond the first 24 hours after surgery and despite the large rise in CRP that resulted, mean CRP levels were higher in +1444TT homozygotes than +1444C-allele carriers (Figure 2B). This was most marked at the 48- and 72-hour time points, although the difference was only significant at the 72-hour time point (P=0.19 and P=0.032 at 48 and 72 hours, respectively). The effect of +1444C>T genotype on peak CRP levels remained significant after multivariate analysis, P=0.01. Apart from CRP +1444C>T genotype, significant predictors of CRP level were BMI and operation duration. There was no significant interaction between statin therapy and genotype on CRP level either at baseline (P=0.29) or at peak (P=0.69). However, after adjustment for statin therapy, there was still evidence of a difference in maximum CRP by genotype (P=0.05). There was no evidence of any significant association of CRP with +1059G>C genotype on CRP levels at any time point either at baseline or after CABG.

Discussie

We have identified 2 novel common CRP polymorphisms, 1 in the gene promoter (−717G>A) and the other in the 3′ untranslated region (+1444C>T). In 2 independent studies, a strong, consistent, and independent association was detected between the +1444C>T polymorphism and CRP level. These findings clearly implicate genetic factors in the regulation of CRP level and are the first to identify a candidate functional polymorphism in the gene itself.

CRP Genotype Is Associated With CRP Level in 2 Models of the Acute-Phase Response

In both our studies, homozygosity for the +1444T allele was significantly and independently associated with a greater peak CRP level after an inflammatory stimulus. Importantly, these associations were preserved after accounting for factors known to influence CRP level, including age, sex, BMI, smoking, diabetes, and IL-6. This association was detected despite differences in the absolute basal level of CRP in the 2 study groups (one a healthy cohort, the other a group with severe CHD) and in the nature and magnitude of the inflammatory stimulus. In the first study of healthy volunteers, the +1444C>T polymorphism was also associated with an approximately 2-fold difference in basal CRP (0.55 versus 1.04 mg/L for +1444C-allele carriers and +1444TT homozygotes, respectively), and this difference was preserved after adjustment for age, BMI, smoking, and baseline IL-6. This magnitude of the difference in CRP level by genotype has been associated, in prospective cohort studies, with a 25% to 50% increase in the long-term risk of cardiovascular events. 31 Although no statistically significant association was detected between CRP genotype and basal CRP in patients with CHD, it should be noted first that the absolute level of CRP was higher in this group than in the healthy army recruits (presumably reflecting a preexisting low-grade inflammatory stimulus in these atherosclerotic patients) and second that many were taking statins that are recognized as modulating CRP level. These factors might have served to dilute any genetic association. Despite this, and consistent with the findings in the army recruits, a clear association was still detected between the CRP +1444C>T polymorphism and peak post-CRP level after the inflammatory stimulus of CABG surgery. Overall, baseline and peak IL-6 correlated with baseline and peak CRP, respectively, but our study was not powered to detect an interaction between the IL-6 stimulus and CRP genotype in the determination of CRP level. It would be important to explore the possibility of such an interaction in future studies.

Cross-sectional studies have indicated that environmental and demographic factors such as age, sex, smoking, obesity, and diabetes account for only 22% to 30% of the interindividual variability in steady-state CRP, 32 and family studies have suggested that CRP level is a heritable trait. 26 However, our study is the first to implicate a single-nucleotide polymorphism in a potential regulatory region of the CRP gene itself in the determination of CRP level. However, it is likely that other important genetic influences exist. Recently, a polymorphism in the gene that encodes IL-6, the major cytokine stimulus for CRP production, was also found to be associated with CRP level. 33

Is the +1444C>T Variant Functional?

Our study cannot provide direct evidence for a functional role for the +1444C>T CRP polymorphism. One explanation for our observations is that this polymorphism is a marker for an as-yet unidentified variant in the vicinity of the CRP locus. If the +1444C>T variant was shown to be functional in in vitro studies, its effects might be mediated through modulation of mRNA stability, as has been reported for a common functional 3′UTR variant in the prothrombin gene. 34 Regulation of mRNA stability is a potentially important step in CRP production, because CRP mRNA is known to have a short half-life of approximately 2.5 hours. 35

Limitations of the Present Study

First, the number of subjects with the TT genotype was relatively few, and most participants were men. Therefore, additional studies in larger cohorts in which women are adequately represented are needed. Second, because this study is unable to define whether the +1444C>T polymorphism is functional or a marker in linkage disequilibrium with a functional variant elsewhere in the gene, it might be regarded as being hypothesis generating.

Implications of Present Findings for Pathogenesis of Atherosclerosis and for Risk Prediction

It is still not clear whether CRP contributes to the pathogenesis of atherosclerosis or is acting as a marker of distinct inflammatory processes or products that have a causal role in atherogenesis. CRP has the capacity to bind oxidized LDL and to induce adhesion molecule and tissue factor expression in endothelial cells and monocytes, respectively. Critically, CRP has also been found within atherosclerotic plaques. 18 In patients with CHD, the circulating level of CRP correlates inversely with endothelium-dependent vasodilatation, which is itself predictive of adverse outcome. 36 If these observations reflect a pathogenic role for CRP and if the lifetime exposure to CRP is important, then the identification of genetic factors like the +1444C>T polymorphism that are associated not only with steady-state CRP but also with the temporal profile of its rise and fall after an inflammatory stimulus may help to refine assessments of susceptibility to CAD. Although not the main aim of the present study, we identified an excess of +1444TT homozygotes among CABG patients when compared with the healthy army recruits (11.8% versus 5.7% χ 2 =4.9 P=0.02). This finding is in keeping with the hypothesis that this variant increases susceptibility to CHD, although this will require confirmation in an appropriately powered case-control study. Alternatively, if CRP is marker for, rather than a mediator of, atherosclerosis, then the important prognostic value of a particular CRP level 37 may differ according to an individual’s genotype, because an elevation in CRP that results from inflammation may have a different implication for future risk than an elevation in CRP that is the result of an individual’s genotype. If this is the case, then there may eventually be a need to establish genotype-specific risk thresholds for CRP in the prediction of CHD risk. An additional potentially important consequence of the identification of a genetic variant associated with differences in CRP concentration is that it will allow clarification of the link between CRP and vascular disease by using Mendelian randomisation to test causality. 38


Uniparental Disomy

In uniparental disomy, both chromosomes of a homologous chromosome pair come from 1 parent. This leads to a disruption of genomic imprinting . One should differentiate between its 2 forms:

  • Paternal uniparental disomy : The maternal chromosome and its genes are missing.
  • Maternal uniparental disomy : The paternal chromosome and its genes are missing.

Failure of genetic expression or overexpression of genomic imprinting can lead to certain diseases, i.e. Prader-Willi syndrome of Angelman syndrome .

The disruption of imprinting caused by uniparental disomy is not passed on to the next generation. The expression of genetic information takes place anew and there is no increased risk of recurrence in families.


Genetics of Lactase Persistence and Lactose Intolerance

AbstractThe enzyme lactase that is located in the villus enterocytes of the small intestine is responsible for digestion of lactose in milk. Lactase activity is high and vital during infancy, but in most mammals, including most humans, lactase activity declines after the weaning phase. In other healthy humans, lactase activity persists at a high level throughout adult life, enabling them to digest lactose as adults. This dominantly inherited genetic trait is known as lactase persistence. The distribution of these different lactase phenotypes in human populations is highly variable and is controlled by a polymorphic element cis-acting to the lactase gene. A putative causal nucleotide change has been identified and occurs on the background of a very extended haplotype that is frequent in Northern Europeans, where lactase persistence is frequent. This single nucleotide polymorphism is located 14 kb upstream from the start of transcription of lactase in an intron of the adjacent gene MCM6. This change does not, however, explain all the variation in lactase expression.


Invoering

By some estimates, genomic variation due to copy number differences underlies more variation in the human genome than that due to single-nucleotide differences (Tuzun et al, 2005 Sudmant et al, 2015). Yet, copy number variation remains challenging to quantify and analyze. Nowhere is this more true than in genomic regions that contain gene families: collections of genes formed through the process of duplication/deletion and diversification of contiguous stretches of DNA (Nei & Rooney, 2005). Two gene families that are of particular biomedical relevance but for which variation is not well characterized are the immunoglobulin heavy variable (IGHV) family, a 1-Mb locus located on chromosome 14 (Matsuda et al, 1998 Watson et al, 2013), and the T-cell receptor beta variable (TRBV) family, a 500-kb locus located on chromosome 7 (Rowen et al, 1996). Both regions undergo VDJ recombination, providing the V (variable) component in the biosynthesis of adaptive immune receptors: the IGHV for the heavy chain of the B-cell receptor and the TRBV for the beta chain of the T-cell receptor (Murphy & Weaver, 2016). In the human genome, both loci are organized as a series of approximately 45 functional V gene segments and are adjacent to a collection of D (diversity) and J (joining) segments. Both loci are present in the genomes of all vertebrates known to have an adaptive immune system, although the arrangement of the IGHV locus can differ between species (Cannon et al, 2004 Das et al, 2008 Flajnik & Kasahara, 2010). Indeed, the genes comprising the IGHV and TRBV loci are distant paralogs and are believed to derive from a common ancestral locus in a vertebrate contemporaneous with or predating jawed fishes (Cannon et al, 2004 Das et al, 2008 Flajnik & Kasahara, 2010). That these two loci share genomic features and evolutionary origins makes them an ideal system for a comparative study in gene family evolution.

Here, we present the largest investigation to date of genetic variation in the IGHV and TRBV loci using short-read whole-genome sequencing data. We apply a customized genotyping pipeline (based on Luo et al [2016]) to data from the Simons Genome Diversity Project (SGDP) Mallick et al (2016), which performed whole-genome sequencing of a globally diverse sample of human individuals from over a 100 populations. Such characterization of population-level genetic variation in the immune receptor loci sheds light on how the two loci evolved from their common origins. Quantification of variation is also needed in the burgeoning field of computational immunology (Robins, 2013 Georgiou et al, 2014), where the relative abundances of germline variants will help in other applications such as genome-wide association studies, measuring linkage disequilibrium, and determining clonal lineages from VDJ sequences. For example, previous work demonstrates that the V genes may contribute a significant proportion of the CDR3, and oftentimes, lineages with conserved D and J genes must be distinguished using V gene information (Li et al, 2004). Past methods for CDR3 determination have included integrating over all possible V genes when information was lacking and taking population-wide frequencies into account would likely improve the accuracy of such methods (Murugan et al, 2012). In addition, the common copy number polymorphisms we find in our data agree with what has previously been documented, and the most frequent allele we report for each gene segment corresponds to the first or second allele (*01 and *02, respectively) recorded for that gene segment in the ImMunoGeneTics information system (IMGT) database (Giudicelli et al, 2005). We emphasize, however, that the results from this genotyping is used purely for aggregate measures of sample-level variation. Our method is not intended to be used to accurately genotype individual genomes.


Plant materialen

Seeds of 837 Oryza sativa germplasm accessions from 5 different continents (Asia, Africa, North America, South America and Australia) representing18 countries were obtained from two different sources viz., Paddy Breeding Station, Tamil Nadu Agricultural University (TNAU), Coimbatore, Tamil Nadu, India and Ramiah Gene Bank, Department of Plant Genetic Resources, TNAU, Coimbatore, India. Two high RS expressing mutants viz., RSM 271 and RSM 311 isolated recently at our laboratory through gamma irradiation were included as positive controls. EEN rice cultivar Pooja with very low RS (unpublished) was included as a negative control for comparison. These accessions were raised in a single row trial. Based on the observations on flowering, seed set and plant morphology (data not shown), a total of 547 accessions were found to be photo insensitive and suitable for further multiplication. Out of 547 accessions, we randomly selected 512 accessions belonging to indica type for EcoTILLING by sequencing (Additional file 1: Table S1).

DNA extraction and normalization

Total genomic DNA from chosen 512 accessions was extracted from the leaf tissues using DNeasy 96 Plant kit (Qiagen, Valencia, CA, USA) following the manufacturer’s protocol. The DNA concentration was measured with Tecan Infinite M200 pro multimode reader (Tecan, Switzerland) using a nano quant plate. After assessment of the concentration, DNA samples were normalized by dispensing different volumes of water in DNA samples using a Tecan Freedom Evo75 robotic liquid handling system (Tecan, Switzerland).

Pooling and super pooling of genomic DNA

Bidimensional pooling strategy of Tsai et al. [40] was adopted with slight modifications. We combined equivalent amount of concentration normalized DNA from eight germplasm accessions to make one 64 well pool plate in a symmetrical 8 × 8 well format instead of the regular 8 × 12 (96 well) microplate format. Genomic DNAs were further pooled by collapsing rows (8 wells × 8 individuals = 64 individuals) and column (8 wells × 8 individuals = 64 individuals) of this plate which resulted in 16 template super pools.

Selection of candidate genes and their sequences

Through literature search, we identified the putative candidate genes associated with RS expression in rice [54, 69–72]. The list of chosen genes with their putative functional effects on RS was presented in Table 1. The nucleotide sequences of gDNA and full length cDNAs of candidate genes were retrieved from the NCBI Genbank. Sequences of these genes were utilized for building up gene models and designing primers.

Discovery of EcoTILLING fragments, designing primers and PCR amplification

The EcoTILLING gene regions with maximum probability for missense variants were fixed using CODDLE bioinformatics pipeline (http://blocks.fhcrc.org/proweb/). The primers for PCR amplification of EcoTILLING fragments were designed with PRIMER 3 software (Additional file 6: Table S2).

PCR for amplification of EcoTILLING fragments

High fidelity LongAmp® Taq DNA polymerase (Cat#M0534) obtained from New England Biolabs (NEB), Ipswich, UK was used for PCR amplification in a 50 μl reaction. PCRs were performed using 10 μl of 5x longAMPTaq Reaction buffer, 1.5 μl of dNTPs (10 mM), 2 μl of each forward and reverse primer (10 μM), 2 μl of DMSO, 5 μl of pooled DNA (50 ng/μl), 2 μl of LongAmp® Taq polymerase (5 unit) and 25.5 μl sterile water (Additional file 7: Table S3). Touch down PCR cycling was performed with a 30 s 95 °C denaturing step followed by 10 touchdown cycles at 94 °C for 20 s, 62 °C for 1 min (decrement at 0.6 °C cycle -1 ), and 65 °C for 1 min. Thirty more cycles were followed at 94 °C for 30 s, 57 °C for 1 min, 65 °C for 1 min with 10 min final extension at 65 °C. Reactions were held at 10 °C until retrieved (Additional file 2: Table S4, Additional file 3: Table S5).

Equimolar pooling of PCR products and sequencing of libraries

The concentration of PCR products were quantified using the Qubit dsDNA BR assay system (Invitrogen, Carlsbad, CA) to eliminate over-estimation resulting from free nucleotides in the PCR products. The amplified products of the EcoTILLING fragments were normalized and equimolarly pooled gene wise maintaining the super pool identity.

Sequencing library preparation was carried out using the Ion Xpress™ Fragment Library Kit, with 100 ng of super pooled DNA. Adapter ligation, size selection, nick repair and amplification were performed as per manufacturer’s instructions ((Ion Xpress™ Fragment Library Kit - Part Number 4469142Rev.B). Size selection was executed using the Lab Chip XT (Caliper Life Sciences, USA) and the Lab Chip XT DNA 750 Assay Kit (Caliper Life Sciences, USA), with collection between 175 bp and 220 bp. The Agilent 2100 Bioanalyzer (Agilent Technologies, USA) and the manufacture recommended high sensitivity DNA kit (Agilent Technologies, USA) were used to determine quality and concentration of the libraries. Emulsion PCR and enrichment steps were carried out using the Ion Xpress™ Template Kit adopting its associated protocol (Part Number 44 69004 Rev. B). Individual libraries were barcoded by using Ion Xpress™ Barcode Adapters Kit. Sequencing was carried out using Ion Proton™ with 10 GB data output by using Ion 316™ Chip. The Ion Sequencing Kit v2.0 was used for sequencing reactions of all 16 libraries as per manufacturer’s instructions.

SNP calling and mutation discovery

After the sequencing of libraries, filtering, trimming and aligning of sequence information were carried out by using Torrent Suite 1.5 with their reference sequences. After the alignment, Variant Caller was used for filtering the SNPs from the aligned sequence contigs in comparison with their corresponding reference sequences. The parameters such as min-max distance, mismatch cost, length fraction and similarity were selected in order to minimize reads alignment ambiguities as well to detect rare SNPs. The minimum variant frequency and minimum coverage were set 0.5 and 20, respectively which gives variations on or above 0.5% from the pools which were considered as SNPs. The candidate gene sequences of Pooja (a line with lowest RS content of 2.5%) were used as reference for variant calling.

Functional analysis of SNP variants

Discovered sequence variants were analysed by the PARSESNP program (http://blocks.fhcrc.org/proweb/) which provides information on the location along with the details about amino acid changes. The severity of mutations was analysed by SIFT (Sorting Intolerant from Tolerant) (http://sift.jcvi.org/) with default parameters [73]. Amino acids with substitutions probabilities <0.05 are predicted to affect protein function.

Deconvolution fromEcoTILLING pools

To identify the individual germplasm accessions carrying natural allelic variants from the prospective pools, individual genomic DNA of the eight constituent accessions was subjected to PCR amplification with primers designed for short target (

600 bp) spanning the variant region for each target gene. Sanger sequencing was performed using BigDye® Terminator version 3.1 cycle sequencing kit (Applied Biosystems, USA) on an ABI3730L (96 well) sequencer (Applied Biosystems, USA) according to the manufacturer’s protocols. By comparing the gene sequences of the individual PCR amplicons after alignment with their reference sequence, the positive variant carrying accessions were identified for subsequent characterization.

Biochemical characterization of variants

Biochemical traits measured were total starch content, amylose content (AC), resistant starch (RS) and hydrolysis index (HI). Total starch contents were determined on the basis of the AACC International (AACC Method 76–13.01) method. AC was determined through high performance size exclusion liquid chromatography as described by Demeke et al. [74]. The RS content was estimated on dry weight basis following Goni et al. [75] using the Megazyme RS assay kit (Cat#K-RSTAR Megazyme International Ireland Ltd., Ireland). In vitro starch hydrolysis rate and HI were determined according to Goni et al. [61]. In vitro enzymatic hydrolysis with different time points (0, 30, 60, 120 and 240 min) were carried out to predict the rate of starch digestibility which is measured as HI by comparing the rate of digestibility of white bread. This is considered to be in vitro equivalent of GI estimate. All determinations were done in three biological replicates and two independent observations for each replicate.

Statistische analyse

Duncan’s multiple range test (DMRT) was carried out using MINITAB 16 to distinguish the mean differences between the accessions.


Bekijk de video: Wat is genetische manipulatie? (Januari- 2022).