Informatie

6.S: Genetische Basis van Complexiteit (Referenties) - Biologie


6.S: Genetische basis van complexiteit (referenties)

Genetische complexiteit van sinusknoopdisfunctie

De pacemakercellen van de cardiale sinoatriale knoop (SAN) zijn essentieel voor een normale cardiale automatisering. Disfunctie in pacemaking resulteert in menselijke sinoatriale knoopdisfunctie (SND). SND komt meer in het algemeen voor bij de oudere populatie en wordt geassocieerd met een verminderde werking van de pacemaker die een abnormaal hartritme veroorzaakt. Personen met SND hebben een verscheidenheid aan symptomen, waaronder sinusbradycardie, sinusarrest, SAN-blok, bradycardie/tachycardiesyndroom en syncope. Belangrijk is dat personen met SND chronotrope incompetentie rapporteren als reactie op stress en/of inspanning. SND kan genetisch of secundair zijn aan systemische of cardiovasculaire aandoeningen. De huidige behandeling van patiënten met SND is beperkt tot de verlichting van aritmiesymptomen en pacemakerimplantatie indien geïndiceerd. Gebrek aan effectieve therapeutische maatregelen die gericht zijn op de onderliggende oorzaken van SND maakt het beheer van deze patiënten uitdagend vanwege de progressieve aard en heeft de kritieke noodzaak benadrukt om ons begrip van de onderliggende mechanistische basis van SND te verbeteren. Deze review richt zich op de huidige informatie over de genetica die ten grondslag ligt aan SND, gevolgd door toekomstige implicaties van deze kennis bij de behandeling van personen met SND.

trefwoorden: GIRK4 HCN4 Nav1.5 atriale fibrillatie calsequestrin-2 genetica sick sinus-syndroom sinoatriale knoopdisfunctie.

Copyright © 2021 Wallace, El Refaey, Mesirca, Hund, Mangoni en Mohler.

Belangenconflict verklaring

De recensent HZ verklaarde een co-auteurschap met de auteurs PM en MM in het verleden aan de behandelende redacteur. De overige auteurs verklaren dat het onderzoek is uitgevoerd zonder enige commerciële of financiële relatie die kan worden opgevat als een mogelijk belangenconflict.


Wat veroorzaakt de continue distributie van fenotypes voor kwantitatieve eigenschappen?

De continue variatie voor complexe eigenschappen is te wijten aan genetische complexiteit en omgevingsgevoeligheid. Genetische complexiteit komt voort uit het scheiden van allelen op meerdere loci. Het effect van elk van deze allelen op het fenotype van de eigenschap is vaak relatief klein en hun expressie is gevoelig voor de omgeving. Allelische effecten kunnen ook afhankelijk zijn van genetische achtergrond en geslacht. Vanwege deze complexiteit kunnen veel genotypen aanleiding geven tot hetzelfde fenotype, en hetzelfde genotype kan verschillende fenotypische effecten hebben in verschillende omgevingen. Er is dus geen duidelijke relatie tussen genotype en fenotype.


De genetische basis voor de evolutie van soma: mechanisch bewijs voor de coöptatie van een stress-geïnduceerd gen in een ontwikkelingsmasterregulator

In meercellige organismen met gespecialiseerde cellen is het belangrijkste onderscheid tussen celtypen tussen reproductieve (kiem)cellen en niet-reproductieve/somatische cellen (soma). Hoewel soma heeft bijgedragen aan de duidelijke toename van de complexiteit van veel meercellige geslachten, is er weinig bekend over de evolutionaire oorsprong ervan. We hebben eerder gesuggereerd dat de evolutie van genen die verantwoordelijk zijn voor de differentiatie van somatische cellen de coöptatie van levensgeschiedenis-trade-off-genen omvatte die in eencellige organismen de overleving verbeterden ten koste van onmiddellijke reproductie. In de meercellige groene alg, Volvox carteri, wordt het lot van de cel vroeg in de ontwikkeling bepaald door de differentiële expressie van een hoofdregulerend gen dat bekend staat als regA. een nauw verwante RegA-Als reeks (RLS1) is aanwezig in zijn eencellige verwant, Chlamydomonas reinhardtii. RLS1 wordt uitgedrukt als reactie op stress, en we hebben voorgesteld dat een door de omgeving veroorzaakte RLS1-achtig gen werd gecoöpteerd in een ontwikkelingspad in de lijn die leidde tot V. carteri. Het exacte evolutionaire scenario dat verantwoordelijk is voor de veronderstelde coöptatiegebeurtenis moet echter nog worden bepaald. Hier laten we zien dat naast ontwikkelingsgereguleerd, regA kan ook worden veroorzaakt door omgevingssignalen, wat aangeeft dat: regA heeft zijn voorouderlijke regeling behouden. We vonden ook dat de afwezigheid van een functioneel RegA-eiwit een verhoogde gevoeligheid voor stress geeft, in overeenstemming met RegA die een directe of indirecte rol speelt bij stressreacties. Over het algemeen levert deze studie (i) mechanistisch bewijs voor de coöptatie van een door de omgeving geïnduceerd gen in een belangrijke ontwikkelingsregulator, (ii) ondersteunt de opvatting dat belangrijke morfologische innovaties kunnen evolueren via veranderingen in de regelgeving en (iii) pleit voor de rol van stress in de evolutie van meercellige complexiteit.

trefwoorden: Volvox carteri co-optie ontwikkeling evolutie van soma regA stress.


Discussie

Nieuwe thermische omgeving induceert een herbedrading van metabole regulatie

Temperatuur is een belangrijke factor die de expressie van talrijke genen in ectothermen moduleert en is bijzonder goed bestudeerd in Drosophila [19, 20, 39]. Onze experimentele populaties die evolueerden in een nieuwe hete thermische omgeving vertoonden zeer significante verschillen in genexpressie waarbij veel genen van goed gedefinieerde routes betrokken waren. Van bijzonder belang waren genen die neerwaarts werden gereguleerd in de hete geëvolueerde populaties, omdat ze een wereldwijde neerwaartse regulatie van de energieproductie in hete-geëvolueerde vliegen suggereren, wat de glycolyse, de TCA-cyclus en oxidatieve fosforyleringsroutes beïnvloedt. Interessant is dat een sterk gerepliceerde studie in Escherichia coli ontdekte dat RNA-polymerase het meest voorkomende gen was in replica's, wat resulteerde in een lagere snelheid van eiwitsynthese [40], wat verder bewijs levert dat een belangrijke evolutionaire reactie op warme omgevingen is om de toename van de energieproductie en eiwitsynthese te verminderen, wat is verhoogd in warme omgevingen en brengt waarschijnlijk aanzienlijke kosten met zich mee.

In overeenstemming met gemodificeerde metabolische herbedrading van de hot-geëvolueerde populaties, vonden we significante verschillen in CO2 productie ten opzichte van de voorouderlijke en koud-geëvolueerde controlepopulaties (zie Fig. 2e Aanvullend bestand 1: Figuur S3 en aanvullende methoden en resultaten). In tegenstelling tot naïeve verwachtingen, CO2 de productie was hoger in de hete geëvolueerde vliegen. Niettemin worden rustmetabolisme en genexpressie gemeten op twee verschillende momenten van de dagelijkse cyclus van de evoluerende populaties, wat suggereert dat het verband tussen genexpressie en energieproductie misschien niet eenvoudig is. Bovendien, hogere CO2 productie in hot-geëvolueerde vliegen is consistent met toenemende O2 consumptie geassocieerd met verminderde AMPK-activiteit [41]. Verdere inzichten in dit contra-intuïtieve patroon van CO2 consumptie komt uit een metabolomische analyse van D. melanogaster onder een breed scala aan ontwikkelingstemperaturen [42]. Bij extreme temperaturen hadden de vliegen een tekort aan suikers en energiemetabolieten (NAD+, NADP+ en AMP), wat wordt toegeschreven aan hun onvermogen om de cellulaire homeostase te handhaven. Als de hete omstandigheden van ons experiment hetzelfde effect hebben, kunnen vliegen die niet naar deze omgeving zijn geëvolueerd, ook ontdaan zijn van suikers en energiemetabolieten. Als reactie kunnen enzymen in de glycolyse, TCA-cyclus en oxidatieve fosforyleringsroutes worden opgereguleerd. Heet geëvolueerde vliegen hebben mogelijk het vermogen verworven om cellulaire homeostase bij hoge temperaturen te handhaven, waardoor een hoger rustmetabolisme mogelijk is zonder opregulering van de metabole route-genen.

Onze resultaten contrasteren met een recente studie waarin CO2 productie werd geconserveerd onder D. melanogaster populaties die evolueerden in verschillende thermische omgevingen [43]. Met verschillende experimentele details die verschillen tussen de onderzoeken (isvrouwelijke lijnen versus pools van gekruiste individuen, 20 min-metingen gedurende de dag versus rustmetabolisme 's nachts), is de interpretatie van deze schijnbare discrepantie moeilijk. Desalniettemin sluit het goed aan bij de algemene controverse over het effect van temperatuur op de evolutie van het metabolisme [44]. We concluderen dat de consistente verschillen in CO2 productie tussen voorouderlijke en geëvolueerde populaties leveren sterk bewijs van temperatuurspecifieke evolutie van metabolismeregulatie, maar geven ook aan dat de onderliggende fysiologische veranderingen complexer zijn.

AMPK verklaart de fenotypische veranderingen die worden waargenomen in hot-geëvolueerde populaties

Op basis van alleen de genomische analyses is het niet mogelijk om andere genen in de Sestrin piek als doelwit van selectie, of drie andere kleine genen die overlappen met de selectiesignatuur van SNF4Aγ (Aanvullend bestand 2: Tabel S3). In combinatie met de expressiegegevens is de rol van SNF4Aγ en Sestrin als de primaire drijfveren van de metabolische herbedrading duidelijk wordt. Sestrin moduleert de fosforylatiesnelheid van AMP-geactiveerd proteïnekinase (AMPK) [45], dat is samengesteld uit SNF4Aγ en twee andere subeenheden. AMPK is een belangrijke speler in energiehomeostase op cellulair en organismaal niveau, en beide SNF4Aγ en Sestrin zijn direct gekoppeld aan AMPK-activiteit [45,46,47]. Lage niveaus van ATP resulteren in de activering van AMPK, wat leidt tot opregulatie van glycolyse en biogenese van mitochondriën [48]. Bovendien worden energetisch kostbare routes, zoals vetzuurproductie en gluconeogenese, neerwaarts gereguleerd door AMPK [49]. Inactivering van AMPK veroorzaakt neerwaartse regulatie van glycolyse en opwaartse regulatie van anabole routes zoals vetzuurproductie, die beide werden gezien in onze gegevens. Interessant is dat Pfk, het doelenzym voor AMPK in glycolyse, het eerste neerwaarts gereguleerde enzym van de glycolyseroute in onze dataset is (figuur 2a, blauwe pijl). In D. melanogaster, RNA-interferentie-gemedieerde neerwaartse regulatie van SNF4Aγ verhoogt het glucosegehalte van spieren en het vetlichaam [50] en induceert hongergedrag [41]. Sommige genen van de insulinereceptorsignaleringsroute werden ook differentieel tot expressie gebracht in de hot-geëvolueerde populaties (Ilp6, InR, zie Extra bestand 1: Afbeelding S1). Bovendien vertonen enkele belangrijke enzymen die betrokken zijn bij de productie van vetzuren (ACCoAs, ACC en FASN2, Desat1, CG30008, CG33110, CG18609 zie Aanvullend bestand 1: Figuur S1) ook een signaal van opregulatie, consistent met de directe remming van ACC door AMPK [51]. Verhoogde temperaturen en hittestress verminderen de vetopslag in D. melanogaster [52] door apoptose in het vetlichaam op te roepen - een proces dat afhankelijk is van SNF4Aγ [53] dat het hier waargenomen uithongeringspatroon koppelt aan temperatuuradaptatie. Sestrin is ook verbonden met autofagieregulatie in Drosophila, door zijn rol bij het activeren van AMPK [54, 55].

Onze resultaten geven dus aan dat de activiteit van de belangrijkste metabole regulator AMPK wordt gemoduleerd door de differentiële regulatie van de subeenheid SNF4Aγ en interactief gen Sestrin in hot-geëvolueerde populaties. Gezien de centrale rol van SNF4Aγ en Sestrin voor temperatuurafhankelijke metabolische herbedrading redeneerden we dat beide genen zouden moeten variëren langs temperatuurlijnen in natuurlijke populaties. Hoewel we geen bewijs hebben gevonden voor de clinaliteit van Sestrin, de patronen voor SNF4Aγ voldeed aan onze verwachtingen. Een analyse van het hele genoompolymorfisme geïdentificeerd SNF4Aγ als een van de topkandidaten in clinal Noord-Amerika D. melanogaster populaties [22]. Klinische en seizoensgebonden variatie van SNF4Aγ in D. melanogaster en D. simulans verder impliceren temperatuur als een adaptieve driver [21, 24]. Genetische gegevens van de klinische populatie opnieuw analyseren [23], SNF4Aγ behoort tot de 603 meest gedifferentieerde genen die worden gedeeld door Noord-Amerika en Australië D. simulans populaties. genexpressie van SNF4Aγ is klinisch in het Europees D. subobscura populaties, waarbij zuidelijke populaties lagere expressieniveaus hebben [19], wat overeenkomt met de respons die wordt waargenomen in onze experimentele evolutiepopulaties. Omdat het geselecteerde haplotypeblok mogelijk gedeeltelijk wordt gehandhaafd in andere populaties, hebben we de diagnostische SNP's getest op klinische variatie. Opmerkelijk is dat populaties van de uiterste uiteinden van de Noord-Amerikaanse cline een klinisch signaal vertonen voor de diagnostische SNP's. Desalniettemin was het signaal gemengd voor minder extreme populaties.

Loci met groot effect die segregeren bij tussenliggende allelfrequenties zorgen voor snelle evolutie

De gecombineerde analyse van transcriptomische en volledige genoom-sequencing-gegevens van een vers verzamelde D. simulans populatie die in een nieuwe thermische omgeving evolueerde, identificeerde twee genen, beide verbonden met AMPK, een centrale metabole schakelaar. Hoewel er veel mogelijkheden zijn over hoe het metabolisme kan worden gereguleerd, suggereert de sterke selectierespons in alle replica's dat twee loci met een groot effect de adaptieve metabole respons in onze populaties aansturen. De waargenomen selectiesignatuur geeft duidelijk aan dat adaptatie in ons E&R-onderzoek [27] wordt gedomineerd door een klein aantal loci met een sterk effect, wat een ander voorbeeld is van snelle adaptatie die wordt aangedreven door enkele loci met groot effect [12,13,14,15, 16].

De twee haplotypes die de metabole omschakeling in onze experimentele populaties aansturen, scheiden bij tussenliggende frequenties in de grondleggerpopulatie en vertonen klinische variatie. Het is dus zeer aannemelijk dat deze genen bijdragen aan vergelijkbare adaptieve processen in natuurlijke populaties, die waarschijnlijk op zeer korte tijdschalen plaatsvinden. Omdat de temperatuur per seizoen varieert, is het mogelijk dat ruimtelijke en temporele heterogeniteit de geselecteerde allelen op een tussenfrequentie in stand houdt D. simulans [10, 24].

Het feit dat weinig loci met groot effect resulteerden in een duidelijke selectiesignatuur in ons experiment, sluit echter niet uit dat verschillende loci met klein effect ook de metabole herbedrading in warme omgevingen beïnvloeden. Toch suggereren onze computersimulaties dat deze twee loci waarschijnlijk meer dan 50% van de fenotypische verandering verklaren, zelfs wanneer loci met kleine effecten ook bijdragen (figuur 4). Eerder was aangetoond dat allelen met een groot effect die bijdragen aan kwantitatieve eigenschappen de snelste selectierespons vertonen, maar met een toenemend aantal generaties worden deze loci weggeconcurreerd omdat allelen met een klein effect geleidelijk in frequentie toenemen [56]. De reden voor het verlies van de allelen met groot effect is dat het gemakkelijker is om genotypen te verkrijgen die dicht bij het fitness-optimum liggen met allelen met klein effect, terwijl allelen met groot effect overshoot kunnen veroorzaken, wat resulteert in extremere fenotypen dan begunstigd door selectie. Daarom zou de analyse van deze experimentele populaties na een langer tijdsinterval zeer informatief kunnen zijn om de dynamiek van adaptieve allelen in natuurlijke populaties te begrijpen.

Aangezien het favoriete allel vast of bijna gefixeerd is in zuidelijke populaties in de VS, zou het interessant zijn om de adaptieve respons in deze populaties te bestuderen. Omdat AMPK waarschijnlijk niet verder zal bijdragen aan adaptatie, zou een dergelijk experiment andere adaptieve signalen kunnen onthullen die in dit onderzoek niet werden gedetecteerd. Zouden dergelijke populaties segregeren voor andere belangrijke allelen of zou een polygene respons worden gedetecteerd?

Volgende stappen

Experimentele evolutie biedt een uitstekend kader voor het experimenteel testen van geselecteerde allelen. Allelische vervangingen met de CRISPR/Cas9-technologie maken de directe vergelijking mogelijk van geselecteerde en niet-geselecteerde allelen in een verder homogene genetische achtergrond. Desalniettemin is de afbeeldingsresolutie in onze studie nog steeds vrij laag. Vervanging van een genomisch gebied van > 10 kb in D. simulans, een soort met een lagere transformatie-efficiëntie dan D. melanogaster, is zeer uitdagend. De volgende stappen zouden dus een verdere nauwkeurige afbeelding van het selectiedoel vereisen. We verwachten dat het toevoegen van chromosomen zonder de geselecteerde allelen tijdens een uitgebreide experimentele evolutie meer kans zal bieden in recombinatie om een ​​kleiner kandidaat-gebied te verkrijgen. Zodra voldoende kleine kandidaatregio's zijn gekloond, zijn er veel vervolgexperimenten denkbaar, variërend van competitie-experimenten van geselecteerde en niet-geselecteerde allelen in een experimentele evolutiesetting tot gedetailleerde biochemische vergelijkingen met behulp van metabolomics, transcriptomics en proteomics.


Achtergrond

Om genetische varianten te identificeren die de gevoeligheid van een verscheidenheid aan ziekten beïnvloeden, genotyperen genoombrede associatiestudies (GWAS) een dichte reeks gemeenschappelijke SNP's (Single Nucleotide Polymorphism) en testen ze allele frequenties bij een cohort van getroffen mensen en niet-aangetaste mensen [1 ]. Traditionele analysemethoden voor GWAS-gegevens beschouwen slechts één SNP per keer en testen de associatie met ziekte. Dit type analysestrategie is alleen geschikt voor eenvoudige Mendeliaanse stoornissen. Sommige veel voorkomende complexe ziekten zoals verschillende soorten kanker, hart- en vaatziekten en diabetes worden beïnvloed door meerdere genetische varianten. Daarom kan het detecteren van hoge-orde epistasie, dat verwijst naar het interactieve effect van twee of meer genetische varianten op complexe menselijke ziekten, helpen te ontrafelen hoe genetische risicofactoren gevoeligheid voor complexe ziekten veroorzaken [2]. Het zeer grote aantal SNP's dat is gecontroleerd in een typische GWAS en het enorme aantal mogelijke SNP-combinaties maakt het detecteren van hoge-orde epistatische interacties van GWAS-gegevens echter rekenkundig uitdagend [3]. Bovendien vormt het meten van de associatie tussen een reeks SNP's en het fenotype een andere grote statistische uitdaging.

In het afgelopen decennium zijn twee soorten heuristische computationele methoden voorgesteld om epistatische interacties te detecteren: op voorspelling/classificatie gebaseerde methoden en op associatie gebaseerde methoden. Op voorspelling/classificatie gebaseerde methoden proberen de beste set SNP's te vinden, die de hoogste voorspelling/classificatienauwkeurigheid kunnen genereren, waaronder bijvoorbeeld multifactor dimensionality reduction (MDR) [4], bestrafte logistische regressie (bijv. stepPLR [5], en lassoPLR [6]), ondersteuning voor vectormachine (SVM) [7] en willekeurig bos [8]. MDR is een niet-parametrische en modelvrije methode gebaseerd op het construeren van een risicotabel voor elke SNP-combinatie [4]. Als de casus- en controleratio in een cel van deze risicotabel groter is dan 1, zal MDR het labelen als "hoog risico", anders "laag risico". Aan de hand van de risicotabel kan MDR het ziekterisico voorspellen en de SNP-combinatie selecteren met de hoogste voorspellingsnauwkeurigheid. StepPLR en lassoPLR brengen enkele wijzigingen aan om de overfitting-problemen te vermijden waaraan standaard logistische regressiemethoden lijden [9] bij het detecteren van epistatische interacties. StepPLR combineert bijvoorbeeld het logistische regressiecriterium met een bestraffing van de L2-norm van de coëfficiënten. Deze wijziging maakt stepPLR robuuster voor epistatische interacties van hoge orde [5]. Twee machine learning-methoden: SVM [7] en random forest [8] zijn ook toegepast voor het detecteren van epistatische interacties. Methoden voor machinaal leren zijn gebaseerd op binaire classificatie (voorspelling) en behandelen gevallen als positieven en controles als negatieven in SNP-gegevens. Ze gebruiken SVM of willekeurig bos als voorspeller en selecteren een set SNP's met de hoogste voorspellings-/classificatienauwkeurigheid door functieselectie. Sommige op voorspelling/classificatie gebaseerde methoden kunnen vanwege hun rekenkundige complexiteit alleen worden toegepast op kleinschalige analyse (d.w.z. een klein aantal SNP's). Bovendien hebben bijna alle op voorspelling/classificatie gebaseerde methoden de neiging om een ​​groot aantal valse positieven te introduceren, wat kan resulteren in enorme kosten voor verdere biologische validatie-experimenten [10].

Bayesiaanse epistasie-associatiemapping (BEAM) is een schaalbare en op associaties gebaseerde methode [11]. Het verdeelt SNP's in drie groepen: groep 0 is voor normale SNP's, groep 1 bevat ziekte-SNP's die het ziekterisico onafhankelijk beïnvloeden, en groep 2 bevat ziekte-SNP's die gezamenlijk bijdragen aan het ziekterisico (interacties). Bij een vaste partitie kan BEAM de posterieure waarschijnlijkheid van deze partitie verkrijgen uit SNP-gegevens op basis van de Bayesiaanse theorie. Een Markov Chain Monte Carlo-methode wordt gebruikt om de optimale SNP-partitie met maximale posterieure waarschijnlijkheid in BEAM te bereiken. Een nadeel van BEAM is dat het gelijktijdig identificeren van zowel SNP- als SNP-combinaties van een enkele ziekte BEAM te complex maakt en de kracht ervan verzwakt.

Onlangs hebben we een nieuwe op Markov-deken gebaseerde methode voorgesteld, DASSO-MB, om epistatische interacties te detecteren in case-control studies [10]. De Markov-deken is een minimale set variabelen, die de doelvariabele volledig kan afschermen van alle andere variabelen op basis van de Markov-voorwaarde-eigenschap [12]. De algemene methoden van Markov kunnen dus de causale ziekte-SNP's detecteren met de minste valse positieven. Bovendien kan de heuristische zoekstrategie in Markov-dekenmethoden het tijdrovende trainingsproces zoals in SVM en willekeurige bossen vermijden. De getrouwheidsaanname in Markov-dekenmethoden, die nauwelijks altijd kan worden gegarandeerd, kan hun toepassingen bij het detecteren van epistatische interacties echter belemmeren [13].

In dit artikel gaan we in op de twee kritieke uitdagingen (kleine steekproefomvang en hoge dimensionaliteit) in epistatische interactiedetectie door een op scores gebaseerde Bayesiaanse netwerkstructuurleermethode te introduceren, EpiBN (Epistatische interactiedetectie met behulp van Bayesian Network-model), die gebruik maakt van een Branch- and-Bound techniek en een nieuwe scoringsfunctie. Bayesiaanse netwerken bieden een beknopte weergave van de gezamenlijke kansverdeling en voorwaardelijke onafhankelijkheid tussen een reeks variabelen. Over het algemeen definieert een op scores gebaseerde structuurleermethode voor Bayesiaanse netwerken eerst een scorefunctie die de geschiktheid tussen elke mogelijke structuur en de waargenomen gegevens weergeeft, en zoekt vervolgens naar een structuur met de maximale score. In vergelijking met de algemene methoden van Markov, zijn de voordelen van het toepassen van op scores gebaseerde Bayesiaanse netwerkstructuurleermethode voor epistatische interactiedetectie: (1) de veronderstelling van trouw kan worden versoepeld en (2) de heuristische zoekmethode kan het klassieke XOR-probleem (exclusief of) oplossen [14]. We passen de EpiBN-methode toe op gesimuleerde datasets op basis van vier ziektemodellen en drie echte datasets: leeftijdsgebonden maculaire degeneratie (AMD) dataset, late-onset ziekte van Alzheimer (LOAD) en autisme dataset. We laten zien dat de voorgestelde methode beter presteert dan sommige veelgebruikte methoden zoals SVM, MDR en BEAM, vooral wanneer het aantal monsters klein is.


Discussie

Onze populatie-epigenetische resultaten, verkregen in de setting van een aangeboren immuniteitscelpopulatie, tonen uitgebreide verschillen in DNA-methylatieprofielen aan tussen twee populaties die verschillen in hun genetische afkomst maar dezelfde huidige omgeving delen. Dergelijke populatieverschillen werden waargenomen op het niveau van het epigenoom

12% van de totale variantie in DNA-methylatie) en betrof 12.050 plaatsen die meestal waren gelokaliseerd in genen met functies die verband houden met celperiferie of immuunresponsregulatie. Eerdere studies hebben gezocht naar voorouderlijke verschillen in DNA-methylatie in verschillende menselijke populaties en celtypen [16, 38,39,40,41, 43, 95]. Hoewel vergelijkingen tussen onderzoeken worden bemoeilijkt door verschillen in experimentele instellingen en statistische drempels die worden gebruikt om voorouders-geassocieerde CpG-sites te detecteren, variëren deze van 299 tussen blanke en Aziatische / gemengde personen die in Canada wonen [16] tot 36.897 tussen Europese CEU en Afrikaanse YRI [39]. Een interessant inzicht dat uit onze analyses kan worden gehaald, is dat genen die betrokken zijn bij de activering en regulatie van immuunresponsen de neiging hebben om hogere niveaus van DNA-methylatie te vertonen bij individuen van Europese afkomst, met betrekking tot die van Afrikaanse afkomst, voornamelijk als gevolg van genetische controle. Dat tot 16% van de immuungerelateerde genen die hypergemethyleerd zijn bij Europeanen ook differentieel tot expressie worden gebracht tussen populaties [48] zou een mechanistische verklaring kunnen zijn voor de afkomstgerelateerde verschillen in transcriptionele reacties op bacteriën die worden gerapporteerd in macrofagen, waar Europese afkomst is geassocieerd met lagere ontstekingsreacties [49].

Hoewel variatie in milieublootstellingen in het verleden en sociaaleconomische factoren kunnen bijdragen aan populatieverschillen in DNA-methylatie, ontdekten we dat 70% van de differentieel gemethyleerde locaties tussen Afrikaanse en Europese voorouders geassocieerd waren met ten minste één meQTL. Dit geeft aan dat populatieverschillen in DNA-methylatie meestal worden aangedreven door varianten van de DNA-sequentie [38, 40,41,42]. In sommige gevallen kan een enkele genetische variant verantwoordelijk zijn voor belangrijke populatieverschillen op meerdere CpG-locaties, zoals blijkt uit de trans-meQTL die we hebben gedetecteerd op CTCF, waarvan is aangetoond dat lokale genetische variatie verre DNA-methylatiepatronen in volbloed verandert [65]. We laten zien dat een CTCF variant (rs7203742) reguleert DNA-methylatie van 30 ver verwijderde CpG's, waarvan 40% differentieel gemethyleerd is tussen populaties. Dat vonden we ook allemaal CTCF-trans-gereguleerde CpG's vallen binnen een TFBS, wat onze initiële hypothese bevestigt over het mechanisme waarmee een genetische variant DNA-methylatie op een verre CpG-site zou kunnen veranderen. Interessant is dat 9 van de 30 CTCF-trans-gereguleerde CpG's vallen binnen een TFBS van CTCF, terwijl de overige 21 vallen binnen een TFBS die specifiek is voor andere TF's, zoals: YY1, ESR1, of ZNF143. Deze waarneming is consistent met een model van pionierstranscriptiefactoractiviteit [96] en suggereert dat: CTCF fungeert als een pioniersfactor die veranderingen in de chromatinetoestand zal genereren die op zijn beurt toegankelijk zullen worden voor binding van secundaire factoren.

Op genoombreed niveau vinden we dat de kwantitatieve impact van DNA-methylatie op genexpressievariatie lager is dan die gerapporteerd door sommige eerdere studies, mogelijk als gevolg van verschillen in experimentele instellingen en statistische power (bijv. celtypes en steekproefgroottes) [23] , 65, 84, 89]. Een studie van 204 gezonde pasgeborenen ontdekte bijvoorbeeld substantiële variatie tussen weefsels in het aantal genen waarvan de expressieniveaus geassocieerd waren met DNA-methylatie, variërend van 596 in fibroblasten tot 3838 in T-cellen [23]. We ontdekten, in de niet-gestimuleerde toestand, 811 eQTM-genen (6% van het totale aantal tot expressie gebrachte genen), een cijfer dat daalt tot 230 voor reQTM-genen in stimulatiecondities. Een beperking van onze studie is echter dat we DNA-methylatie in de basale toestand hebben gemeten, terwijl genexpressie na 6 uur werd verkregen. Er is onderzoek nodig met een uitgebreidere reeks epigenetische kenmerken die op verschillende tijdstippen zijn verkregen - in verschillende celtypen en weefsels afkomstig van individuen van verschillende voorouders - om de wisselwerking tussen deze regulerende elementen nauwkeuriger te begrijpen en hun respectieve rollen in de regulatie van transcriptionele werkzaamheid.

De gedetecteerde eQTM's bleken drastisch verrijkt te zijn in genetische controle (OR

33.2, P < 1 × 10 −326, Fig. 3c), die de gecoördineerde actie van genetische en epigenetische factoren bij het aansturen van genexpressievariatie benadrukt, maar vragen oproept over de causale rol van DNA-methylatie [56]. Ondanks dat een voorzichtige interpretatie van causaliteit in bemiddelingsanalyses vereist is [97], geeft onze analyse een eerste schatting van de mogelijke directe rol van DNA-methylatie bij het reguleren van transcriptionele activiteit, zowel in rustende als gestimuleerde monocyten. In de niet-gestimuleerde toestand vinden we dat:

20% van de eQTM-genen tonen bewijs van een causaal mediatie-effect van DNA-methylatie. Hoewel een vergelijkbare mate van mediatie werd gevonden bij immuunstimulatie (

17%), ontdekten we specifieke patronen bij behandeling met virale uitdagingen, waarbij een hoger voorkomen van positieve associaties werd waargenomen bij gemedieerde gevallen. Deze bevindingen weerspiegelden meestal gevallen waarin hoge niveaus van DNA-methylatie geassocieerd waren met lage genexpressie in de niet-gestimuleerde toestand, waardoor sterkere reacties nodig waren om hoge niveaus van genexpressie te bereiken bij celverstoring. Deze trends suggereren een belangrijke, directe en contextspecifieke rol van DNA-methylatie bij de regulatie van immuunresponsen, waarvan de complexiteit nader onderzoek vereist.

Ten slotte ontdekten we dat meQTL's, in het bijzonder die geassocieerd met voorouderlijke verschillen, verrijkt zijn in GWAS-hits die verband houden met immuunstoornissen. Dit suggereert dat DNA-methylatie een belangrijke invloed heeft op de cellulaire activiteit van monocyten en uiteindelijk de fenotypische uitkomsten beïnvloedt. Niettemin blijft een groot deel van de variantie van DNA-methylatie en genexpressie onverklaard. Er is aanvullend werk nodig om de relatieve impact te kwantificeren van genetische, epigenetische, omgevings- en levensstijlfactoren bij het aansturen van variatie van DNA-methylatie en genexpressie, zowel in rustende als gestimuleerde cellen. Bovendien, hoewel de causale bemiddelingsanalyses die in deze studie worden gepresenteerd, het idee versterken dat DNA-methylatie een directe rol kan spelen bij het reguleren van genexpressie bij mensen [23, 98], is het monitoren van de kinetiek van variatie in DNA-methylatie en genexpressie na blootstelling aan verschillende infectieuze agenten zullen ons begrip van het samenspel tussen deze moleculaire fenotypes en hun impact op eindpuntfenotypes verbreden.


Conclusie

Met de combinatie van biochemie, spiercelbiologie en het gebruik van het modelleren van dieren, heeft moleculair genetische informatie licht geworpen op het begrijpen van het pathomechanisme van spierdystrofieën. Zoals besproken, lijkt primaire genetische of secundaire functionele verstoring van de matrix-plasmamembraankoppeling de oorzaak te zijn van verschillende vormen van spierdystrofieën. De mechanische eigenschap van skeletspieren wordt in stand gehouden door contractiele elementen en elastische elementen, die respectievelijk worden geleverd door het sarcomeer en de extracellulaire matrix. Bovendien wordt de laterale overdracht van de contractiele kracht gemedieerd door matrix-receptor-interactie. Dus, gebaseerd op het feit dat de matrix-cytoskelet-koppeling een sleutel is voor het behoud van de skeletspierfunctie, zijn er verschillende therapeutische strategieën voorgesteld zoals geïntroduceerd in deze review en door anderen. Hopelijk zullen dergelijke benaderingen bijdragen aan een beter begrip van de etiologie van de ziekte en leiden tot geschikte therapeutische strategieën om spierdystrofieën te behandelen.


Conclusies

PCWDE's die oorspronkelijk door kevers werden verkregen uit bacteriën en schimmels via HGT, maakten een efficiënte symbiont-onafhankelijke vertering van plantaardige biomassa mogelijk, de meest voorkomende bron van koolhydraten op aarde. We stellen voor dat deze belangrijke innovatie de evolutie van unieke gespecialiseerde voedingsgewoonten voor planten mogelijk maakte, zoals blad- en zaadwinning en het boren van stengels en hout, en waarschijnlijk ook enkele vormen van gespecialiseerde schimmelvoeding, bijvoorbeeld schimmelteelt in Platypodinae en Scolytinae (67) . Hoewel dit onzeker blijft, zijn het uiterlijk en de uitbreidingen van vermeende PCWDE's en invertasen in kevergenomen gecorreleerd met een significante toename van de diversificatiesnelheid onder gespecialiseerde herbivore kevers (Buprestoidea en Phytophaga). Onze bevindingen kunnen helpen bij het verklaren van de ongelijkheid in de mate van voedingsspecialisatie en soortenrijkdom die is waargenomen bij groepen herbivore kevers die een divers repertoire van PCWDE's bezitten of missen, evenals het bestaan ​​van groepen kevers die zich voeden met planten (met name met inbegrip van angiospermen) maar zijn niet ongewoon soortenrijk. PCWDE's die oorspronkelijk via HGT werden verkregen, speelden waarschijnlijk een belangrijke rol bij de adaptieve straling van andere groepen herbivore insecten, bijvoorbeeld bepaalde Lepidoptera en Hemiptera, die ten minste enkele van deze genfamilies hebben (8, 14, 68).

De buitengewone diversiteit aan kevers lijkt dus het gevolg te zijn van meerdere factoren, waaronder een lage mate van uitsterving van de afstamming gedurende een lange evolutionaire geschiedenis (2, 5), codiversificatie met angiospermen (2) en de adaptieve straling van gespecialiseerde herbivore kevers die convergerende horizontale overdrachten (en "domesticatie") van microbiële genen die coderen voor PCWDE's. More broadly, our findings show how large-scale genomic data can reveal new insights into the evolution and genomic basis of insect biodiversity and underscore the intimacy and complexity of the relationships between insects, plants, and microorganisms, as well as their concerted roles in the “origins of terrestrial organic diversity” (60).


Dankbetuigingen

We thank Dr. Karsten Zengler and Marc Abrams for reviewing the manuscript and providing constructive suggestions. This work was supported by NIH Grants AI124316 and GM057089, and Novo Nordisk Foundation Grant NNF10CC1016517. We are grateful to Drs. Rebecca Lindsey, Nancy Strockbine, Shi Chen, Sang Jun Lee, Dana Boyd, Mehmet Berkmen, Henning Sørum, David Rozak, Shannon Lyn Johnson, Craig Winstanely, Roger Johnson, and Weihua Huang for generously providing bacterial strains for this study.


Bekijk de video: Examen biologie - Genotype en fenotype Erfelijkheid (December 2021).