Informatie

Asymmetrische vulkaanplot


Bijna alle vulkaanplots die ik heb gezien, zijn meestal ongeveer symmetrisch rond de y-as, met een redelijk gelijk aantal opwaartse en neerwaartse gereguleerde genen. Wat zijn de mogelijke redenen voor een vulkaanplot dat zwaar uit balans is (d.w.z. veel meer negatieve vouwveranderingsgenen dan positieve)?

In mijn analyse heb ik twee patiëntenpopulaties geïdentificeerd binnen een ziektecohort, die de subpopulaties "interferon hoog" en "interferon laag" vertegenwoordigen. Vervolgens bereken ik de differentiële expressie tussen deze groepen en visualiseer ik de resultaten met een vulkaanplot (log(p-waarde) van differentiële expressie vs. log(fold change)). De vulkaanplot is vrij asymmetrisch, met een maximale log2-voudige verandering van 1 aan het positieve uiteinde en een minimale log2-voudige verandering van -3 aan het negatieve uiteinde, met veel meer genen die significant naar beneden zijn gereguleerd in de IFN-lage populatie.

Is het redelijk om te veronderstellen dat er veel genen opwaarts gereguleerd zijn in IFN-hoog, zonder neerwaarts gereguleerde genen die deze populatie definiëren, of is er iets anders aan de hand?


Ik heb geen ervaring met de analyse van zoogdierexpressie, maar ik heb deze asymmetrische plots nogal eens gezien toen cellen zeer gestrest waren. Tijdens één behandeling stopten ze de eiwitbiosynthese en fotosynthese, zodat het aantal gedownreguleerde genen veel groter was dan de weinige genen die betrokken waren bij de aanpassingsreactie. Ik weet niet of er iets soortgelijks kan gebeuren in uw monsters?


Invoering

Vulkaanplots worden vaak gebruikt om de resultaten van RNA -seq of andere omics-experimenten weer te geven. Een vulkaanplot is een soort spreidingsdiagram dat statistische significantie (P-waarde) weergeeft ten opzichte van de grootte van de verandering (voudige verandering). Het maakt snelle visuele identificatie mogelijk van genen met grote vouwveranderingen die ook statistisch significant zijn. Dit kunnen de biologisch meest significante genen zijn. In een vulkaanplot zijn de meest opgereguleerde genen naar rechts, de meest naar beneden gereguleerde genen naar links en de meest statistisch significante genen naar de top.

Om een ​​vulkaanplot van RNA -seq-resultaten te genereren, hebben we een bestand met differentieel uitgedrukte resultaten nodig dat hier voor u wordt verstrekt. Om dit bestand zelf te genereren, zie de RNA -seq counts to genes tutorial. Het hier gebruikte bestand is gegenereerd op basis van limma-voom, maar u kunt een bestand gebruiken van elk RNA -seq differentieel expressiehulpmiddel, zoals edgeR of DESeq2, zolang het de vereiste kolommen heeft (zie hieronder).

De gegevens voor deze tutorial komen uit een Nature Cell Biology-paper, EGF-gemedieerde inductie van Mcl-1 bij de overgang naar borstvoeding is essentieel voor overleving van alveolaire cellen), Fu et al. 2015. Deze studie onderzocht de expressieprofielen van basale en luminale cellen in de borstklier van maagdelijke, zwangere en zogende muizen. Hier zullen we de resultaten visualiseren van de luminale zwangerschap versus lacterende vergelijking.

Agenda


Inhoud

Er is een alternatieve definitie van vouwverandering, [ citaat nodig ] hoewel dit over het algemeen buiten gebruik is geraakt. Hier wordt vouwverandering gedefinieerd als de verhouding van het verschil tussen de eindwaarde en de beginwaarde gedeeld door de beginwaarde. Voor hoeveelheden EEN en B, wordt de vouwverandering gegeven als (BEEN)/EEN, of gelijkwaardig B/EEN − 1. Deze formulering heeft aansprekende eigenschappen zoals geen verandering gelijk is aan nul, een 100% toename is gelijk aan 1, en een 100% afname is gelijk aan −1. Echter, verbaal verwijzen naar een verdubbeling als een eenvoudige verandering en een verdrievoudiging als een tweevoudige verandering is contra-intuïtief, en daarom wordt deze formulering zelden gebruikt.

Deze formulering wordt soms de relatieve verandering genoemd en wordt aangeduid als: fractioneel verschil in het softwarepakket Prism. [8]

Op het gebied van genomica (en meer in het algemeen in bio-informatica), is het moderne gebruik om vouwverandering te definiëren in termen van verhoudingen, en niet door de alternatieve definitie. [9] [10]


Resultaten

Brassica rapa embryo's worden gehypermethyleerd in de CHH-context

Om globale methylatieniveaus in volwassen embryo's te analyseren, hebben we bisulfietsequencing van het hele genoom uitgevoerd op embryo's die uit droge zaden zijn ontleed en de resulterende gegevens vergeleken met andere reproductieve weefsels (eicel, endosperm en vroeg embryo) en een niet-reproductieve controle (blad). Bisulfietconversie was in alle monsters groter dan 99%, met een leesdiepte van > 9 (aanvullend bestand 1: Fig. S1). We berekenden methylering in niet-overlappende vensters van 300 bp voor alle drie de sequentiecontexten (figuur 1a). CG-methylering was grotendeels onveranderd in de weefsels, met uitzondering van endosperm, dat gedemethyleerd was in CG- en CHG-contexten, consistent met de waarnemingen in Arabidopsis en rijst [33,34,35]. Als in Arabidopsis, sojabonen en kikkererwten [22,23,24,25,26,27], zagen we ook verhoogde wereldwijde CHH-methylering in B. rapa rijpe embryo's, met matig verhoogde CHH-methylering in embryo's in torpedostadium (Fig. 1a en Aanvullend bestand 1: Fig. S1). De verhoogde CHH-methylering in embryo's in het torpedostadium was gecorreleerd met CHH-hypermethylering in rijpe embryo's (Fig. 1b, correlatiecoëfficiënt = 0, 6), wat aangeeft dat hypermethylering een geleidelijk proces is tijdens embryogenese.

B. rapa embryo's worden gehypermethyleerd op CHH-plaatsen. een Verdeling van methyleringsniveaus in vensters van 300 nt over de B. rapa genoom. Randplots geven de dichtheid van de gemiddelde methylering in elke context weer, terwijl achtergrondboxplots de 10e tot 90e percentielen van de gegevens omsluiten. De zwarte balk markeert de mediaan voor elke weefsel/context-combinatie. Alleen vensters met een leesdiepte ≥ 5 over alle cytosines werden opgenomen (ongeveer 1 miljoen vensters per weefsel/context-combinatie). B Verhoogde CHH-methylering (log2 vouwverandering ten opzichte van bladeren) is gecorreleerd in torpedo en volwassen embryo's 752.405 300-nt vensters met een leesdiepte van ten minste 5 in beide weefsels zijn uitgezet

Om de soorten chromatine te beoordelen die verantwoordelijk zijn voor embryo-hypermethylering, analyseerden we methylatieniveaus in vensters van 25 kb over elk chromosoom (Fig. 2a en Aanvullend bestand 1: Fig. S2). Pericentromeer heterochromatine, dat een dichtere accumulatie van transposons heeft, was sterk gemethyleerd in CG- en CHG-contexten in alle weefsels. De enige uitzondering was endosperm, dat zoals verwacht een kleine vermindering van CG-methylering en sterker verlies van CHG-methylering liet zien. In vergelijking met deze heterochromatische markeringen was CHH-methylering gelijkmatiger verdeeld over de lengte van het chromosoom. Verhoogde CHH-methylering in rijpe embryo's ten opzichte van andere weefsels was direct duidelijk. In Arabidopsis, embryo-hypermethylering vond voornamelijk plaats in pericentromeer heterochromatine [22, 23], terwijl in somatische embryo's van soja CHH-hypermethylering werd gezien over het genoom [27]. We hebben een vergelijkbare mate van CHH-hypermethylering waargenomen in zowel de CG-dichte pericentromere regio's als de chromosoomarmen (Fig. 2b), wat aangeeft dat zowel heterochromatine als euchromatine doelen zijn van CHH-methylatie tijdens B. rapa embryonale ontwikkeling.

Embryo CHH hypermethylering is niet beperkt tot het pericentromeer. een Heatmaps van transposondichtheid of methylatieniveau in vensters van 25 kb over chromosoom 10. Elke methyleringscontext heeft zijn eigen schaalbalk om veranderingen in weefsels te visualiseren. Andere chromosomen worden gepresenteerd in aanvullend bestand 1: Fig. S2. B CHH-hypermethylering in rijpe embryo's (groene lijn) is niet gecorreleerd met de hoeveelheid CG-methylering in bladeren (paarse lijn). Vijf-venster voortschrijdend gemiddelde van 25-kb vensters over chromosoom 10 zijn uitgezet

Ten slotte hebben we embryo-methylatie beoordeeld ten opzichte van blad voor elke cytosine-context binnen elk 300-nt-venster. De meeste vensters waren onveranderd met betrekking tot CG- en CHG-methylering, terwijl CHH-methylering een uitgesproken verschuiving naar hypermethylering vertoonde (figuur 3a). Deze veranderingen waren zeer significant (Fig. 3b), maar we selecteerden alleen vensters met de sterkste veranderingen in methylering voor verdere analyse. We hebben differentieel gemethyleerde vensters (DMW's) gedefinieerd als die met ten minste 5-voudige (log2 = 2,32) toename of afname van methylering in volwassen embryo in vergelijking met blad, en een FDR aangepast P waarde kleiner dan 0,005 (afb. 3a, b, aanvullend bestand 1: afb. S3). Gehypermethyleerde vensters waren overvloediger dan gehypomethyleerde vensters voor elke sequentiecontext, waarbij CHH hyper-DMW's veel groter waren dan andere DMW's in andere sequentiecontexten (Fig. 3c).

Identificatie van embryo differentieel gemethyleerde ramen. Dichtheidsverdelingen (een) en vulkaanplots (B) van methyleringsvouwverandering in rijpe embryo's versus blad voor drie cytosinecontexten 300-nt-vensters met een leesdiepte van ten minste 5 zijn uitgezet (650.665 CG, 686.741 CHG en 869.526 CHH-vensters). De gestippelde blauwe lijn markeert 5-voudige hypomethylering en de gestippelde groene lijn markeert 5-voudige hypermethylering. Windows boven deze drempel met een FDR-aangepast P waarde <0,005 werden verzameld voor daaropvolgende DMW-analyse. C Aantal differentieel gemethyleerde vensters (DMW's) die de bovenstaande drempels passeren in elke methyleringscontext

Samen tonen onze observaties aan dat volwassen B. rapa embryo's worden uitgebreid gehypermethyleerd op CHH-plaatsen in het genoom, en deze hypermethylering is het belangrijkste verschil tussen de methyleringspatronen van bladeren en embryo's. Deze hypermethylering is wijdverbreid, niet beperkt tot pericentromere heterochromatine, en progressief gedurende de embryogenese.

Embryo CHH hypermethylering is afhankelijk van RdDM

RdDM is de belangrijkste route voor de novo methylering in alle sequentiecontexten, en de activiteit ervan wordt vaak waargenomen door de accumulatie van CHH-methylering. Het grootste deel van de CHH-methylering in het genoom wordt in plaats daarvan geplaatst door CHROMOMETHYLTRANSFERASE 2 (CMT2) [18, 36]. Kawakatsu en collega's [23] toonden aan dat zowel RdDM als CMT2 bijdragen aan CHH-methylering in het embryo, maar hun analyse bepaalde niet welk proces verantwoordelijk was voor de hypermethylering ten opzichte van niet-embryonale weefsels. Kleine RNA-accumulatie op hypergemethyleerde gebieden is gecorreleerd met embryo-hypermethylering [22, 24, 26], maar het is niet duidelijk of siRNA-accumulatie vereist is voor verhoogde methylering, of dat deze twee processen onafhankelijk plaatsvinden.

Onze analyse impliceert ook RdDM bij embryo-CHH-hypermethylering. Ten eerste, vergeleken met alle genomische vensters met voldoende WGBS-leesdiepte, zijn embryo CHH hyper-DMW's significant verrijkt voor klasse II DNA-elementen en klasse III Helitrons (Fig. 4a). CHH hyper-DMW's zijn ook significant uitgeput bij genen en bij long terminal repeat (LTR) retro-elementen, volgens het karakteristieke patroon van RdDM-loci in B. rapa [19]. Het belangrijkste is dat CHH hyper-DMW's verrijkt zijn voor loci waarvan eerder is aangetoond dat ze 24-nt siRNA's produceren (Fig. 4a).

kleine RNA-productie is gecorreleerd met embryo-hypermethylering, maar niet met hypomethylering in bladeren. een Verrijking of uitputting van genomische kenmerken bij CHH hyper-DMW's. Het percentage CHH hyper-DMW's overlappende geannoteerde genomische kenmerken is uitgezet in vergelijking met het percentage overlap voor alle genomische vensters met vergelijkbare leesdiepte. Alle verschillen zijn significant bij P<2.2e−16. B, NS CHH hyper-DMW's en alle genomische vensters werden weggegooid op basis van het aantal sRNA's dat erop is toegewezen in torpedo-embryo's of bladeren, en de fractie van vensters in elke bak wordt getoond. De embryo-sRNA-bibliotheek heeft 39,1 miljoen toegewezen reads, terwijl de leaf-bibliotheek 10,8 miljoen reads heeft. C Absolute CHH-methylering in rijpe embryo's wordt uitgezet als een functie van het aantal in kaart gebrachte sRNA's in torpedo-embryo's bij alle CHH-hyper-DMW's. Boxplots omschrijven de 10e-90e percentielen en de zwarte balk markeert de mediaan

Om de associatie tussen CHH hyper-DMW's en siRNA's verder te onderzoeken, analyseerden we siRNA-accumulatie bij CHH hyper-DMW's in embryo's in torpedostadium (aanvullend bestand 1: Fig. S2). CHH hyper-DMW's hebben een significant hogere accumulatie van siRNA's dan het genoom als geheel (Fig. 4b), en vensters met grotere siRNA-accumulatie in torpedo-embryo's hebben een hogere CHH-methylering in volwassen embryo's (Fig. 4c). Veel CHH-hyper-DMW's missen echter substantiële siRNA-accumulatie, een patroon dat ook wordt gedetecteerd in kikkererwten [26]. We hebben ook een vergelijkbare verrijking van siRNA's waargenomen bij CHH hyper-DMW's in bladeren ondanks het 5-voudige of grotere verschil in methylering tussen deze weefsels (figuur 4d). Dit suggereert dat hoewel de productie van 24-nt siRNA's geassocieerd is met embryo-hypermethylering, vergelijkbare 24-nt siRNA-accumulatie in bladeren niet resulteert in vergelijkbare hypermethylering.

Om direct te testen of RdDM nodig is voor embryo-hypermethylering in B. rapa, we hebben de verschillen in methylatieniveaus bij CHH hyper-DMW's tussen wildtype en een RdDM-deficiënte mutant getest, behaA.rdr2-2 (rdr2 hierna) (Grover et al. [19]). Volwassen rdr2 embryo's hebben een duidelijke vermindering van CHH- en CHG-methylatie in vergelijking met wildtype embryo's (Fig. 5a, b), met CHH-methylatieniveaus vergelijkbaar met wildtype bladeren. Daarentegen is CG-methylering bij deze CHH-hyper-DMW's rdr2-onafhankelijk. We vergeleken ook WT en rdr2 methylering op individuele loci (figuur 5c). Meer dan 80% van de CHH-hyper-DMW's verliest ten minste de helft van hun methylering in de rdr2 mutant, wat aantoont dat embryo-hypermethylering in de CHH-context voornamelijk te wijten is aan RdDM, en dat andere methyleringsroutes slechts een kleine bijdrage leveren aan embryo-CHH-hypermethylering.

Embryohypermethylering wordt bepaald door het kindergenotype. een Verdeling van CHH-methylatie bij CHH hyper-DMW's in bladeren en volwassen embryo's. rdr2 embryo's zijn afgeleid van ofwel rdr2 homozygote moeders (kastanjebruin) of uit rdr2/+ heterozygote moeders (paars). B Cartoon en afbeeldingen van representatieve zaden gemeten in (een). Gekleurde weefsels hebben functionele RdDM grijze weefsels hebben een tekort aan RDR2. Schaalbalk is 5 mm. C Hex plots van volwassen embryo CHH methylatie verandering door torpedo-stadium endosperm CG (links) of CHG (rechts) methylering. NS siRNA-accumulatie in endosperm bij CHH hyper-DMW's. De endosperm-siRNA-bibliotheek heeft 19,6 miljoen toegewezen reads

Geen bewijs voor endosperm-gerichte hypermethylering van het embryo

Er is gesuggereerd dat demethylering van het endosperm de productie van siRNA's mogelijk maakt die gericht zijn op DNA-methylering in het embryo [22, 28,29,30]. Om te bepalen of er een verband is tussen endosperm-demethylering en embryo-hypermethylering, vergeleken we de veranderingen in methyleringsniveaus in deze weefsels. In vergelijking met bladmonsters is endosperm gedemethyleerd voor zowel CG als CHG, terwijl embryo's worden gehypermethyleerd voor CHH (figuur 1a). Er is echter geen correlatie tussen CG- of CHG-demethylering in het endosperm en CHH-hypermethylering in het embryo, of we nu alle genomische vensters hebben beoordeeld (Fig. 5d) of alleen de CHH hyper-DMW's (Aanvullend bestand 1: Fig. S4). We hebben correlaties tussen embryo- en endosperm-methylatie op meerdere manieren gemeten, zowel wereldwijd als bij CHH hyper-DMW's (aanvullend bestand 1: Fig. S3). Absolute CHH-methylatie in het embryo is positief gecorreleerd met alle methyleringscontexten in het endosperm, wat aangeeft dat de embryo-gehypermethyleerde loci de neiging hebben om hogere absolute methylatie in het endosperm te hebben. Wanneer vouwverandering in methylering ten opzichte van bladmonsters wordt gemeten, is alleen CHH-methylering gecorreleerd tussen deze weefsels, wat aangeeft dat ongeacht hun absolute methyleringsniveau, de kinderweefsels de CHH-methylering gecoördineerd verhogen. Alleen wanneer we het verschil in absolute methylering als maatstaf gebruiken, vinden we een correlatie tussen endosperm-CG/CHG-demethylering en embryo-CHH-hypermethylering. Deze correlatie is echter niet sterk en wordt zwakker wanneer alleen de CHH-hyper-DMW's worden beoordeeld. Samen suggereren deze resultaten dat, hoewel vergelijkbare loci kunnen worden gedemethyleerd in endosperm en gehypermethyleerd in embryo's, er geen bewijs is dat demethylering van endosperm hypermethylering van embryo's in embryo's veroorzaakt. B. rapa.

Omdat het veronderstelde mechanisme waarbij endosperm-demethylering embryo-hypermethylering veroorzaakt, transport van siRNA's is, hebben we ook de siRNA-productie bij CHH hyper-DMW's bij het ontwikkelen van endosperm beoordeeld (Fig. 5e). CHH hyper-DMW's produceren meer siRNA's dan het genoom als geheel, maar op een niveau dat vergelijkbaar is met het ontwikkelen van embryo's of bladeren (Fig. 4b, d), wat suggereert dat siRNA-productie bij deze vensters consistent over weefsels plaatsvindt en geen reactie is tot endosperm demethylering. Over het algemeen vinden we geen bewijs dat demethylering van het endosperm de productie van siRNA op gang brengt om hypermethylering van het rijpe embryo te veroorzaken.

Maternale sporofytische RdDM is niet voldoende voor embryo-hypermethylering

RdDM-mutanten in Capsella rubella en Brassica rapa laten een hoge mate van zaadabortie zien die afhankelijk is van het maternale somatische genotype in plaats van het kinderlijke genotype [19, 37]. De weinige zaden die worden geproduceerd uit rdr2 planten zijn kleiner en onregelmatig van grootte en vorm (Fig. 5b). Omdat een functionele RdDM-route in de maternale sporofyt vereist is voor zaadontwikkeling, veronderstelden we dat maternale sporofytische RdDM hypermethylering van het zich ontwikkelende embryo zou kunnen veroorzaken. Om deze hypothese te testen, bestoven we heterozygoot (rdr2/RDR2) stampers met homozygoot (rdr2/rdr2) stuifmeel en geïdentificeerd rdr2 embryo's die zich ontwikkelden in de aanwezigheid van functionele maternale sporofytische RdDM. Vergeleken met methyleringsniveaus van rdr2 gemuteerde embryo's van homozygote gemuteerde moeders (rdr2/rdr2), hebben we het herstel van embryo-CHH-hypermethylering niet waargenomen (Fig. 5a, b).

Om de mogelijkheid verder te onderzoeken dat maternale sporofytisch afgeleide siRNA's hypermethylering van het embryo zouden kunnen veroorzaken, hebben we DNA-methylatieniveaus beoordeeld op eerder gedefinieerde "sirene" loci [31]. Deze loci produceerden meer dan 90% van de 24-nt siRNA's in maternale integumenten en zijn ook de meest tot expressie gebrachte siRNA-loci in het endosperm. We hebben geen bewijs gevonden dat siRNA's geproduceerd door sirene loci in het integument DNA-methylatie in rdr2 embryo's (Aanvullend bestand 1: Fig. S5). Deze resultaten geven aan dat hoewel siRNA-productie in de maternale sporofyt noodzakelijk is voor zaadontwikkeling, het niet voldoende is voor embryo-hypermethylering.

Samen leveren deze waarnemingen geen bewijs dat embryo-hypermethylering wordt aangestuurd door siRNA's uit een ander weefsel. Gecombineerd met de observatie dat embryo's gevormd door somatische embryogenese ook verhoogde DNA-methylatie hebben ondanks hun gebrek aan interactie met endosperm of integumenten, concluderen we dat embryo-hypermethylatie autonoom wordt gestuurd.


Discussie

We presenteren wat, voor zover wij weten, de eerste uitgebreide functionele identificatie is van genen die de fenotypische gevolgen van het verlies of de winst van een volledig chromosoom veroorzaken. We ontwikkelden een hiërarchische CRISPR-screeningaanpak, waarmee we een groot aantal genen konden profileren met betrekking tot meerdere fenotypes die verband houden met geslachtsverschillen in mESC's op een onbevooroordeelde manier. In een eerste X-chromosoom-breed scherm identificeerden we een reeks kandidaatgenen, die vervolgens verder werden gekarakteriseerd voor een rol bij het moduleren van drie extra moleculaire fenotypes. Op deze manier identificeerden we verschillende genen die mogelijk X-chromosomale doseringseffecten mediëren en karakteriseerden we de twee sterkste kandidaten in meer detail, namelijk Dusp9 en Klhl13. Door CRISPR-gemedieerde overexpressie in mannelijke en knock-out of knock-down in vrouwelijke cellen, laten we zien dat deze twee genen bijdragen aan gedeeltelijk overlappende, maar toch verschillende aspecten van het door X-dosering geïnduceerde fenotype en dat ze lijken samen te werken met extra factoren. De X-doseringsafhankelijke effecten in pluripotente cellen kunnen dus niet worden toegeschreven aan een enkel X-gebonden gen, maar komen voort uit een complex samenspel van meerdere factoren.

Dusp9 is een fosfatase dat de MAPK-route tussenproduct Erk defosforyleert en is dus een bekende negatieve regulator van de route [35]. In overeenstemming met eerdere rapporten, vonden we dat Dusp9 gain-of-function verstoringen in mannelijke cellen de feedbacksterkte en doelgenexpressie veranderen [25, 63], terwijl verwijdering van één kopie van Dusp9 in vrouwelijke cellen resulteert in het tegenovergestelde fenotype. Bovendien bevestigden we de eerder gerapporteerde veranderingen in wereldwijde DNA-methylatieniveaus, maar de omvang van de effecten was minder uitgesproken in onze studie, misschien als gevolg van verschillen in de cellijnen, kweekomstandigheden en gebruikte methylatietest [25]. Dusp9 had ook een sterke invloed op de expressie en differentiatie van pluripotentiefactoren in de gain-of-function-experimenten, wat consistent is met een eerder rapport [25]. We hebben echter slechts marginale effecten waargenomen in de vrouwelijke heterozygote Dusp9-mutante cellen, opnieuw in overeenstemming met een andere studie [12], die echter aanzienlijk sterker waren, wanneer beide kopieën van het gen werden gemuteerd of uitgeschakeld.

Voor Dusp9 hebben we dus een sterk fenotype waargenomen in het gain-of-function-experiment in mannelijke cellen en het tegenovergestelde, zij het veel zwakker fenotype bij functieverlies in vrouwelijke cellen. Intrigerend genoeg vonden we het tegenovergestelde patroon voor Klhl13, de tweede factor die we in detail hebben onderzocht. Hier had de verstoring van de functiewinst slechts kleine effecten, terwijl functieverlies leidde tot een toename van MAPK-doelgenexpressie en een afname voor pluripotentiefactoren, wat zelfs meer uitgesproken was dan de effecten die werden waargenomen voor Dusp9. Deze asymmetrie tussen de gain- en loss-of-function-verstoringen blijft raadselachtig en kan wijzen op complexere interacties tussen meerdere X-chromosomale factoren.

Klhl13 is een substraatadaptereiwit van het Cul3 E3 ubiquitine-ligasecomplex [45] en is, voor zover wij weten, nog niet betrokken bij pluripotentie, signalering of X-doseringseffecten. In plaats daarvan is gemeld dat het betrokken is bij mitotische progressie door zich te richten op Aurora-kinase B in Hela-cellen [45]. We konden echter zonder problemen mutante ES-cellen met een normaal karyotype genereren, wat een andere functie voor Klhl13 in ES-cellen suggereert. Hoewel Klhl13 de fosforylering van de MAPK-route tussenproduct Mek niet beïnvloedde, ontdekten we dat knock-out van slechts één kopie van het gen resulteerde in een substantiële toename van MAPK-doelwitgenexpressie, een vermindering van pluripotentiefactoren en efficiëntere differentiatie.

We veronderstelden dat een eiwit, dat het doelwit is van proteasomale afbraak door Klhl13-afhankelijke ubiquitinylering, het Klhl13-fenotype zou kunnen mediëren. We identificeerden daarom Klhl13-interagerende eiwitten die werden opgereguleerd na Klhl13-deletie. Hoewel geen van de vijf geïdentificeerde eiwitten het Klhl13-fenotype volledig kon recapituleren, zouden twee van hen, Peg10 en Larp1, een bijdrage kunnen leveren. Peg10 is een bekend oncogen en er is aangetoond dat het een interactie aangaat met Nanog en Oct4 in menselijke kankercellen [64, 65], en men denkt dat Larp1 de translatie stroomafwaarts van de mTor-route reguleert [66]. Identificatie van E3-ubiquitine-ligase-doelwiteiwitten is ook eerder gemeld als een uitdaging, waarschijnlijk vanwege de voorbijgaande aard van de interacties en de snelle doelafbraak [67]. Bovendien hebben ze meestal honderden substraten, zodat het Klhl13-fenotype een gecombineerd effect van meerdere doeleiwitten kan zijn. Een andere mogelijkheid is dat ubiquitinylering mogelijk niet leidt tot afbraak, maar in plaats daarvan als een signaaleenheid zou kunnen functioneren [68, 69]. De Klhl13-interactiepartners die we hebben geïdentificeerd die niet differentieel tot expressie werden gebracht in Klhl13-mutante cellen, zouden daarom verder onderzoek kunnen rechtvaardigen.

Wat de gebeurtenissen stroomafwaarts van Klhl13 ook mogen zijn, of de resultaten laten duidelijk zien dat veranderingen in Mek-fosforylering volledig kunnen worden toegeschreven aan Dusp9, terwijl Klhl13 de belangrijkste regulator lijkt te zijn die ten grondslag ligt aan de van X-dosering afhankelijke verschuiving naar de naïeve pluripotente toestand. Het gecombineerde effect van de twee genen kan dus kwalitatief alle aspecten van het door X-dosering geïnduceerde fenotype verklaren. Het feit dat de omvang van de effecten in de dubbel-mutant die van XO-cellen niet volledig reproduceert, suggereert een bijdrage van een of meerdere aanvullende genen. Onze screeningsaanpak heeft enkele veelbelovende kandidaatgenen geïdentificeerd die nog in meer detail moeten worden onderzocht. Bovendien kunnen aanvullende schermen in de achtergrond van de D9K13-mutant het mogelijk maken om in de toekomst andere factoren te identificeren.

Van de andere genen die in de schermen zijn geïdentificeerd, is Zic3 een pluripotente transcriptiefactor die Nanog-expressie induceert en de iPSC-generatie verbetert [47, 48, 70]. Dienovereenkomstig identificeerde ons scherm Zic3 als een MAPK-remmer die Nanog-expressie en verminderde differentiatie bevorderde. Hoewel het niet op een X-doseringsgevoelige manier tot expressie wordt gebracht in de cellijn die we gebruikten, is een hogere expressie in vrouwelijke vergeleken met mannelijke cellen gerapporteerd in andere cellijnen [12]. De expressie of differentiatie van pluripotentiefactoren bleek echter niet te worden beïnvloed in heterozygote Zic3-mutante mESC-lijnen [12]. Een andere factor die in onze schermen is geïdentificeerd, is Stag2, een lid van het Cohesin-complex dat is betrokken bij het behoud van pluripotentie door middel van lange-afstandsregulatie van pluripotentie-geassocieerde genen [49]. Een bijzonder interessante kandidaat is het Fthl17-gencluster, dat zeven genen bevat die coderen voor ferritine-achtige eiwitten, die echter geen ferroxidase-activiteit hebben en zich gedeeltelijk in de kern bevinden [46]. Ze zijn van de moeder ingeprent en komen daarom alleen tot uiting in vrouwelijke, maar niet in mannelijke blastocysten [51]. Hun functie is volledig onbekend, maar het feit dat ze een vrouwelijk specifiek expressiepatroon vertonen, maakt ze intrigerende kandidaten die een meer gedetailleerd onderzoek rechtvaardigen. Bovendien wordt een bijdrage van X-gebonden ingeprente genen aan geslachtsverschillen tijdens de ontwikkeling ook ondersteund door het feit dat muizenembryo's met een XO-genotype tegengestelde groeifenotypes vertonen in vergelijking met XX-embryo's, afhankelijk van of ze het maternale of paternale X-chromosoom bevatten [10] .


Voordelen van visualisaties om informatie over bijwerkingen te evalueren en te communiceren in gerandomiseerde gecontroleerde onderzoeken

Achtergrond: Gerandomiseerde gecontroleerde onderzoeken (RCT's) bieden waardevolle informatie en informeren de ontwikkeling van schadeprofielen van nieuwe behandelingen. Schade wordt doorgaans beoordeeld aan de hand van het verzamelen van ongewenste voorvallen (AE's). Ondanks dat AE's routinematige resultaten zijn die in onderzoeken worden verzameld, wordt voortdurend aangetoond dat analyse en rapportage van AE's in tijdschriftartikelen suboptimaal zijn. Een belangrijke uitdaging is het grote aantal AE's, wat evaluatie en communicatie problematisch kan maken. Prominente praktijk is om frequentietabellen van AE's per arm te rapporteren. Visuele displays bieden een effectieve oplossing om complexe informatie te beoordelen en te communiceren, maar ze worden zelden gebruikt en er is een gebrek aan praktische richtlijnen over wat en hoe complexe AE-gegevens visueel moeten worden weergegeven.

Methoden: In dit artikel demonstreren we het gebruik van twee grafieken waarvan is vastgesteld dat ze gunstig zijn voor breed gebruik in RCT's, omdat beide meerdere AE's kunnen weergeven en geschikt zijn om puntschattingen weer te geven voor binaire, telling of time-to-event AE-gegevens: de vulkaan en puntenplots. We vergelijken en contrasteren het gebruik van datavisualisaties met traditionele frequentietabelrapportage, met behulp van gepubliceerde AE-informatie in twee placebogecontroleerde onderzoeken, van remdesivir voor COVID-19 en GDNF voor de ziekte van Parkinson. We introduceren statistische programma's voor implementatie in Stata.

Resultaten/casestudy: Visualisaties van bijwerkingen in de COVID-19-studie gaven een risicoprofiel voor remdesivir weer dat afweek van de hoofdboodschap in de gepubliceerde conclusie van de auteurs. In het GDNF-onderzoek naar de ziekte van Parkinson zorgde de visualisatie voor onmiddellijke communicatie van schadesignalen, die anders waren opgenomen in lange beschrijvende tekst en tabellen. Asymmetrie in de vulkaanplot hielp bij het markeren van extreme gebeurtenissen die minder duidelijk waren door herziening van de frequentietabel en puntplot. De dotplot maakte een uitgebreidere weergave mogelijk door middel van een meer gedetailleerde samenvatting.

conclusies: Visualisaties kunnen onderzoekers beter ondersteunen bij het assimileren van grote hoeveelheden gegevens en betere informele vergelijkingen tussen armen mogelijk maken in vergelijking met tabellen. We onderschrijven een verhoogde opname voor gebruik in proefpublicaties. Er moet voorzichtigheid worden betracht bij de constructie van visuele displays, omdat er in sommige omstandigheden mogelijk te veel nadruk wordt gelegd op de behandelingseffecten.

trefwoorden: Bijwerkingen Bijwerkingen Gegevensanalyse Afbeeldingen Schade Gerandomiseerde gecontroleerde onderzoeken Rapportage Visualisatie.


Benadering

BiomMiner gebruikt Snakemake [10] als de primaire workflow-beheertaal voor schaalbaarheid en reproduceerbare uitvoering van verschillende wrapper-scripts die zijn ontwikkeld in python en R voor bestaande softwaretools. BiomMiner kan mislukte stappen gemakkelijk opnieuw doen en hervatten vanaf controlepunten zonder rekenintensieve taken te herhalen, wat het testen van verschillende parameters in een workflow vergemakkelijkt. Het andere aspect van BiomMiner is de mogelijkheid om te implementeren op beide grote clusters zoals Amazon Web Services (AWS) of een enkele desktopcomputer met een paar kernen. BiomMiner genereert een HTML-pakket als gestandaardiseerde uitvoer met behulp van JavaScript om alle gegenereerde grafieken, grafieken en op tekst gebaseerde resultaten te catalogiseren. De meeste resultaten worden gevisualiseerd met behulp van ggplot2 [11] die een afbeelding met een hoge resolutie kan genereren met verschillende formaten. De gebruiker kan het HTML-pakket openen in toepassingen voor surfen op internet, zoals Chrome, Firefox of Safari. De pijplijn gebruikt een enkel workflowconfiguratiebestand (JSON-configuratiebestand) dat de meeste essentiële stappen van de workflow kan besturen en de gebruikers kunnen deze eenvoudig aanpassen op basis van hun onderzoeksdoelen. Bij elke stap houdt BiomMiner de logboeken bij die zijn gegenereerd in een specifieke map die kan worden gebruikt om het proces te bewaken.


Er is een fout opgetreden bij het instellen van uw gebruikerscookie

Deze site gebruikt cookies om de prestaties te verbeteren. Als uw browser geen cookies accepteert, kunt u deze site niet bekijken.

Uw browser instellen om cookies te accepteren

Er zijn veel redenen waarom een ​​cookie niet correct kan worden ingesteld. Hieronder de meest voorkomende redenen:

  • Je hebt cookies uitgeschakeld in je browser. U moet uw browser opnieuw instellen om cookies te accepteren of om u te vragen of u cookies wilt accepteren.
  • Uw browser vraagt ​​u of u cookies wilt accepteren en u heeft dit geweigerd. Om cookies van deze site te accepteren, gebruikt u de knop Terug en accepteert u de cookie.
  • Uw browser ondersteunt geen cookies. Probeer een andere browser als u dit vermoedt.
  • De datum op uw computer ligt in het verleden. Als de klok van uw computer een datum aangeeft vóór 1 jan 1970, zal de browser de cookie automatisch vergeten. Om dit op te lossen, stelt u de juiste tijd en datum in op uw computer.
  • U hebt een applicatie geïnstalleerd die het plaatsen van cookies controleert of blokkeert. U moet de toepassing uitschakelen tijdens het inloggen of contact opnemen met uw systeembeheerder.

Waarom vereist deze site cookies?

Deze site gebruikt cookies om de prestaties te verbeteren door te onthouden dat u bent ingelogd wanneer u van pagina naar pagina gaat. Om toegang te bieden zonder cookies zou de site een nieuwe sessie moeten maken voor elke pagina die u bezoekt, wat het systeem tot een onaanvaardbaar niveau vertraagt.

Wat wordt er in een cookie opgeslagen?

Deze site slaat niets anders op dan een automatisch gegenereerde sessie-ID in de cookie, er wordt geen andere informatie vastgelegd.

In het algemeen kan alleen de informatie die u verstrekt, of de keuzes die u maakt tijdens het bezoeken van een website, worden opgeslagen in een cookie. De site kan bijvoorbeeld uw e-mailnaam niet bepalen, tenzij u ervoor kiest deze te typen. Allowing a website to create a cookie does not give that or any other site access to the rest of your computer, and only the site that created the cookie can read it.


Producing interactive plots

Interactive plots in the bigPint package open as Shiny applications. These applications consist of a simple dashboard that includes an “About” tab that explains how to use the application. They also include an “Application” tab that offers several input fields that the user can tailor to their needs. Some of these input fields are generated dynamically based off the dataset that the user input. These tailorizations include aesthetics (such as point color) and metrics to determine the subset of data to be superimposed. In these applications, users can also easily save static images of the interactive graphics and lists of selected genes to their local computer.


MATERIALEN EN METHODES

Asymmetron enables versatile genomic investigations of strand asymmetry patterns across different biological problems. It is a Python-based toolkit and its core BED-formatted file comparison functions use the package Pybedtools ( 23). Asymmetron provides support for three types of analyses: (i) consecutive strand asymmetry estimation in a single file with strand annotation (ii) strand asymmetry estimation of strand-assigned motifs within strand-assigned regions (iii) strand asymmetry estimation between two strand-assigned motifs in proximity or overlapping each other. A fourth function performs the strand assignment of an unassigned feature based on another overlapping feature, thereby enabling the strand asymmetry analysis of the first (Figure 1).

Let us define the alphabet |$L = < >$|⁠ . DNA can be represented by a pair of sequences |$ = ldots $|⁠ , where |$ in L for i = 1,2,3 ldots n$| and |$ = ldots $|⁠ , its complement strand, where |$ = A,if, = T,,, = < m< >>G$| if |$ = < m< >>C,, = < m< >>C< m< >>if = < m< >>G$| and |$ = < m< >>T$| if |$ = < m< >>A$|⁠ . Because of the directionality of the two strands, we read BN from right to left, e.g. indien BN = AGGCT, we will say that BN contains the motif TCG. Here, we use ‘motif’ to refer to a short sequence from the same alphabet that is of particular interest.

Analyses are often performed on genomic data, to extract all locations of a specific motif. In Asymmetron, we use these locations to estimate strand asymmetries through several types of analyses. We use these methods to evaluate strand asymmetries of non-palindromic sequences. To represent the locations of the motif in the genome, it is enough to save the chromosome, the index where the motif starts, the index where the motif ends as well as which strand the motif is found at. A common format used to store this information is a BED file, which, inter alia, saves the above mentioned information. In this format, the strand is represented with a + or − sign for EENN of BN respectively, which we will also use here. The information of a BED file relevant for our analyses can be represented as a set of vectors S, where in each vector chromosome is represented as C, start coordinate is represented as s, end coordinate as e sand sign as R.

The commands used to perform the analyses and the files can be found on the GitHub page (https://github.com/Ahituv-lab/Asymmetron). Asymmetron documentation, including a tutorial, several examples and description of all available options is available in http://asymmetron.readthedocs.io/.

Consecutive strand asymmetry estimation for single motifs

Nearby recurrences of a motif in the genome can have biological significance. To examine the patterns emerging from recurring motifs, we developed this function which allows the observation of consecutive occurrences of a motif. It analyzes whether there is an asymmetry in the number of times the motif appears in one strand versus the other (Figure 2A).

Schematic of strand asymmetry analyses across different scenarios. (EEN) Estimation of biases in the orientation patterns of consecutive occurrences of a motif relative to those found in the shuffled simulated data. Calculation of orientation patterns for consecutive motif occurrences is performed using the function consecutive_patterns.py functie. In the presented example, there are seven motifs, six of them in the same orientation and one in the opposite orientation. We perform N simulations (in the schematic N = 1) and calculate the adjusted strand asymmetry ratio and empirical P-waarde. In this simple case, simulated strand asymmetry = 3/7 < strand asymmetry = 6/7, so the set of successes, as defined in the methods section, for which the simulated asymmetry is higher than the strand asymmetry has a cardinality of 0. This results in a trivial P-value of 1, as is to be expected from only a single simulation. (B) Estimation of transcriptional strand asymmetry of a motif in genic regions. Genes in both orientations are shown. Calculation of transcriptional strand asymmetries can be performed using the function contained_asymmetries.py. In the schematic, there are ten motifs distributed across two opposite oriented genes the null hypothesis is that they are equally-likely to have either orientation relative to the gene direction. There are seven motifs in the non-template orientation resulting in |$p - value = mathop sum limits_^3 C( <10,i>) imes imes > + mathop sum limits_^ <10>C( <10,i>) imes imes > = 0.34$|⁠ , calculated with the two-tailed binomial test. Motifs can occur in (C) same (++ and –) or (NS) in opposite (+- and −+) strand orientations. The order of two same-type or different motifs is not taken into consideration because the double strand DNA molecule is bidirectional nevertheless, if a third strand-oriented feature was included, their order would be another factor to account for. (NS) For those motifs in opposite strands, they can be separated in convergent (+−) or divergent (-+) orientations. These orientations of motif pairs are specific to non-palindromic motifs. (E) Orientation of motif pairs and estimation of same/opposite and convergent / divergent strand asymmetry ratios using a miniature genome example of two chromosomes and several occurrences of two motifs in pairs. Calculation of the strand asymmetry for motif pairs is performed with the function pairwise_asymmetries.py. In the schematic, there are eight motif pairs, across the two chromosomes the null hypothesis is that they are equally-likely to have same or opposite orientation and in the subset of opposite orientation cases, they are equally likely to be in convergent or divergent orientation. There are three motif pairs in same orientation, resulting in |$p - value = mathop sum limits_^3 C( <8,i>) imes imes > + mathop sum limits_^8 C( <8,i>) imes imes > = 0.73$| and there are five motif pairs in opposite orientation resulting in |$p - value = mathop sum limits_^1 C( <1,i>) imes imes > + mathop sum limits_^5 C( <5,i>) imes imes > = 0.38$|⁠ , for same/opposite and convergent/divergent strand asymmetries, respectively, calculated with the two-tailed binomial test.

Schematic of strand asymmetry analyses across different scenarios. (EEN) Estimation of biases in the orientation patterns of consecutive occurrences of a motif relative to those found in the shuffled simulated data. Calculation of orientation patterns for consecutive motif occurrences is performed using the function consecutive_patterns.py functie. In the presented example, there are seven motifs, six of them in the same orientation and one in the opposite orientation. We perform N simulations (in the schematic N = 1) and calculate the adjusted strand asymmetry ratio and empirical P-waarde. In this simple case, simulated strand asymmetry = 3/7 < strand asymmetry = 6/7, so the set of successes, as defined in the methods section, for which the simulated asymmetry is higher than the strand asymmetry has a cardinality of 0. This results in a trivial P-value of 1, as is to be expected from only a single simulation. (B) Estimation of transcriptional strand asymmetry of a motif in genic regions. Genes in both orientations are shown. Calculation of transcriptional strand asymmetries can be performed using the function contained_asymmetries.py. In the schematic, there are ten motifs distributed across two opposite oriented genes the null hypothesis is that they are equally-likely to have either orientation relative to the gene direction. There are seven motifs in the non-template orientation resulting in |$p - value = mathop sum limits_^3 C( <10,i>) imes imes > + mathop sum limits_^ <10>C( <10,i>) imes imes > = 0.34$|⁠ , calculated with the two-tailed binomial test. Motifs can occur in (C) same (++ and –) or (NS) in opposite (+- and −+) strand orientations. The order of two same-type or different motifs is not taken into consideration because the double strand DNA molecule is bidirectional nevertheless, if a third strand-oriented feature was included, their order would be another factor to account for. (NS) For those motifs in opposite strands, they can be separated in convergent (+−) or divergent (-+) orientations. These orientations of motif pairs are specific to non-palindromic motifs. (E) Orientation of motif pairs and estimation of same/opposite and convergent / divergent strand asymmetry ratios using a miniature genome example of two chromosomes and several occurrences of two motifs in pairs. Calculation of the strand asymmetry for motif pairs is performed with the function pairwise_asymmetries.py. In the schematic, there are eight motif pairs, across the two chromosomes the null hypothesis is that they are equally-likely to have same or opposite orientation and in the subset of opposite orientation cases, they are equally likely to be in convergent or divergent orientation. There are three motif pairs in same orientation, resulting in |$p - value = mathop sum limits_^3 C( <8,i>) imes imes > + mathop sum limits_^8 C( <8,i>) imes imes > = 0.73$| and there are five motif pairs in opposite orientation resulting in |$p - value = mathop sum limits_^1 C( <1,i>) imes imes > + mathop sum limits_^5 C( <5,i>) imes imes > = 0.38$|⁠ , for same/opposite and convergent/divergent strand asymmetries, respectively, calculated with the two-tailed binomial test.

Laten S be the vector representation of the input BED file. Let |$>,>,>, ldots ,>$| be the vectors of set S sorted first by chromosome C and then by start position s. We define the distance between two consecutive appearances of the motif in the same chromosome as |$d ( <>, )>>> ) = min < <0, )>> -->> >$|⁠ . If |$dlangle <<>> or d> angle <>>$| they are not considered consecutive for the purpose of this analysis. Let |$C = < ,, ldots ,>$| be a set consisting of sequences of characters |$ = <>>> <>>> ldots <>>>$|⁠ , where each character is the sign of an appearance of the motif that fit the previously mentioned criteria. wij definiëren m as the cardinality of the set |$ < ( ):<>>> = <><>>>> >$|⁠ , which represents all consecutive appearances of the motif on the same strand (both on EENN or both on BN ). evenzo, O is defined as the cardinality of the set |$ < ( ):<>>> e <><>>>>>$|⁠ , which represents all consecutive appearances of the motif on opposite strands (one EENN and the other on BN). The strand asymmetry ratio is defined as |$r = m /( )$|⁠ , which represents the magnitude of consecutive orientation bias. We then run N simulations (default: N = 1000), randomly assigning a value (‘+’ or ‘−‘) to every |$<>>>$|⁠ , while keeping the total number of ‘+’ and ‘-’ in C constante. Following the same procedure as above, the strand asymmetry ratio |$<><>>>,< m< >>j = 1, ldots ,N$| is calculated. The adjusted strand asymmetry ratio is then defined as the original strand asymmetry ratio R divided by the mean strand asymmetry ratio |$<>> = frac<^N <><>>>>>$| across simulations. We define a success as |$<><>>> >r$|⁠ . Laten L be the number of successes. We use the cardinality of L to calculate the empirical P-value as follows:

|$p - value = min( <1,2*frac<><>> )$|⁠ , where |$l = < m>( )$|⁠ . We multiply by 2, to ensure that the P-value is not over-estimated, due to the two-tailed test.

The outputs of this tool include a table with the statistical evaluation of the asymmetry bias for each inputted pattern BED files with statistically biased coordinates consecutively observed for each inputted pattern with an extra column having their estimated Bonferroni corrected P-value and barplot visualizations of the distribution of observed versus expected consecutive occurrences of each pattern and other relevant statistics. As an extension, the tool also offers the option to analyze custom patterns provided by the user.

Strand asymmetry estimation between regions and overlapping motifs

The strand asymmetry between regions and overlapping motifs tool requires a set of strand-oriented BED-formatted files of the regions of interest and a set of strand-oriented BED-formatted motif files. The tool performs independently the analysis across pairs of region and motif files and measures the strand asymmetry scores for the motifs overlapping or contained in the regions (Figure 2B).


Bekijk de video: Disney Music - Lava Official Lyric Video from Lava (December 2021).