Informatie

Waarom leidt deaminering in de lagging strand tot een toename van het relatieve aantal guanine en thymine ten opzichte van cytosine en adenine?


Mijn vraag kwam voort uit dit artikel op Wikipedia over de GC-skew in bacteriële genomen: https://en.wikipedia.org/wiki/GC_skew Voor zover ik begreep, is de lagging strand (de template streng), tijdens replicatie, meer vaak enkelstrengs dan de leidende streng (sjabloon), dus het is meer vatbaar voor mutaties zoals deaminering. Daarom zou men op de achterblijvende streng (hier, de matrijs voor de streng gevormd door Okazaki-fragmenten) meer Ts en minder Cs moeten verwachten. Omgekeerd zou de streng gesynthetiseerd door Okazaki-fragmenten een verrijking van As en een uitputting van Gs moeten hebben. Waarom vermeldt het Wikipedia-artikel een toename van de verhouding (G+T)/(C+A)? Ik zou een toename van de verhouding van (T)/(C) verwachten. Ik snap de link met Gs en As niet.


Ik denk dat je verwijst naar deze zin uit je wikipedia-link:

Er is een rijkdom aan guanine ten opzichte van cytosine en thymine ten opzichte van adenine in de leidende streng en vice versa voor de achterblijvende streng.

Merk op dat dit niet zegt (G+T) > (C+A). In plaats daarvan zegt het (G)>(C) en (T)>(A). Ik denk dat dat niet hetzelfde is als zeggen (G+T) > (C+A), hoewel dat waarschijnlijk ook waar is?

Dus ik denk dat er geen tegenstrijdigheid is - het is gewoon, zoals je zegt, meer T's (ten opzichte van verwachte gelijkheid met As) en minder C's (ten opzichte van verwachte gelijkheid met G's).

Als ik het goed begrijp, is het belang van de GC-scheefheid, en de reden dat het interessant is, dat het een afwijking is van de pariteitsregels van Chargaff (zoals uitgelegd in het artikel). Deze regels stellen dat voor een bepaald stuk DNA, (G)~(C) en (T)~(A), wat de verwachte samenstelling is voor (bijvoorbeeld) dubbelstrengs DNA, vanwege basenparing.

Bewerken: voor meer informatie over de regels van Chargaff, zie deze andere vraag die ik hier (door puur toeval) heb beantwoord. Merk op dat de tweede pariteit "regel" a . is statistisch fenomeen, liever dan een logisch vereiste regel. De wikipedia-pagina over de regels van Chargaff is ook informatief.

Hoop dat dat helpt.


DNA voor de MCAT: alles wat u moet weten

(Opmerking: deze gids maakt deel uit van onze MCAT Biochemistry-serie.)

Deel 1: Inleiding

Deel 2: Structuur van DNA

a) Stikstofbasen

b) Fosfaatruggengraat

c) GC-gehalte

d) DNA-synthese

Deel 3: Het centrale dogma

a) Transcriptie

b) Vertaling

c) Uitzonderingen op het centrale dogma

Deel 4: Epigenetica en imprinting

a) Histonstructuur en functie

b) X inactivering

Deel 5: Aandoeningen en kankers

a) Oncogenen en tumorsuppressorgenen

b) Chromosomale defecten

Deel 6: Hoogrentende voorwaarden

Deel 7: Passage-gebaseerde vragen en antwoorden

Deel 8: Op zichzelf staande vragen en antwoorden


B. Wat veroorzaakt DNA-schade?

DNA is het meest blootgesteld en daarom het meest kwetsbaar voor schade, vooral bij eukaryoten. De eenvoudigste schade aan DNA tijdens replicatie is de puntmutatie, het per ongeluk inbrengen van een nucleotide in een groeiende DNA-streng. Andere mutaties, net zo toevallig, omvatten DNA-deleties, duplicaties, inversies, enz., waarvan elk aan reparatie zou kunnen ontsnappen. De oorzaken van DNA-schade kunnen chemisch of fysiek zijn en omvatten spontane intracellulaire gebeurtenissen (bijv. oxidatieve reacties) en omgevingsfactoren (straling, exogene chemicaliën, enz.). Op basis van onderzoeken naar verschillende soorten DNA-schade schatte Thomas Lindahl dat er mogelijk 10.000 per dag DNA-schadelijke gebeurtenissen plaatsvinden! Lindahl realiseerde zich dat er een aantal "fundamentele DNA-herstelmechanismen" aan het werk moeten zijn om cellen te beschermen tegen zo'n hoge mate van DNA-schade. De ontdekking van de basis excisie reparatie mechanisme verdiende Thomas Lindahl een aandeel in de Nobelprijs voor de Scheikunde van 2015. Omgevingsfactoren die DNA kunnen beschadigen zijn onder meer UV-licht, röntgenstralen en andere straling, evenals chemicaliën (bijv. toxines, kankerverwekkende stoffen en zelfs medicijnen, enz.). Zowel kiembaan als somatische cellen kunnen worden aangetast. Hoewel mutaties vaak slopende ziekten kunnen en zullen veroorzaken, is het leerzaam om de impact van mutaties in perspectief te houden. De meeste mutaties zijn eigenlijk stil ze veroorzaken geen ziekte. Daarnaast wordt veel DNA-schade hersteld. Cellen corrigeren meer dan 99,9% van de verkeerde baseveranderingen voordat ze de kans krijgen om mutaties te worden. Daarom beschouwen we replicatie als een “trouw&rdquo-proces. Laten we eens kijken naar enkele veelvoorkomende soorten DNA-schade die meestal worden gerepareerd:

  • pyrimidine dimeren, typisch voor aangrenzende thymines (minder vaak cytosines) in een enkele DNA-streng, veroorzaakt door blootstelling aan UV
  • depurinatie de hydrolytisch verwijdering van guanine of adenine uit de #1 C (koolstof) van deoxyribose in een DNA-streng
  • deaminering: hydrolytische verwijdering van amino (-NH2) groepen uit guanine (meest voorkomende), cytosine of adenine
  • Roestschade van deoxyribose met elke base, maar meestal purines
  • Ongepast methylering van alle basen, maar meestal purines
  • DNA-streng breuk tijdens replicatie of door blootstelling aan straling of chemicaliën

Resultaten en discussie

Methodologie

Om de snelheid van vorming en deaminering van C en m C in cis-syn cyclobutaandimeren te bepalen, hebben we een test ontwikkeld die gebruik maakt van de specificiteit van E coli photolyase voor het terugdraaien van deze klasse van fotoproducten. Het idee was om de C of mC van belang met 32P te labelen en na fotodimerisatie en deaminering specifiek het cis-syn-fotodimeer samen met onbeschadigd DNA af te breken tot mononucleotiden met E coli fotolyase en nuclease P1 (Fig. 2). De mate van deaminering kon vervolgens worden gekwantificeerd door analyse van de hoeveelheid gedeamineerd tot niet-gedeamineerd 32P-gelabeld nucleotide door middel van gelelektroforese (Fig. 3). Om er zeker van te zijn dat het substraat in de duplexvorm was en om de effecten op deaminering tot een minimum te beperken, hebben we een 42-meer ontworpen dat twee centraal gelegen pyrimidinen (X & Y) bevat, geflankeerd door variabele basen van belang (N & M) ( Tafel 1 ). De andere basen in de directe omgeving (n) werden gekozen om ongewenste secundaire structuurvorming in de enkelstrengs te minimaliseren die zou kunnen voortvloeien uit de keuze van N, X, Y en M.

Schema voor substraatbereiding en analyse van de deamineringssnelheid van mC-bevattende cyclobutaandimeren in duplex-DNA. 1) 5'-32P-gelabeld 21-meer met een terminaal mC wordt geligeerd aan tweede 21-meer ODN in aanwezigheid van een 20-nt ligatiestellage. 2) Het enkelstrengs 42-meer ligatieproduct wordt gescheiden van niet-geligeerde producten door middel van denaturerende gelelektroforese. 3) Het dubbelstrengs substraat wordt bereid door het radioactief gemerkte 42-meer substraat aan het complementaire 42-meer ODN te annealen. 4) De duplex wordt bestraald met 302 nm op ijs om de CPD te genereren. 5) Het bestraalde product wordt verschillende keren gedeamineerd bij 37�b0C. 6) Het deamineringsmengsel wordt behandeld met fotolyase en licht om de CPD te fotoreverteren. 7) Nuclease P1 degradeert onbeschadigd en fotoreverted DNA tot mononucleotiden. 8) Tweedimensionale acrylamide-elektroforese van de nuclease P1-producten scheidt het niet-gedeamineerde mC van zijn deamineringsproduct T.

2D-gelelektroforese en analyse van de deamineringsreactie. A) 2D acrylamidegel van de Nuclease P1-digestieproducten van duplex tGT = m CGtc die werd gedeamineerd gedurende 0, 59, 120, 171, 218, 330, 456, 536 min bij 37° C (respectievelijk Lanes 1𠄸) in 10 mM Tris/Mes/HCl pH 7,0 met ongeveer 5 mM NaCl, en vervolgens fotoreverted. Baan 9 bevat de producten na 16 uur incubatie bij 67 °C bij pH 6,3. De eerste dimensie werd in neerwaartse richting uitgevoerd in 10% acrylamide met een 7 M ureum, TBE-buffer om een ​​onopgelost mengsel te geven van de met 32P gemerkte mononucleotiden pm dC en pT die migreren als een enkele intense band die in het kader wordt getoond. De tweede dimensie werd uitgevoerd in de opwaartse richting naar de positieve elektrode in 28% acrylamide/citraat. De tweede dimensie scheidt pT (snelste migrerende band) van pm dC (langzaamste migrerende band). De banden in het midden (<0003c 5%) zijn te wijten aan onvolledige verteringsproducten van P1-nuclease en niet-fotoreverteerbare fotoproduct-bevattende trinucleotiden. B) Plots van de fractie niet-gedeamineerd dimeer versus tijd: gegevens voor duplex tGT=CGtc in 0 mM toegevoegd NaCl (□) weergegeven in paneel A, en in 400 mM toegevoegd NaCl (■) en voor duplex tAT m CAtc in 0 mM (◊), en 400 mM toegevoegd NaCl (♦).

Tafel 1

Cis-syn cyclobutaandimeer fotoproductopbrengst en deaminatiehalfwaardetijd.

Om het intern gelabelde 42-meer te bereiden, werd een ODN dat een 5’-terminaal mC bevatte [γ-32P]-end-gelabeld en vervolgens geligeerd aan een tweede ODN met behulp van een 20-meer-scaffold. Het geligeerde product werd vervolgens van de ligatiesteiger gescheiden door denaturerende gelelektroforese in aanwezigheid van een zesvoudige overmaat van een ODN die complementair was aan de steiger om ervoor te zorgen dat we alleen de enkelstrengige vorm van het 42-meer verkregen. De duplexvorm werd vervolgens bereid door het met 32P gemerkte 42-meer aan het complementaire 42-meer te annealen. Bestraling van enkelstrengs of duplex 42-meer werd uitgevoerd bij 302 nm (UVB-licht) gedurende één uur bij 4 °C en pH 8,3 om de hoeveelheid deaminering te minimaliseren. 14 Onder deze omstandigheden zijn cis-syn-dimeren (6𠄴) fotoproducten en hun Dewar-isomeren de belangrijkste producten, terwijl trans-syn- en TA*-fotoproducten zeer ondergeschikt zijn. Na bestraling werden de monsters op pH 7 gebracht en gedurende bepaalde tijden bij 37 °C gedeamineerd en vervolgens werden de cis-syn-dimeren specifiek fotoreverted met een 100-voudige overmaat van E coli fotolyase. 33

Na fotoreversie werd het DNA afgebroken tot 5-mononucleotidefosfaten met nuclease P1 om 32 pm C/C en 32 pT/U te genereren, die werden gescheiden door een 2D acrylamidegelsysteem (Fig. 3A). Alle niet-fotoreverteerbare dipyrimidine-fotoproducten worden verteerd tot trinucleotiden, pPyPyN. 34 Nuclease P1 interfereerde met de migratie van de nucleotiden in de citraatgel en kon niet worden gebruikt om 32pmC/C en 32pT/U rechtstreeks door één enkele dimensie te scheiden. We hebben daarom een ​​10% acrylamidegel gebruikt die TBE en 7 M ureum bevat om 32 pm C/C en 32 pT/U te scheiden als een enkele intense band als een eerste dimensiestap (getoond in rechthoek). Vanwege het lage percentage acrylamide bevatte deze band ook enkele onvolledig verteerde di- en trinucleotideproducten, evenals fotoproductbevattende trinucleotiden zoals hieronder besproken.

De tweede dimensie met citraatbuffer 35 werd gebruikt om 32 pT/U te scheiden van 32 pm C/C, die verschijnen als afzonderlijke en reproduceerbare banden met respectievelijk hoge en lage mobiliteit. Oligonucleotiden in een citraatgel bewegen voornamelijk volgens de basesamenstelling en zijn niet erg gevoelig voor grootte, waarbij de elektroforetische mobiliteit toeneemt in de volgorde CϪ>>G>T. Er werden ook een aantal tussenliggende banden met een variabele hoeveelheid (<0003c5%) waargenomen, die overeenkomen met oligodeoxynucleotidedimeren, trimeren en mogelijk hoger, met een variabele basesamenstelling die onvolledig werd verteerd door nuclease P1. Controle-experimenten met niet-bestraald DNA suggereerden dat de onvolledig verteerde producten afkomstig kunnen zijn van een kleine fractie van gelabeld substraat dat slecht in contact was met NP1 en omdat elk tijdstip afzonderlijk werd verteerd, een variabele hoeveelheid zijn. Omdat NP1 geen onderscheid kan maken tussen onbeschadigd DNA en fotoreverted DNA, wordt de berekening van het percentage gedeamineerd product niet beïnvloed door de aanwezigheid van gedeeltelijk verteerde producten.

Een andere bijdrage aan de tussenliggende banden zijn trimeren die het resultaat zijn van de vertering van niet-fotoreverteerbare DNA-fotoproducten. Experimenten met en zonder fotoomkering door fotolyase toonden aan dat de cis-syn dimeerbevattende trinucleotide-fotoproducten migreerden ook met deze banden, maar worden volledig geëlimineerd door fotoreversale omstandigheden die in ons experiment worden gebruikt. Verdere experimenten met T4 endo V om te kwantificeren cis-syn dimeren in 5'-uiteinde gelabeld substraat toonden ook aan dat onder de gebruikte omstandigheden fotolyase 㺕% van TT en TmC terugkeerde cis-syn dimeren. De onvolledig verteerde producten en niet-omkeerbare fotoproducten interfereren niet met de kwantificering van de pT/U-band, aangezien er zeer weinig product werd waargenomen op de positie van deze band bij een deamineringstijd van nul, en elke achtergrondactiviteit op dit tijdstip werd afgetrokken van de andere. rijstroken.

Om de snelheid van deaminering te bepalen, werd eerst de opbrengst aan cis-syn-fotodimeer bepaald door het bestraalde DNA gedurende 16 uur tot 67 ° C bij pH 6,3 te verwarmen om het dimeer volledig te deamineren voorafgaand aan de fotolyase- en nuclease P1-stappen, en de verhouding te berekenen van de pT/U-band naar de pm C/C + pT/U-band. De halfwaardetijden werden verkregen uit een grafiek van de natuurlijke logaritme van de fractie niet-gedeamineerd dimeer tegen de tijd. Fig. 3B toont typische grafieken van de gegevens van verschillende 2-D gels waaruit de halfwaardetijden werden berekend.

Deaminering van m C in T= m C is sneller dan in m C=T

In onze eerste experimenten vergeleken we de deaminatiesnelheden van 5-methyl C binnen m C = T en T = m C dimeren geflankeerd door A’s of G’s. Als we dezelfde flankerende base vergelijken, deamineert de 3'-m C in het dimeer ongeveer 3𠄴 keer sneller dan de 5'-m C in zowel enkelstrengs als duplex-DNA. ( Tabel 1 , Afb. 4 ). Dit staat in contrast met de deaminering van C in de cis-syn dimeren van de dinucleotiden TpdC en dCpT, die vergelijkbare halfwaardetijden hebben van respectievelijk 1,3 en 1,2 uur bij pH 7 bij 50°C. 22 Dit suggereerde aanvankelijk dat de langzamere deaminering van de 5'-m C te wijten is aan sterische interferentie door de 5'-flankerende basis, die de aanval van water op C4 van een 5'-C zou kunnen belemmeren. In de kristalstructuur van een cis-syn-thyminedimeer geflankeerd door A's (Fig. 5 A - 00026 B ) 36 , is de 3'-flankerende basis sterk naar de zijkant verplaatst en zou niet dezelfde mate van sterische interferentie opleveren voor de aanval van water op C4 van een 3'-m C. Enkelstrengs DNA is ook gedeeltelijk gestapeld en kan een vergelijkbare mate van sterische interferentie verlenen. Aan de andere kant lijkt m C bijna 200 keer sneller te deamineren in het dimeer van het dinucleotide Tpd m C (5,6 uur, pH 7,4 50�b0C) 27 dan in het dimeer van dm CpT (48 d, 1152 uur, pH 7 25ଌ). 23 Behoudens een experimentele fout, suggereert dit grote verschil in snelheid dat de methylgroep meer interfereert met de benadering van hydroxide vanaf de 5'-kant dan de 3'-kant vanwege de cyclobutaanringconformatie, die anders moet zijn in het dinucleotide vergeleken met enkelstrengs of duplex DNA. Ter ondersteuning van dit idee is aangetoond dat de cyclobutaanringconformatie van een TT-dimeer significant verschilt in duplex-DNA in vergelijking met het dinucleotide. 37

Effect van sequentiecontext en duplexvorming op deamineringssnelheid. Sequenties in cursief en rood op de achterkant van de kubus verwijzen naar de enkelstrengige vorm. Sequenties in vet en blauw op de voorkant van de kubus verwijzen naar de dubbelstrengige vorm. Cijfers in cursief zijn de deaminatiehalfwaardetijden in uren.

Invloed van basenstapeling op nucleofiele aanval en exciplexvorming in duplex-DNA. A) Bekijk de helix-as vanaf het 3'-uiteinde, en B) een zijaanzicht van een AT=TA cyclobutaandimeer (PDB File 1NE4) 36 waaruit blijkt dat de 5'-A bovenop de 5'-T van de dimeer en blokkeert de aanval van water, terwijl de 3'-A niet stapelt op de 3'-T en de aanval van water niet kan blokkeren. C) Uitzicht vanaf het 3'-uiteinde van een ATTA-site in duplex-DNA (PDB-bestand 1D49) 49 met significant meer basenstapeling tussen de 5'-A en de 5'-T dan voor de 3'-A met de 3'- T.

Deaminering van m C=T en T= m C is het snelst wanneer de m C wordt geflankeerd door G

De deaminatiehalfwaardetijden van mC in een CPD geflankeerd door A of G zijn zeer vergelijkbaar in enkelstrengs DNA met waarden van respectievelijk 3,5 en 4,2 uur voor GT=mCG en AT=mCA, en 10,7 en 12,1 uur voor GmC=TG en AmC=TA (Tabel I, Fig. 4). Daarentegen was deaminering van mC in duplex-DNA het snelst wanneer het werd geflankeerd door G’s. de t½ voor m C was 22 keer korter voor GT = m CG (5,8 uur) dan voor AT = mCA (134 uur), en benaderde die waargenomen in enkelstrengs DNA. Evenzo is de t1/2 voor deaminering in G m C=TG (26,6 uur) was 19 keer korter dan voor Am C=TA (𾔀 uur).

Om het effect van een flankerende C of T op deaminering te bepalen, bepaalden we de deamineringssnelheden van mC binnen TT m CTT- en CC m CCC-sequenties in duplex-DNA. Bestraling van deze sequenties produceert een mengsel van twee dipyrimidinedimeren waarbij de mC zich ofwel in de 5’ of 3’ posities bevindt. Met behulp van het cis-syn dimeer specifieke T4 endonuclease V vonden we dat TT=m CT en TmC=TT werden geproduceerd in een verhouding van 2:1, en dat CC=m CC en Cm C=CC werden geproduceerd in een 3: 4 verhouding. De waargenomen deamineringssnelheid is daarom een ​​samenstelling van de deamineringssnelheden voor m C in de 5'- en 3'-posities, die een 4-voudig kunnen verschillen op basis van wat werd waargenomen voor de deaminering van mC geflankeerd door A of G. De waargenomen deaminatiehalfwaardetijd van 300 uur voor mC in dimeren geflankeerd door C's is ongeveer 2𠄳 keer dan de 107� uur bepaald voor deaminering van de centrale twee C's in CCCC van plasmide-DNA in vitro 25 zoals zou worden verwacht van het snelheidsvertragende effect van methylering. De deamineringshalfwaardetijd is ook vergelijkbaar met de 160 uur berekend op basis van de % deamineringsgegevens voor C C C in codon 300 van het p53-gen in bestraalde menselijke cellen. 26 In diezelfde studie was de deaminatiehalfwaardetijd van zes TCT-plaatsen in het p53-gen ook ongeveer 160 uur en vergelijkbaar met die van 385 uur die we vinden voor mC in een dimeer geflankeerd door T's. Deze deamineringssnelheden zijn echter heel anders dan die van 3,9 uur gerapporteerd voor een C in TCT-sequentie tRNA-suppressorgen in E coli. 21 , 38 Deze site in E coli wordt actief getranscribeerd, wat de site meer enkelstrengs zou maken en bijgevolg meer vatbaar voor deaminering. Aangezien de halfwaardetijden van deaminering erg lang waren voor dimeren geflankeerd door T en C in onze substraten en vergelijkbaar met die van dimeren geflankeerd door A’s, concluderen we dat G uniek is in zijn vermogen om de deaminering van C te versnellen. Alleen de G onmiddellijk flankerende am C had dit effect waarbij AT= m CG veel sneller deamineerde dan GT= m CA (t ½’s van respectievelijk 6,6 en 170 uur) (Tabel 1).

O6 van guanine betrokken bij het deamineringsmechanisme

Spontane deaminering van C of mC in een dinucleotide-fotoproduct is een algemene door zuur gekatalyseerde reactie. 22 De reactie wordt geïnitieerd door de protonering van cytosine op N3, wat een positieve lading op C4 induceert. Aanval van hydroxide of water op C4 produceert dan een tetraëdrisch aminaal tussenproduct dat instort om ammoniak of ammoniumionen vrij te maken. Om te bepalen of een bepaalde functionele groep op G al dan niet bij het mechanisme betrokken zou kunnen zijn, hebben we de G's die het fotodimeer flankeren vervangen door verschillende analogen die specifieke functionele groepen van G missen (Fig. 6). Toen G werd vervangen door 2-aminopurine, dat de C6-carbonylgroep mist maar de C2-aminogroep behoudt, nam de deamineringssnelheid van mC in T=mC met een factor 8 af. Toen G werd vervangen door inosine, dat de C2-aminogroep mist, maar de carbonylgroep behoudt, nam de snelheid slechts 2-voudig af. Op basis van deze resultaten concluderen we dat O6 en mogelijk N7 van guanine op de een of andere manier betrokken zijn bij het sturen of activeren van water voor aanval op C4. Opeenvolgende guanines zoals in GT=mCGGG versterkten het effect niet (Tabel 1) en suggereert dat er geen coöperatief effect is tussen aangrenzende guanines.

Invloed van individuele functionele groepen van een 3'-G op de deaminatiesnelheid van de 3'-C van het dimeer in tGT= m CGtc. Waarden in cursief zijn de halfwaardetijden in uren bij 37ଌ.

De 06-carbonylgroep van G kan samen met N7 een gebied vormen met een hoge negatieve elektrostatische potentiaal 39 die de positief geladen geprotoneerde C stabiliseert, waardoor de pKa effectief wordt verhoogd om de reactie te versnellen. Deze uitleg is vergelijkbaar met de uitleg die wordt gebruikt om uit te leggen waarom de cis-syn dimeer van TpdC deamineert sneller dan de trans-syn-Ik dimer. 22 In dat geval bleek dat de pKa van het geprotoneerde C in de trans-syn dimeer was lager (2,9 versus 4,2) en werd toegeschreven aan een gunstige uitlijning van de C4-carbonyl van T met het iminium-ion van C aan dezelfde kant van de cyclobutaanring. In de trans-syn-I-dimeer, de O4-carbonyl van de T bevindt zich aan de andere kant van de cyclobutaanring en kan niet zo effectief interageren. Hoewel het verschil in snelheid aanzienlijk is bij pH 4 (24-voudig), is het veel minder bij pH 7 (3-voudig) dan het 22-voudige verschil dat wordt waargenomen voor deaminering van mC geflankeerd door G in vergelijking met A, C of T G kan dichter in de structuur komen om een ​​betere uitlijning van zijn O4-carbonylgroep (Fig. 5) te bereiken in vergelijking met de O4-carbonyl van flankerende T, terwijl A en C een aminogroep hebben met een minder gunstige dipool.

Effect van zout op deaminering

We hebben het effect van zout op deaminering getest, aangezien het bekend is dat mono- en divalente kationen een interactie aangaan met zowel N7 als O6 van guanine door binnenste bol- en water-gemedieerde interacties 40 en de duplexvorm stabiliseren. 41 Deaminering werd uitgevoerd in 0� mM toegevoegd NaCl met duplex GT = m CG en AT = m CA (Fig. S1). Bij de hoogste NaCl-concentratie vertraagde de deaminatiesnelheid met een factor 3,8 voor de G-reeks, maar ook met een vergelijkbare factor 3,3 voor de reeks geflankeerd door A’s. Verrassend genoeg deamineerde de G-geflankeerde sequentie 20 keer sneller dan de A-geflankeerde sequentie over het gehele bereik van zoutconcentraties. In overeenstemming met de waarneming dat zowel mono- als divalente kationen strijden om dezelfde plaatsen in DNA, 42 vonden we dat de snelheid van deaminering van GT = m CG met een factor 4,3 afnam in 10 mM MgCl2. Uit deze resultaten blijkt dat zout deaminering kan vertragen door de duplexvorm van de helix op een niet-sequentiespecifieke manier te stabiliseren, waardoor protonering van de C en toevoeging van water wordt geremd. Deze resultaten geven ook aan dat, hoewel zout de relatieve snelheden van deaminering tussen verschillende sequenties mogelijk niet beïnvloedt, de deaminering vrij langzaam kan zijn in vivo, waar eenwaardige zoutconcentraties ongeveer 150 mM zijn.

Effect van methylering op deaminering van C

Hoewel het bekend is dat C-methylering de CPD-vorming in zonlicht ongeveer 15-voudig verhoogt, 9 is het effect van methylering op de deamineringssnelheid van fotodimeren in duplex-DNA niet goed vastgesteld. We ontdekten dat methylering van de C in GT=CG, AT=CG en AT=CA deaminering vertraagde met respectievelijk een factor 1,2, 1,3 en 3,8 (Tabel 1). Het blijkt dat de deaminatiesnelheid van een 3'-C meer wordt beïnvloed door methylering wanneer geflankeerd door een aangrenzende A dan door een G. Deaminering van een 5'-C geflankeerd door A werd ook vertraagd met een factor 3,8 na methylering ( vergelijk met1/2 van 500 uur voor Am CTA (Tabel 1) met 131 uur voor ACTG (Tabel 2)).

Tafel 2

Vorming en deaminering van C m C-dimeren. 32 P-gelabeld C vetgedrukt. Mismatches zijn onderstreept.

binnenkomstAfgekort.volgorde% Opbrengstt1/2
1AC m CEENAC m CBij3.4nd
TG GTa
2GC m CGGC m CGt1.4nd
CG GCa
3EENC m CGEENC m CGt2.8320 ± 12
TG GCa
4AC m CGAC m CGt3.0256 ± 16
TG GCa
5een U m CGeen U m CGt0.84.7 ± 1
T G GCa
6EENC T GEENC T Gg3.928 ± 2.6
TG G Cc
7EENCTGEENCTGg0.8131 ± 12
TGACc

Vergelijking van de geschatte deamineringssnelheid voor C in het cis-syn dimeer TpdC bij 25 ° C bij pH 7 (halfwaardetijd van 7,7 uur) 22 met gemethyleerde C bij pH 7,4 (69 uur) 27 geeft aan dat methylering van een 3'-C vertraagt deaminering met een factor 9 Het effect lijkt zelfs nog groter (172-voudig) te zijn voor 5'-C in vergelijking met de deamineringssnelheden van dCpT (6,7 uur) en dmCpT (48 dagen). Een mogelijke verklaring kan de cyclobutaanringconformatie zijn zoals hierboven besproken (zie: Deaminering van m C in T= m C is sneller dan in m C=T). Onze resultaten met duplex-DNA zijn meer in overeenstemming met een in vitro PCR-experiment met bestraald plasmide-DNA dat wijst op weinig effect van methylering op deaminering van CmCG op codon 248 of 282. 26

Dubbele deaminering van C= m C tot U=T

Beide C-residuen in een C=C-cyclobutaandimeer kunnen afzonderlijk deamineren om uiteindelijk U=U te geven en daardoor resulteren in een CC→TT-mutatie na replicatie. 25, 26 Om het mechanisme van de dubbele deaminering te ontleden, hebben we eerst geprobeerd de deaminatiesnelheden van C en mC te meten in de volgorde GC=mCG, maar de opbrengst van dit product was niet optimaal (Tabel 2). We ontdekten dat het vervangen van de 5'-G door A de opbrengst verhoogde, en dat zowel de C als de mC zeer langzaam en met bijna dezelfde snelheden deamineren (de levensduur was respectievelijk 320 en 256 uur) (Tabel 2) .

De langzame deaminering van de m C geflankeerd door G was verrassend, omdat we hadden ontdekt dat G de deaminering van T m C-dimeren aanzienlijk versnelt. In AC= m CG zal deaminering van de C leiden tot AU = m CG, terwijl deaminering van m C zal leiden tot AC= TG, waarbij de onderstreepte basen niet goed met G zijn gepaard. versnelt de deaminering van de resterende base, aangezien een mismatch van basenparen de toegankelijkheid van de C voor protonen en water zou moeten verbeteren door duplexdestabilisatie. We ontdekten inderdaad dat de deamineringshalfwaardetijden van AC = TG en dA U = m CG met een G-mismatch tegenover de gedeamineerde base respectievelijk 28 en 4,7 uur waren, en 11,4 en 54 keer sneller dan de overeenkomstige plaatsen in AC = m CG (Tabel 2). De U•G-mismatch droeg heel weinig bij aan de 54-voudige toename van de deaminatiesnelheid van de 3'-m C, zoals beoordeeld door slechts een 1,5-voudige toename van de deaminatiesnelheid van niet-overeenkomende AU = m CG vergeleken met gematchte AT= m CG (Tabel 1). De T•G-mismatch bleek echter de belangrijkste factor te zijn voor de 11,4 toename van de deamineringssnelheid van de 5'-C, zoals beoordeeld aan de hand van de 4,7-voudige toename van de deamineringssnelheid van AC= TG vergeleken met AC= TG. Het lijkt er dus op dat de 5'-C in AC=mCG een veel groter remmend effect uitoefent op de deaminering van de 3'-mC dan de 3'-mC op de 5'-C. De langzame algemene deaminatiesnelheid van AC=mCG kan dus worden verklaard door een snelheidsbeperkende eerste deaminatiestap die van vergelijkbare snelheid is voor zowel de 5'-C als de 3'-mC, gevolgd door een snelle tweede deamineringsstap.

Onze resultaten zijn consistent met de in vitro snelheid van deaminering van CC-dimeren in een CCCC-sequentie in een plasmide-DNA door een reversietest, 25 Een snelheidsbeperkende eerste deamineringsstap met een halfwaardetijd van 107� uur werd afgeleid omdat enkele C→T-mutaties een plateau bereikten van ongeveer 10% , terwijl de frequentie van CC→TT-mutaties in de loop van de tijd tot ongeveer 90% toenam. Een tweestaps deamineringsmechanisme met een snelheidsbeperkende eerste deaminatie past ook bij de waargenomen reversiefrequenties die worden geïnduceerd door een CC-dimeer in een CCC-sequentie in E coli. 29 Door de mutatiefrequentie aan te passen aan een analytische uitdrukking voor twee opeenvolgende eerste-ordestappen, werd berekend dat de tweede deamineringsstap 7,6 keer sneller was dan de eerste stap. In tegenstelling tot de resultaten van de in vitro deamineringsstudies, werd de halfwaardetijd voor de eerste en tweede deamineringsstappen berekend op respectievelijk 2,7 uur en 21 minuten, wat wijst op een ander proces, zoals transcriptie, dat de duplexaard van het DNA zou verstoren.

De langzamere deaminering van een CC-dimeer werd voor het eerst voorspeld door Lemaire en Ruzsicska uit hun studies van cis-syn- en trans-syn-I TpdC-dimeren. 22 Zoals hierboven besproken, (zie O6 van guanine betrokken bij het deamineringsmechanisme) ontdekten deze onderzoekers dat het trans-syn-I-dimeer langzamer deamineert dan het cis-syn-dimeer, wat ze toeschreven aan een gunstige dipoolinteractie tussen de O4-carbonyl van T met het iminium-ion van het geprotoneerde C. Op basis hiervan redeneerden ze dat een cis-syn CC-dimeer langzamer zou moeten deamineren dan een TC-dimeer omdat de aminogroep van de aangehechte C geen gunstige dipoolinteractie zou hebben met het iminium-ion van de geprotoneerde C. Wat echter raadselachtig is, is waarom m C in dimeren van CC m CC die worden geflankeerd door C deamineert met ongeveer dezelfde snelheid als het dimeer in het AC m CG, dat zou moeten worden versneld door de 3'-flankerende G (Tabel 1). Even raadselachtig is waarom de m C in dimeren van CC m CC, die een ongunstige dipool zou moeten hebben, met ongeveer dezelfde snelheid deamineert als in dimeren van T m CT. Het kan zijn dat het complementaire G-kanaal kan slippen en niet goed uitgelijnd is met het dimeerbevattende C-kanaal, waardoor de duplexstructuur wordt verstoord en deaminering wordt versneld. Het is ook mogelijk dat een flankerende C, in tegenstelling tot een C die op een bepaalde positie in het dimeer is gefixeerd, kan helpen deaminering te katalyseren door te helpen de aanval van hydroxide op de geprotoneerde C te richten door H-binding met de C4-aminogroep van de flankerende C.

Sequentie- en methyleringseffecten op de opbrengst van het fotoproduct

Bij het voorbereiden van CPD's voor deamineringsonderzoeken, ontdekten we dat de fotoproductopbrengst bij 302 nm zeer gevoelig was voor flankerende sequentie (Tabel 1). We observeerden hogere fotoproductopbrengsten wanneer de dipyrimidinen werden geflankeerd door A’s in vergelijking met G's en dat dit onafhankelijk was van de positie van de mC in de dipyrimidinesequentie. Een opbrengst van CPD-vorming van 17% werd waargenomen voor AT mCA vergeleken met 5,4% voor GT m CG en een opbrengst van CPD-vorming van 7,8% voor Am CTA vergeleken met 3,4% voor G m CTG. De opbrengst was ook hoog voor een mC geflankeerd door T's zoals beoordeeld aan de hand van de gecombineerde opbrengst van 15,7% voor T=mC en mC=T CPD's in TT m CTT. De opbrengst aan C m C CPD's was het laagst (1,4%) wanneer de sequentie werd geflankeerd door G's in GC m CG, gemiddeld (2,9%) wanneer geflankeerd door een A en een G, hoger (3,4%) wanneer geflankeerd door A's in AC m CA, en de hoogste (6% gecombineerde opbrengst) wanneer geflankeerd door C's in CC m CCC. Methylering verhoogde de fotoproductopbrengsten met 302 nm licht niet zo veel als de 15-voudige toename gerapporteerd voor gesimuleerd zonlicht, maar verhoogde alleen de opbrengst voor GT=CG, AT=CA, AT=CG en AC=TG met 5,4, 2,4, 2,4. en 8-voudig, respectievelijk ( Tabellen 1 & 2 ).

Recente experimenten hebben aangetoond dat een thyminedimeer wordt geproduceerd in &# 1 ps na UV-excitatie, wat sneller is dan DNA kan conformatie veranderen, wat suggereert dat de dimeeropbrengst gerelateerd is aan het aandeel van fotoreactieve conformaties. 43 Dit voorstel is ondersteund door moleculaire dynamica-berekeningen die de opbrengst van thyminedimeer correleren met conformatie. 44 Andere factoren kunnen ook de opbrengst van cyclobutaanpyrimidinedimeervorming door licht verhogen of verlagen, inclusief fotosensibilisatie, en zowel directe als door elektronenoverdracht gemedieerde fotoomkering van het dimeer. Vanwege de vele potentiële factoren is het moeilijk om de waargenomen dimeeropbrengst aan één enkele oorzaak toe te schrijven. Sommige factoren zullen naar verwachting echter niet veel bijdragen bij 302 nm, zoals directe fotoomkering, vanwege het lage absorptievermogen van pyrimidinedimeren. 22 Evenzo is base-gemedieerde foto-geïnduceerde elektronenoverdracht ook inefficiënt bij deze golflengte, behalve in het speciale geval van een quadruplex-dragend DNAzyme. 45 Wat betreft fotosensibilisatie, A is ten minste 10 keer efficiënter in energieoverdracht in aangeslagen toestand dan C, G of T bij 256 nm. 46 Als fotosensibilisatie een dominant mechanisme vertegenwoordigt bij 302 nm, zou de opbrengst van CPD's lager moeten zijn met flankerende T’s in vergelijking met A's, wat niet het geval is.

Correlatie van oxidatiepotentieel met fotoproductopbrengst

The observed yields are more consistent, however, with an electron-transfer mediated mechanism as revealed by CPD formation in the sequence NT m CN where N = G, A, and inosine (I). When G is replaced by A, which has a higher oxidation potential, the yield increased from 5.4% to 17%. When the A's are replaced with inosine (I), which has an even a higher oxidation potential, 47 the yield further increased from 17% to 29%. We also found that consecutive G’s, which have a lower oxidation potential than a single G, 48 decreased photoproduct yield. Dimer formation in ggGT m CG and GT m CGgg was lower (3.9 and 3.4% yields respectively) compared with GT m CG (5.4%). One possible explanation for these results is quenching by electron-transfer of the pyrimidine excited state by the flanking base. This would result in the formation of an exciplex that would deactivate by back electron transfer. When the flanking G's in GT m CG are replaced with 2-aminopurine (AP), which has a similar oxidation potential to A and therefore expected to increase the yield, the yield dropped from 5.4 % to 2.8 %. We attribute this drop in yield to competitive absorption of the 302 nm light by AP which has a red-shifted absorption maximum at about 320 nm.

In further support of an exciplex mechanism, we observe a lower photodimer yield when G is located in the 5’ position relative to the dipyrimidine site. When the 5'-A in the sequence AT m CA is replaced by G, the yield drops about 50% from 17% to 8.8%, but if the 3'-A is replaced by G, the yield only drops by about 30% to 12%. This is consistent with better stacking at Pu-Py sequences compared to Py-Pu sequences ( Fig. 5C ), 49 that would facilitate electron transfer and exciplex formation. Interestingly, the effect of flanking A, C, G and T on the yield of photoproduct induced at 302 nm parallels the yield observed at 254 nm, which has been explained by a competition between dimer formation and photoinduced electron transfer-mediated reversion. 50

Implications for the origin of sunlight-induced C to T mutations

In our study, we found that a 3'-flanking G has the unique ability to increase the deamination rate of m C in a T m C cyclobutane pyrimidine dimer, but not in a C m C dimer, which occurs about 50 times slower. If one accepts the deamination bypass mechanism as the principal pathway for C to T mutations, we would then expect that these mutations would occur more frequently at T m C sites than at C m CG sites as has been observed in a SupF system. 30 On the other hand, C m CG and not T m CG are the major mutation hotspots in the p53 gene of skin cancers. Of 86 C → T mutations at 8 methylated CCG and 3 TCG sites in non-XP squamous and basal skin cancers, 81 (97%) were at C m CG sites ( Table 3 ). 51 The lower than expected frequency of TCG → TTG mutations can be explained, in part, by the very low frequency observed for this mutation at two of the these three T m CG sites in the p53 gene in all cancers, indicating that they are not as tumor promoting as those at the C m CG sites..

Tafel 3

Analysis of mutation spectra of non-XP, squamous cell and basal cell carcinomas of the skin at 11 Py m CG sites from the p53 database. een

m CG codonnon-transcribed
/transcribed b
CC→TCCC𡤬TCC→TTTC→TTXPC
152CCG/na8/na
158CCG/na 1/na1/na
196CCG/TCG 13/02/0 2/0
213TCG/TCG 3/0
245na/CCGna/2na/5na/2
248CCG/CCG 12/99/1 6/0
282CCG/CCG 913 6/0
Totaal11 sites104528314

The high frequency of C→T mutations at C m CG in the p53 gene of skin cancers also suggests that dimers at these sites must be repaired slowly enough to allow deamination to occur prior to pol η replication. In support of this notion, it has been found that only 20% of dimers in CHO cells were repaired in 6 h, and only 25�% after 24 h. 52 The initial rapid removal of 20% of the dimers is likely due to transcription coupled repair, which has been shown to remove 70% of CPDs within 24 h. 53 Transcription-coupled repair is known to preferentially remove dimers from the transcribed strand of the p53 gene, 54 which would explain why 71/84 mutations at the 8 C m CG sites are in the non-transcribed strand. It has also been found that 25�% of cis-syn dimers at two C m CG sites in exon 8 of the mouse p53 gene remain after 48 hours. 7 Thus it is likely that some fraction of dimers may persist for hundreds of hours in untranscribed regions as well as in untranscribed strands, giving them sufficient time to deaminate. Transcription, however, might also accelerate deamination in non-transcribed strands due to disruption of the duplex structure.

While slow repair of C= m C dimers may explain the high frequency of C→T mutations at C m CG sites, it does not explain the much higher percentage of single C→T mutations than tandem CC→TT mutations at these sites. Of 83 C→T and CC→TT mutations at the 8 C m CG sites, 8 are CC → TC and 45 are CC𡤬T single base mutations (66%), whereas only 28 are CC → TT tandem mutations (34%). Since the second deamination step in tandem deamination is much faster than the first, the doubly deaminated product is calculated from the kinetic data ( Table 2 ) to predominate after only about 5% of the dimer has deaminated (Fig. S2). Unless replication of the dimers only takes place during this first 5% of reaction, an alternative explanation for the high percentage of single C→T mutations is needed. One possibility is that excision repair of the doubly deaminated dimer (U=T•GG) is faster than the singly deaminated dimers (U= m C•GG and C=T•GG), which would suppress CC→TT mutations as shown in the scheme in Fig. 7 . We have previously found that a T=T•GA mismatched dimer destabilizes the DNA duplex by 0.7 kcal compared to a matched T=T� dimer, 55 suggesting that a double mismatch would be even more destabilizing, and hence more easily detected by the excision repair system. Indeed, a doubly mismatched dimer, T=T•GG, is repaired faster than the singly mismatched dimer T=T•GA, which is repaired at a similar rate to T=T𠈪G, both of which are repaired much faster than T=T�. 56 , 57

Proposed scheme showing the possible deamination/bypass pathways leading to C→T and CC→TT pathways at an AC m CG site. Black arrows refer to chemical steps, red arrows to excision repair steps, blue arrows to pol η bypass steps, and dotted arrows to either excision repair, or replication of the undamaged strand. The thickness of the arrows represents the relative rates of deamination (experimentally determined) or repair (proposed). Values in italics are the experimentally determined half lives in hours at 37ଌ.

In further support of our scheme ( Fig. 7 ), the frequency of CC→TT mutations is much higher in skin cancers from XPC patients than in non-XP patients (76% vs 8%) and occurs almost exclusively in the non-transcribed strand. 58 , 59 At the 8 C m CG hotspots, only CC → TT mutations were observed. Sufferers of XPC lack the DNA damage recognition component of nucleotide excision repair, and thus C=C dimers in the non-transcribed strand have enough time to completely deaminate and cause CC → TT mutations. Our scheme also would predict that CC𡤬T mutations would predominate over CC→TC mutations because while both U= m C and C=T dimers are produced at the same rate, U= m C is more rapidly depleted due to the accelerating effect of G on deamination. In accord with this, 45/53 of the C→T mutations at the 8 C m C hotspots are CC𡤬T mutations. Because these CC𡤬T mutations correspond to missense mutations, it is possible that they predominate because of some selective survival advantage conferred by the mutant protein, and not because of selective deamination


Eukaryotic RNA Processing*

C-to-U Editing

Deamination of cytosine to uracil is performed by an editing complex, sometimes referred to as the editosome, which includes the deaminase Apobec-1 ( Fig. 11.7 ). Only a small number of nuclear-encoded targets have been identified, and in these, editing generates translation termination codons, producing shorter forms of the encoded proteins. The best-characterized example of C-to-U RNA editing involves the mRNA encoding intestinal apolipoprotein B (ApoB), where CAA-to-UAA editing in the loop of a specific stem-loop structure generates a stop codon. The truncated protein, ApoB48, has an important role in lipoprotein metabolism. In other cases editing may generate mRNAs that are targets for NMD (see later), leading to downregulation of protein expression.


Auteurs informatie

Gad Getz and Dmitry A Gordenin: These authors contributed equally to this work.

Voorkeuren

Laboratory of Molecular Genetics, National Institute of Environmental Health Sciences, Durham, North Carolina, USA

Steven A Roberts, Michael A Resnick & Dmitry A Gordenin

The Broad Institute of MIT and Harvard, Cambridge, Massachusetts, USA

Michael S Lawrence, Petar Stojanov, Adam Kiezun, Gregory V Kryukov, Scott L Carter, Gordon Saksena & Gad Getz

Integrative Bioinformatics, National Institute of Environmental Health Sciences, Durham, North Carolina, USA

Leszek J Klimczak, Sara A Grimm & David Fargo

Harvard Medical School, Boston, Massachusetts, USA

SRA International, Inc., Durham, North Carolina, USA

Shawn Harris & Ruchir R Shah

Massachusetts General Hospital Cancer Center, Boston, Massachusetts, USA

Department of Pathology, Massachusetts General Hospital, Boston, Massachusetts, USA

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

Bijdragen

S.A.R., G.G. and D.A.G. designed the study. S.A.R., M.S.L., L.J.K., S.A.G., D.F., P.S., A.K., G.V.K., S.L.C., G.S., S.H., R.R.S., M.A.R., G.G. and D.A.G. contributed to data analysis. S.A.R. and D.A.G. wrote the manuscript.

Corresponderende auteurs


Resultaten

Positional Variation of the Nucleotide Strand Bias

To quantify the strength of the asymmetric substitution pattern, we first estimated the contribution of the replication-induced bias at third codon positions (Bl) relative to the bias caused by transcription- and translation-associated effects (BII) in 20 γ-proteobacterial genomes, including three B. aphidicola genomes ( table 1). The starting point for our comparative analysis is that B. aphidicola (Bp) shows a fourfold higher replication-induced bias (Bl = 0.408) than B. aphidicola (Sg) and (Ap) (Bl = 0.125 and 0.102, respectively) ( table 1) ( Lobry and Sueoka 2002). Taken together, as much as 89% of the total GC bias at third codon positions in this species is explained by differences in the rates and/or patterns of nucleotide substitutions between the leading and the lagging strands.

A plot of the variation in GC skew along the chromosome in B. aphidicola (Bp) shows a rather uniform increase relative to the other two species ( fig. 1A), although the GC skew is much stronger than the TA skew in each species ( fig. 1B). Local variations within and among genomes were observed, with more than 10 segments showing an altered direction of the GC skew in B. aphidicola (Sg) and (Ap) that is evident irrespectively of whether all sites ( fig. 1A) or only third codon positions are included in the analysis ( fig. 1B). Two of these segments coincide with chromosomal inversions, one of which covers six genes (ygfZ, prfB, lysS, lysA, lgt, en thyA) and the other a single gene (pyrF) (marked with arrows in fig. 1A). Because a reverse bias is observed at the longer segment compared to its flanking regions in B. aphidicola (Ap) and (Sg), we infer that the inversion probably occurred in an ancestor of these two species.

(EEN) Representation of the GC skew in B. aphidicola together with the positions of genes with significantly higher nonsynonymous substitution frequencies and the positions of genes lost in B. aphidicola (Bp) as compared with B. aphidicola (Sg). The colors in (EEN) show the chromosomal variation of the GC skew pattern in the different species: yellow (Bp), red (Sg), and green (Ap). Genes with significantly higher nonsynonymous substitution rate are all on the leading strand (blue lines). The black lines represent genes that are missing in B. aphidicola (Bp) compared to (Sg) and the red lines indicate the position of priA, topA, dnaT, hinA, himD, en fis. The arrows represent the location of the two inversions. (B) Representation of the GC skew and TA skew in B. aphidicola (Bp), (Ap), and (Sg) including third codon positions only.

(EEN) Representation of the GC skew in B. aphidicola together with the positions of genes with significantly higher nonsynonymous substitution frequencies and the positions of genes lost in B. aphidicola (Bp) as compared with B. aphidicola (Sg). The colors in (EEN) show the chromosomal variation of the GC skew pattern in the different species: yellow (Bp), red (Sg), and green (Ap). Genes with significantly higher nonsynonymous substitution rate are all on the leading strand (blue lines). The black lines represent genes that are missing in B. aphidicola (Bp) compared to (Sg) and the red lines indicate the position of priA, topA, dnaT, hinA, himD, en fis. The arrows represent the location of the two inversions. (B) Representation of the GC skew and TA skew in B. aphidicola (Bp), (Ap), and (Sg) including third codon positions only.

Relative Rates of Nonsynonymous Substitutions

To test the hypothesis that B. aphidicola (Bp) evolves more rapidly than the other two species, we estimated the relative rates of sequence evolution for a set of orthologous genes present in all three B. aphidicola soort. The tests were performed as implemented in RRTree ( Robinson-Rechavi and Huchon 2000), using W. glossinidia (330 orthologs) and B. floridanus (337 orthologs) as outgroups. The motivation for using these species as outgroups is that they, despite being closely related to B. aphidicola and having similar genomic GC contents (W. glossinidia G + C = 22.5% B. floridanus G + C = 27.4%), display different levels of GC skew. The magnitude of the strand-specific DNA asymmetry in B. floridanus is even stronger than in B. aphidicola (Bp) ( table 1), whereas there are no signs of such a bias in W. glossinidia and the origin of replication has as yet not been identified in this species.

The relative rate tests indicated that only three genes (hflC, hflK, en rne) evolve with a significantly (P < 0.05 with Bonferroni-Holm correction) elevated frequency of nonsynonymous nucleotide substitutions in B. aphidicola (Bp) relative to B. aphidicola (Sg) and (Ap). All three of these were found to evolve significantly faster in all of the four possible tests (P < 0.05). No gene was identified as evolving faster in B. aphidicola (Sg) or B. aphidicola (Ap).

Patterns of Strand-Specific Nucleotide Substitutions

To explore other reasons for the different magnitudes of the GC skew in the three B. aphidicola lineages, we recorded the spectrum of nucleotide substitutions for each codon position individually in each lineage, again using W. glossinidia of B. floridanus as the outgroups. As expected, we found that the overall distributions of the substitution frequencies differed significantly for the leading and lagging strand genes within each genome (multinomial test, P < 0,0001). Most importantly, we noted that the distributions differed significantly for the three B. aphidicola genomes on both the leading and lagging strands (multinomial test, P < 0,0001). The variance and the SD were estimated for genes longer than 750 bp (supplementary table 1).

Transitions were observed to be the most frequent type of substitutions in B. aphidicola (Bp), with a relative predominance of C → T (C:G → T:A) on the leading strand genes (which might arise through C → T on the leading strand as well as through G → A substitutions on the lagging strand) ( figs. 2 and 3). The bias was consistently observed at second codon positions, which are the least likely to be saturated ( fig. 2A) as well as for all codon positions combined ( fig. 2B). The strand bias of the C:G → T:A substitutions in B. aphidicola (Bp) was equal or slightly higher than the strand bias of the A:T → G:C substitutions in the same species ( fig. 2A).

Differences in substitution patterns for genes located on the leading and lagging strands of B. aphidicola (Bp), (Ap), and (Sg). The values refer to the strand-specific difference in substitution frequencies for (EEN) only second codon positions and (B) all three codon positions. C:G → T:A = (C → T(Leading) + G → A(Lagging))−(C → T(Lagging) + G → A(Leading)) and so on. Values above and below 0 refer to the substitution frequencies that are higher on the leading and the lagging strands, respectively. Estimates including the whole branch from the divergence of B. aphidicola (Ap) or (Sg) from B. aphidicola (Bp) are indicated as Ap/Sg followed by either (Ap) or (Sg), respectively. Each species is represented by two bars of the same color, representing the two outgroups used for the analysis, B. floridanus en W. glossinidia in that order.

Differences in substitution patterns for genes located on the leading and lagging strands of B. aphidicola (Bp), (Ap), and (Sg). The values refer to the strand-specific difference in substitution frequencies for (EEN) only second codon positions and (B) all three codon positions. C:G → T:A = (C → T(Leading) + G → A(Lagging))−(C → T(Lagging) + G → A(Leading)) and so on. Values above and below 0 refer to the substitution frequencies that are higher on the leading and the lagging strands, respectively. Estimates including the whole branch from the divergence of B. aphidicola (Ap) or (Sg) from B. aphidicola (Bp) are indicated as Ap/Sg followed by either (Ap) or (Sg), respectively. Each species is represented by two bars of the same color, representing the two outgroups used for the analysis, B. floridanus en W. glossinidia in that order.

The estimated substitution frequencies for genes located on the leading and lagging strands of B. aphidicola (Bp), (Ap), and (Sg). The values refer to the frequency of substitutions at second codon positions. Each bar shows the sum of the equivalent substitutions at the leading and lagging strands. Estimates including the whole branch leading to B. aphidicola (Ap) or (Sg) are indicated as Ap/Sg followed by either (Ap) or (Sg), respectively. B. floridanus was used as the outgroup in the analysis.

The estimated substitution frequencies for genes located on the leading and lagging strands of B. aphidicola (Bp), (Ap), and (Sg). The values refer to the frequency of substitutions at second codon positions. Each bar shows the sum of the equivalent substitutions at the leading and lagging strands. Estimates including the whole branch leading to B. aphidicola (Ap) or (Sg) are indicated as Ap/Sg followed by either (Ap) or (Sg), respectively. B. floridanus was used as the outgroup in the analysis.

The substitution patterns in B. aphidicola (Ap) and (Sg) was different, with C → T substitutions being equally frequent on both strands or slightly more frequent on lagging strand genes ( figs. 2 and 3). However, this pattern is reversed if B. aphidicola (Bp) is excluded from the analysis, but even so the predominance of C → T substitutions on the leading strand is much lower in B. aphidicola (Ap) and (Sg) compared to B. aphidicola (Bp) (data not shown). A similar substitution pattern was also observed for the ancestral lineage to B. aphidicola (Sg) and (Ap) ( figs. 2 and 3). Thus, to the extent that C → T deaminations contribute to the strand bias of the C:G → T:A substitutions at second codon positions, we infer that these occur at a higher frequency on the leading strand in B. aphidicola (Bp) as compared to the lagging strand (Mann-Whitney, P < 0,001). No such relative increase on the leading strand was observed in either of the other two species ( figs. 2 and 3).

Even for divergences as low as 10%, the use of parsimony may infer an excess of common to rare changes if the sequences are highly biased ( Eyre-Walker 1998). In our comparisons, the substitution frequencies were in the range of 0.15 (for B. aphidicola (Ap) and (Sg)) to 0.30 (for B. aphidicola (Bp) relative to (Ap) or (Sg)) nonsynonymous substitutions per site and the frequencies of T/(T + C) at second codon positions were 67% on the leading strand and 64% on the lagging strand. Hence, it is conceivable that we have slightly underestimated the total amount of substitutions from C → T. However, this is expected to neither influence the inferred relative differences between strands nor between species.


Dankbetuigingen

We thank Dr. Mary Muers for comments on the manuscript.

Financiering

SK and B.S.-B. are funded by Ludwig Cancer Research. SK received funding from BBSRC grant BB/M001873/1. MT and J.T. are funded by EPSRC (EP/F500394/1).

Beschikbaarheid van gegevens en materialen

All data used in this study were downloaded from public repositories. A complete list of whole-genome sequencing data sets and their accession information can be found in Additional file 1: Table S1 and the list of all whole-genome sequencing samples and signature exposures are in Additional file 5: Table S4. The replication direction [11] was taken from http://software.broadinstitute.org/cancer/cga/AsymTools, table per_base_territories_20kb.mat. The replication origins measured by SNS-seq [13] were based on the supplementary files of National Center for Biotechnology Information Gene Expression Omnibus accession GSE37757. The strand-specific signatures are in Additional file 6: Table S5. The code is available at https://bitbucket.org/bsblabludwig/replicationasymmetry [71] and Figshare (https://figshare.com/s/21174d60d594ddb9b83d, DOI https://doi.org/10.6084/m9.figshare.6941456) [72] under GPL3 license.


De novo mutations in clinical practice

The recent recognition of the importance of de novo mutations in human disease has many implications for routine genetic testing and clinical practice. De novo mutations are now established as the cause of disease in a large fraction of patients with severe early-onset disorders, ranging from rare congenital malformation syndromes [185, 186] to more-common neurodevelopmental disorders, such as severe forms of intellectual disability [33], epilepsy [31], and autism [29]. Together, these disorders represent a substantial proportion of all patients seen at neuropediatric and clinical genetics departments around the world.

Pinpointing the genetic cause of a disorder caused by a de novo mutation in an individual can be challenging from the clinical point of view because of pleiotropy as well as genetic heterogeneity underlying a single phenotype. For instance, intellectual disability can be caused by de novo point mutations, indels, or CNVs in any of hundreds of genes [117]. This obstacle to providing a clinical diagnosis strongly argues for a reliable and affordable genomics approach that can be used to detect these de novo mutations in large groups of patients. Exome and genome sequencing (which additionally offers the possibility of accurate detection of structural variation) of patient–parent trios is ideal for this and will soon become the first-tier diagnostic approach for these disorders. A key advantage of this trio-based sequencing approach is that it helps prioritize candidates by de novo occurrence, allowing clinical laboratories to focus on the most likely candidate mutations for follow-up and interpretation (Box 3) [187]. The interpretation of candidate de novo mutations can be guided by the use of different scores, such as the “residual variation intolerance score” (RVIS), based on the comparison of rare versus common missense human variation per gene [188]. Alternatively, “selective constraint scores” can be used, based on the observed versus expected rare functional variation per gene within humans [126].

The identification of a de novo mutation as the cause of disease in a patient has several implications for the patient and his or her family. First, the detection of the genetic defect underlying the phenotype establishes a genetic diagnosis that can be used to provide a prognosis based on data from other patients with similar mutations [189] and information about current treatment options [190] and, in the future, for the development and application of personalized therapeutic interventions [191]. Furthermore, the identification of a de novo mutation offers the parents of the affected patient an explanation as to why the disorder occurred and might help deal with feelings of guilt [192, 193]. In terms of family planning, the identification of a de novo mutation as the cause of disease in a child can be positive news with regard to recurrence risk, as it is much lower than for recessive or dominant inherited disorders (slightly above 1% versus 25 and 50%, respectively) [11, 158]. However, the recurrence risk is strongly dependent on the timing of the mutation as parental mosaicism for the mutation increases the risk of recurrence [158]. Approximately 4% of seemingly de novo mutations originate from parental mosaicism detectable in blood [11], and recent work suggests that transmission of parental mosaicism could explain up to 10% of de novo mutations in autism spectrum disorder [194]. This entails that a fraction of de novo mutations have an estimated recurrence risk above 5% [158]. Furthermore, close to 7% of seemingly de novo mutations arise as postzygotic events in the offspring [88, 89, 91]. Parents of an individual with a postzygotic mutation have a low risk for recurrence of the mutation in an additional child, estimated as being the same as the population risk [90]. Targeted deep sequencing of a disease-causing mutation can be performed to test for its presence in parental blood and detect mosaicism in the offspring. Although it is not yet offered on a routine basis, this kind of testing can provide a personalized and stratified estimate of the recurrence risk based on the presence or absence of mosaicism in the parents or in the offspring.

Finally, it is impossible to prevent de novo mutations from arising in the germline of each new generation, but attention must be brought to the factors that increase the number of de novo mutations in the offspring. The single most important risk factor is advanced paternal age at conception [15], which is of great importance from an epidemiological perspective since most couples in Western countries are having children at later ages. In fact, this increase in de novo mutations with paternal age at conception might explain epidemiological studies that link increased paternal age to increased risk of neurodevelopmental disorders in offspring [195]. A recent population-genetic modeling study, however, indicated that de novo mutations might not explain much of the increased risk of psychiatric disorders in children born to older fathers [122]. While this might be the case for relatively mild and later-onset phenotypes such as schizophrenia, de novo mutations are responsible for the majority of the most severe pediatric disorders arising in outbred populations [10, 196]. At present, most attention, advice, and guidelines are focused on advanced maternal age as a public health issue. It is evident from current work on de novo mutations that advising the public, including policy makers, on potential risks of advanced paternal age and the burden it might bring on society is crucial. An extreme “solution” if reproduction is to be postponed might be to promote cryopreservation of oocytes and sperm [197], a measure under much debate that has been termed “social freezing”.


Causes of Gene Mutation

Gene mutations are most commonly caused as a result of two types of occurrences. Environmental factors such as chemicals, radiation, and ultraviolet light from the sun can cause mutations. These mutagens alter DNA by changing nucleotide bases and can even change the shape of DNA. These changes result in errors in DNA replication and transcription.

Other mutations are caused by errors made during mitosis and meiosis. Common errors that occur during cell division can result in point mutations and frameshift mutations. Mutations during cell division can lead to replication errors which can result in the deletion of genes, translocation of portions of chromosomes, missing chromosomes, and extra copies of chromosomes.


Bekijk de video: Aminosyrornas metabolism (December 2021).