Informatie

Hoe veroorzaakt NHEJ indels?


Ik was aan het lezen over CRISPR-cas9 en hoe het werkt en ik heb problemen met het begrijpen hoe NHEJ om de DSB te repareren indels kan veroorzaken. Moet de NHEJ niet gewoon de twee DNA-strengen weer aan elkaar plakken?

Ik meen ergens gelezen te hebben dat als andere middelen een DSB veroorzaken, zoals bepaalde chemicaliën, ze ook nucleotiden kunnen beschadigen/klieven; de beschadigde nucleotiden zouden vóór de ligatie moeten worden verwijderd en overhangen moeten worden opgevuld door polymerase, wat zou kunnen resulteren in de fouten waar NHEJ bekend om staat.

Aangezien cas9 dergelijke schade niet veroorzaakt, hoe kan het dan resulteren in een indel?

Bedankt.


Dit is een zeer interessante vraag en ik had er nog niet eerder over nagedacht. Ik herhaal de achtergrond van uw vraag.

Achtergrond

Cas9 knipt de beide strengen van het doel-DNA op dezelfde locatie door, waardoor een stompe eindsnede wordt gemaakt. Gewoonlijk leiden plakkerige uiteinden en microhomologe uiteinden tot indels vanwege exonucleolytische clipping en toevoeging van extra basen door pol-µ. De vraag is hoe indels ontstaan ​​tijdens NHEJ-gemedieerde herligatie van stompe uiteinden.


NHEJ leidt mogelijk niet altijd tot indels. De meeste botte sneden kunnen foutloos worden gerepareerd. Sommige niet-stompe sneden zijn ook perfect opnieuw geligeerd; het beste voorbeeld hiervan is VDJ-recombinatie. De binding van Ku-eiwitten is essentieel voor een perfecte herligatie (canonieke NHEJ/C-NHEJ).

Er zijn echter enkele variante niet-canonieke routes die alternatieve-NHEJ, back-up-NHEJ en microhomologie gemedieerde end-joining (MMEJ) omvatten (Bétermier et al. 2014). Sommige studies verwijzen ook naar al deze routes als alternatief-NHEJ of altNHEJ. Deze alternatieve routes omvatten resectie van nucleotiden door exonucleasen zoals Mre11 om overhangen te produceren. Onvolmaakte uitlijning van deze overhangen voorafgaand aan ligatie leidt tot indels. Soms gebeurt niet-matrijstoevoeging van nucleotide door de werking van terminale deoxyribonuclotidetransferase (TdT). Pol-µ kan ook willekeurige nucleotiden toevoegen aan het 3'-uiteinde (Lieber 2010).

Over het algemeen zou de neiging van DSBR via alternatieve NHEJ-routes hoger zijn wanneer Ku-activiteit lager is. Zelfs met een matige Ku-activiteit is er altijd een kans dat alternatieve routes in actie komen. Bovendien moet worden opgemerkt dat ligaties met kleverige uiteinden efficiënter zijn dan ligaties met stompe uiteinden.


overgenomen van Betermier et al. 2014


Hoofdstuk drie - Dynamiek van Indel-profielen geïnduceerd door verschillende CRISPR/Cas9-leveringsmethoden

De introductie van CRISPR/Cas9-genediting in zoogdiercellen is een wetenschappelijke doorbraak, die fundamenteel onderzoek en gentherapie sterk heeft beïnvloed. De eenvoud en algemene toegang tot CRISPR/Cas9-reagentia heeft op een ongekende manier gentargeting in biomedisch onderzoek "gedemocratiseerd", waardoor genetische manipulatie van elk gen in elke cel, weefsel, orgaan en organisme mogelijk is. Het vermogen voor snelle, nauwkeurige en efficiënte profilering van de dubbelstrengs breukgeïnduceerde inserties en deleties (indels), gemedieerd door een van de beschikbare programmeerbare nucleasen, is van het grootste belang voor een bepaalde benadering van gentargeting. In deze studie bekijken we de meest gebruikte indel-detectiemethoden en met behulp van een robuuste, gevoelige en kostenefficiënte Indel-detectie door Amplicon-analysemethode hebben we de impact onderzocht van de meest gebruikte CRISPR/Cas9-leveringsformaten, waaronder lentivirustransductie, plasmide lipofectie en ribo-elektroporatie van kerneiwitten, over de dynamiek van de vorming van indelprofielen. We observeren snelle indel-vorming met behulp van RNP-elektroporatie, vooral met synthetisch gestabiliseerd gRNA, evenals een langdurige afname van de algehele indel-frequentie met op lipofectamine gebaseerde, plasmide-transfectiemethoden. De meeste methoden bereiken de maximale bewerking op dag 2-3 na levering. Verder vinden we een relatieve toename in frequentie van grotere indels (>6 bp) onder voorwaarde van aanhoudende bewerking met behulp van stabiel geïntegreerde lentivirale gRNA- en Cas9-vectoren.


Indel

Indel is een moleculair biologische term voor een inserie of deletie van basen in het genoom van een organisme. Het wordt ingedeeld bij kleine genetische variaties, met een lengte van 1 tot 10.000 basenparen, [1] [2] [3] [4] [5] [6] [7] inclusief invoeg- en deletiegebeurtenissen die kunnen worden gescheiden door vele jaren en mogen op geen enkele manier met elkaar in verband staan. [8] A micro-indel wordt gedefinieerd als een indel die resulteert in een netto verandering van 1 tot 50 nucleotiden. [9]

In coderende gebieden van het genoom, tenzij de lengte van een indel een veelvoud van 3 is, zal het een frameshift-mutatie produceren. Een gemeenschappelijke micro-indel die resulteert in een frameshift veroorzaakt bijvoorbeeld het Bloom-syndroom bij de Joodse of Japanse bevolking. [10] Indels kan worden gecontrasteerd met a punt mutatie. Een indel voegt nucleotiden in en verwijdert ze uit een sequentie, terwijl een puntmutatie een vorm van substitutie is die vervangt een van de nucleotiden zonder het totale aantal in het DNA te veranderen. Indels kan ook worden gecontrasteerd met Tandem Base Mutations (TBM), die het gevolg kunnen zijn van fundamenteel verschillende mechanismen. [11] Een TBM wordt gedefinieerd als een substitutie op aangrenzende nucleotiden (voornamelijk substituties op twee aangrenzende nucleotiden, maar substituties op drie aangrenzende nucleotiden zijn waargenomen). [12]

Indels, ofwel inserties of deleties, kunnen worden gebruikt als genetische markers in natuurlijke populaties, vooral in fylogenetische studies. [13] [14] Het is aangetoond dat genomische regio's met meerdere indels ook kunnen worden gebruikt voor soortidentificatieprocedures. [15] [16] [17]

Een indelverandering van een enkel basenpaar in het coderende deel van een mRNA resulteert in een frameshift tijdens mRNA-translatie die zou kunnen leiden tot een ongepast (voortijdig) stopcodon in een ander frame. Indels die geen veelvouden van 3 zijn, zijn bijzonder ongebruikelijk in coderende gebieden, maar relatief vaak in niet-coderende gebieden. [18] [19] Er zijn ongeveer 192-280 frameshifting-indels in elke persoon. [20] Indels vertegenwoordigen waarschijnlijk tussen de 16% en 25% van alle sequentiepolymorfismen bij mensen. [1] In de meeste bekende genomen, waaronder mensen, is de indelfrequentie zelfs aanzienlijk lager dan die van single nucleotide polymorphisms (SNP), behalve in de buurt van zeer repetitieve regio's, waaronder homopolymeren en microsatellieten. [ citaat nodig ]

De term "indel" is de afgelopen jaren door genoomwetenschappers gecoöpteerd voor gebruik in de hierboven beschreven zin. Dit is een verandering ten opzichte van het oorspronkelijke gebruik en de oorspronkelijke betekenis, die voortkwam uit systematiek. In de systematiek konden onderzoekers verschillen tussen sequenties vinden, bijvoorbeeld van twee verschillende soorten. Maar het was onmogelijk om te concluderen of de ene soort de reeks verloor of de andere soort die kreeg. Bijvoorbeeld soorten EEN heeft een reeks van 4 G-nucleotiden op een locus en soort B heeft 5 G's op dezelfde locus. Als de selectiewijze onbekend is, kan men niet zeggen of soort A één G heeft verloren (een "deletie"-gebeurtenis") of soort B één G heeft gewonnen (een "insertie"-gebeurtenis). Wanneer men de fylogenetische richting van de sequentie niet kan afleiden change, wordt de sequence change-gebeurtenis een "indel" genoemd. citaat nodig ]


INDEL VARIATIE OP MENSELIJK CHROMOSOOM 22

De eerste grootschalige inspanningen om INDEL's in het menselijk genoom te identificeren waren gericht op menselijk chromosoom 22 (23,24). Mullikin et al. (23) analyseerde ABI-re-sequencinggegevens van 31 mensen om genetische variatie op chromosoom 22 te identificeren en stelde vast dat 13% van de varianten op dit chromosoom INDEL-polymorfismen waren. Dawson et al. (24) identificeerde later dichte clusters van zowel SNP's als INDEL's op chromosoom 22 door de overlappende sequenties van aangrenzende bacteriële kunstmatige chromosoom (BAC) klonen en P1-afgeleide kunstmatige chromosoom (P1) klonen te vergelijken. De BAC- en P1-bibliotheken die werden gegenereerd om chromosoom 22 te sequencen, werden geconstrueerd uit negen verschillende diploïde individuen en herbergden 18 verschillende haplotypes. Daarom zou nieuwe genetische variatie gemakkelijk kunnen worden ontdekt door de overlappende sequenties van aangrenzende klonen te vergelijken. Een totaal van 10 051 SNP's en 2180 kleine INDEL's werden geïdentificeerd uit de 358 overlappende regio's die werden vergeleken [13,2 Mb overlappend DNA (24)]. Deze studies suggereerden dat kleine INDEL's waarschijnlijk overvloedig aanwezig waren in menselijke genomen (82% van de gedetecteerde varianten waren SNP's en 18% waren INDEL's). Tweeënnegentig procent van deze varianten werd bevestigd in vervolgvalidatiestudies (tabel  1 ).

Tabelਁ.

INDEL-ontdekking in menselijke populaties en persoonlijke genomen

StudieJaarAantal INDEL'sIndividu(en)MethodeINDEL-maatbereik (bp)Validatie studie a Tarief (%)
menselijke populaties
 Mullikin et al. (23)2000NR b 31ABI-traceringtoewijzingNRNDNvt
�wson et al. (24)200121809 c BAC-overlapNRPCR/RFLP/indringer92
 Weber et al. (13)20022000NRVerscheidene2�PCR58
𠀻hangale et al. (14)20052393137PCR/sequencing1�NDNvt
𠀻hangale et al. (25)20061126CODERENPCR/sequencing1 tot 30Handmatige inspectie100
 Molen et al. (15)2006415 43636ABI-traceringtoewijzing1�PCR97
 Kind et al. (22)2008796 2738ABI-traceringtoewijzing1�ND d 96
 R.E. molens et al. (ingediend voor publicatie)20101,96 miljoen79 euro ABI-traceringtoewijzing1� 000PCR f 97
Persoonlijke menselijke genomen
 Levy et al. (1)2007823 396VenterABI1� 711PCR84� g
 Wheeler et al. (2)2008222 718Watson4542� 896PCR70 uur
 Wang et al. (3)2008135 262Han ChineesIllumina/SOAP1𠄳PCR90�
�ntley et al. (4)2008400 000 i YorubanIllumina/ELAND/MAQ1�NDNvt
 Ley et al. (5)2008726 uur AMLIllumina/Aangepast1�PCR93 j
𠀺hn et al. (7)2009342 965Koreaans (SJK)Illumina/MAQ1�PCR100 u,k
 Kim et al. (6)2009170 202Koreaans (AK1)Illumina/Alpheus1�Opnieuw rangschikken100
 Schuster et al. (8)2010NRAfrikaanseNvtNvtNvtNvt

NR, niet gemeld ND, niet gedaan Nvt, niet van toepassing.

a Gedefinieerd als een onderzoek waarin een willekeurig geselecteerde set INDEL-varianten wordt onderzocht die zijn voorspeld bij echte mensen en vervolgens de bevestigingssnelheid van de voorspelde varianten wordt gemeten met behulp van een test zoals PCR-RFLP, PCR-sequencing, microarray-genotypering of een vergelijkbare test.

b 13% van de varianten waren INDEL's.

c BAC/PAC-bibliotheken (die elk een mens vertegenwoordigen).

d SSAHA-DIP, dat werd gebruikt om de INDEL's te detecteren, heeft een validatiepercentage van 96% (46).

e Aantal mensen of bibliotheken (elke bibliotheek vertegenwoordigt een mens).

f In dit onderzoek is gebruik gemaakt van de pijpleiding die hierboven is ontwikkeld en getest (15).

g 36/43 (84%) van 100� bp homozygote inserties en 15/15 (100%) van de onderzochte INDEL's van 1𠄸 bp werden bevestigd.

j 24/26 (93%) van de kandidaten die met succes werden onderzocht, werden gevalideerd.

k 9/9 (100%) van de onderzochte INDEL's waren gevalideerd.


Abstract

Dubbelstrengs DNA-breuken (DSB's) zijn de gevaarlijkste vorm van DNA-schade omdat ze kunnen leiden tot het verlies van grote chromosomale regio's. In alle zoogdiercellen worden DSB's die tijdens de celcyclus voorkomen, voornamelijk gerepareerd door de niet-homologe DNA-end-join (NHEJ)-route. Defecten in NHEJ resulteren in gevoeligheid voor ioniserende straling en de ablatie van lymfocyten. De NHEJ-route maakt gebruik van eiwitten die de DNA-uiteinden op een flexibele manier herkennen, wegsnijden, polymeriseren en ligeren. Deze flexibiliteit stelt NHEJ in staat te functioneren op een breed scala aan DNA-eindconfiguraties, waarbij de resulterende gerepareerde DNA-juncties vaak mutaties bevatten. In deze Review bespreken we de meest recente bevindingen met betrekking tot de relatieve betrokkenheid van de verschillende NHEJ-eiwitten bij het herstel van verschillende DNA-eindconfiguraties. We bespreken ook het rangeren van DNA-eindreparatie naar de hulproutes van alternatieve eindverbinding (a-EJ) of enkelstrengige annealing (SSA) en de relevantie van deze verschillende routes voor ziekten bij de mens.


Pines, G., Freed, E.F., Winkler, J.D. & Gill, R.T. Bacteriële recombinatie: genoomengineering via op fagen gebaseerde homologe recombinatie. Acs Synth Biol 4, 1176-1185, doi: 10.1021/acssynbio.5b00009 (2015).

Gu, P.F. et al. Een snelle en betrouwbare strategie voor chromosomale integratie van gen(en) met meerdere kopieën. Sci Rep-Uk 5, doi: ARTN968410.1038/srep09684 (2015).

Smanski, M.J. et al. Synthetische biologie om toegang te krijgen tot de chemische diversiteit van de natuur en deze uit te breiden. Nat Rev Microbiol 14, 135-149, doi: 10.1038/nrmicro.2015.24 (2016).

Esvelt, K. M. & Wang, H. H. Genoom-schaal engineering voor systemen en synthetische biologie. Mol Syst Biol 9, 641, doi: 10.1038/msb.2012.66 (2013).

Thomason, L.C., Sawitzke, J.A., Li, X., Costantino, N. & Court, D.L. Recombineering: genetische manipulatie in bacteriën met behulp van homologe recombinatie. Curr Protoc Mol Biol 106, 1 1611-1116 39, doi: 10.1002/0471142727.mb0116s106 (2014).

Murphy, K.C. Gebruik van bacteriofaag lambda-recombinatiefuncties om genvervanging in Escherichia coli te bevorderen. J Bacteriol 180, 2063-2071 (1998).

Zhang, Y., Buchholz, F., Muyrers, J.P. & Stewart, A.F. Een nieuwe logica voor DNA-engineering met behulp van recombinatie in Escherichia coli. Nat Genet 20, 123-128, doi: 10.1038/2417 (1998).

Datsenko, K.A. & Wanner, B.L. Eenstaps-inactivatie van chromosomale genen in Escherichia coli K-12 met behulp van PCR-producten. P Natl Acad Sci USA 97, 6640-6645, doi: DOI 10.1073/pnas.120163297 (2000).

Zeitoun, R.I. et al. Gemultiplexte tracking van combinatorische genomische mutaties in gemanipuleerde celpopulaties. Nat Biotechnol 33, 631-637, doi: 10.1038/nbt.3177 (2015).

Jiang, W. Y., Bikard, D., Cox, D., Zhang, F. & Marraffini, L. A. RNA-geleide bewerking van bacteriële genomen met behulp van CRISPR-Cas-systemen. Nat Biotechnol 31, 233-239, doi: 10.1038/nbt.2508 (2013).

Ran, F.A. et al. Dubbele nicking door RNA-geleide CRISPR Cas9 voor verbeterde specificiteit van genoombewerking. Cel 155, 479-480, doi: 10.1016/j.cell.2013.09.040 (2013).

Luo, M.L., Leenay, R.T. & Beisel, C.L. Huidige en toekomstige vooruitzichten voor op CRISPR gebaseerde tools in bacteriën. Biotechnol Bioeng 113, 930-943, doi: 10.1002/bit.25851 (2016).

Cong, L. et al. Multiplex genoom-engineering met behulp van CRISPR/Cas-systemen. Wetenschap 339, 819-823, doi: 10.1126/science.1231143 (2013).

Mali, P. et al. RNA-geleide menselijke genoom-engineering via Cas9. Wetenschap 339, 823-826, doi: 10.1126/science.1232033 (2013).

Mao, Z., Bozzella, M., Seluanov, A. & Gorbunova, V. DNA-reparatie door niet-homologe eindverbinding en homologe recombinatie tijdens de celcyclus in menselijke cellen. Celcyclus 7, 2902-2906 (2008).

Bowater, R. & Doherty, A. J. De eindjes aan elkaar knopen: breuken in bacterieel DNA repareren door niet-homologe end-joining. Plos Genet 2, e8, doi: 10.1371/journal.pgen.0020008 (2006).

Bassing, C.H. & Alt, F.W. De cellulaire respons op algemene en geprogrammeerde DNA-dubbelstrengsbreuken. DNA-reparatie 3, 781-796, doi: 10.1016/j.dnarep.2004.06.001 (2004).

Gomaa, A.A. et al. Programmeerbare verwijdering van bacteriestammen door gebruik te maken van genoomgerichte CRISPR-Cas-systemen. MBio 5, e00928–00913, doi: 10.1128/mBio.00928-13 (2014).

Citorik, R.J., Mimee, M. & Lu, T.K. Sequentiespecifieke antimicrobiële middelen met behulp van efficiënt geleverde RNA-geleide nucleasen. Nat Biotechnol 32, 1141-1145, doi: 10.1038/nbt.3011 (2014).

Aravind, L. & Koonin, E.V. Prokaryote homologen van het eukaryote DNA-eindbindende eiwit Ku, nieuwe domeinen in het Ku-eiwit en voorspelling van een prokaryotisch dubbelstrengs breukherstelsysteem. Genoom Res 11, 1365-1374, doi: DOI 10.1101/gr.181001 (2001).

Della, M. et al. Mycobacteriële Ku- en ligase-eiwitten vormen een tweecomponenten NHEJ-reparatiemachine. Wetenschap 306, 683-685, doi: 10.1126/science.1099824 (2004).

Brissett, N.C. & Doherty, A.J. Reparatie van dubbelstrengige DNA-breuken door de prokaryotische niet-homologe end-joining pathway. Biochem Soc T 37, 539-545, doi: 10.1042/Bst0370539 (2009).

Tong, Y., Charusanti, P., Zhang, L., Weber, T. & Lee, S. Y. CRISPR-Cas9 Gebaseerde engineering van actinomycetale genomen. Acs Synth Biol 4, 1020-1029, doi: 10.1021/acssynbio.5b00038 (2015).

Caliando, B. J. & Voigt, C. A. Gerichte DNA-afbraak met behulp van een CRISPR-apparaat dat stabiel in het gastheergenoom wordt gedragen. Nat Commun 6, 6989, doi: 10.1038/ncomms7989 (2015).

Malyarchuk, S. et al. Uitdrukking van Mycobacterium tuberculosis Ku en Ligase D in Escherichia coli resulteert in RecA- en RecB-onafhankelijke DNA-eindverbinding in gebieden van microhomologie. DNA-reparatie (Amst) 6, 1413-1424, doi: 10.1016/j.dnarep.2007.04.004 (2007).

Jinek, M. et al. Een programmeerbare dual-RNA-geleide DNA-endonuclease in adaptieve bacteriële immuniteit. Wetenschap 337, 816-821, doi: 10.1126/science.1225829 (2012).

Pagano, A. et al. Nieuwe kleine nucleaire RNA-genachtige transcriptie-eenheden als bronnen van regulerende transcripten. Plos Genet 3, 174-184, doi: ARTN e110.1371/journal.pgen.0030001 (2007).

Wang, T., Wei, J.J., Sabatini, D.M. & Lander, E.S. Genetische schermen in menselijke cellen met behulp van het CRISPR-Cas9-systeem. Wetenschap 343, 80-84, doi: 10.1126/science.1246981 (2014).

Li, Y.F. et al. Metabolische engineering van Escherichia coli met behulp van CRISPR-Cas9 gemedieerde genoombewerking. Metab Eng 31, 13-21, doi: 10.1016/j.ymben.2015.06.006 (2015).

Santos, C. N., Regitsky, D. D. & Yoshikuni, Y. Implementatie van stabiele en complexe biologische systemen door middel van recombinase-geassisteerde genoom-engineering. Nat Commun 4, 2503, doi: 10.1038/ncomms3503 (2013).

Wang, H. et al. Verbeterde naadloze mutagenese door te recombineren met behulp van ccdB voor tegenselectie. Nucleïnezuren Res 42, e37, doi: 10.1093/nar/gkt1339 (2014).

Ellis, H.M., Yu, D.G., DiTizio, T. & Court, D.L. Hoogrenderende mutagenese, reparatie en engineering van chromosomaal DNA met behulp van enkelstrengs oligonucleotiden. P Natl Acad Sci USA 98, 6742-6746, doi: 10.1073/pnas.121164898 (2001).

Wang, H.H. et al. Programmeren van cellen door multiplex genoom-engineering en versnelde evolutie. Nature 460, 894-898, doi: 10.1038/nature08187 (2009).

Ronda, C., Pedersen, L.E., Sommer, M.O. & Nielsen, A.T. CRMAGE: CRISPR-geoptimaliseerde MAGE-recombinering. Sci Rep 6, 19452, doi: 10.1038/srep19452 (2016).

Kolisnychenko, V. et al. Engineering een gereduceerde Escherichia coli genoom. Genoom Res 12, 640-647, doi: 10.1101/gr.217202 (2002).

Tuntufye, H. N. & Goddeeris, B. M. Gebruik van lambda Red-gemedieerde recombineering en Cre / lox voor het genereren van markerloze chromosomale deleties bij aviaire pathogene Escherichia coli. FEMS Microbiol Lett 325, 140-147, doi: 10.1111/j.1574-6968.2011.02421.x (2011).

Jiang, Y. et al. Multigene bewerking in de Escherichia coli genoom via het CRISPR-Cas9-systeem. Appl Environ Microbiol 81, 2506-2514, doi: 10.1128/AEM.04023-14 (2015).

Pyne, M.E., Moo-Young, M., Chung, D.E.A. & Chou, C.P. Koppeling van het CRISPR/Cas9-systeem met lambda-rood-recombinering maakt vereenvoudigde chromosomale genvervanging mogelijk in Escherichia coli. Appl Environ Microb 81, 5103–5114, doi: 10.1128/Aem.01248-15 (2015).

Reisch, C.R. & Prather, K.L.J. Het no-SCAR (scarless Cas9 Assisted Recombineering) systeem voor genoombewerking in Escherichia coli. Sci Rep-Uk 5, doi: ARTN 1509610.1038/srep15096 (2015).

Lv, L., Ren, Y.L., Chen, J.C., Wu, Q. & Chen, G.Q. Toepassing van CRISPRi voor prokaryotische metabolische engineering waarbij meerdere genen betrokken zijn, een casestudy: regelbare P (3HB-co-4HB) biosynthese. Metab Eng 29, 160-168, doi: 10.1016/j.ymben.2015.03.013 (2015).

Bikard, D. et al. Programmeerbare onderdrukking en activering van bacteriële genexpressie met behulp van een geconstrueerd CRISPR-Cas-systeem. Nucleïnezuren Res 41, 7429-7437, doi: 10.1093/nar/gkt520 (2013).

Altenbuchner, J. Bewerking van de Bacillus subtilis genoom door het CRISPR-Cas9-systeem. Appl Environ Microbiol, doi: 10.1128/AEM.01453-16 (2016).

Standage-Beier, K., Zhang, Q. & Wang, X. Gerichte grootschalige verwijdering van bacteriële genomen met behulp van CRISPR-nickasen. Acs Synth Biol 4, 1217-1225, doi: 10.1021/acssynbio.5b00132 (2015).

Cui, L. & Bikard, D. Gevolgen van Cas9-splitsing in het chromosoom van Escherichia coli. Nucleïnezuren Res, doi: 10.1093/nar/gkw223 (2016).

Peters, J.M. et al. Bacteriële CRISPR: prestaties en vooruitzichten. Curr Opin Microbiol 27, 121-126, doi: 10.1016/j.mib.2015.08.007 (2015).

Xu, T. et al. Efficiënte genoombewerking in Clostridium cellulolyticum via CRISPR-Cas9-nickase. Appl Environ Microbiol 81, 4423–4431, doi: 10.1128/AEM.00873-15 (2015).

Shee, C., Ponder, R., Gibson, J.L. & Rosenberg, S.M. Wat beperkt de efficiëntie van dubbelstrengs breukafhankelijke stress-geïnduceerde mutatie in Escherichia coli? J Mol Microb Biotech 21, 8-19, doi: 10.1159/000335354 (2011).

Shee, C., Gibson, J.L., Darrow, M.C., Gonzalez, C. & Rosenberg, S. M. Impact van een stress-induceerbare omschakeling naar mutageen herstel van DNA-breuken op mutatie in Escherichia coli. Proc Natl Acad Sci USA 108, 13659-13664, doi: 10.1073/pnas.1104681108 (2011).

Zhu, L. J., Li, Y. & Cai, Z. Ontwikkeling van een stress-geïnduceerde mutagenesemodule voor autonome adaptieve evolutie van Escherichia coli om de stresstolerantie te verbeteren. Biotechnol Biobrandstoffen 8, doi: ARTN 9310.1186/s13068-015-0276-1 (2015).

Gibson, D.G. et al. Enzymatische assemblage van DNA-moleculen tot enkele honderden kilobasen. Nat Methods 6, 343-345, doi: 10.1038/Nmeth.1318 (2009).


Inhoud

MMEJ-reparatie is laag in de G0/G1-fase, maar is verhoogd tijdens de S-fase en G2-fase van de celcyclus. [3] NHEJ daarentegen werkt gedurende de hele celcyclus en homologe recombinatie (HR) werkt alleen in de late S en G2.

De keuze van welke route wordt gebruikt voor reparatie van dubbelstrengs breuken is complex. In de meeste gevallen is MMEJ verantwoordelijk voor een klein deel (10%) van de reparatie van dubbelstrengs breuken, hoogstwaarschijnlijk in gevallen waarin de dubbelstrengs breuk wordt weggesneden maar er geen zusterchromatide beschikbaar is voor homologe recombinatie. [3] Cellen met een tekort aan klassieke NHEJ of HR vertonen typisch verhoogde MMEJ. Menselijke homologe recombinatiefactoren onderdrukken mutagene MMEJ na resectie van dubbelstrengs breuken. [8]

Een biochemisch testsysteem laat zien dat er ten minste 6 genen nodig zijn voor microhomologie-gemedieerde end-joining: FEN1, Ligase III, MRE11, NBS1, PARP1 en XRCC1. [9] Alle zes deze genen zijn opgereguleerd in een of meer kankers. Bij mensen speelt DNA-polymerase thèta, gecodeerd door het POLQ-gen, een centrale rol bij microhomologie-gemedieerde eindverbinding. [7] Polymerase theta gebruikt zijn helicasedomein om replicatie-eiwit A (RPA) van DNA-uiteinden te verdringen en microhomologie-annealing te bevorderen. [6] Polymerase-theta gebruikt ook zijn polymerase-activiteit om opvulsynthese uit te voeren, wat helpt om gepaarde uiteinden te stabiliseren.

Ongeveer de helft van alle eierstokkankers heeft een tekort aan homologe recombinatie (HR). Deze HR-deficiënte tumoren reguleren polymerase theta (POLQ) opwaarts, wat resulteert in een toename van MMEJ. [10] Deze tumoren zijn in hoge mate afhankelijk van MMEJ, zodat het uitschakelen van polymerase-thèta resulteert in een aanzienlijke dodelijkheid. In de meeste celtypen levert MMEJ een kleine bijdrage aan het herstel van dubbelstrengsbreuken. De hyperafhankelijkheid van HR-deficiënte tumoren op MMEJ kan een mogelijk medicijndoelwit zijn voor de behandeling van kanker.

MMEJ omvat altijd inserties of deleties, zodat het een mutageen pad is. [11] Cellen met verhoogde MMEJ kunnen een hogere genomische instabiliteit hebben en een aanleg voor de ontwikkeling van kanker, hoewel dit niet direct is aangetoond.

Penaeus monodon is een zeeschaaldier dat veel wordt geconsumeerd vanwege zijn voedingswaarde. Herstel van dubbelstrengige breuken in dit organisme kan plaatsvinden door HRR, maar NHEJ is niet detecteerbaar. [12] Hoewel HRR de belangrijkste herstelroute voor dubbelstrengsbreuken lijkt te zijn, bleek MMEJ ook een belangrijke rol te spelen bij het herstel van dubbelstrengs DNA-breuken. [12]


Resultaten

We hebben geprobeerd om de HPRT1 CpG-eiland met in vitro gemethyleerd DNA met behulp van CRISPR-gemedieerde NHEJ (figuur 1a). Hiertoe is de HPRT1 CpG-eiland, dat overlapt met het eerste exon van HPRT1 waaronder een deel van het ORF, werd gekloneerd uit humaan genomisch DNA (Fig. 1b). Twee synonieme SNV's werden geïntroduceerd in de coderende sequentie van het eerste exon in het gekloneerde plasmideconstruct om een ​​eerste allel te genereren dat te onderscheiden was van de wildtype CpG-eilandsequentie. Vanuit het startconstruct werd ook een tweede allel gecreëerd door twee synonieme SNV's op verschillende posities te introduceren dan gebruikt voor het eerste allel. Omdat de posities die werden gebruikt voor de synonieme SNV's in de twee allelen verschillend waren, waren de allelen zowel van elkaar als van de wildtype sequentie te onderscheiden. De CpG-eilandallelen werden PCR-geamplificeerd om ze te lineariseren en vervolgens in vitro gemethyleerd met het enzym M.SssI. Door de primers die voor deze PCR werden gebruikt, werden mutaties geïntroduceerd op de locaties die overeenkomen met de PAM-site van de beoogde gids-RNA-doelen, om de kans op opnieuw knippen door Cas9 na succesvolle insertiegebeurtenissen te verminderen (Fig. 1b Aanvullend bestand 1 : Figuur S1).

Gemethyleerde allel 1 en niet-gemethyleerde allel 2 amplicons, samen met plasmiden die de expressie van Cas9-2A-GFP sturen en RNA's begeleiden die zich richten op de uiteinden van de 1120-bp HPRT1 CpG-eiland, werden gecotransfecteerd in een enkele plaat met Hapl-cellen. Het wederzijdse experiment, d.w.z. met behulp van een gemethyleerde versie van allel 2 en een niet-gemethyleerde versie van allel 1, werd parallel uitgevoerd, als een vorm van replicatie en om te controleren op eventuele effecten van de synonieme mutaties (Fig. 1c). Zowel de primaire als de wederzijdse experimenten werden in drievoud uitgevoerd. Een belangrijk punt is dat met dit experimentele ontwerp de allelen het mogelijk maken om af te leiden of het gemethyleerde of niet-gemethyleerde amplicon was ingevoegd, zonder dat bisulfietconversie nodig was voorafgaand aan sequencing.

48 uur na transfectie werden > 100.000 GFP-positieve cellen gesorteerd door FACS en gedurende 7 dagen weer in cultuur gebracht. GFP-positiviteit geeft aan dat deze cellen met succes zijn getransfecteerd. Op dit punt werd de helft van de cellen van elke plaat geoogst ("preselectie" in Fig. 1c) en de resterende helft van de cellen werd in twee schalen gesplitst. Aan één schaal werd 6-TG toegevoegd als selectiemiddel ("6-TG geselecteerd" in Fig. 1c), en aan de andere schaal werd DMSO toegevoegd als een voertuigcontrole ("mock Selected" in Fig. 1c). Na 11 dagen werden de cellen geoogst, werd genomisch DNA geëxtraheerd en de HPRT1 CpG-eiland werd met PCR geamplificeerd en de sequentie ervan werd bepaald.

Op basis van sequencing werden de relatieve frequenties van gemethyleerde en niet-gemethyleerde allelen berekend en vergeleken tussen voorselectie, schijngeselecteerde en 6-TG-geselecteerde monsters. Deze frequenties zijn afhankelijk van de uitkomsten van genoombewerking, die leiden tot overleving of overlijden onder 6-TG-selectie (figuur 1d). Mogelijke bewerkingsresultaten zijn onder meer het verwijderen van het tussenliggende segment, het opnieuw inbrengen van het oorspronkelijke wildtype CpG-eiland of het inbrengen van het getransfecteerde gemethyleerde of niet-gemethyleerde allel. Bovendien kunnen het wildtype CpG-eiland of gemethyleerde of niet-gemethyleerde allelen mogelijk in de oorspronkelijke voorwaartse of omgekeerde oriëntatie worden ingevoegd. Omdat Hap1-cellen haploïde zijn, wordt slechts één van deze bewerkingsresultaten per cel verwacht. Het kan worden verwacht dat insertie van het gemethyleerde allel in de voorwaartse oriëntatie resulteert in door methylering geïnduceerde silencing van HPRT1, terwijl een deletie of een inversie zou resulteren in verlies van expressie. Cellen met silencing of verlies van expressie van HPRT1 wordt verwacht dat ze 6-TG-selectie overleven, terwijl verwacht wordt dat degenen met expressie sterk worden geselecteerd.

We hebben eerst de allel-definiërende SNV's en het omringende deel van exon 1 gesequenced met behulp van kort leesbare Illumina-sequencing. Hiervoor werd een geneste PCR-benadering gebruikt met één buitenste nest PCR-primer stroomopwaarts van de 5'-cut-site en één tussen de cut-sites (aanvullend bestand 2: figuur S2). Het binnenste nest versterkte een regio van 44 bp, inclusief de allel-definiërende SNV's in de exon 1 CDS en een klein deel van de promotor. Het voordeel van deze geneste benadering is dat het amplificatie en sequencing van willekeurige integraties op andere posities in het genoom verhinderde, evenals on-target inversies of deleties van het tussenliggende segment. Omdat deze andere uitkomsten zijn uitgesloten, waren onze verwachtingen voor dit experiment als volgt: als het gemethyleerde allel wordt ingevoegd, zou 6-TG-selectie moeten resulteren in een verhoging van de frequentie van het gemethyleerde allel in vergelijking met het niet-gemethyleerde allel (kwantificeerbaar door sequencing van de allel-definiërende SNV's). Daarentegen werd in de voorselectie- en schijnselectiemonsters geen verschil in de frequentie van gemethyleerde en niet-gemethyleerde allelen voorspeld. Aan de andere kant is een beperking van de geneste benadering dat we blind zijn voor eventuele NHEJ-gemedieerde indels op de twee snijsites zelf. In ieder geval konden we met Illumina-sequencing echter niet zowel de allel-definiërende SNV's als de knipplaatsen in dezelfde uitlezing sequensen, simpelweg omdat de uitlezingen te kort zijn (in principe zou dit kunnen worden gedaan met gepaarde uitlezingen, maar de amplicons zou te groot zijn voor compatibiliteit met Illumina-sequencing). We komen terug op deze kwestie en de vraag of er consequente NHEJ-gemedieerde indels zijn op de afzonderlijke snijplaatsen verderop.

We hebben de frequenties van de ingevoegde gemethyleerde en niet-gemethyleerde allelen gekwantificeerd, zowel voorselectie als na 6-TG en schijnselectie (Fig. 2a). Deze frequenties werden berekend met alleen tellingen van voorwaarts georiënteerde gemethyleerde, niet-gemethyleerde en wildtype allelen, en zoals hierboven opgemerkt, zijn we blind voor eventuele mutaties op de knipplaatsen voor al deze klassen, inclusief het wildtype allel. Een eerste observatie is dat zelfs bij voorselectie het aandeel gemethyleerde allelen dat wordt ingebracht erg laag is (gemiddeld 0,24%). Daarentegen is het aandeel niet-gemethyleerde allelen dat is ingevoegd bescheiden maar consistent (gemiddeld 5,1%). Dit suggereert dat NHEJ-gemedieerde insertie van gemethyleerde allelen duidelijk minder efficiënt is dan die van niet-gemethyleerde allelen. Voor zowel gemethyleerde als niet-gemethyleerde allelen waren de verhoudingen na schijnselectie grotendeels onveranderd. Verrassend genoeg was het effect van 6-TG-selectie een verhoging van het percentage beide de ingevoegde gemethyleerde en niet-gemethyleerde allelen, ten opzichte van het wildtype allel. De veelvoudige verandering voor 6-TG-selectie ten opzichte van schijnselectie van het gemethyleerde allel was echter veel groter dan die van het niet-gemethyleerde allel, wat een verrijking voor het gemethyleerde allel suggereert, wat consistent is met door methylering geïnduceerde silencing van HPRT1 (gemiddelde vouwverandering voor gemethyleerd versus niet-gemethyleerd, 41,0 versus 3,0 log-getransformeerd, gepaard t-toets P ≈ 0.002).

methylering van de HPRT1 CpG-eiland door CRISPR-gemedieerde sequentievervanging resulteert in: HPRT1 tot zwijgen brengen. een Percentages van Illumina-sequencing-lezingen toegewezen aan gemethyleerde en niet-gemethyleerde ingevoegde allelen door SNV's, gegroepeerd op selectiestatus (Pre, pre-selectie Mock, mock-selectie 6-TG, 6-TG-selectie). Hoewel beide verrijkt zijn, zijn gemethyleerde ingevoegde allelen meer verrijkt dan niet-gemethyleerde ingevoegde allelen na 6-TG-selectie. Wild-type sequenties worden niet getoond, maar zijn in percentages opgenomen. Het eerste paneel toont het experiment waarbij allel 1 gemethyleerd was en allel 2 ongemethyleerd, het tweede paneel toont het wederzijdse experiment. Foutbalken tonen het bereik van drievoud. B Percentages PacBio-sequencing-uitlezingen toegewezen aan "exacte matching" gemethyleerde en niet-gemethyleerde ingevoegde allelen door SNV's, gegroepeerd op selectiestatus (Pre, pre-selectie Mock, mock selection 6-TG, 6-TG selection). Gemethyleerde ingevoegde allelen, maar niet-gemethyleerde ingevoegde allelen, worden sterk verrijkt door selectie. Sequenties werden alleen geteld als ze in de voorwaartse oriëntatie waren en exact overeenkwamen met de promotor, exon 1, splicedonor, PAM-mutatie en een van de drie sets allel-definiërende SNV's (wildtype, allel 1 of allel 2). Wild-type sequenties worden niet getoond, maar zijn in percentages opgenomen. Foutbalken tonen het bereik van drievoud. Merk op dat de ja-as is gapped en bevat twee schalen, om de resolutie in het bereik van 0-10% te verhogen. C Percentages PacBio-sequencing-uitlezingen toegewezen aan omgekeerde/omgekeerde oriëntatie, gegroepeerd op selectiestatus. Verwijderingsgebeurtenissen, evenals sequenties die niet voldoen aan de hierboven gedefinieerde "exacte matching"-criteria, werden niet meegeteld. Voorwaarts gerichte sequenties worden niet getoond, maar zijn in percentages opgenomen. Het duidelijke patroon is dat geïnverteerde sequenties overheersen na 6-TG-selectie. NS Waargenomen aantal gemethyleerde plaatsen bij bisulfietsequencing van gemethyleerde, niet-gemethyleerde of wildtype allelen van het CpG-eiland, gesommeerd over selectieomstandigheden. Het gebied bevat 35 CpG-dinucleotiden. Reads are assigned to in vitro methylated or unmethylated alleles, or to unedited wild-type sequence based on synonymous SNVs. In vitro methylated alleles remain heavily methylated, while unmethylated alleles and unedited sequences remain predominantly unmethylated

Given that the above experiments were blind to the cut sites, we speculated that the unexpected increase in inserted, unmethylated alleles upon selection (Fig. 2a) might have resulted from loss of expression due to repair-induced indels at the end(s) of the of the CpG island insert (in the first intron or 5′ UTR as noted above, we were not able to observe these junctions in the experiment represented in Fig. 2a), or alternatively from mutations in the promoter, exon 1 coding sequence, or splice donor in the CpG island insert introduced by PCR. To test this, we amplified a

2-kb region including the entire CpG island, with primers positioned

700 bp upstream of one cut site and

165 bp downstream of the other cut site (Additional file 3: Figure S3). We sequenced these amplicons using Pacific Biosciences (PacBio) instruments (the “Materials and methods” section).

Circular consensus sequence (CCS) calling was performed to a mean CCS accuracy of 99.4%. In contrast with our Illumina-based sequencing, this approach is expected to recover not only forward-oriented alleles, but also inversions, deletions, and multiple insertions of the intervening sequence. However, we did not attempt to quantify wholesale deletions or multiple insertions of the CpG island for the following reasons. First, we performed a gel extraction step after PCR that removed most deletion events. Second, although the PCR cycling conditions were designed to be able to amplify multiple insertion events, bands representing such longer sequences were not visible on agarose or polyacrylamide gels. Third, even to the extent that either wholesale deletions or multiple insertions are recovered, due to biases in PCR amplification and sequencing towards shorter sequences, it would be very difficult to interpret the counts of sequences of different sizes.

For our first analysis of these PacBio data, sequences were only counted if they were in the forward orientation and moreover exactly matched the promoter, exon 1, splice donor, expected PAM site for a given allele, and one of three sets of allele-defining SNVs (wild-type, allele 1, or allele 2), i.e., excluding inversions as well as sequences containing PCR errors or repair-induced indels. Because we required observation of the expected PAM sites for a given allele, indels at either cut site that extend more than 5 bp into the CpG island were excluded from this analysis. In contrast with the Illumina-based results presented in Fig. 2a, after 6-TG selection, we observed markedly higher proportions of methylated inserted alleles than unmethylated inserted alleles (mean 82.8% vs. 8.1% arcsine square root transformed, paired t-test P ≈ 0.005) (Fig. 2b Additional file 4: Table S1). However, as illustrated by the pre-selection and mock selection experiments, the proportion of inserted methylated and unmethylated alleles remained very low in the absence of 6-TG.

We also examined other sequences in the PacBio data, i.e., sequences other than those exactly aligning to forward-oriented wild-type or forward-oriented inserted alleles. For example, one prediction is that 6-TG should also select for alleles inserted in the inverted orientation, regardless of whether it is the wild-type sequence or one of the exogenous inserts. To investigate this, we tabulated sequences that exactly matched the promoter, exon 1, splice donor, PAM mutation, and any of the three sets of allele-defining SNVs (wild-type, allele, 1 or allele 2), in of orientation. Events involving wholesale deletion of the CpG island were again excluded. Collapsing all alleles in each orientation, we observe that the proportion of forward-oriented alleles was modestly higher in both the pre-selection and mock selection samples (mean 63.4% and 71.1% forward oriented, respectively). Although, percentages closer to 50/50 might have been expected, the deviation towards forward-oriented alleles is likely because the calculation includes wild-type alleles that were not fully cut out (e.g., either because of incomplete editing or NHEJ-mediated indels at one of the cut sites). However, after 6-TG selection, the overwhelming majority of sequences were in the reverse/inverted orientation (mean 98.6% reverse oriented) (Fig. 2c Additional file 4: Table S1). This confirms that 6-TG selection was nearly complete, particularly as the forward-oriented sequences observed after 6-TG selection were dominated by the methylated, inserted alleles (Fig. 2b).

Although we observe that the forward-oriented, methylated allele is strongly selected for by 6-TG, we sought to confirm that its in vitro methylation is maintained after transfection and insertion, and thus might plausibly cause silencing of HPRT1 and the consequent strong selection. We therefore performed bisulfite sequencing on a region of the CpG island including the allele-defining SNVs and 35 surrounding CpGs (Additional file 5: Figure S4). We observe that the in vitro methylated allele remained heavily methylated in the pre-selection, mock selection, and 6-TG selection samples, whereas the unmethylated allele and the wild-type sequence remained predominantly unmethylated in all samples (Fig. 2d). Of note, bisulfite sequencing of this same region in untransfected Hap1 cells harvested after mock selection exhibited a lack of methylation similar to the wild-type sequences of the transfected cells (data not shown). Consistent with this, 6-TG selection of untransfected Hap1 cells killed all cells, confirming that the HPRT1 gene was not silenced by methylation without our intervention.

Estimates of the rate of insertion of the methylated allele based on data in Fig. 2b are not based on all sequences and are therefore not exact. In our view, it is not possible to obtain a precise insertion rate from these data because of size biases in PCR amplification and sequencing, which vastly overestimate the number of the shorter deletion sequences. However, in an attempt to get a better estimate, we recalculated insertion rates, but this time including all sequences, except wholesale deletions of the intervening sequence, that could be aligned to the CpG island in either the forward or the inverted orientation in the total count, i.e., the denominator. Sequences were included in this total count regardless of whether or not they could be assigned to either the allele or the wild-type sequence, and indels larger than 5 bases were also included (in the previous calculations, sequences with indels larger than 5 bases were effectively filtered out because of the requirement that the PAM sites, which are 6 bases from the cut sites, match). Using only sequences that could be assigned to the methylated allele with a perfect match in the promoter, exon 1, splice donor, and PAM mutations and allowing up to 5 bp indels on either side, the methylated allele represented 0.72% of reads. If no indels were allowed, 0.12% of reads were the methylated allele. When the pre-selection and mock selection samples were combined and averaged for an estimate of the insertion rate without selection and up to 5 bp indels were allowed, the methylated allele represented 0.16% of reads. If no indels were allowed, the methylated allele represented 0.03% of reads.

Although our strategy remains challenged by the much higher rates of deletion or inversion over insertion of the methylated inserts, our observations nonetheless support the conclusions that (a) we successfully used CRISPR/NHEJ to replace the HPRT1 CpG island with an in vitro methylated allele (b) this methylation was maintained after insertion to the genome, at least over the course of our 11-day experiment and (c) this methylation was sufficient to functionally silence the HPRT1 gen.

Why are unmethylated alleles frequent upon 6-TG selection in the Illumina-based results but not the PacBio-based results, given that this is the same experiment? As the main difference between these analyses involves the former analysis being blind to the larger region vs. the latter including but only allowing small indels at the repair junctions, we speculated that large repair-induced indels (included in the Illumina-based analysis of Fig. 2a, but analytically excluded from the PacBio-based analysis of Fig. 2b) may result in a subset of forward-oriented, unmethylated inserts being positively selected.

To assess this and related questions, we further analyzed the PacBio sequencing data to explore the indel patterns at the cut sites. First, we asked why, in the Illumina short-read sequencing, 6-TG selection resulted in enrichment of both methylated and unmethylated alleles rather than just methylated alleles (Fig. 2a, b). As discussed above, comparison of the Illumina short-read sequencing and PacBio sequencing data suggested that larger indels impacting functional regions of the CpG island insert, i.e., the 5′ UTR, promoter, exon 1, or splice donor sequences, might cause loss of expression of HPRT1, resulting in selection of these indel-bearing, unmethylated sequences by 6-TG. We formally addressed the question by analyzing the distribution of indels across the region subjected to PacBio sequencing (Fig. 3a). To facilitate comparison, inclusion criteria were identical to those used for analysis of Illumina reads (both methylated and unmethylated allele sequences selected by 6-TG, with a perfect match of the allele-defining SNVs and the surrounding region of exon 1). As expected, the distribution of indel sites had peaks at both CRISPR/Cas9 cut sites (Fig. 3a). Notably, many indels extended from the flanking CRISPR/Cas9 cut sites into the interior of the CpG island encompassing functional regions involved in HPRT1 uitdrukking. Such indels are predicted to result in loss of expression of HPRT1. Since these regions were not visible to Illumina short-read sequencing, indel-containing alleles were included in the results shown in Fig. 2a, but were excluded by our sequencing matching requirements with PacBio for the results shown in Fig. 2b. Overall, we conclude that any modest enrichment of unmethylated alleles after 6-TG selection was likely due to these alleles containing indels extending into functional regions of the CpG island (Additional file 6: Figure S5).

The positional and size distribution of indels, in relation to methylation status, insertion type, and orientation. een Percentage of reads with an indel at positions along the PacBio sequenced region. The same subset of reads used in Fig. 2a is included here (6-TG selected, both methylated and unmethylated, perfect match on the allele-defining SNVs and the surrounding portion of exon 1). Red arrowheads indicate the CRISPR/Cas9 cut sites. The purple bar marks the region of exon 1 surrounding the allele-defining SNVs. The distribution of indels is highest at the CRISPR/Cas9 cut sites, but many reads have indels within the CpG island as well. B Indel distributions at repair junctions of methylated (blue) or unmethylated (purple) alleles. C Indel distributions at repair junctions from events involving exogenous inserts (gray) or endogenous inserts (forward-oriented and inverted wild-type sequences black). NS Indel distributions at repair junctions from forward-oriented wild-type sequences (gray) or inverted wild-type sequences (black). The numbers of indels (ja-axis) were scaled so that the maximum number for any indel size (x-axis) for a given distribution was one to allow easier comparison between distributions. Negative numbers for indel size represent deletions, positive numbers represent insertions, and sequences without any repair junction indels have an indel size of zero

Next, we examined the potential effects of methylation on indel patterns in CRISPR/NHEJ-mediated sequence replacement. We started by asking whether there are differences in the rates of insertion of methylated vs. unmethylated alleles. A caveat of this analysis is that it is unclear if the 100,000 cells transfected are sufficient to accurately quantify the frequency of insertion events, which were rare (Additional file 4: Table S1). Nonetheless, combining alleles and observations in both orientations, we found that the unmethylated allele was consistently inserted more frequently than the methylated allele (0.65% methylated vs. 2.37% unmethylated in pre-selection 0.60% methylated vs. 2.06% unmethylated in mock selection). These differences were consistent between the forward and reverse orientations. There are reports that some double-strand breaks are repaired differently in methylated than unmethylated DNA it is possible that such differences may also affect the relative rates of insertion of methylated vs. unmethylated fragments [20, 21].

If these methylated vs. unmethylated inserts are handled differently, it might, but not necessarily, be reflected in a difference in the rates of repair-associated indels. We therefore examined the rates of indels at the flanking CRISPR/Cas9 cut sites, excluding sequences from 6-TG-selected samples. We did not find a rate difference between the methylated and unmethylated alleles (48.9% vs. 50.9%, Fisher’s exact test P ≈ 0.3) and furthermore observed similar distributions of indel sizes for methylated vs. unmethylated sequences (Fig. 3b).

However, we did observe a higher rate of indels for exogenous inserts (i.e., either methylated or unmethylated alleles in either orientation) as compared with endogenous inserts (50.4% vs. 40.6%, Fisher’s exact test P < 2.2 × 10 − 16 size distribution of events in Fig. 3c counts for endogenous inserts include both forward-oriented and inverted wild-type sequences of note, whereas all inverted alleles were obviously cut out then reinserted, we cannot distinguish whether forward-oriented sequences were cut out and then re-inserted vs. not). These data suggest that exogenous DNA might be more likely to be inserted if there is exonuclease chew-back during the repair. This result is further supported by the indel distribution of 6-TG-selected methylated and unmethylated alleles, which showed many indels extending from the CRISPR/Cas9 cut sites into the interior of the CpG island (Fig. 3a). We note that three phosphorothioate linkages were incorporated during PCR at both ends of the insert amplicons, because these linkages are supposed to prevent exonuclease chew-back [3]. It is unclear how effective these linkages were, and it is possible that the association between insertion and exonuclease chew-back is simply an artifact of these linkages.

Again excluding 6-TG-selected sequences, we also observed higher rates of indels for forward-oriented wild-type alleles as compared to inverted wild-type alleles (46.8% vs. 27.5%, Fisher’s exact test P < 2.2 × 10 − 16 size distribution of events in Fig. 3d). However, this could simply be due to an increased propensity for indels when the break-repair recreates the wild-type sequence without mutation, because this site becomes a substrate for CRISPR/Cas9 cleavage again. This break-repair cycle can repeat until Cas9 is no longer active or a mutation occurs, explaining the higher rate of observed indels with forward-oriented wild-type alleles.


CK designed the research, performed the experiments, analyzed the results, and wrote the manuscript NU contributed to the design of the study and scientific discussion of the results, and wrote the manuscript JFT contributed to the design of the study and scientific discussion of the results and wrote the manuscript and GPR designed the research, evaluated the results, wrote the manuscript, and gave final approval of the manuscript.

The authors have no competing interests.

Bijlage S1. Supplemental Methods.

Table SI. List of on- and off-target loci for amplicon deep sequencing of polymerase chain reaction (PCR) amplicons.

Let op: De uitgever is niet verantwoordelijk voor de inhoud of functionaliteit van eventuele ondersteunende informatie die door de auteurs wordt aangeleverd. Alle vragen (behalve ontbrekende inhoud) moeten worden gericht aan de corresponderende auteur van het artikel.


Bekijk de video: NHEJ Repair upon TALEN DSB (December 2021).