Informatie

Meiotische recombinatie hotspots


Ik probeer een juist en algemeen bestand te vinden met chromosomale coördinaten voor meiotische recombinatie-hotspots.

Ik weet dat ucsc hgtables een tabel heeft met recombinatiegebieden en hun recombinatiesnelheid. Deze regio's zijn echter allemaal 1Mb en in verschillende artikelen staat dat deze hotspotregio's meer lokaal zijn met een regionale lengte van 2Kb.

https://genome.ucsc.edu/cgi-bin/hgTables?hgsid=782680683_Cxp9zzjwgsql7P0T81FFyATyTNOl&clade=mammal&org=&db=hg19&hgta_group=map&hgta_track=recombRate&hgta_atelier=

Kent iemand van jullie een bestand of database met de chromosoomcoördinaten voor mensen die zijn geïdentificeerd als recombinatie-hotspots?

Hartelijk dank voor uw tijd en hulp.


Samenspel tussen modificaties van chromatine en meiotische recombinatie hotspots

Meiotische recombinatie vormt de kern van seksuele voortplanting. Het is essentieel voor het produceren van levensvatbare gameten met een normaal haploïde genoomgehalte en de disfuncties ervan kunnen de oorzaak zijn van aneuploïdieën, zoals het syndroom van Down, of vele genetische aandoeningen. Meiotische recombinatie genereert ook genetische diversiteit die wordt overgedragen op het nageslacht door maternale en vaderlijke allelen langs chromosomen te schuifelen. Recombinatie vindt plaats op niet-willekeurige chromosomale locaties die 'hotspots' worden genoemd. Recent bewijs heeft aangetoond dat hun locatie wordt beïnvloed door eigenschappen van chromatine. Bovendien hebben veel onderzoeken in somatische cellen de noodzaak van veranderingen in de chromatinedynamiek benadrukt om het proces van recombinatie mogelijk te maken. In deze review bespreken we hoe veranderingen in het chromatinelandschap de recombinatiekaart kunnen beïnvloeden, en omgekeerd, hoe recombinatiegebeurtenissen kunnen leiden tot epigenetische modificaties op plaatsen van recombinatie, die kunnen worden overgedragen aan nageslacht.


ABSTRACT

Meiotische recombinatie vormt cross-overs die belangrijk zijn voor een goede chromosoomsegregatie en levensvatbaarheid van nakomelingen. Dit complexe proces omvat veel eiwitten die werken bij elk van de meerdere stappen van recombinatie. Recombinatie begint door de vorming van dubbelstrengs DNA-breuken (DSB's), die bij de verschillende onderzochte soorten met hoge frequentie voorkomen op speciale plaatsen (DSB-hotspots). In Schizosaccharomyces pombe, DSB-hotspots zijn gebonden met een hoge specificiteit en worden sterk geactiveerd door lineaire element (LinE) eiwitten Rec25, Rec27 en Mug20, die gecolokaliseerde nucleaire foci vormen met Rec10, essentieel voor alle DSB-vorming en recombinatie. Hier testen we de hypothese dat het nucleaire lokalisatiesignaal (NLS) van Rec10 cruciaal is voor gecoördineerde nucleaire invoer na het vormen van een complex met andere LinE-eiwitten. In NLS-mutanten waren alle LinE-eiwitten overvloedig aanwezig in het cytoplasma, niet de vorming en recombinatie van DSB in de kern waren veel verminderd maar niet geëlimineerd. Nucleaire invoer van beperkte hoeveelheden Rec10, schijnbaar klein genoeg voor passieve nucleaire invoer, kan verantwoordelijk zijn voor resterende recombinatie. LinE-eiwitten zijn verwant aan synaptonemale complexe eiwitten van andere soorten, wat suggereert dat ze ook een NLS delen, nog niet geïdentificeerd, en eiwitcomplexvorming ondergaan voordat ze de kern binnenkomen.


Hotspots detecteren en meten

DSB-hotspots - mapping-onderbrekingen en ssDNA

Meiotische recombinatie wordt gestart vanuit DNA DSBS, dat direct kan worden gemeten om hotspots te onthullen. Een groot voordeel bij de studie van meiose in ontluikende gist Saccharomyces cerevisiae is het vermogen om grote aantallen cellen te synchroniseren om tegelijkertijd meiose binnen te gaan, wat de biochemische analyse van meiotische recombinatie vergemakkelijkt. Vanwege het effect van DSB's op de DNA-molecuulgrootte, kan gelelektroforese van gefaseerd meiotisch DNA worden gebruikt om DSB's in gist te analyseren (Nicolas et al., 1989 Baudat en Nicolas, 1997 Garcia et al., 2015 ). Dit is een veelzijdige methode waarmee DSB-variatie kan worden gemeten op schalen van hele chromosomen tot enkele nucleotiden, afhankelijk van de elektroforese-omstandigheden en de keuze van de sonde (Nicolas et al., 1989 Baudat en Nicolas, 1997 Garcia et al., 2015 ). De detectie van DSB's kan worden verhoogd door gebruik te maken van DNA-verwerkingsmutanten zoals: rad50S en sae2D, die een tekort hebben aan endonucleolytische afgifte van SPO11 uit DSB's en ongerepareerde breuken accumuleren (Buhler et al., 2007 ). Het is echter belangrijk op te merken dat het in kaart brengen van DSB's in rad50s en sae2D mutanten kunnen leiden tot een vertekende detectie van vroegvormende DSB's ten opzichte van late DSB's, die verantwoordelijk zijn voor een aanzienlijk deel van de breuken in S. cerevisiae (Buhler et al., 2007 Joshi et al., 2015 ). Hoewel de toepassing van gelelektroforese-assays op grotere genomen een uitdaging is, was een gemodificeerde Southern-blotmethode met behulp van terminale transferase en geneste PCR in staat om DSB's te detecteren op de H2-Ea hotspot in testiskiemcellen van muizen (Qin et al., 2004 ).

Een gevoelige methode om meiotische DSB's te detecteren, is gebaseerd op het katalytische mechanisme van het SPO11-endonuclease (Neale et al., 2005 ). SPO11 is verwant aan topo-isomerases en wordt covalent gebonden aan 5′-target-sites op een katalytisch tyrosineresidu (Bergerat et al., 1997 Keeney et al., 1997 Neale et al., 2005 ). Daaropvolgende stroomopwaartse of stroomafwaartse splitsing door het MRX-nucleasecomplex bevrijdt SPO11 gebonden aan oligonucleotiden met een lengte van ongeveer 20-100 nt (Figuur 1b) (Neale et al., 2005 Garcia et al., 2011 Lange et al., 2011 Pan et al., 2011 ). Immunoprecipitatie van SPO11 en zuivering van de gebonden oligonucleotiden kan worden gebruikt om DSB-doelplaatsen te analyseren, met behulp van eindlabels en gelelektroforese, of het genereren van sequencingbibliotheken (Figuur 1c) (Neale et al., 2005 Lange et al., 2011 Pan et al., 2011 ). Deze benaderingen zijn met succes uitgevoerd in ontluikende gist, splijtingsgist en muizen (Lange et al., 2011 Pan et al., 2011 Fowler et al., 2014). Deze techniek is ook herhaald in muis Geldautomaat kinasesignaleringsmutanten, die hogere DSB-niveaus accumuleren (Lange et al., 2011 ). In ontluikende gist functioneert Spo11 met een groep hulpeiwitten, waaronder Rec114, Mer2 en Mei4 ​​(Panizza et al., 2011 ). Deze eiwitten zijn geanalyseerd door chromatine-immunoprecipitatie (ChIP) en er is aangetoond dat ze associëren met cohesinerijke regio's (Panizza et al., 2011 ), wat mogelijk een weerspiegeling is van een mechanisme om DSB's gevormd op chromatine-lussen te binden om plaatsen op de meiotische chromosoomas te repareren (Kleckner et al., 2004 ). Als alternatief wordt de locus waar breuken worden gevormd eerst aan de as vastgemaakt, waar SPO11 aanwezig is, en vervolgens wordt een DSB gevormd (Kleckner et al., 2004 Sommermeyer et al., 2013 ).

Na DSB-resectie kan meiotisch ssDNA direct worden gezuiverd en geanalyseerd met behulp van een affiniteitshars, die ook kan worden gecombineerd met recombinatie / verwerkingsmutanten die niet-gerepareerde breuken accumuleren (Figuur 1e) (Buhler et al., 2007 , 2009 ). Omdat ssDNA is gebonden door de DMC1- en RAD51-recombinasen, is ChIP van deze factoren gebruikt om recombinatiekaarten met hoge resolutie te genereren in gist, muis en mens, met behulp van een benadering die ssDNA-sequencing (SSDS) wordt genoemd (Figuur 1e) (Smagulova et al., 2011 Steen et al., 2012 Khil et al., 2012 He et al., 2013 Pratto et al., 2014). Soortgelijke methoden zijn ook ontwikkeld in maïs (He et al., 2013). Het zal belangrijk zijn om deze of verwante methoden in planten toe te passen om de genomische distributies van meiotische DSB's volledig te begrijpen. Er is een verscheidenheid aan meiotische mutanten van Arabidopsis beschikbaar die de studie van DSB's kunnen vergemakkelijken, inclusief die welke de breukverwerking veranderen (sae2/com1) (Uanschou et al., 2007 ), DNA-schade kinase-signalering (Geldautomaat, atr) (Garcia et al., 2003 Roitinger et al., 2015 ) en chromatinemodificatie (arp6, ontmoet1, ddm1) (Colomé-Tatché et al., 2012 Melamed-Bessudo en Levy, 2012 Mirouze et al., 2012 Yelina et al., 2012 Keuze et al., 2013 ).

Crossover-hotspots – direct in kaart brengen

Een klassieke methode om cross-overs te detecteren is via analyse van co-overerving van gekoppelde heterozygote markers door meiose (Hunt Morgan, 1916), waarbij verandering van koppelingsfase tussen markers het optreden van een cross-over aangeeft. Meiotische tetrad-analyse is een krachtige genetische techniek, waarbij alle vier de dochtercellen van een enkele meiose worden geanalyseerd (Lichten, 2014). Naast het onderscheid maken tussen twee-, drie- en vierstrengige crossover-gebeurtenissen, maakt tetrad-analyse ook het meten van genconversie-gebeurtenissen mogelijk via detectie van 3:1-overerving tussen zustergameten (Nicolas et al., 1989 Berchowitz en Copenhaver, 2008 Martini et al., 2011 zo et al., 2012 ). Onlangs is tetrad-analyse uitgebreid naar zowel muizen als planten (Berchowitz en Copenhaver, 2008 Cole et al., 2014). In Arabidopsis de kwartet1 (qrt1) mutant is veranderd in pollenwandbiogenese, zodat de vier producten van mannelijke meiose fysiek gehecht blijven (Franciscus et al., 2006 ). Combinatie van qrt1 met gekoppelde heterozygote transgenen die verschillende kleuren fluorescerend eiwit tot expressie brengen, biedt een elegante visuele methode om cross-overs te scoren (Franciscus et al., 2007 Berchowitz en Copenhaver, 2008 ), en er is een gelijkwaardige benadering ontwikkeld voor ontluikende gist (Thacker et al., 2011 ). Alternatief, qrt1 kan worden aangevuld en enkele stuifmeelkorrels kunnen worden geanalyseerd met behulp van flowcytometrie om de meetdoorvoer te verhogen (Yelina et al., 2012, 2013 ). Enkel qrt1 tetrad bestuivingen kunnen ook worden gebruikt om broers en zussen te isoleren die verwant zijn via een gemeenschappelijke meiose, die vervolgens worden gesequenced om inzicht te geven in genoombrede patronen van cross-over en genconversie (Wijnker et al., 2013 Qi et al., 2014). Evenzo kunnen grote aantallen crossover-gebeurtenissen gemakkelijk in kaart worden gebracht met behulp van genotypering of sequencing van F2 of terugkruisende populaties (Salomé et al., 2012 Rowan et al., 2015 ). Nieuwe methoden die gebruik maken van meerdere op annealing en looping gebaseerde amplificatiecycli (MALBEC) hebben sequencing en identificatie van crossovers in een enkel menselijk sperma of oöcyt mogelijk gemaakt (Lu et al., 2012 Hou et al., 2013). Dit resultaat is ook bereikt in maïs via sequencing van DNA uit geïsoleerde enkele microsporen (de mannelijke meiotische producten) (Li et al., 2015 ). Een belangrijke beperking voor al deze benaderingen voor de studie van hotspots is echter het gebrek aan cross-overs per meiose. Bekende plantenhotspots hebben bijvoorbeeld genetische afstanden tussen ongeveer 0,1-0,5 cM (Tabel 2) (Yelina et al., 2012 Keuze et al., 2013 Drouud et al., 2013). Daarom is het voor het analyseren van honderden crossovers op een bepaalde hotspot noodzakelijk om 100.000 meioses te screenen, wat over het algemeen niet mogelijk is bij het genereren van populaties van planten.

Soort hotspot Interval (basenparen) cm cM/Mb Plaats Chromosoom cM/Mb Verwijzing
Arabidopsis thaliana 3b 5746 0.11 20.01 intergenisch 4.77 Choi et al. ( 2013 )
Arabidopsis thaliana 3a 5825 0.21 36.22 Gen 5' en 3' einde' 4.77 Choi et al. ( 2013 ) Yelina et al. ( 2012 )
Arabidopsis thaliana 14a 7283 0.55 75.52 Gen 5′ einde & intergeen 4.8 Droaud et al. ( 2013 )
Arabidopsis thaliana 130x 12 488 0.53 42.44 intergenisch 4.8 Droaud et al. ( 2013 )
Zea mays a1 1900 0.08 40.00 a1 2.1 Brown en Sundaresan ( 1991 )
Zea mays a1 710 0.04 59.00 gen promotor 0.5–1.5 Yao en Schnable ( 2005 )
Zea mays a1 500 0.005 9.10 Gen 5′ einde 0.5–1.5 Yao en Schnable ( 2005 )
Zea mays Yz1 1900 0.06 32.00 Gen 5′ einde 0.5–1.5 Yao en Schnable ( 2005 )
Zea mays Yz1 540 0.03 48.00 Gen 3′ einde 0.5–1.5 Yao en Schnable ( 2005 )
Zea mays B 620 0.03 52.00 Gen 5′ einde nd Patterson et al. ( 1995 )
Zea mays bronzen 1056 0.051 48.30 Gen 5′ einde nd Fu et al. ( 2002 )
Zea mays bronzen 793 0.033 41.61 Gen 5′ einde nd Fu et al. ( 2002 )
Triticum aestivum HGA3 23 000 0.20 8.82 Gen 5′ einde 0.85 Saintenac et al. ( 2009 )

Om grote aantallen cross-overs op individuele hotspots te isoleren, is een algemene benadering het gebruik van allelspecifieke amplificatie van post-meiotisch gameten-DNA, spermatypering of pollentypering genoemd (Tiemann-Boege et al., 2006 Baudat en de Massy, ​​2007 Cole et al., 2010 Berg et al., 2011 Drouaud en Mézard, 2011 Yelina et al., 2012 Keuze et al., 2013 Drouud et al., 2013). Deze benaderingen zijn afhankelijk van het genereren van individuen die heterozygoot zijn over een hotspotgebied van belang. Verzameling van gameten en isolatie van DNA betekent dat monsters bestaan ​​uit een mengsel van niet-recombinante (ouderlijke) en crossover-moleculen die te onderscheiden zijn door patronen van polymorfismen. Allel-specifieke primers zijn ontworpen om te annealen met polymorfismen die een hotspot flankeren en worden in verschillende configuraties gebruikt om ouderlijke of crossover-moleculen te amplificeren (Figuur 1i) (Baudat en de Massy, ​​2009 Kauppi et al., 2009 Cole en Jasin, 2011 Drouaud en Mézard, 2011). Meestal worden de producten van mannelijke meiose (stuifmeel of sperma) verzameld vanwege het gemak van het isoleren van de vereiste grote aantallen cellen (Kauppi et al., 2009 Drouaud en Mézard, 2011 ), hoewel analyse van vrouwelijke gameten ook mogelijk is (de Boer et al., 2013). Deze analyse is belangrijk omdat geslachtsspecifieke verschillen in meiotische recombinatie wijdverbreid zijn, maar slecht worden begrepen (Lenormand en Dutheil, 2005 Giraut et al., 2011 Campbell et al., 2015 ). Het schatten van de recombinatiesnelheid binnen het geamplificeerde gebied is mogelijk door het gameet-matrijs-DNA te verdunnen om ouderlijke en crossover-moleculen te titreren. Het is dan mogelijk om amplificatieproducten van enkele crossover-moleculen te sequencen of te genotyperen om interne crossover-posities te identificeren voor de resolutie van individuele polymorfismen (Tiemann-Boege et al., 2006 Baudat en de Massy, ​​2007 Cole et al., 2010 Berg et al., 2011 Drouaud en Mézard, 2011 Yelina et al., 2012 Keuze et al., 2013 Drouud et al., 2013). Deze methoden maken de fijnschalige karakterisering van crossover-patronen binnen enkele hotspots mogelijk. Een andere methode om crossover-recombinatie in kaart te brengen is via ChIP van geassocieerde factoren, bijvoorbeeld Zip3 binnen de ZMM-route is geanalyseerd in ontluikende gist (Serrentino et al., 2013). In sommige gevallen worden vroege en late cytogenetische foci waargenomen met verschillende eigenschappen (bijv. RNF212), en daarom is het belangrijk om te overwegen of ChIP-benaderingen verschillende foci-klassen gelijk zullen profileren (Reynolds et al., 2013 Qiao et al., 2014 ).

Crossover-hotspots – historische kaarten

De signatuur van crossover kan ook worden gedetecteerd via analyse van natuurlijke genetische polymorfismen, vanwege het effect dat recombinatie heeft op niet-willekeurige associaties tussen mutaties (Auton en McVean, 2012). In het bijzonder veroorzaken cross-overs verval van koppelingsonevenwicht (LD) tussen gekoppelde polymorfismen, die kunnen worden geanalyseerd met behulp van de coalescentietheorie (Charlesworth en Charlesworth, 2010 Auton en McVean, 2012). Beschouw bijvoorbeeld twee gekoppelde, onafhankelijk optredende mutaties een en B. De enige manier om a–b haplotype kan optreden is door terugkerende mutatie, of via recombinatie toetreden een en B op hetzelfde chromosoom (Hudson en Kaplan, 1985 Charlesworth en Charlesworth, 2010 Auton en McVean, 2012). Pakketten zoals LDhat en SequenceLDhot gebruiken dit principe om SNP-patronen te analyseren en de populatie-geschaalde recombinatiesnelheid te schatten 4NeR (waar R is de recombinatiesnelheid per generatie en Ne is de effectieve populatieomvang) (Fearnhead, 2006 Auton en McVean, 2007). Deze benaderingen zijn krachtig omdat ze de zeer grote aantallen meioses in de geschiedenis van de vergeleken individuen bemonsteren. Er zijn echter een aantal beperkingen aan deze methoden, waaronder dat SNP's worden beïnvloed door populatiegenetische krachten naast recombinatie, waaronder selectie, drift en migratie (Charlesworth en Charlesworth, 2010 Auton en McVean, 2012). Verdere kanttekeningen bij deze benaderingen zijn de mogelijke fout die wordt geïntroduceerd door structurele variatie tussen individuen, bijvoorbeeld inserties, deleties, inversies en translocaties. Het verkeerd aanroepen van SNP-posities ten opzichte van een bepaalde referentiesequentie kan de werkelijke fysieke afstanden tussen varianten onder- of overschatten en zo onjuiste schattingen van de recombinatiesnelheid veroorzaken. Dit kan met name een probleem zijn in repetitieve regio's, waar het nauwkeurig identificeren van SNP's uit korte leessequentiegegevens problematisch kan zijn. Daarom is het belangrijk om historische en experimentele mapping van crossover-recombinatie te combineren.


Huidige onderzoeksprojecten

Het mechanisme van recombinatie bij afwezigheid van Prdm9

Mannetjeswolf (Canis lupons lupus)

De zoogdierfamilie van Canidae, zoals honden en wolven, evenals verschillende orden van vogels en vissen, missen een functionele kopie van PRDM9. Ze zijn niettemin in staat om de meiose met succes af te ronden. De genomen van zowel honden als zebravinken en langstaartvinken bezitten zelfs typische kenmerken van puntvormige historische recombinatie, aanwezig als hotspots van afbraak van koppelingsonevenwicht.

Historische koppelingsonevenwichtspatronen die een hotspot voor recombinatie van honden onthullen.

Wij zijn experts in het onderzoeken van sites van historische recombinatie voor: de-novo recombinatiegebeurtenissen met behulp van spermatyperingsmethoden. We bepalen niet alleen de frequentie van recombinatie, maar ook de plaatsing van recombinatiebreekpunten op fijne schaal, en ontcijferen precies waar recombinatiegebeurtenissen worden verdeeld. Daarnaast gebruiken we immuun-fluorescerende kleuring van meiotische eiwitten in celverspreidingen om de meiotische timing en meiotische defecten zoals arrestatie en asynapsis te beoordelen (zie bannerafbeelding).

Het vergelijken van fijnschalige recombinatiepatronen van verschillende dieren met PRDM9-onafhankelijke hotspotregulatie, met organismen met PRDM9-gereguleerde hotspots zal gedetailleerde inzichten geven in het verschil tussen de dynamiek en regulerende factoren van recombinatie in afwezigheid van PRDM9, wat bijdraagt ​​aan een beter begrip van de functie en de rol van PRDM9 bij normale meiose.

Om dit doel te bereiken, onderzoeken we talloze monsters van Prdm9-deficiënte organismen, waaronder verschillende soorten van de Canidae-familie en leden van de orde van Passeriformes. Natuurlijk hebben we ook monsters van organismen met Prdm9-gereguleerde hotspots, voornamelijk monsters van verschillende soorten en ondersoorten van muizen in het geslacht muziek, zoals Mus musculus musculus, Mus musculus domesticus, Mus spretus, Mus spicilegus net zoals Apodemus uraliensis als outgroup.

Recombinatie Landschap Evolutie

Het sequencen van de Prdm9 Exon-codering voor het C2H2-zinkvingerdomein kan de onderliggende populatiediversiteit onthullen in de posities die relevant zijn voor DNA-binding.

Recombinatie landschappen evolueren snel. Door PRDM9 gereguleerde hotspots worden op zijn minst onderdrukt door mutaties die het recombinatie-initiatiemotief verstoren waaraan PRDM9 bindt. Bij individuen die heterozygoot zijn voor de mutatie, wordt het onderdrukkende allel altijd overgedragen via vooringenomen genconversie, waardoor uiteindelijk de recombinatie-hotspot op populatieniveau tot zwijgen wordt gebracht.

Bijkomende vooroordelen, zoals CG-vooringenomen genconversie, hebben geen invloed op cross-overs of hotspot-activiteit, maar genereren niettemin meiotische drive en veranderen de genoomsamenstelling in de loop van de tijd. Recombinatiegebeurtenissen worden afzonderlijk geïsoleerd uit beide oriëntaties van recombinatie, met behulp van allelspecifieke PCR-benaderingen. Door de frequentie en distributie van wederkerige gebeurtenissen te vergelijken, worden incidenties van vooringenomenheid en meiotische drive ontdekt.

Wanneer waargenomen, wordt deze informatie gebruikt om de evolutionaire gevolgen op lange termijn te voorspellen via computersimulaties.

Bevooroordeelde genconversie van verschillende sterkte verandert de allelfrequenties over generaties.


Resultaten

Detectie van CO's op drie meiotische hotspots door "pollen-typering"

Een eerdere studie van de CO-verdeling over het hele A. thaliana chromosoom 4, in grote populaties van hybriden tussen "Columbia-0" (Col) en "Landsberg erecta-4” (Leh), identificeerden de regio's 14a en 130× als goede kandidaten voor echte CO-hotspots [23]. In deze twee regio's van slechts enkele kilobasen bleek de CO-snelheid 20 tot 30 keer hoger te zijn dan het chromosomale gemiddelde (4,8 cM/Mb). Klassieke genetische technieken konden echter niet worden gebruikt om deze regio's verder te onderzoeken, omdat er enkele tienduizenden planten nodig zouden zijn geweest om voldoende CO's te verkrijgen om deze regio's te karakteriseren. Daarom hebben we een "stuifmeeltypering" -techniek opgezet (zie Materialen en methoden Figuur 1 [24]), die parallel loopt met de "spermatypering" -techniek die wordt gebruikt voor hotspotstudies bij muizen en mensen [25]-[27]. In het kort (zie Materiaal en methoden voor meer details), werd genomisch DNA (gDNA) geëxtraheerd uit miljoenen stuifmeelkorrels verzameld uit een reeks F1 ColxLeh hybriden en nauwkeurig gekwantificeerd door PCR (zie materiaal en methoden). Rekening houdend met de CO-frequentie geschat door onze genetische kaart, werd het gDNA vervolgens verdund om minder dan één vermoedelijk recombinant molecuul per PCR-reactie te verkrijgen. Recombinante producten werden gedetecteerd door twee rondes van allelische PCR's (Figuur 1). Wanneer een geschikte verdunning was bereikt, werd een grote reeks PCR-reacties uitgevoerd om de aanwezigheid of afwezigheid van ten minste één matrijsmolecuul in elke reactie te detecteren. CO-snelheden kunnen vervolgens worden geschat met behulp van de Bayesiaanse inferentiebenadering die is beschreven in het materiaal en de methoden. De meiotische oorsprong van deze moleculen werd beoordeeld met controlereacties die parallel werden uitgevoerd met stuifmeel en blad (somatisch) DNA. Met dezelfde hoeveelheden gDNA konden CO-moleculen worden gedetecteerd in pollen-DNA, maar nooit in blad-DNA (Figuur 2). Toen de sequentie werd bepaald van de weinige positieve PCR-producten die waren geamplificeerd uit een grote hoeveelheid bladgenomen (minstens 15 keer meer genomen dan in de PCR-reactie die werd gebruikt om recombinante moleculen op pollen-DNA te detecteren) bleken ze het resultaat te zijn van niet-specifieke amplificatie. . Ze kwamen niet overeen met een enkele locus van de Arabidopsis genoom, maar eerder tot een complex mengsel van loci van verschillende chromosomen (gegevens niet getoond) in tegenstelling tot producten die zijn verkregen uit stuifmeel-DNA (zie hieronder).

PCR werd uitgevoerd met allelspecifieke oligonucleotiden (ASO's) die zijn ontworpen voor de amplificatie van CO-moleculen (zie Materiaal en methoden, figuur 1), met behulp van afnemende hoeveelheden genomisch DNA (het aantal sjabloonmoleculen is aangegeven op de foto) geëxtraheerd uit F1 Col x Leh hybride planten, hetzij van blad (twee bovenste rijen) of stuifmeel (twee onderste rijen). Voor elke verdunning werden acht aliquotreacties uitgevoerd. Er werden geen PCR-producten uit blad geamplificeerd. Met behulp van equivalente lage concentraties DNA geëxtraheerd uit stuifmeel (4096 moleculen en minder), werden CO-moleculen echter sterk en specifiek geamplificeerd.

We waren in staat om honderden recombinante CO-moleculen in beide regio's te amplificeren en karakteriseren in gDNA geëxtraheerd uit het stuifmeel van ColxLeh hybride planten (167 en 104 CO's bij respectievelijk 130× en 14a). Het CO-percentage in pollen-gDNA was 0,55% (betrouwbaarheidsintervallen (BI): 0,29-0,95) bij 14a en 0,53% (BI: 0,34-0,78) bij 130×. De recombinante moleculen werden bevestigd door sequencing en hun uitwisselingspunt werd nauwkeurig in kaart gebracht. Alle gekarakteriseerde CO-moleculen bevatten een enkele overgang tussen de ouderlijke haplotypes.

Twee verschillende CO-pieken werden waargenomen in het 14a-gebied (vervolgens 14a1 en 14a2 genoemd), die beide passen in een Gauss-verdeling (Figuur 3A). De breedte van de hotspots waarbinnen 95% van de CO's optrad (bepaald door best passende normale verdelingen, zie Materiaal en methoden) was respectievelijk 1.475 bp en 3.775 bp voor 14a1 en 14a2. Hun respectievelijke medianen liggen 3047 bp uit elkaar, met een "vallei" ertussen waar slechts een paar CO's werden gedetecteerd. De CO frequentie was nul aan weerszijden van deze regio (Figuur 3A). Bij 14a1 en 14a2 pieken de CO-snelheden bij respectievelijk 261 en 127 cM/Mb (54 en 26 keer het chromosomale gemiddelde). Om de relatie tussen CO-frequentie bij 14a en chromatine te onderzoeken, hebben we gepubliceerde gegevens met lage nucleosoomdichtheid (LND) over hetzelfde gebied uitgezet (Figuur 3C), waar een hoog signaal een afwezigheid van nucleosomaal DNA vertegenwoordigt [28]. Regio's van LND worden typisch waargenomen bij de 5' van genen die samenvallen met transcriptionele startplaatsen (TSS). In overeenstemming met deze waarneming waren de LND-pieken stroomopwaarts van de twee genen binnen 14a gelokaliseerd. Opvallend was dat we een overlap zagen van de 14a CO-frequentiepieken en de LND-pieken (Figuur 3C), wat suggereert dat DNA-toegankelijkheid CO's op de 14a-hotspot bevordert.

Honderdvier CO's werden geanalyseerd op 14a (62 op 14a1 en 42 op 14a2) en 167 op 130×. Grijze gestippelde verticale lijnen: mediaanposities van de hotspots. Op de x-as: driehoeken zijn posities van inserties-deleties groter dan 7 bp (van links naar rechts van 130×: 20, 13, 12, 70, 10, 7 en 11 bp) groene driehoeken zijn posities van gebruikte indels om onderofficieren te detecteren groene stippen zijn SNP's die worden gebruikt om onderofficieren te detecteren. De zwarte stip op de x-as in (A) is de positie van de microsatelliet. Genstructuren langs de hotspotgebieden worden weergegeven bovenop grafische gebieden (licht gehasht grijs: exons, donkergrijs: UTR, onderbroken lijnen: introns). (C) (D) Lage nucleosoomdichtheid (LND) bij 14a en 130×. LND is afkomstig van gepubliceerde nucleosomale DNA-microarray-hybridisatie-experimenten, waarbij een hoog signaal een afwezigheid van nucleosomaal DNA vertegenwoordigt [28].

Bij 130 × was de CO-snelheid ook nul aan beide zijden van de regio en bereikte een maximum (dicht bij het midden) bij 167 cM/Mb, wat 35 keer het chromosomale gemiddelde is (Figuur 3B). De verdeling van CO's verschilde van die waargenomen in 14a: het was breed (meer dan 7 kb) en onregelmatig met afwisselend "pieken" en "dalen" (Figuur 3B), wat niet goed past bij een unieke Gauss-curve. Interessant genoeg was er weinig correlatie tussen CO-pieken en LND bij 130 × (Figuur 3D), wat suggereert dat er hotspots bestaan, die verschillende relaties hebben met de nucleosoomdichtheid. Alles bij elkaar geven zowel de CO-snelheid als de verdeling bij 14a en 130× duidelijk aan dat er hotspots zijn in A. thaliana.

Vervolgens hebben we gekeken naar de verdeling van uitwisselingspunten in de recombinante moleculen in elke oriëntatie op beide loci (Figuur 4). Bij de 14a hotspots (14a1+14a2), verschillen tussen de CO-verdeling in de reciproke oriëntaties “Col to Leh" en ikeh to Col" (d.w.z. 'CtoL' en 'LtoC') werden waargenomen: 'LtoC'-uitwisselingen werden naar links van 'CtoL'-uitwisselingen verschoven (Figuur 4A). Een vergelijking van cumulatieve CO-verdelingspatronen toonde aan dat dit leidt tot een overmaat van het Col-allel in het midden van beide hotspots (Figuur 4A). Op 14a1 werd het Col-allel met 68% over-overgedragen en dit verschil was zeer significant (p-waarde = 0,00111), terwijl het slechts nauwelijks significant was (p-waarde = 0,0734) voor de 14a2-hotspot, waarschijnlijk vanwege het lagere CO-getal. Deze patronen zijn consistent met de hypothese dat de Leh allel heeft een sterkere initiatie-activiteit dan het Col-allel op deze hotspots [29]. De gemiddelde positie van de twee wederkerige verdelingen 'CtoL' en 'LtoC' was gemiddeld gescheiden door 213 bp en 483 bp voor respectievelijk de 14a1 en 14a2 hotspots. Daarentegen leken bij de 130 × hotspots beide allelen even bekwaam in het initiëren van recombinatie (Figuur 4B).

Negenentwintig 'CtoL' en 33 'LtoC' CO's werden geanalyseerd op 14a1, 23 en 19 op 14a2 en 75 en 92 op 130×. De 'LtoC'-verdeling wordt weergegeven in rood en de 'CtoL' in blauw. Voor alle drie hotspots en beide wederzijdse oriëntaties werden gecumuleerde (van links naar rechts) relatieve CO-snelheden gescoord op opeenvolgende polymorfe locaties langs de regio. Blauwe curven: gecumuleerde relatieve 'CtoL' CO-tarieven. Rode curven: gecumuleerde relatieve 'LtoC' CO-tarieven. Blauw histogram: verdeling van 'CtoL' CO-tarieven. Rood histogram: verdeling van 'LtoC' CO-tarieven. Grijze gestippelde verticale lijnen: mediaanposities van de hotspots.

Detectie van NCO-gebeurtenissen op meiotische recombinatie-hotspots

Bij meiotische recombinatie-hotspots worden DSB's gerepareerd als CO's of NCO's. In planten zijn zeer weinig meiotische NCO's gekarakteriseerd vanwege de moeilijkheid om moleculaire gebeurtenissen te detecteren, tenzij ze verband houden met een fenotypische verandering. We hebben NCO-gebeurtenissen gekarakteriseerd op zowel de 14a1- als 130 × hotspots, met verschillende moleculaire benaderingen die zijn aangepast aan de polymorfismen die beschikbaar zijn op elke hotspot (Figuur 1 zie Materiaal en methoden [30]).

Voor 14a1 waren de polymorfismen in het midden van de hotspot niet geschikt voor een pollentyperingsstrategie. We gebruikten dus een kloneringsstrategie op basis van een methode beschreven in [31] (Figuur 1 zie Materiaal en methoden, [30]): na twee rondes van allelspecifieke PCR uitgevoerd op pollen-DNA, was het fragment dat overeenkomt met het 14a1-hotspotgebied gekloond. 3000 klonen werden individueel gegenotypeerd bij drie SNP's: twee (#35 en #37) aan weerszijden van het midden van de hotspot en één (#33) aan de linkerrand (Figuur 5). Voor de controlereactie werd een vergelijkbare reeks PCR's, klonering en genotypering uitgevoerd met DNA geëxtraheerd uit F1 ColxLeh bladeren. Positieve klonen verkregen met stuifmeel-DNA werden gesequenced (zie Materiaal en Methoden Figuur 1). Van de 3.000 geteste moleculen werden 8 en 7 NCO-gebeurtenissen gedetecteerd bij respectievelijk polymorfisme #35 en #37, en geen bij de hoogste externe SNP #33 (Figuur 5). Er werden geen positieve klonen verkregen in DNA geëxtraheerd uit bladeren (0/2850) bij SNP#35 en #37, wat aantoont dat NCO's specifiek waren voor pollen-DNA. De cumulatieve NCO-frequentie voor beide SNP's (#35 en #37) (1/203, 0,50% (BI: 0,30-0,82)) was vergelijkbaar met de totale CO-frequentie geschat met de pollentyperingsaanpak, wat suggereert dat deze hotspot even gevoelig is voor produceren onderofficieren en CO's (0,55%).

De SNP's #33, #35 en #37 worden aangegeven door gevulde groene cirkels. De polymorfismen worden aangegeven door gevulde zwarte cirkels langs de chromosoomcoördinaatassen. De positie van de microsatelliet tussen #35 en #37 wordt aangegeven als een oranje cirkel. Dikke blauwe of rode horizontale lijnen: geconverteerde SNP's, Dikke gestippelde grijze horizontale lijnen: interval waarin NCO-kanaaluiteinden zich bevinden. Blauw: Col Rood: Leh.

NCO-gebeurtenissen op beide locaties waren allemaal beperkt tot een enkel polymorfisme, ofwel #35 of #37, dwz zonder co-conversie van linker- en/of rechterflankerende markers, die zich op 111 bp en 482 bp van #35 en 166 bp bevinden en 340 bp voor #37 (Figuur 5). Het gemiddelde minimale kanaal was dus 1 bp als alleen het geconverteerde polymorfisme werd beschouwd en het gemiddelde maximale kanaal was 552 bp als het kanaal net voor het volgende niet-geconverteerde polymorfisme naar beide kanten werd uitgebreid (276 bp als het minimale en maximale gemiddelde worden gemiddeld).

We hebben ongelijke aantallen onderofficieren in beide richtingen teruggevonden: twee 'LtoCtoL' en zes 'CtoLtoC' werden gedetecteerd bij polymorfisme #35, terwijl één 'LtoCtoL' en zes 'CtoLtoC' bij polymorfisme #37 (Figuur 5). Toen alle NCO's werden samengevoegd, was het verschil tussen NCO-percentages in wederzijdse oriëntaties ('LtoCtoL' versus 'CtoLtoC') significant (p-val = 0,018). Dit resultaat versterkt de hypothese dat initiatie bij voorkeur plaatsvindt op de Leh allel op de 14a1-hotspot (zie hierboven).

Bij 130 × werden NCO-moleculen gekarakteriseerd met behulp van een PCR-gebaseerde "pollentypering" -strategie (zie Materialen en methoden Figuur 1 [30]). Allel-specifieke PCR werd uitgevoerd met behulp van Col-specifiek of Leh specifieke primers op 96 monsters, die elk 4.145 F1-pollengenomen of 4.800 F1-bladgenomen bevatten. Vervolgens werd, om specifiek NCO-moleculen te detecteren, allelspecifieke PCR uitgevoerd bij drie verschillende SNP's (Figuur 1 zie Materiaal en methoden [30]): de drie polymorfe plaatsen #21, #44 en #52 waren 2339 en 2052 bp verwijderd, respectievelijk (zie groene stippen in figuur 3B). SNP#44 bevindt zich naast het midden van de hotspot waar de CO-frequentie maximaal is, #21 bevindt zich in het linkerdeel van 130× waar de CO-snelheid laag is en #52 is rechts waar de CO-snelheden gemiddeld waren. Voor de controle, DNA geëxtraheerd uit bladeren (bijna 468.000 genomen), werd geen PCR-product geamplificeerd op SNP #44. In DNA geëxtraheerd uit stuifmeel (bijna 398.000 genomen), werden 29 NCO-gebeurtenissen gevonden bij SNP # 44 (Figuur 6A), wat aantoont dat NCO's specifiek waren voor stuifmeel-DNA. Dertig en vier NCO-evenementen werden gevonden op respectievelijk SNP # 21 en # 52 (Figuur 6B, 6C). De waargenomen NCO-frequentie was ongeveer 0,007% (BI: 0,005-0,010), 0,008% (BI: 0,005-0,011) en 0,001% (BI: 0,0004-0,0033) bij respectievelijk #44, #21 en #52. Toen de resultaten van de drie SNP's werden samengevoegd, was het NCO-percentage 0,017%, wat ongeveer dertig keer minder is dan de totale CO-frequentie (0,53%).

(A) SNP #44, (B) SNP #21, (C) SNP #52. De posities van de gegenotypeerde SNP's worden aangegeven door groene gevulde cirkels (SNP's) of driehoeken (indels). De polymorfismen worden aangegeven door gevulde zwarte cirkels langs de chromosoomcoördinaatassen. Driehoeken: invoeging of verwijdering groter dan 7 bp. Dikke rode of blauwe horizontale lijnen: geconverteerde SNP's, Dikke grijze gestippelde horizontale lijnen: interval waarin NCO-kanaaluiteinden zich bevinden. Blauw: Col Rood: Leh.

At SNP #44, 23/29 NCO tracts extended to the right toward the neighboring polymorphism (89 bp away), while polymorphisms to the left were co-converted in only five tracts, but over a greater distance (up to 791 bp) (Figure 6B) similarly, at #21, 20/30 NCOs included the first two polymorphisms on the left (275 bp) whereas only five extended to the right but again over a greater distance (up to 1028 bp) (Figure 6A). This apparent non-symmetrical distribution of the NCO tracks reflects the asymmetrical scattering of the SNPs on either side of #44 and #21. At both sites, numerous SNPs are present only on one side, leading to an accurate analysis of the breakpoints whereas on the other side only distant SNPs were available. The minimal track length means were comparable for both SNPs (160 bp at #21 and 278 bp at #44) whereas the maximal mean track length was more than three times longer at #21 (1798 bp) when compared to #44 (492 bp). The longest NCO track was found at #52: six SNPs were co-converted along a tract of 1882 bp that could extend up to 3045 bp. Interestingly, none of the NCO tracks covered either #21 and #44 or #44 and #52. At #21 three NCO tracts were chimeric (with more than two exchange points): two ‘CtoLtoCtoLtoC’ and one ‘LtoCtoLtoCtoL’ (Figure 6A).

We also noticed that as observed for 14a1, an excess of ‘LtoCtoL’ (36) NCOs compared to ‘CtoLtoC’ (23) NCOs were detected at both #21 and #44. At #52, only ‘LtoCtoL’ NCOs were obtained. In the latter case, it was not possible to determine whether there was an absence of ‘CtoLtoC’ NCOs in our starting pool of almost 398000 genomes or if these were missed by pollen-typing. However, when the results were pooled for #21 and #44, the difference was not significant (‘LtoCtoL’: 0.009% (CI: 0.007–0.013) ‘CtoLtoC’: 0.006% (CI: 0.004–0.009)).

CO and NCO rates in the Atmsh4 gemuteerd

In A. thaliana, on the basis of chiasma counts in mutant backgrounds, it is assumed that 85% of COs belong to the interference dependent pathway (class I), while the remaining 15% are interference-free (class II) [32]. To test the contribution of both CO pathways at the 130× and 14a hotspots, we analyzed CO rate and distribution in an atmsh4 mutant background in which interfering COs are absent. Crosses were made between hemizygous Col and Ler lines containing a T-DNA insertion in the AtMSH4 gene (see Material and Methods). Meiosis appeared regular in both AtMSH4 +/− Col and Ler parents and the F1s AtMSH4 +/+ or AtMSH4 +/− . Meiosis, however, was disturbed in the F1 Atmsh4 −/− with a dramatic reduction in chiasma number as described in (Higgins et al.2004 data not shown). We set up pools of Atmsh4 −/− or AtMSH4 +/− or AtMSH4 +/+ F1 plants, extracted gDNA from their pollen and performed pollen-typing PCR to detect CO molecules. CO rates were not statistically different in AtMSH4 +/+ and AtMSH4 +/− at either 14a or 130× (data not shown). Thus pollen gDNA from AtMSH4 +/+ and AtMSH4 +/− was pooled and is referred to as “MSH4” in the following experiments. As expected, in the Atmsh4 −/− pollen, when we conducted the experiment at the 14a locus, we detected a dramatic decrease (12 fold) in CO frequency compared to the “MSH4” CO rate (Table 1). However, this frequency is likely to be slightly over-represented because the proportion of viable pollen grains depends on the number of bivalents (i.e. pairs of homologous chromosomes containing a CO). We then analyzed CO distribution (Figure 7A). Surprisingly, the two hotspots, 14a1 and 14a2, were affected differently by the mutation. In “MSH4”, the majority of COs (61%) occurred in 14a1 (ratio 14a1/14a2: 1.6). Bij contrario in Atmsh4 −/− , the proportion of COs between 14a1 and 14a2 was inversed (ratio 14a1/14a2: 0.5 chi2 p-waarde = 8.7 10 −5 ) (Figure 7A Table 2). At 130×, we performed two series of overlapping PCRs to cover the whole area (see Material and Methods Figure 7B). We also obtained a lower rate of CO frequency in Atmsh4 −/− , but at a different level in the left (13 times lower), and right (78 times lower) sections of the loci (Figure 7B Table 1).

(A) One hundred and eight and 48 COs were analyzed in “MSH4" en Atmsh4 −/− respectively. Grey distribution: “MSH4”. Green distribution: Atmsh4 −/− . Green dotted line: 5× magnification of the Atmsh4 −/− distribution. (B) Two hundred and forty five and 58 COs were analyzed in “MSH4" en Atmsh4 −/− respectively. Grey distribution: “MSH4”. Green distribution: Atmsh4 −/−. The localization of the two overlapping PCRs is shown with orange (left part) and pink lines (right part). Green dotted line: 5× magnification of the Atmsh4 −/− distribution.

Next, we tested the NCO frequency in the Atmsh4 mutant background and “MSH4” at both loci. At the SNP#35 in the center of 14a1, 41 NCOs were detected and confirmed among 11,896 colonies in pollen DNA extracted from Atmsh4 −/− and 20 among 3,600 colonies for “MSH4” pollen DNA. Thus, at this marker the NCO rate was comparable in both genetic backgrounds (Table 3). At 130×, in the Atmsh4 −/− pollen DNA, among 83,656 molecules, two NCOs were detected at #44, which gave a NCO frequency of 0.0024% (CI: 0.00074–0.0086). In “MSH4”, the NCO frequency (84 events/545844 genomes) was significantly higher at the same SNP 0.015% (0.012–0.019) (p-waarde = 0.0035) (Table 3 Figure S3). Therefore, the NCO frequency at #44 decreased considerably (six fold) in the absence of MSH4.

Hotspot strength and landscape vary depending on the genetic background

We selected two other Arabidopsis accessions for which we could use the same allele-specific primers to perform pollen typing but which have different levels of polymorphisms within the DNA sequence at the 14a hotspot: Pyl-1 (8AV) and Ws-4 (530AV), (Material and Methods). Between Col and the three accessions Ler, Pyl1 and Ws-4, there are 0.43%, 0.53% and 0.63% of polymorphisms distributed along the 5 kb of the 14a hotspot (Figure S1). We also included the “MSH4” data in this study because it is another ColxLer F1with exactly the same sequence at both the 14a and 130× loci. We observed considerable variation in CO rates at the 14a loci. Strikingly, the 14a hotspots almost disappeared in ColxPyl-1. There were 100 times less COs than in “MSH4”, 60 times less than in ColxLer and 23 times less than in ColxWs and even 12 times less than in the mutant Atmsh4 −/− background (Table 4 Figure 8A). In ColxWs, the CO rate (0.21%) was in the same range as in ColxLer (0.55%) but significantly less than in “MSH4” (1.27% Table 4).

(A). One hundred and four, 108 and 87 COs were analyzed in ColxLer (black), “MSH4” (orange) and ColxWs (purple), respectively. Thin dotted vertical lines: median position at 14a1 and 14a2 for each distribution. (B). One hundred and sixty seven and 245 COs were analyzed in ColxLer en "MSH4”, respectively. Thin dotted vertical lines: median position for each distribution. Using a Fisher exact test, the two distributions were found to be highly significantly different (p-waarde = 2.2×10 −16 ).

Surprisingly, we observed that the CO and NCO rates and CO distribution at 130× differed significantly between the two ColxLer F1s used in this study (ColxLer en "MSH4”), whereas no significant variation was obtained at 14a (Table 4 Figure 8). We also observed another difference, with ‘LtoC’ and ‘CtoL’ exchanges peaking in the same interval in ColxWs and in “MSH4” but distant in ColxLer (see above) (Figure S2). Moreover in “MSH4” we recovered a comparable number of ‘LtoCtoC’ and ‘CtoLtoC’ NCOs (Figure S3). Thus the bias in recombination appears to only exist in ColxLer. We believe that the differences in CO rates and distribution between these two F1s are robust, as they were observed in several different experiments (data not shown) but as mentioned above the hotspot sequences are identical in these two lines.


Resultaten en discussie

Identification and Distribution of Recombination Hotspots Along the Chromosome.

The alignment is 287 kb long and there are 464 nonsingleton SNPs in the European population and 232 in the Far East Asian, giving an average density of one SNP every 0.6 kb in Europe and 1.2 kb in the Far East (Table S1). For each population no more than two alternative nucleotides were found at each site. We estimated the population recombination parameter ρ between neighboring pairs of SNPs using the program rhomap (20) (Fig. 1EEN). In an idealized population, ρ is equal to 4NeR(1−F)m, waar Ne is the effective population size, R the rate of recombination between the two SNPs, F the inbreeding coefficient, and m the frequency of sex (18, 21). Both populations show heterogeneity in the rate of recombination along the chromosome, particularly the European population, which also shows higher rates on average. This difference is not simply because of the smaller sample size in the Far East population, as it persists when the European population is reduced to eight strains (Fig. S1).

Distribution of recombination on S. paradoxus chromosome III. (EEN) The population-recombination parameter ρ, calculated between consecutive pairs of SNPs along the chromosome, is shown for the European and Far East populations (the first and last genes in the alignment are VBA3 en HMRA1 SNPs are shown as dots along the lines). The hotspot regions identified in each population are highlighted in red, and the corresponding regions in the other population in blue (for visual clarity, these extend 2 kb on either side). Hotspot numbers correspond to those used in Table 1. Positions of the centromere (CEN) and mating type locus (MAT) are indicated by arrows. The distribution of haplotype blocks, representing regions with no evidence of recombination, is also shown (black lines) (see Methoden:). Haplotype blocks are longer in the Far East population, consistent with the finding of lower recombination rate. (B) The average ρ for the two populations of S. paradoxus is plotted and hotspots from the combined analysis shown in red. Diamonds indicate the position of DSB hotspots in S. cerevisiae (11). (C) Comparison of hotpsot locations. Vertical red bars show the position of hotspots in S. paradoxus. Diamonds again show the position of DSB hotspots in S. cerevisiae (11) and horizontal lines show the hotspots identified by Mancera et al. (12) in their “crossover” and “total” analyses.

Physical locations and parameter estimates for recombination hotspots on chromosome III of S. paradoxus

To assess our population-genomic estimates of recombination rates, we tested whether two well-supported experimental results from S. cerevisiae are replicated in our dataset. In S. cerevisiae, rates of recombination are relatively low between the centromere and mating-type locus, and also higher in intergenic regions containing at least one promoter than in those with none (22, 23). We confirm both these results in S. paradoxus. Recombination in the ∼100-kb region between the centromere (CEN) and the mating type (MAT) locus is about half that for the rest of the chromosome (ρ = 1.9 vs. 4.5 Morgans/kb in Europe and 0.9 vs. 2.0 in the Far East). In addition, intergenic regions that are 5′ to at least one of the flanking genes have higher ρ than those that are 5′ to none (P = 0,004 en P = 0.07 for Europe and Far East) (Table S2). This correspondence of results gives us confidence that our dataset is sufficient to detect major features of recombination.

To identify recombination hotspots, we tested for statistically significant increases in ρ compared to flanking regions, using the program sequenceLDhot (24). For each 2-kb window (with a 1-kb offset), the program tests the null hypothesis that ρ in the window is equal to ρ in the flanking 50-kb region (centered on that window). Six recombination hotspots were found in each population (Fig. 1A and Table 1). They are 2 to 5 kb in length, similar to the 3 kb average found in S. cerevisiae chromosome III and the 1 to 2 kb length of human hotspots (3, 12, 25). Exactly the same hotspots are found if each 2-kb window along the chromosome is tested against the flanking 6-kb region. We further evaluated the significance of these hotspots by calculating the number of hotspots expected by chance in chromosomes with constant recombination along their length. Twenty simulated alignments were obtained by evolving chromosomes of the same length and level of polymorphism as the original dataset, using the program ms (26). Only an average of about one such “false” hotspot region was found per simulated alignment (1.2 and 1.4 for Europe and Far East, respectively). All hotspots in Europe have likelihood ratios greater than 10, and in the simulated alignments only 0.2 hotspots per alignment had likelihood ratios at least that high.

Detecting statistically significant recombination hotspots from population genomic data are a challenging problem, and even the best algorithms can have low power (20, 24). This low power probably accounts in part for the fact that some peaks in the rhomap estimates are not identified as statistically significant by sequenceLDhot (Fig. 1EEN). Nevertheless, one region is identified as a hotspot in both populations independently (the IMG1-BUD23-ARE1 hotspot ∼9 kb to the right of MAT). Moreover, it is apparent from Fig. 1EEN that hotspots in one population correspond to local peaks of recombination in the other population, even if these are not identified as statistically significant by sequenceLDhot. For the 10 hotspots that are statistically significant in only one population, the corresponding regions in the other population have higher ρ than their respective 6-kb flanking regions (paired randomization test, N = 10, P = 0.02). Therefore, to maximize our power to detect hotpots in S. paradoxus, we performed a combined analysis of the two populations. Ten of the 11 hotspots found in the separate analyses of the two populations are also significant in the combined analysis, and no new hotspots were identified (Fig. 1B) (the expected false-positive rate in the combined data is 0.9 hotspots per alignment).

Conservation of Recombination Hotspots.

To test whether recombination hotspots are conserved between S. paradoxus en S. cerevisiae, we compared our hotspots to those identified in two recent experimental studies of S. cerevisiae. The first study is an analysis of double-strand breaks (DSBs) formed during meiosis, in which 17 hotspots were identified on chromosome III that had DSB rates more than 8-fold greater than background (11). Eight of these are in regions homologous to the hotspots we identified in the combined S. paradoxus dataset (Fig. 1 B en C). As our hotspots occupy only 11.2% of the chromosome, the probability of such overlap under the null hypothesis of random placement is (from the binomial distribution) P = 0.00024. In addition, five more of the hotspots identified by Buhler et al. (11) correspond to local peaks in recombination in S. paradoxus that did not reach statistical significance in our analyses (Fig. 1B, hotspots a, j, k, l, and n).

The distribution of meiotic DSBs along a chromosome may not be identical to the distribution of crossovers, as breaks can be repaired without crossing over, for example, using the sister chromatid as a template for repair, or using the homologous chromosome without crossing over (27). Therefore we have also compared our data to the results of an analysis of 51 meioses in S. cerevisiae that identified five crossover hotspots on chromosome III (12). Three of these hotspots overlap hotspots in S. paradoxus (i.e., the middle of the smaller region is contained within the larger region) (Fig. 1C). To test if this much overlap would be expected by chance, we randomized hotspot locations separately in each of the two species, and for each randomization recorded the number of overlaps. In only 2% of randomizations were three or more overlaps observed. Mancera et al. (12) also identified five additional hotspots when combining both crossover and noncrossover data, and two of these overlap with another S. paradoxus hotspot (Fig. 1C). Overall, 4 of the 10 hotspots found in S. paradoxus overlap hotspots in S. cerevisiae, and 5 of the 10 hotspots in S. cerevisiae overlap those in S. paradoxus.

All three studies identify the same region as the hottest hotspot, corresponding to the well-known ARE1 (YCR048R) hotspot region (23, 28, 29) (hotspot 7 in Fig. 1B), suggesting there may be similarities between species in both location and intensity of recombination hotspots. These similarities are found despite the fact that completely different methodologies were used in the two species (population genomic vs. experimental). For those hotspots found in only one of the two species, it is not clear if this is because of real differences in the location of hotspots or to low power in the analyses.

Thus, the distribution of hotspots in S. cerevisiae en S. paradoxus appears to be much more similar than that between humans and chimpanzees, despite the fact that the yeasts are more than 10-times more divergent at the sequence level. These similarities between yeast species are most parsimoniously explained by conservation from the common ancestor, although we cannot formally exclude the possibility of recurrent hotspot evolution at the same sites because of limited availability of alternative sites for hotspots in a smaller genome. This relatively high conservation presumably reflects a slower rate of hotspot loss by gene conversion. We attribute this difference to the low frequency of sex and outcrossing in yeast. At the population level, the change in gene frequencies due to biased gene conversion, and hence the rate of deterioration of a particular hotspot, will be proportional to the frequency of sex and the level of heterozygosity (5). Previous work has indicated that S. paradoxus in nature goes through meiosis only once every 1,000 generations, and only 1% of matings are outcrossed (15, 18). The effect of gene conversion will therefore be reduced by a factor of 10 5 relative to that in an otherwise comparable obligately outcrossed species. Hotspots may also be maintained if the hotspot sequence is functionally relevant for a reason other than recombination, and it is likely that a smaller fraction of the yeast genome is selectively neutral than in the human genome [upper bounds of ∼35% and ∼88%, respectively (18, 30)].

The low frequency of sex and outcrossing in natural populations means that features of recombination that are observed in the laboratory (e.g., a conversion bias in favor of recombination-suppressing alleles) may have relatively small evolutionary effects. We now analyze two other laboratory-observed features of recombination, and estimate the magnitude of their effects on yeast genome evolution.

Recombination and Mutation Rate.

Recombinational repair of DSBs in mitotic cells is associated with a 100-fold increase in the mutation rate (31). Assuming that meiotic recombination shows an equivalent increase in mutation rate—for which there is some evidence (32)—and if sex is common, one might expect increased sequence divergence at recombination hotspots. Echter, S. paradoxus hotspots are neither more diverse nor more divergent than the chromosome average (Table 1). In addition, there is no correlation between rates of recombination and either levels of polymorphism or rates of divergence across 5-kb segments of the chromosome (Fig. S2). The lack of positive association between recombination rates and divergence (also reported by ref. 32) is fully consistent with recombination being rare, as the mutational effect of recombination will be swamped by the mutations occurring in the intervening asexual generations. Bijvoorbeeld in S. cerevisiae the hottest hotspot recombines in about 25% of meioses (12). If sex occurs only once every 1,000 generations, then its average mutation rate over the whole life cycle is only 100 × 0.25 × 1/1,000 = 2.5% higher than a region that never recombines, too small a difference to be detected. Again, if hotspots tend to be in more functionally constrained regions of the genome, this could also contribute to the lack of association with increased divergence.

Recombination and Base Composition.

Experiments have shown that biased gene conversion in S. cerevisiae not only favors recombination-suppressing alleles, but also, independently, G and C nucleotides over A and T (12, 33). This bias occurs as a result of the mismatch-repair system acting on heteroduplex DNA formed during meiosis converting AT nucleotides into GC nucleotides. This repair bias may in turn have evolved to counteract the AT-bias in mutation (34). Recombination hotspots in S. cerevisiae have higher GC content than the rest of the genome (23), a result also found in S. paradoxus (43 vs. 39%, for both Europe and Far East, P = 0.004 and 0.02, respectively) (Table 1), and there is a highly significant positive correlation between ρ and GC content across nonoverlapping 5-kb segments of the genome (N = 56 windows Kendall's τ: 0.30, P = 0.001, in both populations) (Fig. 2). Correlations between recombination rate and GC content can be explained by biased gene conversion in favor of Gs and Cs, or by high GC content promoting recombination (35). Similar correlations have previously been found in humans (36). However, if we consider only the substitutions that have occurred since the common ancestor of the European and Far East lineages, and are therefore recent, hotspots show a pronounced bias in the opposite direction, toward increased AT content (Table 2). The absolute number of AT to GC changes in hotspots is about 40% lower than the number of GC to AT changes. By contrast, the numbers of changes in the nonhot regions are about equal, indicating that GC content is at equilibrium.

Rates of nucleotide substitution in ancestral GC or AT sites during the differentiation of European or Far East sequences from their common ancestor


The regulatory mechanism of meiotic recombination hotspots is a fundamental problem in biology, with broad impacts on areas ranging from disease study to evolution. Recently, many genomic and epigenomic features have been associated with recombination hotspots, but none of them can explain hotspots consistently. It is highly desirable to integrate the different features into a predictive model, and study the relation of the features with hotspots and themselves with a systems approach. Moreover, due to rapid and dynamic evolution of recombination hotspots, regulatory mechanisms of hotspots that are evolutionarily conserved among species remain unclear.

We propose a machine learning approach that encode genomic and epigenomic features into a support vector machine (SVM). Trained on known hotspots and coldspots in human and mouse genomes, the model is able to predict hotspots based on the features with good performance in both species. Moreover, the model reports a ranking of feature importance, uncovering the interactions of the features with hotspots and themselves. Applying the method to large-scale data, we identified evolutionarily conserved patterns of trans-regulators and feature importance between human and mouse hotspots. This is the first attempt to build a predictive model to identify evolutionarily conserved mechanisms for recombination hotspots by integrating both genomic and epigenomic features.


Download en print dit artikel voor uw persoonlijke wetenschappelijke, onderzoeks- en educatieve doeleinden.

Koop een los nummer van Wetenschap voor slechts $ 15 USD.

Wetenschap

Vol 339, Issue 6116
11 January 2013

Artikel Gereedschap

Log in om een ​​waarschuwing voor dit artikel toe te voegen.

By Laurent Acquaviva , Lóránt Székvölgyi , Bernhard Dichtl , Beatriz Solange Dichtl , Christophe de La Roche Saint André , Alain Nicolas , Vincent Géli

Wetenschap 11 Jan 2013 : 215-218

A protein involved in histone methylation targets the meiotic recombination machinery to chromatin.


Wayne P. Wahls, Ph.D.

Ph.D., University of Illinois, Chicago

E-mail: [email protected]
Kantoor: (501) 686-5787 – Biomedical Research Center B421C
Lab: (501) 686-7876 – Biomedical Research Center B428, B430, B432
FAX: (501) 526-7008

Chromosome Dynamics in Meiosis Stress Response Pathways

During meiosis, homologous chromosomes replicate once, pair, enjoy a high rate of recombination, and undergo two rounds of chromosome segregation to produce haploid meiotic products. We use a combination of genetic, molecular, biochemical, cytological and proteomic approaches to study meiotic chromosome dynamics in fission yeast. Our primary focus is on how recombination hotspots and chromatin remodeling regulate recombination throughout the genome. We are also investigating how complexes of meiotic recombination enzymes assemble and function. A third focus is on the relationship between recombination, sister chromatid cohesion, and proper segregation of chromosomes in each meiotic division.

Proteins of the ATF/CREB/AP-1 family are components of signal transduction pathways that monitor intracellular and extracellular conditions and transmit those signals to downstream targets. These proteins share a conserved bZIP domain that mediates both protein dimerization and sequence-specific DNA binding activity. We are interested in how these protein-DNA complexes regulate chromatin structure, transcription and RNA decay, and how cross-talk between pathways confers plasticity to environmental stress responses.


Bekijk de video: TOLAK PENGUMPULAN SEMULA-TEKNIK 10 JARI (December 2021).