Informatie

Mechanisme van DNA-gemedieerde transpositie - Biologie


DNA-gemedieerd omzettingsmechanisme

Sommige families van transponeerbare elementen die via een DNA-tussenproduct bewegen, doen dat in een replicatief manier. EEN co-integreren structuur wordt gevormd door fusie van de donor- en ontvangerreplicons, die vervolgens wordt opgelost (Figuur 9.12). Andere gezinnen gebruiken a niet-replicatief mechanisme. In dit geval wordt de originele kopie verwijderd van de oorspronkelijke site en verplaatst naar een nieuwe doelsite, waarbij de oorspronkelijke site leeg blijft.

Afbeelding 9.12. Contrasten tussen replicatieve en niet-replicatieve transpositie. Het transponeerbare element (TE) wordt weergegeven als een open pijl. De dikke lijn voor elk replicon staat voor dubbelstrengs DNA; de verschillende arceringen vertegenwoordigen verschillende sequenties.

Studies van bacteriële transposons hebben aangetoond dat replicatieve transpositie en sommige soorten niet-replicatieve transpositie verlopen via a streng-overdracht tussenproduct (ook bekend als a crossover-structuur), waarbij zowel de donor- als de ontvangerreplicons aan het transponeerbare element zijn bevestigd (Figuur 9.13). Voor replicatieve transpositie produceert DNA-synthese via het tussenproduct voor strengoverdracht een transponeerbaar element op zowel de donor- als de doelwitplaats, waardoor het co-integraattussenproduct wordt gevormd. Dit wordt vervolgens opgelost om de replicons te scheiden. DNA-synthese vindt niet plaats bij de crossover-structuur bij niet-replicatieve transpositie, waardoor een kopie alleen op de nieuwe doelplaats achterblijft. In een alternatieve route voor niet-replicatieve transpositie wordt het transposon uitgesneden door twee dubbelstrengs breuken en wordt het met een verspringende breuk met de ontvanger verbonden (geïllustreerd onderaan figuur 9.12).

Meer in detail zijn er twee gemeenschappelijke stappen voor replicatieve en niet-replicatieve transpositie, waarbij het tussenproduct voor strengoverdracht wordt gegenereerd (Figuur 9.13).

  1. De transposase gecodeerd door een transponeerbaar element maakt aanvankelijk vier nicks. Er worden twee inkepingen gemaakt op de doelplaats, één in elke streng, om een ​​verspringende breuk met 5'-verlengingen (3' verzonken) te genereren. De andere twee inkepingen flankeren de transposon; een inkeping wordt gemaakt in de ene DNA-streng aan het ene uiteinde van het transposon en de andere inkeping wordt gemaakt in de andere DNA-streng aan het andere uiteinde. Aangezien de transposon aan elk uiteinde omgekeerde herhalingen heeft, zijn deze twee inkepingen die de transposon flankeren splitsingen in dezelfde volgorde. Het transposase heeft dus een sequentiespecifieke nicking-activiteit. Het transposase van TnA bindt bijvoorbeeld aan een sequentie van ongeveer 25 bp die zich binnen de 38 bp van de omgekeerde terminale herhaling bevindt (Figuur 9.10). Het snijdt een enkele streng aan elk uiteinde van het transposon, evenals de doellocatie (Figuur 9.13). Merk op dat hoewel het doel en de transposon apart worden weergegeven in de tweedimensionale tekening in figuur 9.13, ze tijdens de transpositie naast elkaar worden geplaatst.
  2. Aan elk uiteinde van het transposon wordt het 3'-uiteinde van één streng van het transposon verbonden met de 5'-extensie van één streng op de doelplaats. Deze ligatie wordt ook gekatalyseerd door transposase. ATP stimuleert de reactie, maar het kan optreden in afwezigheid van ATP als het substraat supercoiled is. Ligatie van de uiteinden van het transposon aan de doelplaats genereert een tussenproduct voor strengoverdracht, waarin de donor- en ontvangerreplicons nu worden verbonden door het transposon.

Na vorming van het tussenproduct voor strengoverdracht kunnen twee verschillende routes worden gevolgd. Voor replicatieve transpositie dienen de 3'-uiteinden van elke streng van de verspringende breuk (oorspronkelijk op de doelplaats) als primers voor reparatiesynthese (Figuur 9.13). Replicatie gevolgd door ligatie leidt tot de vorming van de co-integraatstructuur, die vervolgens kan worden opgelost in de afzonderlijke replicons, elk met een kopie van het transposon. De oplossen gecodeerd door transposon TnA katalyseert de resolutie van de co-integraatstructuur. De site voor resolutie (res) bevindt zich tussen de divergent getranscribeerde genen voor tnpA en tnpR(Figuur 9.10). TnA-resolvase reguleert ook de expressie van beide negatief tnpAen tnpR(zelf).

Voor niet-replicatieve transpositie wordt het tussenproduct voor strengoverdracht vrijgegeven door inkepingen aan de uiteinden van het transposon dat aanvankelijk niet was ingekerfd. Reparatiesynthese is beperkt tot de opening bij de flankerende directe herhalingen, en daarom blijft er slechts één kopie van het transposon over. Deze kopie wordt geligeerd aan de nieuwe doelwitplaats, waardoor een lege plaats in het donormolecuul achterblijft.

Figuur 9.13. Transpositiemechanisme via een tussenproduct voor strengoverdracht.

Het enzym transposase kan specifieke DNA-sequenties herkennen, twee duplex-DNA-moleculen op vier plaatsen klieven en strengen van de donor aan de ontvanger ligeren. Dit enzym heeft een opmerkelijk vermogen om de uiteinden van DNA te genereren en te manipuleren. Een driedimensionale structuur voor het Tn5-transposase in complex met de uiteinden van het Tn5-DNA is opgelost door Rayment en collega's. Een statisch beeld van dit eiwit-DNA-complex staat in figuur 9.14.A. Het transposase is een dimeer en elk dubbelstrengs DNA-molecuul (donor en doelwit) is gebonden door beide eiwitsubeenheden. Dit oriënteert de transposon-uiteinden in de actieve plaatsen, zoals weergegeven in de afbeelding. Ook toont een afbeelding met alleen het DNA (Figuur 9.14.B.) een aanzienlijke vervorming van de DNA-helix aan de uiteinden. Deze recentelijk bepaalde structuur is een goed startpunt om het mechanisme voor strengsplitsing en -overdracht beter te begrijpen.

A.

B.

Afbeelding 9.14.Driedimensionale structuur van het Tn5-transposase in complex met Tn5-transposon-DNA. A. Het dimeer van het Tn5-transposase is gebonden aan een fragment van duplex-DNA vanaf het uiteinde van het transposon. Alfa-helices zijn groene cilinders, bèta-vellen zijn geelbruin, platte pijlen en eiwitlussen zijn blauwe draden. Het DNA is een duplex van twee rode draden, één voor elke streng. B. Het DNA wordt getoond zonder het eiwit en met de nucleotiden gelabeld. Het uiteinde van het DNA aan de bovenkant van dit paneel is georiënteerd in de actieve plaats in het midden van het eiwit in paneel A. De structuur werd bepaald door Davies DR, Goryshin IY, Reznikoff WS, Rayment I. (2000) "Three- dimensionale structuur van het Tn5 synaptische complex transpositie tussenproduct." Wetenschap 289:77-85. Deze afbeeldingen zijn verkregen door de atomaire coördinaten te downloaden van de Molecular Modeling Database bij NCBI, ze te bekijken met CN3D 3.0 en statische weergaven op te slaan als schermafbeeldingen.


DNA-transposons en de evolutie van eukaryote genomen

Transponeerbare elementen zijn mobiele genetische eenheden die een grote diversiteit vertonen in hun structuur en omzettingsmechanismen. Transponeerbare elementen nemen een groot deel van veel eukaryote genomen in beslag en hun beweging en accumulatie vormen een belangrijke kracht die de genen en genomen van bijna alle organismen vormgeeft. Deze beoordeling richt zich op DNA-gemedieerde of klasse 2-transposons en benadrukt hoe deze klasse van elementen zich onderscheidt van andere typen mobiele elementen in termen van hun structuur, amplificatiedynamiek en genomisch effect. We bieden een actuele kijk op de diversiteit en taxonomische distributie van alle belangrijke typen DNA-transposons in eukaryoten, waaronder Helitrons en Mavericks. We bespreken enkele van de evolutionaire krachten die hun instandhouding en diversificatie in verschillende genomische omgevingen beïnvloeden. Ten slotte benadrukken we hoe de onderscheidende biologische kenmerken van DNA-transposons hebben bijgedragen aan het vormgeven van de genoomarchitectuur en hebben geleid tot de opkomst van genetische innovaties in verschillende eukaryote lijnen.

Figuren

Verdeling van de grote groepen...

Verdeling van de belangrijkste groepen DNA-transposons over de eukaryote boom van ...

De relatieve hoeveelheid retrotransposons...

De relatieve hoeveelheid retrotransposons en DNA-transposons in diverse eukaryote genomen. De…

Figuur 3. Model voor de montage van…

Figuur 3. Model voor de assemblage van een regulerend netwerk door domesticatie van een transposase...


Parasieten of symbionten?

Bieden de transponeerbare elementen enig selectief voordeel aan de "host"? Of zijn ze slechts parasitair of 'egoïstisch' en bestaan ​​ze alleen om het aantal exemplaren van het element te vergroten? Deze kritieke kwestie is een voortdurende controverse. Zoals zojuist vermeld, kunnen bepaalde resultaten van transpositie nadelig zijn, wat leidt tot functieverlies of veranderingen in de regulatie van de genen op de plaats van integratie na beweging. Ook beginnen we het intieme verband tussen virussen en transponeerbare elementen te waarderen. Zo kan men veel transponeerbare elementen zien als parasieten op het genoom. Het aantal transponeerbare elementen kan snel groeien in een genoom. Het lijkt er bijvoorbeeld op dat transponeerbare elementen die het grootste deel van het genoom van maïs uitmaken, niet overvloedig aanwezig zijn in de wilde ouder, teosinte. Dus deze enorme expansie heeft plaatsgevonden sinds de domesticatie van maïs, ongeveer in de afgelopen 10.000 jaar.

Andere studies geven echter aan dat de aanwezigheid van transponeerbare elementen gunstig is voor een organisme. Twee bacteriestammen, één met een normaal aantal transponeerbare elementen en de andere met veel minder, kunnen onder concurrerende omstandigheden worden gekweekt. De stam met het hoogste aantal transponeerbare elementen heeft onder deze omstandigheden een groeivoordeel. Over de aard van dat voordeel zijn verschillende voorstellen gedaan. Een intrigerende mogelijkheid is dat het mechanisme van transpositie de mogelijkheid biedt om chromosoombreuken af ​​te dichten. Andere mogelijke voordelen zijn niet uitgesloten. Dus de relatie tussen transponeerbare elementen en hun gastheren kan evenzeer symbiotisch als parasitair zijn. Het oplossen van deze problemen is een interessante uitdaging voor toekomstig onderzoek.


Inhoud

Barbara McClintock ontdekte de eerste TE's in maïs (Zea mays) in het Cold Spring Harbor Laboratory in New York. McClintock experimenteerde met maïsplanten met gebroken chromosomen. [5]

In de winter van 1944-1945 plantte McClintock maïskorrels die zelfbestoven waren, wat betekent dat de zijde (stijl) van de bloem stuifmeel ontving van zijn eigen helmknop. [5] Deze korrels kwamen van een lange rij planten die zelfbestoven waren, waardoor gebroken armen aan het einde van hun negende chromosomen ontstonden. [5] Toen de maïsplanten begonnen te groeien, merkte McClintock ongebruikelijke kleurpatronen op de bladeren op. [5] Eén blad had bijvoorbeeld twee albino-vlekken van bijna identieke grootte, naast elkaar op het blad. [5] McClintock veronderstelde dat tijdens de celdeling bepaalde cellen genetisch materiaal verloren, terwijl andere kregen wat ze verloren hadden. [6] Toen ze echter de chromosomen van de huidige generatie planten vergeleek met de oudergeneratie, ontdekte ze dat bepaalde delen van het chromosoom van positie waren veranderd. [6] Dit weerlegde de populaire genetische theorie van die tijd dat genen vastzaten op hun positie op een chromosoom. McClintock ontdekte dat genen niet alleen kunnen bewegen, maar ook kunnen worden in- of uitgeschakeld vanwege bepaalde omgevingsomstandigheden of tijdens verschillende stadia van celontwikkeling. [6]

McClintock toonde ook aan dat genmutaties ongedaan kunnen worden gemaakt. [7] Ze presenteerde haar rapport over haar bevindingen in 1951, en publiceerde een artikel over haar ontdekkingen in Genetica in november 1953 getiteld "Inductie van instabiliteit op geselecteerde loci in maïs". [8]

Op het Cold Spring Harbor Symposium in 1951, waar ze haar bevindingen voor het eerst bekendmaakte, werd haar toespraak doodstil ontvangen. [9] Haar werk werd grotendeels afgewezen en genegeerd tot het einde van de jaren zestig en zeventig, toen het, nadat TE's in bacteriën waren gevonden, werd herontdekt. [10] Ze kreeg in 1983 een Nobelprijs voor Fysiologie of Geneeskunde voor haar ontdekking van TE's, meer dan dertig jaar na haar eerste onderzoek. [11]

Ongeveer 64% van het maïsgenoom bestaat uit TE's, [12] [13] evenals 44% van het menselijk genoom. [14]

Transponeerbare elementen vertegenwoordigen een van de verschillende soorten mobiele genetische elementen. TE's worden toegewezen aan een van de twee klassen op basis van hun omzettingsmechanisme, dat kan worden beschreven als: knippen en plakken (Klasse I TE's) of knippen en plakken (Klasse II TE's). [15]

Retrotransposon Bewerken

Klasse I TE's worden in twee fasen gekopieerd: eerst worden ze van DNA naar RNA getranscribeerd en het geproduceerde RNA wordt vervolgens omgekeerd getranscribeerd naar DNA. Dit gekopieerde DNA wordt vervolgens op een nieuwe positie terug in het genoom ingebracht. De stap van reverse transcriptie wordt gekatalyseerd door een reverse transcriptase, dat vaak wordt gecodeerd door de TE zelf. De kenmerken van retrotransposons zijn vergelijkbaar met die van retrovirussen, zoals HIV.

Retrotransposons worden gewoonlijk gegroepeerd in drie hoofdorden:

  • Retrotransposons, met lange terminale herhalingen (LTR's), die coderen voor reverse transcriptase, vergelijkbaar met retrovirussen
  • Retroposons, lange afgewisselde nucleaire elementen (LINE's, LINE-1's of L1's), die coderen voor reverse transcriptase maar LTR's missen, en worden getranscribeerd door RNA-polymerase II (SINE's) coderen niet voor reverse transcriptase en worden getranscribeerd door RNA-polymerase III

(Retrovirussen kunnen ook als TE's worden beschouwd. Na omzetting van retroviraal RNA in DNA in een gastheercel, wordt het nieuw geproduceerde retrovirale DNA bijvoorbeeld geïntegreerd in het genoom van de gastheercel. Deze geïntegreerde DNA's worden provirussen. Het provirus is een gespecialiseerde vorm van eukaryoot retrotransposon, dat RNA-tussenproducten kan produceren die de gastheercel kunnen verlaten en andere cellen kunnen infecteren. De transpositiecyclus van retrovirussen heeft overeenkomsten met die van prokaryotische TE's, wat wijst op een verre relatie tussen de twee.)

DNA-transposons Bewerken

Bij het knip-en-plak-transpositiemechanisme van klasse II TE's is geen RNA-tussenproduct betrokken. De transposities worden gekatalyseerd door verschillende transposase-enzymen. Sommige transposasen binden niet-specifiek aan elke doelplaats in DNA, terwijl andere aan specifieke doelsequenties binden. De transposase maakt een verspringende snede op de doelplaats en produceert plakkerige uiteinden, snijdt het DNA-transposon eruit en ligeert het in de doelplaats. Een DNA-polymerase vult de resulterende gaten van de kleverige uiteinden op en DNA-ligase sluit de suiker-fosfaatruggengraat. Dit resulteert in duplicatie van doelwitplaatsen en de insertieplaatsen van DNA-transposons kunnen worden geïdentificeerd door korte directe herhalingen (een verspringende snede in het doelwit-DNA gevuld met DNA-polymerase) gevolgd door omgekeerde herhalingen (die belangrijk zijn voor de TE-excisie door transposase).

Knip-en-plak TE's kunnen worden gedupliceerd als hun transpositie plaatsvindt tijdens de S-fase van de celcyclus, wanneer een donorplaats al is gerepliceerd maar een doelplaats nog niet is gerepliceerd. [17] Dergelijke duplicaties op de doellocatie kunnen resulteren in genduplicatie, wat een belangrijke rol speelt in de genomische evolutie. [18] : 284

Niet alle DNA-transposons transponeren via het knip-en-plakmechanisme. In sommige gevallen wordt een replicatieve transpositie waargenomen waarbij een transposon zichzelf repliceert naar een nieuwe doelplaats (bijv. helitron).

Klasse II TE's omvatten minder dan 2% van het menselijk genoom, waardoor de rest Klasse I is. [19]

Autonoom en niet-autonoom Bewerken

Omzetting kan worden geclassificeerd als "autonoom" of "niet-autonoom" in zowel klasse I als klasse II TE's. Autonome TE's kunnen zichzelf verplaatsen, terwijl niet-autonome TE's de aanwezigheid van een andere TE nodig hebben om te bewegen. Dit komt vaak omdat afhankelijke TE's transposase (voor klasse II) of reverse transcriptase (voor klasse I) missen.

Activator-element (Ac) is een voorbeeld van een autonome TE, en dissociatie-elementen (Ds) is een voorbeeld van een niet-autonome TE. Zonder Ac, Ds niet kan transponeren.

Nieuwe ontdekkingen van transponeerbare elementen hebben de exacte verdeling van TE's aangetoond met betrekking tot hun transcriptiestartplaatsen (TSS's) en versterkers. Uit een recente studie bleek dat een promotor 25% van de regio's bevat die TE's herbergen. Het is bekend dat oudere TE's niet worden gevonden op TSS-locaties omdat de frequentie van TE's begint als een functie zodra er een afstand tot de TSS is. Een mogelijke theorie hiervoor is dat TE's kunnen interfereren met het pauzeren van de transcriptie of de splitsing van de eerste intro. [20] Zoals eerder vermeld, is de aanwezigheid van TE's gesloten door de TSS-locaties gecorreleerd aan hun evolutionaire leeftijd (aantal verschillende mutaties dat TE's in de loop van de tijd kunnen ontwikkelen).

  • De eerste TE's werden ontdekt in maïs (Zea mays) door Barbara McClintock in 1948, waarvoor ze later een Nobelprijs kreeg. Ze merkte chromosomale inserties, deleties en translocaties op die door deze elementen werden veroorzaakt. Deze veranderingen in het genoom kunnen bijvoorbeeld leiden tot een verandering in de kleur van maïskorrels. Ongeveer 85% van het maïsgenoom bestaat uit TE's. [21] Het door McClintock beschreven Ac/Ds-systeem is klasse II TE's. De omzetting van Ac in tabak is aangetoond door B. Baker (Plant Transposable Elements, pp 161-174, 1988, Plenum Publishing Corp., ed. Nelson).
  • In de vijver micro-organisme, Oxytricha, spelen TE's zo'n cruciale rol dat het organisme zich niet kan ontwikkelen wanneer het wordt verwijderd. [22]
  • Eén familie TE's in de fruitvlieg Drosophila melanogaster worden genoemd P-elementen. Ze lijken voor het eerst in de soort te zijn verschenen pas in het midden van de twintigste eeuw in de afgelopen 50 jaar, ze verspreiden zich door elke populatie van de soort. Gerald M. Rubin en Allan C. Spradling pionierden met technologie om kunstmatige P-elementen te gebruiken om genen in te voegen in Drosophila door het embryo te injecteren. [23][24][25]
  • In bacteriën dragen TE's meestal een extra gen voor andere functies dan transpositie, vaak voor antibioticaresistentie. In bacteriën kunnen transposons van chromosomaal DNA naar plasmide-DNA springen en terug, wat de overdracht en permanente toevoeging van genen mogelijk maakt, zoals genen die coderen voor antibioticaresistentie (op deze manier kunnen multi-antibiotica-resistente bacteriestammen worden gegenereerd). Bacteriële transposons van dit type behoren tot de Tn-familie. Wanneer de transponeerbare elementen extra genen missen, staan ​​ze bekend als insertiesequenties.
  • Bij mensen is de meest voorkomende TE de Alu-sequentie. Het is ongeveer 300 basen lang en kan tussen de 300.000 en een miljoen keer in het menselijk genoom worden gevonden. Alu alleen al wordt geschat op 15-17% van het menselijk genoom. [19] zijn een andere prominente klasse van transposons die in meerdere soorten worden aangetroffen, waaronder mensen. De Mariner transposon werd voor het eerst ontdekt door Jacobson en Hartl in Drosophila. [26] Dit transponeerbare element van klasse II staat bekend om zijn griezelige vermogen om bij veel soorten horizontaal te worden overgedragen.[27][28] Er zijn naar schatting 14.000 exemplaren van Mariner in het menselijk genoom, bestaande uit 2,6 miljoen basenparen. [29] De eerste transposons met zeemanselementen buiten dieren werden gevonden in Trichomonas vaginalis. [30] Deze kenmerken van de Mariner-transposon inspireerden de sciencefictionroman Het Mariner-project door Bob Marr. transpositie is het bekendste voorbeeld van replicatieve transpositie.
  • In gistgenomen, (Saccharomyces cerevisiae) zijn er vijf verschillende retrotransposon-families: Ty1, Ty2, Ty3, Ty4 en Ty5. [31]
  • Een helitron is een TE gevonden in eukaryoten waarvan wordt gedacht dat het repliceert door een rollend cirkelmechanisme.
  • In menselijke embryo's werden twee soorten transposons gecombineerd om niet-coderend RNA te vormen dat de ontwikkeling van stamcellen katalyseert. Tijdens de vroege stadia van de groei van een foetus, breidt de binnenste celmassa van het embryo zich uit naarmate deze stamcellen opsommen. De toename van dit type cellen is cruciaal, omdat stamcellen later van vorm veranderen en alle cellen in het lichaam vormen.
  • Bij gepeperde motten zorgde een transposon in een gen genaamd cortex ervoor dat de vleugels van de motten volledig zwart werden. Deze verandering in kleur hielp motten om op te gaan in met as en roet bedekte gebieden tijdens de industriële revolutie.

Transposons bestaan ​​al duizenden jaren naast eukaryoten en zijn door hun naast elkaar bestaan ​​geïntegreerd in het genoom van veel organismen. In de volksmond bekend als 'springende genen', kunnen transposons zich binnen en tussen genomen verplaatsen, waardoor deze integratie mogelijk is.

Hoewel er veel positieve effecten zijn van transposons in de eukaryote genomen van hun gastheer, zijn er enkele gevallen van mutagene effecten die TE's hebben op genomen die leiden tot ziekte en kwaadaardige genetische veranderingen. [32]

Mechanismen van mutagenese

TE's zijn mutageen en vanwege de bijdrage aan de vorming van nieuwe cis-regulerende DNA-elementen die verbonden zijn met vele transcriptiefactoren die in levende cellen worden aangetroffen, kunnen TE's vele evolutionaire mutaties en veranderingen ondergaan. Dit zijn vaak de oorzaken van genetische ziekten en geven de potentiële dodelijke effecten van ectopische expressie. [33]

TE's kunnen het genoom van hun gastheercel op verschillende manieren beschadigen: [32]

  • Een transposon of een retrotransposon die zichzelf in een functioneel gen invoegt, kan dat gen uitschakelen.
  • Nadat een DNA-transposon een gen heeft verlaten, kan de resulterende leemte niet correct worden gerepareerd
  • Meerdere kopieën van dezelfde sequentie, zoals Alu-sequenties, kunnen nauwkeurige chromosomale paring tijdens mitose en meiose belemmeren, wat resulteert in ongelijke cross-overs, een van de belangrijkste redenen voor chromosoomduplicatie.

TE's gebruiken een aantal verschillende mechanismen om genetische instabiliteit en ziekte in hun gastheergenomen te veroorzaken.

  • Expressie van ziekteverwekkende, schadelijke eiwitten die de normale cellulaire functie remmen.
    • Veel TE's bevatten promotors die de transcriptie van hun eigen transposase aansturen. Deze promotors kunnen afwijkende expressie van gekoppelde genen veroorzaken, waardoor ziekte of mutante fenotypes ontstaan. [34]

    Ziekten die vaak door TE's worden veroorzaakt, zijn onder meer:

      A en B
      • LINE1 (L1) TE's die op de menselijke factor VIII landen, hebben aangetoond dat ze hemofilie veroorzaken [35]
      • Insertie van L1 in het APC-gen veroorzaakt darmkanker, wat bevestigt dat TE's een belangrijke rol spelen bij de ontwikkeling van ziekten. [36]
      • Insertie van het Alu-element in het PBGD-gen leidt tot interferentie met het coderende gebied en leidt tot acute intermitterende porfyrie [37] (AIP).
      • LINE1(L1) TE's en andere retrotransposons zijn in verband gebracht met kanker omdat ze genomische instabiliteit veroorzaken. [35]
      • Veroorzaakt door insertie van SVA-transponeerbare elementen in het fukutin-gen (FKTN), waardoor het gen inactief wordt. [35]
      • Ontregeling van transponeerbare elementen kan neuronale dood veroorzaken, wat leidt tot neurodegeneratieve aandoeningen [40]

      Eén studie schatte de omzettingssnelheid van een bepaald retrotransposon, het Ty1-element in Saccharomyces cerevisiae. Gebruikmakend van verschillende aannames, kwam het percentage succesvolle omzettingsgebeurtenissen per enkel Ty1-element uit op ongeveer eens in de paar maanden tot eens in de paar jaar. [41] Sommige TE's bevatten warmteshock-achtige promotors en hun omzettingssnelheid neemt toe als de cel wordt blootgesteld aan stress, [42] waardoor de mutatiesnelheid onder deze omstandigheden toeneemt, wat gunstig kan zijn voor de cel.

      Cellen verdedigen op een aantal manieren tegen de proliferatie van TE's. Deze omvatten piRNA's en siRNA's [43] die TE's tot zwijgen brengen nadat ze zijn getranscribeerd.

      Als organismen voornamelijk uit TE's bestaan, zou men kunnen veronderstellen dat ziekte veroorzaakt door verkeerd geplaatste TE's zeer vaak voorkomt, maar in de meeste gevallen worden TE's tot zwijgen gebracht door epigenetische mechanismen zoals DNA-methylatie, chromatine-remodellering en piRNA, zodat er weinig tot geen fenotypische effecten of bewegingen van TE's komen voor zoals in sommige wildtype plant-TE's. Bepaalde gemuteerde planten bleken defecten te hebben in methylatie-gerelateerde enzymen (methyltransferase) die de transcriptie van TE's veroorzaken, waardoor het fenotype wordt beïnvloed. [4] [44]

      Eén hypothese suggereert dat slechts ongeveer 100 LINE1-gerelateerde sequenties actief zijn, ondanks dat hun sequenties 17% van het menselijk genoom uitmaken. In menselijke cellen wordt het tot zwijgen brengen van LINE1-sequenties geactiveerd door een RNA-interferentiemechanisme (RNAi). Verrassend genoeg zijn de RNAi-sequenties afgeleid van het 5'-onvertaalde gebied (UTR) van de LINE1, een lange terminal die zichzelf herhaalt. Vermoedelijk codeert de 5'-LINE1 UTR die codeert voor de sense-promotor voor LINE1-transcriptie ook voor de antisense-promotor voor het miRNA dat het substraat wordt voor siRNA-productie. Remming van het RNAi-uitschakelingsmechanisme in dit gebied toonde een toename in LINE1-transcriptie. [4] [45]

      TE's worden in bijna alle levensvormen aangetroffen en de wetenschappelijke gemeenschap onderzoekt nog steeds hun evolutie en hun effect op de evolutie van het genoom. Het is onduidelijk of TE's hun oorsprong vonden in de laatste universele gemeenschappelijke voorouder, meerdere keren onafhankelijk zijn ontstaan ​​​​of één keer zijn ontstaan ​​​​en zich vervolgens naar andere koninkrijken hebben verspreid door horizontale genoverdracht. [46] Hoewel sommige TE's voordelen bieden aan hun gastheren, worden de meeste beschouwd als egoïstische DNA-parasieten. Op deze manier lijken ze op virussen. Verschillende virussen en TE's delen ook kenmerken in hun genoomstructuren en biochemische vermogens, wat leidt tot speculatie dat ze een gemeenschappelijke voorouder delen. [47]

      Omdat overmatige TE-activiteit exons kan beschadigen, hebben veel organismen mechanismen verworven om hun activiteit te remmen. Bacteriën kunnen hoge snelheden van gendeletie ondergaan als onderdeel van een mechanisme om TE's en virussen uit hun genomen te verwijderen, terwijl eukaryote organismen typisch RNA-interferentie gebruiken om TE-activiteit te remmen. Niettemin genereren sommige TE's grote families die vaak worden geassocieerd met soortvormingsgebeurtenissen. Evolutie deactiveert vaak DNA-transposons, waardoor ze als introns (inactieve gensequenties) achterblijven. In cellen van gewervelde dieren hebben bijna alle 100.000+ DNA-transposons per genoom genen die coderen voor inactieve transposase-polypeptiden. [48] ​​Het eerste synthetische transposon dat is ontworpen voor gebruik in gewervelde (inclusief menselijke) cellen, het Sleeping Beauty-transposonsysteem, is een Tc1/mariner-achtig transposon. De dode ("fossiele") versies zijn wijd verspreid in het genoom van zalmachtigen en een functionele versie werd ontwikkeld door die versies te vergelijken. [49] Menselijke Tc1-achtige transposons zijn onderverdeeld in Hsmar1- en Hsmar2-subfamilies. Hoewel beide typen inactief zijn, wordt één kopie van Hsmar1 gevonden in het SETMAR-gen geselecteerd omdat het zorgt voor DNA-binding voor het histonmodificerende eiwit. [50] Veel andere menselijke genen zijn op soortgelijke wijze afgeleid van transposons. [51] Hsmar2 is meerdere keren gereconstrueerd uit de fossiele sequenties. [52]

      Grote hoeveelheden TE's in genomen kunnen echter nog steeds evolutionaire voordelen bieden. Afgewisselde herhalingen binnen genomen worden gecreëerd door transpositiegebeurtenissen die zich gedurende de evolutionaire tijd ophopen. Omdat afgewisselde herhalingen genconversie blokkeren, beschermen ze nieuwe gensequenties tegen overschrijving door vergelijkbare gensequenties en vergemakkelijken ze daardoor de ontwikkeling van nieuwe genen. TE's zijn mogelijk ook gecoöpteerd door het immuunsysteem van gewervelde dieren als middel om antilichaamdiversiteit te produceren. Het V(D)J-recombinatiesysteem werkt door een mechanisme dat vergelijkbaar is met dat van sommige TE's. TE's dienen ook om herhalende sequenties te genereren die dsRNA kunnen vormen om als substraat te dienen voor de werking van ADAR bij het bewerken van RNA. [53]

      TE's kunnen vele soorten genen bevatten, waaronder genen die antibioticaresistentie verlenen en het vermogen om te transponeren naar conjugatieve plasmiden. Sommige TE's bevatten ook integrons, genetische elementen die genen uit andere bronnen kunnen vangen en tot expressie kunnen brengen. Deze bevatten integrase, dat gencassettes kan integreren. Er zijn meer dan 40 antibioticaresistentiegenen geïdentificeerd op cassettes, evenals virulentiegenen.

      Transposons snijden hun elementen niet altijd precies uit, soms worden de aangrenzende basenparen verwijderd. Dit fenomeen wordt exon-shuffling genoemd. Het schudden van twee niet-verwante exons kan een nieuw genproduct of, waarschijnlijker, een intron creëren. [54]

      Evolutionaire drive voor TE's in de genomische context

      Er is een hypothese die stelt dat TE's een gemakkelijke bron van DNA kunnen zijn die door de cel kan worden gecoöpteerd om genexpressie te helpen reguleren. Onderzoek toonde aan dat veel verschillende vormen van TE's co-evolutie samen met enkele transcriptiefactoren die gericht zijn op TE-geassocieerde genomische elementen en chromatine evolueren uit TE-sequenties. Meestal volgen deze specifieke modi niet het eenvoudige model van TE's en reguleren ze de genexpressie van de gastheer. [55]

      Transponeerbare elementen kunnen worden gebruikt in laboratorium- en onderzoeksomgevingen om genomen van organismen te bestuderen en zelfs genetische sequenties te manipuleren. Het gebruik van transponeerbare elementen kan in twee categorieën worden opgesplitst: voor genetische manipulatie en als genetisch hulpmiddel.

      Genetische manipulatie Bewerken

      • Bij insertiemutagenese worden de kenmerken van een TE gebruikt om een ​​sequentie in te voegen. In de meeste gevallen wordt dit gebruikt om een ​​DNA-sequentie te verwijderen of een frameshift-mutatie te veroorzaken.
        • In sommige gevallen kan de insertie van een TE in een gen de functie van dat gen op een omkeerbare manier verstoren, waarbij transposase-gemedieerde excisie van het DNA-transposon de genfunctie herstelt.
        • Dit levert planten op waarin naburige cellen verschillende genotypen hebben.
        • Met deze functie kunnen onderzoekers onderscheid maken tussen genen die in een cel aanwezig moeten zijn om te kunnen functioneren (celautonoom) en genen die waarneembare effecten produceren in andere cellen dan die waar het gen tot expressie wordt gebracht.

        Genetisch hulpmiddel Bewerken

        Naast de genoemde kwaliteiten voor genetische manipulatie, is een genetisch hulpmiddel ook: -

        • Gebruikt voor analyse van genexpressie en eiwitfunctie bij mutagenese met handtekeningen.
          • Met dit analytische hulpmiddel kunnen onderzoekers de fenotypische expressie van gensequenties bepalen. Ook muteert deze analytische techniek de gewenste locus van belang, zodat de fenotypen van het oorspronkelijke en het gemuteerde gen kunnen worden vergeleken.

          Specifieke toepassingen Bewerken

          • TE's zijn ook een veelgebruikt hulpmiddel voor mutagenese van de meeste experimenteel handelbare organismen. Het transposonsysteem van Doornroosje is op grote schaal gebruikt als een insertietag voor het identificeren van kankergenen. [56]
          • Het Tc1/mariner-klasse van TEs Sleeping Beauty transposon-systeem, bekroond met Molecule of the Year in 2009, [57] is actief in zoogdiercellen en wordt onderzocht voor gebruik in menselijke gentherapie. [58][59][60]
          • TE's worden gebruikt voor de reconstructie van fylogenieën door middel van aanwezigheid/afwezigheidsanalyses. [61] Transposons kunnen fungeren als biologisch mutageen in bacteriën.
          • Veel voorkomende organismen waarvan het gebruik van Transposons goed is ontwikkeld zijn:
            • Drosophila[62]
            • Arabidopsis thaliana[44]
            • Escherichia coli

            nieuw herhalingsidentificatie is een eerste scan van sequentiegegevens die de repetitieve gebieden van het genoom probeert te vinden en deze herhalingen te classificeren. Er zijn veel computerprogramma's om uit te voeren de novo herhaalde identificatie, die allemaal volgens dezelfde algemene principes werken. [57] Aangezien korte tandemherhalingen over het algemeen 1-6 basenparen lang zijn en vaak opeenvolgend zijn, is hun identificatie relatief eenvoudig. [56] Verspreide repetitieve elementen zijn daarentegen moeilijker te identificeren, omdat ze langer zijn en vaak mutaties hebben. Het is echter belangrijk om deze herhalingen te identificeren, omdat ze vaak transponeerbare elementen (TE's) blijken te zijn. [57]

            nieuw identificatie van transposons omvat drie stappen: 1) vind alle herhalingen binnen het genoom, 2) bouw een consensus op van elke familie van sequenties, en 3) classificeer deze herhalingen. Er zijn drie groepen algoritmen voor de eerste stap. Eén groep wordt de k-mer-benadering genoemd, waarbij een k-mer een reeks met lengte k is. In deze benadering wordt het genoom gescand op oververtegenwoordigde k-meren, dat wil zeggen k-meren die vaker voorkomen dan waarschijnlijk alleen op basis van waarschijnlijkheid. De lengte k wordt bepaald door het type transposon waarnaar wordt gezocht. De k-mer-benadering maakt ook mismatches mogelijk, waarvan het aantal door de analist wordt bepaald. Sommige k-mer-benaderingsprogramma's gebruiken de k-mer als basis en verlengen beide uiteinden van elke herhaalde k-mer totdat er geen overeenkomst meer is tussen beide, wat de uiteinden van de herhalingen aangeeft. [57] Een andere groep algoritmen gebruikt een methode die sequentie-zelfvergelijking wordt genoemd. Zelfvergelijkingsprogramma's voor sequenties gebruiken databases zoals AB-BLAST om een ​​initiële sequentie-uitlijning uit te voeren. Omdat deze programma's groepen elementen vinden die elkaar gedeeltelijk overlappen, zijn ze nuttig voor het vinden van sterk uiteenlopende transposons, of transposons met slechts een klein gebied gekopieerd naar andere delen van het genoom. [58] Een andere groep algoritmen volgt de periodiciteitsbenadering. Deze algoritmen voeren een Fourier-transformatie uit op de sequentiegegevens, identificeren periodiciteiten, regio's die periodiek worden herhaald, en zijn in staat om pieken in het resulterende spectrum te gebruiken om repetitieve kandidaat-elementen te vinden. Deze methode werkt het beste voor tandemherhalingen, maar kan ook worden gebruikt voor verspreide herhalingen. Het is echter een langzaam proces, waardoor het een onwaarschijnlijke keuze is voor analyse op genoomschaal. [57]

            De tweede stap van de novo herhaalde identificatie omvat het opbouwen van een consensus van elke familie van sequenties. Een consensussequentie is een sequentie die is gemaakt op basis van de herhalingen die een TE-familie vormen. Een basenpaar in een consensus is het paar dat het vaakst voorkwam in de sequenties die werden vergeleken om de consensus te bereiken. Bijvoorbeeld, in een familie van 50 herhalingen waar 42 een T-basenpaar op dezelfde positie hebben, zou de consensussequentie ook een T op deze positie hebben, aangezien het basenpaar representatief is voor de familie als geheel op die specifieke positie , en is hoogstwaarschijnlijk het basenpaar dat in de voorouder van de familie op die positie wordt gevonden. [57] Zodra voor elke familie een consensussequentie is gemaakt, is het mogelijk om over te gaan tot verdere analyse, zoals TE-classificatie en genoommaskering om het totale TE-gehalte van het genoom te kwantificeren.

            Transponeerbare elementen zijn erkend als goede kandidaten voor het stimuleren van genadaptatie, door hun vermogen om de expressieniveaus van nabijgelegen genen te reguleren. [59] Gecombineerd met hun "mobiliteit", kunnen transponeerbare elementen naast hun beoogde genen worden verplaatst en de expressieniveaus van het gen regelen, afhankelijk van de omstandigheden.

            De in 2008 uitgevoerde studie "High Rate of Recent Transposable Element-Induced Adaptation in Drosophila melanogaster", gebruikt D. melanogaster die recentelijk vanuit Afrika naar andere delen van de wereld waren gemigreerd, als basis voor het bestuderen van aanpassingen veroorzaakt door transponeerbare elementen. Hoewel de meeste TE's zich op introns bevonden, toonde het experiment het significante verschil in genexpressie tussen de bevolking in Afrika en andere delen van de wereld. De vier TE's die de selectieve sweep veroorzaakten, kwamen vaker voor in D. melanogaster uit gematigde klimaten, waardoor de onderzoekers concludeerden dat de selectieve druk van het klimaat genetische aanpassing veroorzaakte. [60] Uit dit experiment is bevestigd dat adaptieve TE's veel voorkomen in de natuur, door organismen in staat te stellen genexpressie aan te passen als gevolg van nieuwe selectieve druk.

            Niet alle effecten van adaptieve TE's zijn echter gunstig voor de bevolking. In het onderzoek dat in 2009 werd uitgevoerd, "A Recent Adaptive Transposable Element Insertion Near Highly Conserved Developmental Loci in Drosophila melanogaster", onthulde een TE, ingevoegd tussen Jheh 2 en Jheh 3, een verlaging van het expressieniveau van beide genen. Neerwaartse regulatie van dergelijke genen heeft veroorzaakt Drosophila om verlengde ontwikkelingstijd en verminderde levensvatbaarheid van eieren tot volwassen te vertonen. Hoewel deze aanpassing in hoge frequentie werd waargenomen in alle niet-Afrikaanse populaties, was het in geen van hen vastgelegd. [61] Dit is niet moeilijk te geloven, omdat het logisch is dat een populatie de voorkeur geeft aan een hogere levensvatbaarheid van eieren tot volwassen, en daarom probeert de eigenschap te zuiveren die wordt veroorzaakt door deze specifieke TE-aanpassing.

            Tegelijkertijd zijn er verschillende rapporten geweest die de voordelige aanpassing die door TE's wordt veroorzaakt, aantonen. In het onderzoek met zijderupsen, "An Adaptive Transposable Element insertion in the Regulatory Region of the EO Gen in the Domesticated Silkworm", werd een TE-insertie waargenomen in het cis-regulerende gebied van het EO-gen, dat het vervellingshormoon 20E reguleert, en verbeterde expressie werd geregistreerd. Terwijl populaties zonder de TE-insert vaak niet in staat zijn om hormoon 20E effectief te reguleren onder verhongeringsomstandigheden, hadden die met de insert een stabielere ontwikkeling, wat resulteerde in een hogere ontwikkelingsuniformiteit. [63]

            Deze drie experimenten toonden allemaal verschillende manieren waarop TE-inserties voordelig of nadelig kunnen zijn, door middel van het reguleren van het expressieniveau van aangrenzende genen. Het gebied van adaptief TE-onderzoek is nog in ontwikkeling en in de toekomst kunnen meer bevindingen worden verwacht.

            Recente studies hebben bevestigd dat TE's kunnen bijdragen aan het genereren van transcriptiefactoren. Hoe dit proces van bijdragen echter een impact kan hebben op de deelname van genoomcontrolenetwerken. TE's komen vaker voor in veel delen van het DNA en vormen 45% van het totale menselijke DNA. Ook droegen TE's bij aan 16% van de bindingsplaatsen voor transcriptiefactoren. Een groter aantal motieven wordt ook gevonden in niet-TE-afgeleid DNA, en het aantal is groter dan van TE-afgeleid DNA. Al deze factoren correleren met de directe deelname van TE's aan vele manieren van gencontrolenetwerken. [64]


            Specifieke macromoleculaire deelnemers

            Het is verrassend dat een zo complex proces als Tn5 DNA-transpositie vereist slechts drie macromoleculen voor alles behalve de laatste stap (Goryshin en Reznikoff, 1998). Twee van deze macromoleculen zijn het transposon-DNA, typisch ingebed in een donor-DNA-sequentie, en het 476-aminozuur lange transposase (Tnp) dat de transpositie katalyseert. Het derde macromolecuul is de doel-DNA-sequentie die kan worden gelokaliseerd op hetzelfde molecuul als het transposon (zelfs binnen het transposon) of op een tweede DNA-molecuul.Er is weinig specificiteit in de doelsequentie.


            LINE's (Lange afgewisselde elementen)

            • Het menselijk genoom bevat ongeveer 500.000 LINE's (die ongeveer 17% van het genoom vertegenwoordigen).
            • De meest voorkomende hiervan behoren tot een familie genaamd LINE-1 (L1).
            • Deze L1-elementen zijn DNA-sequenties die in lengte variëren van enkele honderden tot wel 9.000 basenparen.
            • Slechts ongeveer 50 L1-elementen zijn functionele "genen", dat wil zeggen, kunnen worden getranscribeerd en vertaald.
            • De functionele L1-elementen zijn ongeveer 6.500 bp lang en coderen voor drie eiwitten, waaronder:
              • een endonuclease dat DNA en a . knipt
              • reverse transcriptase dat een DNA-kopie maakt van een RNA-transcript.
                transcribeert het L1-DNA in RNA.
            • Het RNA wordt door ribosomen in het cytoplasma vertaald in de eiwitten.
            • De eiwitten en RNA komen samen en gaan de kern weer binnen.
            • Het endonuclease knipt een streng "doelwit"-DNA door, vaak in het intron van een gen.
            • De reverse transcriptase kopieert het L1-RNA naar L1-DNA dat in het doel-DNA wordt ingebracht en daar een nieuw L1-element vormt.
            • Door dit kopiëren plakken mechanisme kan het aantal LINE's in het genoom toenemen.

              Het oncogen p53 onderdrukt de vorming van nieuwe L1-elementen. Als p53 door mutatie niet meer functioneert, zoals bij veel kankers het geval is, neemt het aantal L1-elementen toe. Soms breekt het inbrengen van een nieuw L1-element het chromosoom. Dergelijke breuken komen vaak voor in kankercellen.

              De diversiteit van LINE's tussen individuele menselijke genomen maakt ze bruikbare markers voor DNA "vingerafdrukken".

              Variatie treedt op in de lengte van L1-elementen:

              • Transcriptie van een actief L1-element gaat soms stroomafwaarts verder in extra DNA, waardoor een langer getransponeerd element wordt geproduceerd.
              • Achteruit transcriptie van L1-RNA eindigt vaak voortijdig en produceert een verkort getransponeerd element.

              Af en toe maakt en voegt L1-activiteit een kopie van een cellulair mRNA (dus een natuurlijk cDNA) toe. Bij gebrek aan introns en de noodzakelijke controle-elementen zoals promotors, worden deze genen niet tot expressie gebracht. Ze vertegenwoordigen één categorie van pseudogen.


              Mechanisme en regulatie van P-elementtranspositie

              P-elementen werden voor het eerst ontdekt in de fruitvlieg Drosophila melanogaster als de veroorzakers van een syndroom van afwijkende genetische eigenschappen dat hybride dysgenese wordt genoemd. Dit gebeurt wanneer P-elementdragende mannetjes paren met vrouwtjes die P-elementen missen en resulteert in nakomelingen die steriliteit, mutaties en chromosomale herschikkingen vertonen. Sindsdien hebben talrijke genetische, ontwikkelings-, biochemische en structurele studies geleid tot een diepgaand begrip van de transpositie van P-elementen: van de cellulaire regulatie en repressie van transpositie tot de mechanistische details van het transposase-nucleoproteïnecomplex. Recente studies hebben onthuld hoe piwi-interagerende kleine RNA-routes kunnen werken om de splicing van het pre-mRNA van het P-element te regelen om de transposaseproductie in de kiembaan te moduleren. Een recente cryo-elektronenmicroscopiestructuur van het transpososoom van het P-element onthult een ongebruikelijke DNA-architectuur aan de transposon-uiteinden en laat zien dat de gebonden GTP-cofactor functioneert om de transposon-uiteinden binnen de actieve plaats van transposase te positioneren. Genoomsequencing-inspanningen hebben aangetoond dat er P-element transposase-homologe genen (genaamd THAP9) in andere dierlijke genomen, waaronder mensen. Deze review belicht recente en eerdere studies, die samen hebben geleid tot nieuwe inzichten, en onderzoekt ons huidige begrip van de biologie, biochemie, het mechanisme en de regulatie van P-elementtranspositie.

              1. Hybride dysgenese, horizontale genoverdracht en een natuurlijke gene drive

              P-elementen werden halverwege de jaren zeventig ontdekt door populatiegenetici toen ze in het wild Drosophila melanogaster stammen werden in gevangenschap gebracht en gepaard met laboratoriumstammen die sinds het begin van de twintigste eeuw in gevangenschap waren [1,2]. Verrassend genoeg werden, toen mannelijke vliegen van wilde stammen (genaamd P of vaderlijk bijdragend) werden gepaard met vrouwelijke vliegen van laboratoriumstammen (genaamd M of maternaal bijdragend), een aantal afwijkingen waargenomen, waaronder steriliteit als gevolg van rudimentaire ontwikkeling van de geslachtsklieren, hoge mate van mutatie en chromosomale herschikkingen. Daarentegen waren de resulterende nakomelingen van de wederzijdse kruising (lab man (M) door wilde vrouw (P)) normaal en vruchtbaar (figuur 1). Gezamenlijk werd dit syndroom van eigenschappen hybride dysgenese genoemd [4-6].

              Figuur 1. Genetica van hybride dysgenese. De wederzijdse kruisingen van hybride dysgenese zijn aangegeven. De dysgene kruising omvat het paren van mannetjes van de wilde P-stam met vrouwtjes van de laboratorium M-stam, wat resulteert in dysgene eierstokken. Dit resulteert in hoge niveaus van P-elementtranspositie, inductie van mutaties, chromosomale breuken en herschikkingen en kiemceldood. Daarentegen, wanneer lab-M-stammannetjes worden gepaard met wilde P-stamvrouwtjes, worden normale eierstokken geproduceerd omdat de P-stamvrouwen de repressieve toestand hebben die bekend staat als 'P-cytotype'. Aangepast van [3].

              Er wordt aangenomen dat P-elementen werden geïntroduceerd in: D. melanogaster van een ander Drosophila soorten door horizontale genoverdracht via een parasitaire mijt, vroeg in het deel van de twintigste eeuw [7,8]. Omdat de nakomelingen van dysgene kruisingen steriel zijn [5,6], is er een sterke biologische selectie op het vermogen om de mobiliteit van P-elementen in het wild te onderdrukken. Desondanks verspreidden P-elementen zich in ongeveer 30 jaar door wilde populaties. Eigenlijk alles D. melanogaster geïsoleerd uit het wild sinds de jaren 80 hebben P-elementen [9]. Deze invasie vormt een natuurlijke gene drive [10-12] en populatieanalyses geven aan dat een vergelijkbare invasie momenteel aan de gang is in D. simulans wilde populaties [13-15].

              De eerste aanwijzing dat hybride dysgenese werd veroorzaakt door transponeerbare elementen kwam van het feit dat sommige van de resulterende mutaties opmerkelijk onstabiel waren en konden terugkeren [2,16]. Als directe test van dit idee werd een reeks dysgene kruisingen uitgevoerd met als doel oogkleurmutanten te isoleren, aangezien de Drosophila wit locus was gekloond en was een goed doelwit voor het identificeren van de aard van hybride dysgenese-geïnduceerde mutaties [17,18]. Deze analyse leidde tot de identificatie van DNA-inserties in de wit locus en de reversie van deze mutaties resulteerde in het verlies van die DNA-elementen. Deze DNA-inserties werden vervolgens moleculair geïsoleerd en P-elementen genoemd [18,19].

              2. Maternaal effect van P-cytotype en de betrokkenheid van de PIWI-interagerende RNA-route

              De dissectie van het maternale effect waargenomen op wederzijdse kruisingen tussen D. melanogaster wilde en laboratoriumstammen leidden uiteindelijk tot de beschrijving van een van de best gekarakteriseerde voorbeelden van transgenerationele epigenetische overerving bij dieren. Ondanks aanvankelijke moeilijkheden bij het identificeren van de moleculaire basis van de factor die transgenerationele bescherming verleent, werd een reeks elegante genetische analyses gebruikt om definitief aan te tonen dat de epigenetische informatie werd geleverd door determinanten die in het cytoplasma van de eicel werden gevonden in plaats van het maternale DNA zelf [17-20] . Een van de duidelijkste voorbeelden werd geleverd door de genetische experimenten die gebaseerd waren op de natuurlijk voorkomende en genetisch traceerbare P-element-insertie Lk-P1A, die zich in de telomere geassocieerde sequentie op het X-chromosoom (X-TAS) bevindt en die individueel in staat is om onderdrukken dysgenese (figuur 2een) [20,21,23]. Dergelijke experimenten leverden genetisch bewijs dat de transgenerationele bescherming afhankelijk was van de aanwezigheid van het door de moeder verschafte Lk-P1A-afgeleide cytoplasma in plaats van het door de moeder verschafte Lk-P1A-chromosoom [21,24–26]. Van daaruit culmineerde een reeks genetische, genomische, biochemische en ontwikkelingsstudies met de identificatie van een evolutionair geconserveerde kleine RNA-interferentie (RNAi) route bij dieren [27,28]. Deze studies onthulden dat de transgenerationele epigenetische informatie wordt geleverd door maternale gedeponeerde piwi-interagerende kleine RNA's (piRNA's) [29,30] en vertrouwt op de functie van de respectieve piRNA-biogenese-route [31-33].

              Figuur 2. Maternale effectgenetica van P-cytotype tijdens hybride dysgenese en de maternale overerving van PIWI-eiwitten. (een) De repressieve P-stam, Lk-P(1A), kan het P-cytotype over meerdere generaties overdragen in een maternale effectpatroon, onafhankelijk van de overerving van het van de moeder afgeleide Lk-P(1A)-chromosoom. Dat is (links) als moeders (G0) dragen Lk-P(1A), dan de G1 vrouwtjes die ofwel de moederlijk overgeërfde of de vaderlijk overgeërfde Lk-P(1A) dragen, kunnen het vermogen om hybride dysgene steriliteit te onderdrukken, naar de volgende generatie overbrengen. In het wederzijdse testkruis (rechts) worden vrouwtjes die geen Lk-P(1A) dragen, gepaard met Lk-P(1A) mannetjes, en de G1 nageslacht vrouwtjes die het vaderlijk overgeërfde Lk-P(1A)-chromosoom dragen maar het moederlijk gedeponeerde Lk-P(1A)-afgeleide cytotype missen, kunnen geen G2 vrouwen met sterke onderdrukking van GD-steriliteit [21]. Het idee is dat de eicellen van de Lk-P(1A)-grootmoeders maternale componenten afzetten die het P-cytotype creëren. Dit komt door de overdracht van piRNA's in de eicellen afkomstig van Lk-P(1A)-moeders. (B) Confocale beelden van Drosophila-embryo's die de kiemlijnmarkering nos-moeGFP [22] tot expressie brengen, ongeveer 1, 5-2 uur na het leggen van eieren - tijdens de vorming van primordiale kiemcellen (PGC's) aan de achterste pool van het embryo en vóór activering van het zygotische genoom. Onderste afbeeldingen tonen de opname van de door de moeder overgeërfde AUB (cytoplasmatische) en PIWI (nucleaire) eiwitten - maar niet AGO3 - in de ontluikende PGC's. Embryo's werden gekleurd voor GFP (kiemcellen, groen) DAPI (DNA, blauw), Lamin Dm0 (nucleaire envelop, wit) en PIWI-familie-eiwitten (magenta) AUB (linksonder), PIWI (middenonder) en AGO3 (rechtsonder) . Schaalbalken: 100 µm (boven) en 20 µm (onder).

              piRNA's zijn kleine RNA-moleculen (23-29 nt in Drosophila) gegenereerd door de verwerking van grotere RNA-transcripten en worden uiteindelijk geladen in Argonaute effector-eiwitcomplexen van de PIWI-familie (Piwi, Aub en Ago3 in Drosophila beoordeeld in [34]). Net als andere RNAi-systemen, geven piRNA's PIWI-eiwitten sequentiespecificiteit door complementaire Watson-Crick-basenparen met hun doelen, die meestal zijn afgeleid van transponeerbare elementen en andere genomische herhalingen [28,32]. In vliegen en bij zoogdieren is de expressie van piRNA's, evenals van de PIWI-eiwitten, meestal beperkt tot de geslachtsklieren, en Aub en Piwi waren aanvankelijk geïdentificeerd vanwege hun rol in de specificatie en ontwikkeling van de kiembaan in plaats van hun rol in de piRNA-route [35-38]. Het belangrijkste is dat, vanuit een transgenerationeel perspectief, Aub- en Piwi-eiwitten - waarschijnlijk geladen met piRNA's geproduceerd tijdens oögenese - door de moeder worden afgezet op de achterste pool van de eicel in een gespecialiseerd cytoplasma dat bekend staat als het kiemplasma, dat vervolgens wordt opgenomen in de zich ontwikkelende kiemcellen tijdens embryogenese in de volgende generatie (figuur 2B) [30,37,39]. Aangenomen wordt dat dit proces de epigenetische aard van het P-cytotype verklaart, door een reeks genetische en moleculaire onderzoeken die onthullen dat door de moeder verschafte piRNA's voldoende zijn om homologie-afhankelijke RNAi-uitschakeling te veroorzaken in trans, chromatineveranderingen op doelloci bevorderen, P-elementexpressie reguleren en piRNA-productie op gang brengen in de kiembaan van de volgende generatie [23,26,30,33,40-42].

              In de afgelopen 40 jaar heeft de studie van de P-cytotypebescherming het paradigma opgeleverd van epigenetische transgenerationele verschijnselen die culmineerden in de beschrijving van piRNA's als de bron van epigenetisch overgeërfde informatie [25,29,30]. Hoewel er veel vooruitgang is geboekt, zijn sommige aspecten van het transgenerationele model nog niet direct ontleed, grotendeels als gevolg van technische en ontwikkelingsproblemen. Met name het feit dat PIWI-eiwitten nodig zijn voor kiembaanontwikkeling en kiemplasma-assemblage heeft beperkingen opgelegd aan het experimentele ontwerp [34-38]. In deze context zal het de ontwikkeling van nieuwe strategieën en methoden vereisen om enkele van deze sleutelvragen te benaderen, waaronder de moleculaire mechanismen waarmee transgenerationeel overgeërfde piRNA's inwerken op hun doelwitten bij het ontwikkelen van kiemcellen en hoe door de moeder verschafte PIWI-piRNA-complexen hun productie bestendigen door meerdere generaties.

              3. Temperatuurgevoeligheid en de ontwikkeling van dysgene kiemcellen

              Een intrigerend kenmerk van hybride dysgenese dat gemakkelijk de aandacht van onderzoekers trok, was de temperatuurgevoeligheid [4]. Deze eigenschap werd al vroeg gekarakteriseerd door Kidwell & Novy [5] en door Engels & Preston [43]: het smalle temperatuurbereik tussen 24 en 26°C definieert een dramatische drempel voor verandering in fenotype. F1-hybride nakomelingen die bij temperaturen onder dit bereik zijn grootgebracht, vertonen geen duidelijk dysgeen fenotype, terwijl steriliteit wordt waargenomen bij individuen die worden gehouden bij temperaturen van 27°C of hoger, waarbij de vrouwelijke steriliteit de mannelijke steriliteit neigt te overschrijden. Voor individuen die bij 25°C zijn gekweekt, wordt variabele penetrantie van gonadale dystrofie waargenomen, waarbij een fractie van de individuen een lage vruchtbaarheid behoudt, die progressief maar bescheiden kan worden verbeterd op een leeftijdsafhankelijke manier [12]. Hoewel de basis van de temperatuurgevoeligheid momenteel niet bekend is, in vitro biochemische analyses lieten zien dat P-element transposase minder actief is bij lagere temperaturen [44].

              De karakterisering van de ontwikkelingsdefecten geassocieerd met hybride dysgenese, die aanvankelijk beperkt was tot macroscopische analyses [43,45], onthulde dat dysgene individuen rudimentaire volwassen geslachtsklieren vertonen die worden gekenmerkt door bijna volledig tot volledig verlies van kiemcellen. Microscopie-analyse uitgevoerd met nageslacht dat bij restrictieve temperaturen (29 ° C) is grootgebracht, onthulde dat dysgene kiemcellen een relatief normale embryonale ontwikkeling hebben, waarbij primordiale kiemcellen (PGC's) in de achterste pool van het embryo in vergelijkbare aantallen worden gevormd in vergelijking met niet- -dysgene nakomelingen [33,46]. De midden- en late-embryonale ontwikkeling, die migratie van geslachtscellen en samensmelting van de geslachtsklieren omvat, is ook grotendeels onveranderd in dysgene nakomelingen. Tijdens larvale stadia nemen dysgene kiemcellen echter sterk in aantal af, waarbij vrouwelijke larven volledig verstoken zijn van kiemcellen door late larvale ontwikkeling (figuur 3) [33,46]. Ontwikkelingsanalyses bevestigden de resultaten die al vroeg waren verkregen uit experimenten met temperatuurverschuiving, waardoor het temperatuurgevoelige venster, wat leidde tot volledige steriliteit, vernauwde tot de periode tussen 10 uur na het leggen van de eieren en 4 dagen ontwikkeling - een periode die zich uitstrekt van midden-embryogenese tot laat-larvale ontwikkeling [5,43]. Aan de ene kant kan het vertraagde begin van het temperatuurgevoelige venster het feit weerspiegelen dat PGC's transcriptioneel in rust zijn tot halverwege de embryogenese, waarbij het zygotische genoom wordt geactiveerd terwijl kiemcellen de somatische gonade bereiken [47]. Aan de andere kant is het waarschijnlijk dat de overgang van geslachtscellen van PGC's naar kiemlijnstamcellen (GSC's), die plaatsvindt tijdens de late larvale stadia wanneer de somatische niche wordt gevormd en actief wordt, het einde van het temperatuurgevoelige venster afbakent. dat leidt tot volledige steriliteit. In overeenstemming met het idee dat volwassen GSC's minder gevoelig zijn voor dysgenese dan embryonale PGC's, worden vrouwelijke nakomelingen die tijdens de volwassenheid zijn opgegroeid bij de toegestane temperatuur (18 ° C) en verschoven naar beperkende temperaturen (29 ° C) niet volledig steriel. In plaats daarvan wordt, na een tijdelijke stopzetting van de GSC-differentiatie, de vruchtbaarheid enkele dagen na het begin van de blootstelling aan beperkende temperaturen hersteld tot wildtype-niveaus [5,48]. In dit geval, evenals wat werd waargenomen bij individuen die bij 25°C waren gekweekt, heeft de stopzetting van de ontwikkeling van de kiembaan als reactie op dysgenese betrekking op de activiteit van het chk2 DNA-schade-checkpoint-kinase [48,49].

              Figuur 3. Lot van dysgene kiemcellen. Confocale beelden van kiemcelontwikkeling in niet-dysgene en dysgene nakomelingen tijdens embryonale en larvale stadia. Embryo's en larven werden gekleurd voor Vasa (kiemcellen, groen) DAPI (DNA, blauw) phalloidin (F-actine, rode embryostadia) 1B1 (somatische cellen en spectrosomen, rode larvale stadia). De vorming van poolcellen is ongeveer 1,5 uur na het leggen van eieren (AEL) embryostadium 15 is 10–12 uur AEL larve in het eerste stadium is 22–48 uur AEL larve in het tweede stadium is 48–72 uur AEL larve in het derde stadium is 72–120 uur AEL. Schaalbalken: 20 µm. Aangepast van [33].

              4. Organisatie en moleculaire biologie van P-elementen

              Moleculaire biologie-analyse van P-elementen geïsoleerd uit genomische DNA-bibliotheken van de P-stam toonde aan dat er twee soorten P-elementen waren: elementen van 2,9 kb van volledige lengte en kleinere, niet-autonome intern verwijderde elementen variërend van 0,5-2,8 kb [19,50]. Het 2,9 kb lange P-element DNA bezit 31 bp perfecte terminale omgekeerde herhalingen, 10 bp interne transposase bindingsplaatsen en interne 11 bp subterminale omgekeerde herhalingen (figuur 4) [50]. De linker 5'- en rechter 3'-uiteinden verschillen in de afstand tussen de terminale omgekeerde herhaling en de 10 bp transposase-bindingsplaats, respectievelijk 9 bp en 21 bp. Deze afstand doet denken aan de 12 en 23 bp-recombinatiesignaalsequenties (RSS) die worden herkend door V(D)J-recombinasen tijdens de somatische DNA-herrangschikkingen, wat resulteert in de rijping van de immunoglobinegenen in zich ontwikkelende lymfocyten bij gewervelde dieren [51-53]. Bovendien stelde een recente structurele studie voor dat het P-element-transposase het doelwit-DNA koppelt door een geïnduceerd asymmetriemechanisme [53] dat analoog is aan dat waargenomen voor V(D)J-recombinasen [54–56].

              Figuur 4. Sequentiekenmerken aan de uiteinden van het P-element. P-elementen hebben 31 bp terminale omgekeerde herhalingen, interne plaatsspecifieke bindingsplaatsen voor het transposase-eiwit (TNP) en 11 bp interne omgekeerde herhalingen. Er zijn directe doelplaatsduplicaties van 8 bp die de P-elementinserties flankeren. Let ten slotte op de duidelijke afstand tussen de omgekeerde herhalingen van 31 bp en transposase-bindingsplaatsen aan de 5'- en 3'-transposonuiteinden. Aangepast van [50].

              DNA-sequencing van het P-element van volledige lengte gaf aan dat er vier eiwitcoderende open leesramen waren (ORF 0, 1, 2 en 3 figuur 5). Biochemische en moleculair-biologische experimenten toonden aan dat deze ORF gekoppeld konden worden door alternatieve RNA-splitsing om te coderen voor twee eiwitten: het 87 kDa actieve transposase-eiwit (TNP) en een korter 66 kDa-eiwit geproduceerd door een intronretentiegebeurtenis van het derde intron (tussenliggende sequentie 3 , IVS3) [57-59]. Het transposase-eiwit van 87 kDa is een complex eiwit met meerdere domeinen dat de excisie en integratie van P-element-DNA katalyseert [44,50]. Retentie van het derde intron in somatische cellen en in de kiembaan produceert een mRNA dat codeert voor het 66 kDa-eiwit dat werkt als een transpositionele repressor [60,61]. Belangrijk is dat alternatieve pre-mRNA-splitsing van het derde intron specifiek in dysgene kiemcellen leidt tot de productie van P-element-mRNA's van volledige lengte die coderen voor het transposase-eiwit van 87 kDa.Dit beperkt de schadelijke effecten van ongebreidelde transpositie van P-elementen en hybride dysgenese tot kiemlijncellen van dysgene nakomelingen [59]. Deze bevinding was een van de eerste bonafide voorbeelden van functionele weefselspecifieke alternatieve RNA-pre-mRNA-splitsing.

              Figuur 5. P-element open leesramen en afgeleide eiwitten. Boven: complete 2,9 kb P-elementen coderen voor vier eiwitcoderende open leesramen. Deze kunnen twee eiwitcoderende mRNA's genereren via alternatieve splitsing met twee constitutieve introns en één alternatieve splitsingsgebeurtenis van intron 3 of IVS3. Deze mRNA's coderen voor een eiwit van 66 kDa dat een repressor is en een eiwit van 87 kDa dat het actieve transposase (TNP) is. Onder: bij kleine, niet-autonome P-elementen kunnen ze vaak coderen voor repressoreiwitten, zoals het 207aa KP-eiwit.

              5. P-element transposase: domeinorganisatie en transpositiemechanisme

              Net als andere autonome DNA-gebaseerde transposons coderen P-elementen voor een enzym, een transposase dat verantwoordelijk is voor het mobiliseren van het P-element-DNA. Het P-element transposase-eiwit is een complex multi-domein DNA-bindend eiwit, waarvan nu wordt begrepen dat het zes domeinen bevat: een N-terminaal THAP DNA-bindend domein, een aangrenzende coiled coil, een helix-turn-helix (HTH) DNA-bindende domein, een RNase H-domein dat een guanosinetrifosfaat (GTP)-bindend domein-insertie en een zuur C-terminaal domein bevat (CTD figuur 6). Deze informatie is afkomstig van sequentievergelijkingen, structurele en functionele studies [62-67].

              Figuur 6. Domeinorganisatie van P-element transposase. (een) Schematische weergave van de domeinarchitectuur van P-elementtransposase. Domeingrenzen worden aangegeven door aminozuurnummers. THAP, THAP DNA-bindend domein (beige) dimerisatie, leucine zipper-dimerisatie domein (lavendel) HTH, helix-turn-helix DNA-bindend domein (lichtgroen) RNase H, gesplitst RNase H-domein (donkergeel) GTP-binding, GTP -bindend invoegdomein (GBD, lichtblauw) CTD, C-terminaal domein (rood). De drie katalytische residuen in het RNase H-domein worden aangegeven met rode lijnen en stippen. (B) Cartoon van de driedimensionale domeinorganisatie afgeleid van een recente cryo-EM-structuur, waarbij vier van de zes domeinen zichtbaar zijn. Gekleurd als in (een), met domeinen aangegeven. Donor-DNA, P-element DNA-uiteinden (groen en geel) doel-DNA (paars). Aangepast van [53].

              Er is veel moeite gestoken in het blootleggen van het mechanisme van transpositie van P-elementen door middel van de biochemische karakterisering van het 87 kDa-transposase-eiwit. Net als andere knip-en-plak-DNA-transposasen, verloopt de transpositie van het P-element op een gedefinieerde, stapsgewijze manier om nauwkeurige DNA-splitsing en -verbinding tijdens de transpositie te garanderen (figuur 7). Hoewel de fijnere details van de transpositie specifiek zijn voor elke DNA-transposonfamilie, wordt het proces in het algemeen beschreven door zes fundamentele stappen: transposase-transposon-DNA-binding, paren van de transposonuiteinden (synaptische complexvorming), donor-DNA-splitsing, doel-DNA-vangst, streng overdracht (integratie) en demontage/DNA-reparatie [68-70].

              Figuur 7. Model van P-element omzettingsroute. P-elementtransposase interageert eerst met één P-elementuiteinde via het THAP-domein (transposasebinding). In aanwezigheid van GTP en Mg2+ kan het transposase een synaptisch of gepaarde-eindcomplex (PEC) vormen. De transposon-uiteinden worden vervolgens asynchroon gesplitst, waardoor het genomische DNA van de gastheer (gesplitst donorcomplex of CDC) vrijkomt. Het complex vangt vervolgens een geschikt doelwit-DNA (target capture-complex of TCC) op. Hechting van de transposonuiteinden aan het doelwit-DNA levert een strengtransfercomplex of STC op, een stap die GTP en Mg2+ vereist. Na demontage en DNA-reparatie bevat de nieuwe insertieplaats 8 bp directe duplicaties van de doelplaats die het P-element flankeren. Het transposase kan een oligomere herschikking ondergaan om rekening te houden met het tetrameer waargenomen in de vroege stadia van transpositie door atoomkrachtmicroscopiestudies, en het dimeer waargenomen in de laatste stadia door cryo-EM.

              Zoals het geval is voor andere DNA-transposons, assembleert het P-element transposase eerst met plaatsen op het transposon. Zuivering en karakterisering van het transposase-eiwit van Drosophila S2-celkernextracten toonden aan dat het transposase bindt aan interne 10 bp-plaatsen die aan elk uiteinde van het transposon worden gevonden [71]. Na de initiële herkenning van een enkel transposon-uiteinde, vangt en koppelt P-element transposase het tweede uiteinde op een GTP-afhankelijke manier om het gepaarde-uiteinde complex te vormen (PEC figuur 7) [65]. reconstitutie van in vitro omzettingsreacties toonden aan dat guanosinetrifosfaat (GTP) een vereiste cofactor was [44]. Volumemetingen met atoomkrachtmicroscopie suggereren dat een tetramere vorm van transposase mogelijk betrokken is bij de initiële synaptische complexe assemblage [65]. Sequentiële splitsing aan elk uiteinde van elk P-element maakt het transposon vrij van het flankerende gastheergenoom dat het gesplitste donorcomplex vormt (CDC figuur 7) [65,66]. Net als andere transponeerbare elementen voor DNA-knippen en plakken, vindt DNA-splitsing plaats aan het 3'-uiteinde van het transposon, maar aan de andere streng vindt 5'-DNA-splitsing plaats 17 bp in het P-element 31 bp omgekeerde herhalingen, waardoor ongebruikelijke en atypische lange 17 nucleotide 3'-enkelstrengs extensies aan de transposon-termini (figuur 7) [52]. De volgorde en het mechanisme van strengsplitsing zijn momenteel niet bekend.

              Na splitsing van donor-DNA, zal het uitgesneden transposon-transposase-nucleoproteïnecomplex een doelwit-DNA vangen (target capture-complex figuur 7) en het P-element integreren (strengtransfercomplex (STC) figuur 7). De transpositieplaatsen zijn gescheiden door 8 bp, wat aanleiding geeft tot de 8 bp target site duplicaties (TSD's), na transpososoomdemontage en DNA-reparatie. Hoewel P-elementtranspositie niet plaatsspecifiek is, werd een consensusmotief voor de doelsequentie afgeleid van meer dan 23.000 nauwkeurig in kaart gebrachte P-elementinserties van de Drosophila genoomproject [72]. Transpositie vindt bij voorkeur plaats naar nabijgelegen doellocaties op hetzelfde chromosoom (ongeveer 50-150 kb verwijderd) in een fenomeen dat 'lokaal hoppen' wordt genoemd [73]. Bovendien komen P-elementinserties veel voor in regio's rond genpromotors en in regio's die de oorsprong van DNA-replicatie overlappen [74,75], wat erop kan wijzen dat het P-elementtransposase een doelvoorkeur heeft voor regio's met een open chromatinetopologie. De demontage- en DNA-reparatiemechanismen op de doelplaats zijn niet onderzocht, maar het is duidelijk dat de dubbelstrengs breuk die op de donorplaats wordt gegenereerd, kan worden hersteld door zowel homologe recombinatie-afhankelijke (HR) als niet-homologe end-joining ( NHEJ) DNA-herstelroutes met IRBP18/Xrp1, Ku70/80 en de Drosophila Helicase-homoloog van het syndroom van Bloom [76-79].

              6. Inzichten uit de structuur van de P-element transposase STC

              Verschillende mechanistische kenmerken onderscheiden P-elementtranspositie van de andere gekarakteriseerde 'knippen en plakken' DNA-transposons. Namelijk de vereiste van de GTP-cofactor voor de koppeling, donorsplitsing en strengoverdrachtsreacties [44,65,80], en de ongewoon lange 17 nt verspringende splitsing aan elk uiteinde van elk P-element [52]. Om de mechanismen te begrijpen die ten grondslag liggen aan de unieke kenmerken van de P-element-transposase-superfamilie, werden eiwit-DNA-transpositiecomplexen geassembleerd in vitro werden gebruikt voor cryo-elektronenmicroscopie (cryo-EM) waarmee de structuur van de P-element-transposase-STC met een resolutie van 3,6 kon worden bepaald [53]. Dit productcomplex na transpositie bevat transposase en gesplitste P-elementuiteinden die covalent zijn verbonden met het doel-DNA. De reconstructie onthulde dat P-element transposase kan worden onderverdeeld in zes structurele domeinen: het N-terminale THAP DNA-bindende domein, een leucine zipper-dimerisatiedomein, een helix-turn-helix DNA-bindend domein (HTH), een gesplitst katalytisch RNase H-domein onderbroken door een GTP-bindend insertiedomein (GBD) en tenslotte een carboxy-terminaal domein (CTD figuur 8). Hoewel het THAP-domein en het grootste deel van het dimerisatiedomein niet werden opgelost in de reconstructie (vermoedelijk als gevolg van flexibiliteit), biedt hun vermogen om te bewegen een reden voor hoe de paring van het 5'- en 3' P-element elk eindigt met een duidelijke afstand van de omgekeerde herhalingen en transposase-bindingsplaatsen kunnen optreden tijdens de initiële transpososoomassemblage [53].

              Figuur 8. Structuur van het P-element transposase streng transfer complex (STC). (een) Zij- en bovenaanzicht van de cryo-EM-reconstructie bij 3,6 (respectievelijk links en rechts). Domeinen zijn gekleurd zoals in figuur 6 en GTP-dichtheid is rood gekleurd. Elke subeenheid van het dimeer wordt aangegeven (rechts). (B) Zij- en bovenaanzicht van het STC-model (gekleurd als in A, respectievelijk links en rechts). Niet-gemodelleerde verbindingen worden weergegeven in stippellijnen (gestreept groen, gestippeld rood). Doel-DNA wordt in paars weergegeven, de door donor overgedragen streng in lichtgroen en de niet-overgedragen donorstreng in geel. Aangepast van [53]. (C) GBD-insertie in de RNase H-vouw. Relevante structurele elementen van de RNase H-vouw zijn gelabeld. De 5 centrale bèta-strengen zijn gekleurd van rood naar geel, het algemene RNase H-domein in geel en GTP-bindend domein in blauw (GDB). Invoegpositie tussen β5 en α4 wordt aangegeven.

              Het helix-turn-helix-motief vormt een belangrijk structureel element dat DNA kan binden. Het helix-turn-helix domein van P-element transposase maakt contact met de binnenste helft van de 31 bp TIR's, via een lus in de kleine groef en een HTH α-helix ingebracht in de grote groef (figuur 8) [53].

              Net als andere 'knippen en plakken' DNA-transposasen, neemt het katalytische domein van P-element-transposase een canonieke RNase H-achtige vouw aan, waarbij een centrale 5-strengs β-sheet boven en onder wordt ondersteund door α-helixen [53] . Het RNase H-achtige domein organiseert drie zure aminozuurresiduen (D230, D303 en E531), samen verantwoordelijk voor de coördinatie van twee tweewaardige metalen en voor het katalyseren van de nucleofiele splitsing en koppeling van DNA-fosfodiesterbindingen [53]. Binnen de STC-structuur van het P-element is het RNase H-domein gepositioneerd over de doel-transposon-DNA-verbinding.

              Van bijzonder belang in de transposase, RNase H-vouw is de regio die verbindt β5 en α4. In sommige transposasen en verwante retrovirale integrasen, β5 en α4 structurele elementen zijn verbonden door een korte, vaak ongeordende lus [81,82]. Daarentegen heeft P-element transposase een volledig GTP-bindend domein ingevoegd tussen β5 en α4 (figuur 8C). Domeinen die op deze positie worden gevonden, worden 'insertiedomeinen' genoemd en zijn aanwezig in andere transposasen en transposase-gerelateerde eiwitten, zoals Hermes, Tn5 en RAG1 [83,84]. Ondanks structurele overeenkomsten die zijn waargenomen tussen de insertiedomeinen van alle gekarakteriseerde DNA-transposasen, is degene die wordt gevonden in P-elementtransposase het enige bekende GTP-bindende insertiedomein [53]. Verder is P-element transposase uniek onder de transposase/integrase superfamilie bij het binden van GTP als een cofactor voor zowel de splitsings- als integratiestappen van transpositie [50].

              Het GTP-bindende insertiedomein (GBD) verpakt zich tegen het RNase H-domein en de doelwit-transposon-DNA-junctie binnen de STC-structuur van het P-element (figuur 8) [53]. De GBD is bijna volledig α-helix en is anders dan andere GTPases, zoals ras, dynamin of EF-Tu. Een gebonden GTP-cofactor wordt waargenomen in de GBD en interageert via waterstofbinding met de terminale basis van het transposon-DNA, blijkbaar om het P-element-DNA te positioneren voor katalyse (figuur 9een). De wijze van GTP-binding lijkt uniek te zijn en wordt gemedieerd door verschillende residuen die geconserveerd zijn in leden van de P-elementfamilie (D528, K385, K400, V401, S409, F443, D444 en N447) [53,84]. Er is geen biochemisch bewijs voor GTP-hydrolyse tijdens de splitsings- en strengoverdrachtsstappen van transpositie [44,65,66]. Dienovereenkomstig zijn residuen die GTP-hydrolyse zouden kunnen ondersteunen afwezig of te ver verwijderd van het GTP. Naast het binden van GTP maakt de GBD talrijke contacten met de transposon- en doelwit-DNA's [53].

              Figuur 9. Interacties van de GTP-cofactor en ongebruikelijke structuur van de transposon-termini in het P-element strengoverdrachtscomplex. (een) Close-up van de interactie tussen GTP, de GBD-residuen (lichtblauw) en donor-DNA (G-1, licht groen). Afgeleide waterstofbruggen en elektrostatische interacties worden weergegeven als grijze stippellijnen. (B) Inzet: Schema van de donor-DNA-structuur. GTP is in rode letters. Watson-Crick basenparen worden aangegeven door ononderbroken lijnen. Niet-canonieke basenparen worden aangegeven met stippen of stippellijnen. Nucleotiden van de overgedragen streng zijn genummerd −1 tot −31, beginnend bij de 3'-terminale guanosine. Hoofd: structuur van het donor-DNA binnen de STC. Het transposase-eiwit is voor de duidelijkheid vervaagd, met relevante domeinen gelabeld. Het tegenoverliggende RNase H-domein is voor de duidelijkheid weggelaten. De ongeordende nucleotiden van de overgedragen streng (−14 tot −18) zijn gemarkeerd met een groene stippellijn. Aangepast van [53].

              De CTD is verbonden met het RNase H-domein door een flexibele en ongeordende linker. De CTD is volledig a-helix en bevindt zich tussen het RNase H-domein en de GBD van een andere subeenheid (figuur 8) [53]. Net als de GBD maakt de CTD talrijke contacten met de transposon- en doel-DNA's. Het enkelstrengs gebied van het transposon-DNA loopt uit en over de CTD en GBD om talloze eiwit-fosfaat- en aromatische base-stapelingsinteracties langs dit pad te maken. De CTD breidt een basishelix uit naar het centrum van het doel-DNA. Hoewel de laatste 17 aminozuurresiduen van het CTD niet met zekerheid konden worden gemodelleerd, bevat het gebied veel basisresiduen en is het ideaal gepositioneerd om interactie aan te gaan met het doel-DNA (figuur 8) [53].

              Twee onverwachte waarnemingen kwamen voort uit de STC-structuur van het P-element, beide met betrekking tot het transposon-DNA. Ten eerste is er de ongebruikelijke configuratie van de transposon-DNA's, die een structuur aannemen die meer lijkt op RNA dan op DNA. Een groot gebied van de overgedragen streng loopt uit bij de CTD, reist langs de C-terminale en GTP-bindende domeinen, en verdubbelt dan terug naar het basenpaar met het 5'-gedeelte van de niet-overgedragen streng (figuur 9B) [53]. Dit gebied met basenparen neemt een A-vormige spiraalvormige geometrie aan, typisch voor RNA-RNA-helices, en is vereist voor transpositie zoals ondersteund door mutatieanalyse [53]. De tweede onverwachte observatie is dat het terminale nucleotide lijkt te interageren met de gebonden GTP-cofactor, blijkbaar om het transposon-DNA te positioneren voor katalyse (zie hierboven). Hoe de DNA's van het P-element tot hun waargenomen rangschikking binnen de STC komen, is onduidelijk en omvat ongetwijfeld grote conformatieveranderingen van zowel het DNA als het eiwit. Hoewel de volgorde en het mechanisme van de strengsplitsing momenteel niet bekend zijn, is het mogelijk dat, net als bij V(D)J-recombinatie [85,86], er DNA-vervormingen zijn in het initiële donor-DNA-splitsingsstadium die leiden tot de ongebruikelijke gevonden DNA-structuur in de STC. De STC-structuur van het P-element toont GTP gepositioneerd tegen het transposon-DNA nabij de transposon-doel-DNA-junctie, binnen waterstofbindingsafstand van het terminale transposon-DNA-nucleotide (tussen GTP C6-carbonyl en GTP-1 N1). Biochemische experimenten met purine-nucleoside-trifosfaat-analogen tonen aan dat de purine C6-carbonylgroep cruciaal is voor de activiteit van strengoverdracht [53]. De interactie met GTP lijkt het traject van de transposon-DNA-streng te veranderen en positioneert de aanvallende 3′OH op de actieve plaats, wat verklaart waarom GTP nodig is voor strengoverdracht. Voor zover wij weten, is deze rol voor GTP niet waargenomen in andere bekende transposase-nucleoproteïne-complexen die zijn onderzocht.

              De STC-structuur van het P-elementtransposase verschafte het eerste beeld van de superfamilie van het P-element van eukaryote transposasen. De ongebruikelijke aard en hoge resolutie van de structuur bood nieuwe inzichten in de transpositie van P-elementen en duidt op een transpositieroute die mechanistisch en fundamenteel verschilt van andere bekende knip-en-plak-DNA-transposasen.

              7. THAP-DNA-bindende domeinen en de THAP9-genen bij gewervelde dieren

              Met de accumulatie van dierlijke genomen waarvan de sequentie was bepaald, werd opgemerkt dat veel genen van gewervelde dieren homologie deelden met het N-terminale gebied van het P-element transposase-eiwit [87]. Het menselijk genoom bevat 12 van dergelijke genen (THAP0-11) die deze N-terminale homologie delen, het THAP-domein genoemd, waarbij menselijk THAP1 als eerste werd geïdentificeerd. Eerdere studies van het P-element transposase-eiwit hadden het N-terminale gebied gedefinieerd als een C2CH zink-coördinerend DNA-bindend domein dat specifiek bindt aan interne plaatsen grenzend aan de 31 bp terminale omgekeerde herhalingen om transposase aan het P-element-DNA te binden tijdens de beginfasen van transpositie [62]. Daaropvolgende onderzoeken met behulp van röntgenkristallografie toonden aan dat de Drosophila Het THAP-domein van het P-element bond aan het DNA van het P-element met behulp van een bipartiete major-minor groove-modus, in tegenstelling tot andere plaatsspecifieke DNA-bindende eiwitten (figuur 10) [67]. Hoewel veel voorkomend, zijn THAP-domeinen beperkt tot dierlijke genomen en worden ze niet gevonden in planten, schimmels of bacteriën.

              Figuur 10. Structuur van het N-terminale THAP-DNA-bindende domein van het P-element gecomplexeerd met de bindingsplaats aan het uiteinde van het 3'P-element. (een) THAP-domein aangegeven als een lintdiagram met het DNA in detail weergegeven. Let op de twee β-strengen in de hoofdgroef en de C-terminale basislus in de aangrenzende kleine groef. (B) THAP-domein aangegeven als een lintdiagram met het DNA weergegeven als een ruimtevullend model. Aangepast van [67].

              In het menselijke en andere dierlijke genomen zijn er genen die niet alleen een N-terminaal THAP-domein hebben, maar homologie hebben over de gehele lengte van het gen met Drosophila P-element transposase. Deze genen worden aangeduid als THAP9 [87]. THAP9-genen worden gevonden in het genoom van mensen, primaten, zebravissen, andere gewervelde dieren en Ciona, maar zijn gedeeltelijk verwijderd en inactief bij knaagdieren [88-90]. Eerdere functionele studies hebben aangetoond dat het menselijke THAP9-eiwit een enzymatisch actief transposase is dat zowel kan accijnzen als transponeren Drosophila P-elementen in een van beide Drosophila of menselijke cellen [91]. Menselijke THAP9 mist echter de kenmerken van een mobiel element, zoals flankerende terminale omgekeerde herhalingen of het bestaan ​​van meerdere intern verwijderde kopieën [89]. Waar in het menselijk genoom het THAP9-eiwit bindt en of het het genoom op specifieke plaatsen kan splijten, wordt onderzocht.

              Interessant is dat het zebravisgenoom één THAP9-gen van volledige lengte heeft, geflankeerd door 13 bp terminale omgekeerde herhalingen, 12 bp interne omgekeerde herhalingen en 8 bp TSD's [89]. Zebravissen hebben ook meerdere kopieën van intern verwijderde P-achtige elementen met de omgekeerde herhalingen en 8 bp TSD's, wat suggereert dat deze elementen recentelijk mobiel waren (figuur 11).Zo hebben P-elementachtige transposons en THAP9-genen hun aanwezigheid onder dierlijke genomen buiten de Drosophila en andere insecten.

              Figuur 11. Vergelijking van P-elementen van zebravissen en Drosophila. (een) Zebravis THAP9 transposon met 13 bp terminal inverted repeats (TIR) ​​en 12 bp subterminal inverted repeats (STIR), met 400 bp spacers. (B) Drosophila P-elementen met 31 bp terminal inverted repeats (TIR) ​​en 11 bp subterminal inverted repeats (STIR) met ongeveer 100 bp spacers. Beide soorten elementen bevatten directe doelplaatsduplicaties van 8 bp die de transposon-inserties flankeren. Aangepast van [50].

              8. Weefselspecificiteit van P-elementtranspositie: een paradigma van alternatieve pre-mRNA-splitsingsregulatie

              De analyse van het P-element van 2,9 kb van volledige lengte gaf aan dat vier ORF's konden worden gekoppeld door alternatieve splicing om te coderen voor twee eiwitten: het actieve transposase van 87 kDa van volledige lengte (door expressie van alle vier de ORF's) en een afgeknot 66 kDa-eiwit dat de C-terminaal een derde van het transposase, maar met het N-terminale THAP-DNA-bindende domein. Hoewel alleen het product van 87 kDa P-elementtranspositie kan katalyseren, kan het afgeknotte transposase-eiwit binden aan P-element-DNA en werken als een transpositionele repressor [60,61]. Belangrijk is dat verwijdering van de kiembaanbeperking en expressie van actieve transposase in somatische cellen kan worden bewerkstelligd door een P-element genetisch te manipuleren zonder het derde intron van het P-element (IVS3) [59]. Interessant is dat expressie van P-element-transposase in somatische weefsels, die kan worden bereikt met behulp van het stabiele P[Δ2-3] 99B-transgen, letaliteit van de pop veroorzaakte in aanwezigheid van 17 niet-autonome P-elementen van het tweede chromosoom van de Birmingham-stam (BIRM2) [92]. Deze stabiele bron van actief P-element transposase is uitgebreid gebruikt in P-element mutagenese screenings [93].

              Een reeks van beide in vitro en in vivo experimenten leidden tot de identificatie van een negatieve RNA-regulerende plaats stroomopwaarts van IVS3 die interageerde met RNA-bindende eiwitten en U1 snRNP om IVS3-splitsing te remmen [94–96]. Analyse van splicing reporter transgenen en in vitro biochemische studies gaven aan dat een kort splicing regulerend element, nu een exonic splicing silencer (ESS) element genoemd, zich stroomopwaarts van het derde intron bevindt (figuur 12).een) [94,96]. Dit sequentie-element, dat, wanneer gemuteerd, P-element derde intron-splitsing in somatische cellen [94] kan activeren, bevat twee 5'-splitsingsplaatsachtige sequenties die pseudo-5'-splitsingsplaatsen worden genoemd en die kunnen fungeren als een ESS in in vitro splicing-assays [95,96]. Met behulp van biochemische zuiveringsmethoden en Drosophila moleculaire genetica, twee sequentiespecifieke RNA-bindende eiwitten, PSI (P-element somatische remmer, a Drosophila tegenhanger van humaan FBP1, KSRP en FBP3) en hrp48 (a Drosophila tegenhanger van humaan hnRNPA1) werden geïdentificeerd als functioneel belangrijk voor repressie van P-elementsplitsing (figuur 12 .).B) [97,98]. Biochemische analyses van de P-element-splitsende geluiddemper gaven aan dat het ribonucleoproteïne (RNP)-complex dat zich op het geluiddemper-RNA verzamelde, U1 snRNP bevatte gebonden aan een van de twee pseudo-5'-splitsingsplaatsen [96,99]. Het PSI-eiwit, dat twee eiwitherhalingsmotieven A en B heeft, kan direct interageren met het U1 snRNP 70 K-eiwit [99], en er wordt aangenomen dat het de gebonden U1-snRNP blokkeert bij het samenstellen van actieve spliceosomen. Op zijn beurt blokkeert de assemblage van dit inactieve splitsingsgeluiddempercomplex sterisch U1 snRNP van binding aan de nauwkeurige IVS3 5'-splitsingsplaats [96,99].

              Figuur 12. P-element exonic splicing dempercomplex en sequentie-specifieke RNA-bindende eiwitten. (een) Het P-element exonic splicing silencer complex (ESS) wordt samengesteld met U1 snRNP en de RNA-bindende eiwitten PSI, hrp48, hrp36, hrp38 en PABP-C. Assemblage van dit complex blokkeert U1 snRNP-binding aan de nauwkeurige IVS3 5'-splitsingsplaats. (B) De RNA-bindende eiwitten PSI en hrp48 binden specifiek aan het P-element ESS. PSI heeft vier N-terminale KH-type RNA-bindende domeinen en een C-terminaal gebied dat interageert met U1-70 K-eiwit. hrp48 bevat twee N-terminale RNP-CS-type RNA-bindende domeinen en een C-terminaal RGG-domein met lage complexiteit. Aangepast van [50].

              Meer recente studies die gebruik maken van in vitro assemblage van P-element-splitsende dempercomplexen op gebiotinyleerd RNA, affiniteitszuivering, massaspectrometrie en splitsingsreporter-assays identificeerden drie nieuwe eiwitten die functioneel assembleren op het P-element demperelement: hrp36, hrp38 en cytoplasmatisch poly-A-bindend eiwit [100]. Het meest interessante is dat het sequentiespecifieke RNA-bindende eiwit hrp48 dat stevig bindt aan het P-element demper-RNA [97] hrp36 en hrp38 aan het P-element demper-RNA kan rekruteren via hun C-terminale RGG-domeinen met lage complexiteit [100]. De RGG-domeinen, evenals andere sequenties van lage complexiteit op RNA-bindende eiwitten, kunnen leiden tot sequentieafhankelijke condensaten of vloeistof-vloeistoffasescheiding (LLPS), beide in vitro en in vivo [101.102]. De specificiteit van LLPS/condensaten bepaalt vaak veel aspecten van de eiwit-eiwitassemblage in cellen en in de kern.

              9. Een rol voor het piwi-interacterende RNA (piRNA) en repressieve histonmarkeringen bij de controle van transposon-pre-mRNA-splitsing in de soma en kiembaan

              In somatische weefsels binden sequentiespecifieke RNA-bindende eiwitten PSI en hrp48 aan de pre-mRNA's van het P-element, waardoor IVS3-intron-splitsing wordt geblokkeerd en dienen om volledig gesplitste en daardoor volledige transposase-expressie te voorkomen [97,98]. PSI wordt echter niet tot expressie gebracht in de vrouwelijke kiembaan [98], en men denkt dat transposase-expressie in dit weefsel voornamelijk wordt gereguleerd door de piRNA-route [33]. Doorgaans regelen piRNA's de activiteit van transponeerbare elementen door transcriptionele silencing of post-transcriptioneel verval van mRNA's [34] te induceren, wat uiteindelijk leidt tot een afname van de accumulatie van doeltranscripten. Expressieanalyses met behulp van FACS-gesorteerde PGC's of volwassen eierstokken laten echter geen of zeer beperkte veranderingen zien in de accumulatie van P-elementtranscripten in dysgene kiemcellen in vergelijking met niet-dysgene controles, wat aangeeft dat piRNA's niet primair werken om de accumulatie van P-elementtranscripten te onderdrukken [33, 48.103.104]. In plaats daarvan werd aangetoond dat piRNA's de splitsing van P-elementen reguleren door de retentie van derde intron te bevorderen, wat doet denken aan de regulatie die wordt waargenomen in somatische weefsels [33,104]. IVS3-splitsing wordt inderdaad alleen gedetecteerd in de kiemlijn van dysgene nakomelingen of van mutanten die de piRNA-route beïnvloeden [33,61]. Interessant is dat zelfs in dit geval slechts een fractie van de transcripten van het P-element volledig gesplitst lijkt te zijn, wat suggereert dat IVS3-splitsing ofwel een over het algemeen inefficiënt proces is, dat waarschijnlijk hoge niveaus van transposase-expressie beperkt [33,61]. Inderdaad, hrp48 wordt zowel in de kiembaan als in soma tot expressie gebracht [97]. Hoe dan ook, het kwalitatieve effect van piRNA's op IVS3-splitsing is waargenomen voor endogene P-elementen en gerecapituleerd met behulp van reportertransgenen, met beperkte veranderingen op transcriptniveaus in beide gevallen [33,48,104].

              Ondanks dat ze betrokken zijn bij de regulatie van IVS3-splitsing, lijken de mechanismen waarmee somatisch tot expressie gebrachte RNA-bindende eiwitten en kiembaan tot expressie gebrachte piRNA's intronretentie reguleren mechanistisch verschillend te zijn. Het somatisch tot expressie gebrachte RNA-bindende eiwit, PSI, interageert specifiek met het ESS-element dat zich net stroomopwaarts van het derde intron bevindt. Daarentegen is door piRNA gemedieerde regulatie afhankelijk van de binding van PIWI-piRNA-complexen aan targettranscripten en er zijn aanwijzingen dat dit proces niet noodzakelijkerwijs de targeting op een specifieke sequentie vereist. Hybride dysgenese kan inderdaad evenzeer worden onderdrukt door: Drosophila lijnen die piRNA's produceren door het hele element of tegen kleine P-elementsegmenten distaal van het IVS3-intron [30,104].

              Genetische analyses hebben aangetoond dat IVS3-kiemlijnregulatie indirect wordt bereikt door piRNA-gemedieerde veranderingen van chromatinetoestanden. Ten eerste vertrouwt het op Piwi-interagerende eiwitten zoals Asterix/Gtsf1 en Panoramix/Silencio [33], die niet nodig zijn voor piRNA-biogenese, maar essentieel zijn voor het opleggen van chromatineveranderingen op PIWI-doelen [34,105-108]. Ten tweede zijn P-elementen, evenals de genomische regio's die transcriptioneel actieve P-elementinserties flankeren, verrijkt voor de klassieke heterochromatische histonmarkering H3 lysine 9 trimethylatie (H3K9me3) in niet-dysgene kiemcellen, vergeleken met dysgene nakomelingen (figuur 13) [33] ,48]. Het is inderdaad bekend dat Piwi-complexen de afzetting van H3K9me3 [108] bemiddelen. Verrassend genoeg vertonen P-element-mRNA-steady-state-niveaus onder dysgene omstandigheden of in piRNA-pathway-mutanten een beperkte verandering ondanks het verlies van H3K9me3 [33,48]. Dit suggereert dat RNA-polymerase II (Pol II)-activiteit niet sterk wordt beïnvloed door de chromatinetoestand van de P-elementen en dat IVS3-alternatieve splicing onafhankelijk van veranderingen in Pol II-snelheid kan worden gereguleerd [109,110].

              Figuur 13. Verlies van H3K9me3-histonmarkeringen over P-elementinserties tijdens dysgene kruisingen. (een) Genormaliseerde H3K9me3 ChIP-signalen over P-elementen in niet-dysgene (grijs) en dysgene (rode) volwassen eierstokken. (B) Genoombrowserweergave van twee P-elementinserties die transcriptionele activiteit tonen. Genormaliseerde RNA-seq en H3K9me3 ChIP-signalen worden respectievelijk in grijs en blauw weergegeven. De grijze balk die de plots kruist, vertegenwoordigt de chromosomale insertieplaats van het P-element. Annotatie staat onderaan: paarse vakken, coderende exons roze vakken, niet-vertaalde regio's (UTR) paarse lijnen, introns grijs vak, invoeging van P-elementen. Aanzichten die de insertie van het P-element in de Bacc (ook bekend als CG9894) (links) en Lk6 (rechts) genen tonen. Aangepast van [33].

              Interessant is dat piRNA-gemedieerde regulatie van transposon-alternatieve splicing niet exclusief lijkt te zijn voor P-elementen, aangezien ook werd aangetoond dat een vergelijkbare splicingregulatie de expressie van het Gypsy-retrovirus-achtige element moduleert [33]. In dit geval is de regulatie echter beperkt tot de somatische cellen van de eierstokken en zigeuner-mRNA-splitsing bevordert de productie van het Envelope-eiwit-mRNA [111], wat leidt tot de productie van infectieuze deeltjes die zich kunnen verspreiden naar de omliggende weefsels, met name de kiembaan [ 112.113].


              Mechanisme van DNA-gemedieerde transpositie - Biologie

              Tc1 en mariner transposons
              (ITR - Inverted Terminal Repeats)

              Transposasen van beide families bevatten vier geconserveerde zure resten in hun C-terminale helft. Aangenomen wordt dat deze residuen de katalytische plaats vormen vanwege hun gelijkenis met retrovirale integrasen en bacteriële en faagtransposasen (17). Dit wordt ondersteund door experimenten die erop wijzen dat sommige van deze residuen zijn gemuteerd (18, 19, 20).

              De DNA-bindingsplaats van deze transposasen was onbekend. Het is experimenteel gelokaliseerd in het N-terminale gebied van twee Tc1-type transposasen (21, 22). Een paar TC1-transposasen bleken ook een helix-turn-helix (HTH) DNA-bindingsmotief te hebben op hun N-terinale helft (23, 24, 25). Er waren echter ook claims voor een leucine-ritssluiting en een ATP-bindingsmotief in de overeenkomstige regio's van andere Tcl-transposasen (26, 27).

              Resultaten
              We zijn in staat geweest om rijen uit elke familie te vermenigvuldigen. Lokale meervoudige uitlijningen werden voor het eerst gevonden door de BlockMaker- en MEME-systemen en later verfijnd door het MACAW-programma. het identificeren van een aantal geconserveerde regio's in elke familie. De C-terminale gebieden komen overeen met eerder geïdentificeerde motieven rond de geconserveerde zure resten van het katalytische domein. Het N-terminale gebied van beide families is minder geconserveerd dan het C-terminale gebied en het was variabel uitgelijnd (21, 27, 20)

              Geconserveerde sequentiegebieden (blokken) in Tc1- en mariner-transposasen

              Block-to-sequenties en block-to-blocks databasezoekopdrachten vonden dat één blok in het N-terminale gebied van elke familie significant vergelijkbaar was met HTH-DNA-bindingsregio's van verschillende eiwitten (gepaarde domeineiwitten, bacteriële insertiesequenties transposases, transcriptionele regulatoren, RNA-polymersase-sigma factoren, resolvasen, enz.). Dit patroon van overeenkomst werd eerder gevonden voor andere HTH-motieven (28, zie hier).

              Overeenkomst van Tc1- en mariner-blokken met blokken van HTH-DNA-bindende regio's
              Het vergelijken van de Tc1- en mariner-blokken met elkaar bevestigde de overeenkomst tussen hun katalytische domeinen, toonde aan dat hun HTH-motieven op elkaar lijken en duidde op een ander DNA-bindend gebied in de Tc1-transposasen. Twee regio's tussen het Tc1 HTH-motief en het katalytische domein waren vergelijkbaar met de N'- en C'-helices van het mariner HTH-motief:

              Overeenkomst tussen Tc1 en mariner-blokken
              De Dodd- en Egan-methode (29) voor het identificeren van HTH-motieven bevestigde onze bevindingen voor de meeste maar niet alle sequenties. De identificatiefouten kunnen te wijten zijn aan de meestal prokaryotische sequenties die worden gebruikt om de parameters voor de Dodd- en Egan-scorematrix te vinden. Onze bevindingen worden ook ondersteund door experimentele gegevens. Plasterk en medewerkers hebben aangetoond dat de N-terminale regio's van de Tc1A- en Tc3A-transposasen specifiek binden aan hun respectievelijke omgekeerde herhalingen (21, 22). Het aantal mutaties in het voorspelde HTH-gebied in het D.mauritiana mariner-transposase dat de activiteit ervan verminderde en uitschakelde (20) was meer dan wat op basis van toeval zou worden verwacht.

              Onze resultaten voorspellen een bipartiet DNA-bindend domein in Tc1-transposasen. We stellen voor dat het N-terminale deel een 'typisch' HTH-DNA-bindend domein is en dat het C-terminale deel een 'HTH-achtig' domein is met een langer gebied (misschien een lus) tussen twee DNA-bindende helices. Dit deel van het DNA-bindende domein komt overeen met het gebied waarvan is waargenomen dat het niet-specifieke DNA-bindende activiteit heeft in Tc1A- en Tc3A-transposasen (21, 22).

              Tc1-type eiwitten blokkeren logo's

              Structuur van Prd PAX-domein (1PDN) gebonden aan DNA
              Pogo is een DNA-gemedieerde transposonfamilie (genoemd naar het eerste lid dat geïdentificeerd werd in een fruitvlieg). De familie is in de verte verwant aan de mariner- en Tc1-groepen, maar bevat ook niet-transposase-eiwitten (13). De mariner- en Tc1-blokken zouden vergelijkbare regio's in pogo-sequenties kunnen identificeren. Van bijzonder belang was het identificeren van het pogo-DNA-bindingsgebied. Er werd voorspeld dat de katalytische plaats zich in het C-terminale deel van pogo-eiwitten zou bevinden die kunnen worden uitgelijnd met mariner- en Tc1-sequenties. De N-terminale gebieden vertoonden echter geen duidelijke overeenkomst met deze sequenties 13). De DNA-bindingsplaats werd geïdentificeerd en voorspeld als een HTH-structuur door blokvergelijking. Dit werd bevestigd met de Dodd en Egan methode.

              HTH-motieven in pogo-sequenties De pogo-sequenties konden ook in blokken worden uitgelijnd en blok A was vergelijkbaar met verschillende blokken van HTH-motieven. Drie niet-transposasen pogo-eiwitten missen echter blok A en er wordt niet voorspeld dat ze een HTH-motief hebben. Deze eiwitten zijn schimmeltranscriptiefactoren (PDC2 en RAG3) en het schokkerige eiwit. Inactivering van dit eiwit bij muizen zorgde ervoor dat ze epileptische aanvallen kregen (35). Alle andere pogo-blokken zitten in deze drie eiwitten.

              pogo-achtige eiwitten. 9 blokken Het CENP-B centromeer bindende eiwiteiwit heeft wel een voorspeld HTH-motief, maar is geen transposase. Dit houdt in dat het meer als de transposasen functioneert dan als de schokkerige en transcriptiefactoren. Een boom die is opgebouwd uit de sequenties die zijn uitgelijnd in de pogo-blokken, laat zien dat CENP-B slechts in de verte verwant is aan schokkerig. Verrassend genoeg wordt het niet gevonden vergelijkbaar met het gist (S.pombe) centromeer bindende eiwit ABP1. De schimmeltransposasen (Fot1, Pot2, Pot3 en Fcc1) zijn allemaal geclusterd, gescheiden van de dierlijke transposasen (pogo en tijgers).

              Postscript - Experimentele verificaties


              Co-kristalstructuur van het N-terminale uiteinde van het Tc3-transposase (residuen 2-52) en zijn doelwit-DNA (1TC3). Het voorspelde HTH-DNA-bindingsmotief (overeenkomend met posities 11-30 in blok A van de TC1-sequentiefamilie, aa 22-44 in Tc3-transposase) wordt weergegeven in cyaan. Het komt precies overeen met een helix-turn-helix-structuur die inderdaad het DNA bindt.
              Klik op de afbeelding om de structuur in een interactieve modus te zien - u kunt de structuur draaien, zoomen en op een andere manier mainpulteren. Hiervoor is het Chime-plug-inprogramma vereist, dat momenteel beschikbaar is voor Mac-, pc- en SGI-computers. Meer informatie


              Afdeling Biologie en Geologie

              Transponeerbare elementen zijn mobiele stukjes DNA die in staat zijn om van de ene locatie in een genoom naar de andere te transponeren of te "springen". De transposon die in het laboratorium van Dr. Hancock wordt gebruikt, mPing, is een 430 bp miniatuur inverted repeat transposable element (MITE) dat van nature voorkomt in het rijstgenoom. Er lopen projecten om te evalueren welke regio's van mPing transpositie bevorderen en om te bepalen of het inbrengen van mPing kan worden gericht op specifieke sequenties. Andere projecten werken aan het bepalen van het omzettingsmechanisme en hoe replicatieve omzetting plaatsvindt.

              Doelen

              • Test het effect van aanpassingen aan mPing
              • Bepaal welke regio's van mPing en de transposase-eiwitten zijn betrokken bij transpositie
              • Identificeer hyperactieve versies van het element en transposase-eiwitten

              Financiering

              NSF genetische mechanismen CARRIRE (2017 - 2023): $695.696

              Onthulling van de mechanismen die bepalen hoe een actieve DNA TE het genoom beïnvloedt.


              Uitgebreide gegevens Fig. 1 Validatie van recombinant DDM1-eiwit en H2A.X of H2A.W pulldown-assay met DDM1-fragmenten. Gerelateerd aan Fig. 1.

              een, SDS-PAGE-analyse van gezuiverd recombinant DDM1 en DDM1 E334N. Eiwitten werden gescheiden door 10% SDS-PAGE en zichtbaar gemaakt door Coomassie Brilliant Blue-kleuring. Asterisk geeft de afgebroken producten aan die na zuivering niet konden worden verwijderd. (Brongegevens tonen een van de drie verkregen representatieve gels). B, Schematische weergave van de ATPase-assay. Malachietgroene oplossing werd gebruikt om vrij fosfaat te detecteren dat vrijkwam uit ATP door enzym-gekatalyseerde hydrolyse. C, Grafische weergave van de resultaten van ATPase-assays met respectievelijk buffer (groen), wildtype DDM1 (blauw) of DDM1 E334N (rood). DNA-concentratie wordt uitgedrukt als mol nucleotiden. NS, De kristalstructuur van Drosophila RNA-helicase-eiwit VASA 49 samen met de ATP-analoog (AMPPNP) (PDB ID: 2DB3). Het glutaminezuurresidu op positie 400, dat een katalytisch watermolecuul coördineert voor het stabiliseren van de interactie met ATP, is aangegeven. e, Sequentie-uitlijning tussen de Glu400 tussen Drosophila VASA en Arabidopsis DDM1 gecentreerd op GLU400, aangegeven door de blauwe pijl. Glu400 in VASA komt overeen met Glu334 in Arabidopsis. f, h Schematische weergave van de DDM1-fragmenten die in de pulldown-assay worden gebruikt. g, ik SDS-PAGE-analyse van de pulldown-assay. Zijn6-gelabelde DDM1 en zijn truncaties (paneel g) of GST-gelabelde DDM1-fragmenten (paneel i) werden geïncubeerd met histondimeren die H2A.X of H2A.W bevatten.Na pulldown werden monsters geanalyseerd met 15% SDS-PAGE en zichtbaar gemaakt door Coomassie Brilliant Blue. Gegevens in a, g en i vertegenwoordigen drie onafhankelijke experimenten. Brongegevens vindt u in Source Data Extended Data Fig. 1.

              Uitgebreide gegevens Fig. 2 DNA-methylatie in ddm1. Gerelateerd aan Fig. 2.

              Vioolplots voor het aandeel van DNA-methylatie in CG-, CHG- en CHH-contexten op eiwitcoderende genen (links, n = 27.655), TE-fragmenten exclusief TE's (midden, n = 25.695) en TE's (rechts, n = 3.903) in wildtype Col-0 (grijs) en ddm1 (rood).

              Uitgebreide gegevens Fig. 3 Genomische distributie van H1, H3K9me2 en H2A.W in ddm1. Verwant aan Fig. 2 en 3.

              een, Geaggregeerde profielplots (boven) en heatmaps (onder) van H2A.W, H2A.X en H1 in Col-0 (grijs) en ddm1 (rood) over heterochromatische regio's, gedefinieerd door H3K9me2-verrijking. Antilichamen tegen H1 die in deze studie werden gebruikt, herkennen zowel H1.1 als H1.2. B, IGV-genoombrowsermomentopname van H1 (zwart), H2A.W (groen) en H3K9me2 (blauw) in wildtype Col-0 en ddm1. Gekleurde en grijze arcering geven respectievelijk een verrijkt of verarmd signaal aan. Geannoteerde eiwitcoderende genen, TE-fragmenten en TE's worden weergegeven als respectievelijk zwarte, roze of lichtblauwe vakken. C, Geaggregeerde profielplots (boven) en heatmaps (onder) die de verdeling van H3K9me2 en H2A.W over TE-fragmenten tonen zonder TE's in wildtype en ddm1. NS, Chromosomale distributies van TE's geclassificeerd als groep 1 (oranje n = 3.257) en groep 2 (grijs n = 646) in Fig. 3a voor elk chromosoom. Groene vakken vertegenwoordigen pericentrische heterochromatine. e, f IGV-genoombrowsermomentopname van H2A.W (groen), H3K9me2 (blauw), H3K36me3 (oranje) en H3K27me3 (paars) over TE's in wildtype Col-0 en ddm1. Gekleurde en grijze arcering geven respectievelijk een verrijkt of verarmd signaal aan.

              Uitgebreide gegevens Fig. 4 RT-qPCR-analyses van TE's in complementatielijnen die DDM1-mutantvormen tot expressie brengen. Gerelateerd aan Fig. 4.

              een, RT-PCR-analyses van transgene lijnen. cDNA (+RT) en met DNaseI behandeld RNA (-RT) werden van elke plant bereid en gebruikt als matrijs voor RT-PCR-analyses. ACT2 werd gebruikt als controle voor RT-PCR. PCR-producten werden gescheiden door agarosegel en zichtbaar gemaakt door SYBR Green I-kleuring. B, Staafdiagrammen die de resultaten van RT-qPCR tonen als vouwverandering van verrijking over ACT2 bij TE's geanalyseerd in Extended Data Fig. 6c,d van wildtype Col-0 (grijs), ddm1 (rood), ddm1 die DDM1-3xFLAG uitdrukken (paars), ddm1 uiting geven aan DDM1 ∆N-3xFLAG (groen), ddm1 die DDM1 uitdrukken ∆C-3xFLAG (oranje), of ddm1 die respectievelijk DDM1 ∆NC-3xFLAG (bruin) tot expressie brengen. Gepresenteerde gegevens zijn gemiddelden van n = 3 onafhankelijke biologische replica's (elke biologische replica heeft 2 technische herhalingen) foutbalken vertegenwoordigen SD binnen biologische replica's. Brongegevens vindt u in Source Data Extended Data Fig. 4.

              Uitgebreide gegevens Fig. 5 Genomische distributie van H2A.W in complementatielijnen. Gerelateerd aan Fig. 4.

              a, b, d, e IGV-genoombrowsermomentopname van de distributie voor H2A.W en H3K9me2 over TE's (panelen a en b), eiwitcoderend gen (paneel d) en TE-fragment (paneel e) in wildtype, ddm1, ddm1 die DDM1 FL, DDM1 ∆N, DDM1 ∆C en DDM1 ∆NC tot expressie brengen. C, Geaggregeerde profielplots (boven) en heatmaps (onder) die de verdeling van H2A.W over TE's in wildtype tonen, ddm1, ddm1 die DDM1 FL, DDM1 ∆N, DDM1 ∆C en DDM1 ∆NC tot expressie brengen.

              Uitgebreide gegevens Fig. 6 ChIP-qPCR-analyses van H3K9me2 of H2A.W over TE's en expressie van TE's in F1 DDM1/ddm1. Gerelateerd aan Afb. 5.

              een, b, Staafgrafieken die de resultaten van ChIP-qPCR tonen als vouwverandering van H3K9me2 (paneel a) of H2A.W (paneel b) verrijking over H3 bij TE's geanalyseerd in Extended Data Fig. 6c,d van wildtype Col-0 (grijs) , F1 DDM1/ddm1 (blauw), of ddm1 (rood), respectievelijk. Gepresenteerde gegevens zijn gemiddelden van n = 3 onafhankelijke biologische replica's (elke biologische replica heeft 3 technische herhalingen) foutbalken vertegenwoordigen SD binnen biologische replica's. De getallen onder elke TE tonen het expressieniveau van TE's (log2VouwVeranderen (F1/ddm1)) in vergelijking tot ddm1 gemuteerde planten. c-e, Staafdiagrammen met relatieve expressieniveaus van TE's geclassificeerd als geïnactiveerd (blauw) of neutraal (roze) gemeten met RT-qPCR van wildtype Col-0 (grijs), F1 DDM1/ddm1 (blauw), of ddm1 (rood), respectievelijk. De expressieniveaus van elke TE worden weergegeven als een vouwomschakeling ACT2. Gepresenteerde gegevens zijn gemiddelden van n = 3 onafhankelijke biologische replica's (elke biologische replica heeft 2 technische herhalingen) foutbalken vertegenwoordigen SD binnen biologische replica's. De stippellijnen vertegenwoordigen 50% van de ddm1 vouw wissel ACT2. Brongegevens worden gegeven in Brongegevens Uitgebreide gegevens Fig. 6.

              Uitgebreide gegevens Fig. 7 Transcriptoom van TE's in ddm1 en andere mutanten. Gerelateerd aan Fig. 6.

              Heatmap van de z-getransformeerde expressieniveaus van differentieel tot expressie gebrachte TE's (n = 1.878) in mutanten van wildtype Col-0, suvh456, ontmoet1, en ddm1.

              Uitgebreide gegevens Fig. 8 DNA-methylering van TE's in ddm1 en F1 kruis Col-0 x ddm1. Gerelateerd aan Afb. 7.

              Heatmaps met gewogen DNA-methylatieniveaus voor TE's gesorteerd in categorieën 'Geïnactiveerd', 'neutraal' en 'overig' in wildtype Col-0, ddm1, kunstmatig F1-kruis [(Kol-0 + ddm1)/2] en F1 kruis Col-0 X ddm1 voor een CG, B CHG, en C CHH-contexten.