Informatie

12.3: Er worden meerdere mechanismen gebruikt voor het splitsen van verschillende soorten introns - biologie


Verschillende soorten introns

Er zijn ten minste vier verschillende klassen van introns geïdentificeerd: Introns in nucleair eiwitcoderende genen die worden verwijderd door spliceosomen (spliceosomale introns) Introns in nucleaire en archaeale transfer-RNA-genen die worden verwijderd door eiwitten (tRNA-introns) Zelfsplitsende groep I-introns die worden verwijderd door RNA-katalyse.

  1. pre‑tRNA
  2. groep I, groep II: Introns in mitochondriale genen van schimmels en in plastide (chloroplast) genen zijn gegroepeerd in twee verschillende groepen op basis van verschillende consensussequenties die in de introns worden gevonden. Zoals we hieronder zullen zien, hebben de groep II-introns een mechanisme voor splicing dat vergelijkbaar is met dat van pre-mRNA.
  3. pre‑mRNA

In alle gevallen zal splicing de introns verwijderen en de exons samenvoegen om het rijpe RNA te geven.

Tafel. Kenmerken van splicing voor verschillende soorten introns
KlasVerdelingVolgordeOnderscheidend kenmerk:Mechanisme
pre-tRNAgist voor zoogdierenzeer kort (10-20 nucleotiden)vereist ATPknippen, kinase, ligase
groep Ischimmel mitochondriën, plastiden, pre-rRNA in Tetrahymenakarakteristieke consensuszelfsplitsend, G-kern(en)ide om te initiërenphosphoester overdracht
groep IIschimmel mitochondriën, plastidenkarakteristieke consensuskan zichzelf splitsen, intern A-nucleotide om te initiërenphosphoester overdracht
pre-mRNAgist voor zoogdieren5' GU...AG 3'spliceosoom (ATP voor assemblage), intern A-nucleotide om te initiërenphosphoester overdracht

Splicing van pre‑tRNA's

Sommige voorloper-tRNA's bevatten korte introns (slechts 10 tot 20 nucleotiden) zonder duidelijke consensussequenties. Deze korte introns worden verwijderd in een reeks stappen die worden gekatalyseerd door enzymen die een endonuclease, een kinase en een ligase omvatten. Omdat het endonuclease een 2', 3' cyclisch fosfodiësterproduct genereert, is een extra fosfodiësterase nodig om de cyclische fosfodiester te openen om de 3'-hydroxyl voor de ligasereactie te leveren. Daarnaast moet het 2'-fosfaat (product van de fosfodiësterase) verwijderd worden door een fosfatase. Dit proces gebruikt twee ATP's voor elke splitsingsgebeurtenis.


Intron

Een intron is een lang stuk niet-coderend DNA dat wordt gevonden tussen exons (of coderende gebieden) in een gen. Genen die introns bevatten, staan ​​bekend als discontinue of gesplitste genen omdat de coderende regio's niet continu zijn. Introns worden alleen gevonden in eukaryote organismen.


Hier zien we de structuur van een pre-mRNA (of hrRNA) en een volwassen mRNA volgend op mRNA-verwerking (splitsing, de toevoeging van een 5'8242-cap en een poly-A-staart).


Inhoud

Alternatieve splicing werd voor het eerst waargenomen in 1977. [9] [10] Het adenovirus produceert vijf primaire transcripten vroeg in zijn infectieuze cyclus, voorafgaand aan virale DNA-replicatie, en nog een later, nadat DNA-replicatie begint. De vroege primaire transcripten worden nog steeds geproduceerd nadat de DNA-replicatie begint. Het aanvullende primaire transcript dat laat in de infectie wordt geproduceerd, is groot en komt van 5/6 van het 32 ​​kb adenovirusgenoom. Dit is veel groter dan elk van de individuele adenovirus-mRNA's die aanwezig zijn in geïnfecteerde cellen. Onderzoekers ontdekten dat het primaire RNA-transcript geproduceerd door adenovirus type 2 in de late fase op veel verschillende manieren werd gesplitst, wat resulteerde in mRNA's die coderen voor verschillende virale eiwitten. Bovendien bevatte het primaire transcript meerdere polyadenylatieplaatsen, waardoor verschillende 3'-uiteinden voor de verwerkte mRNA's werden verkregen. [11] [12] [13]

In 1981 werd het eerste voorbeeld van alternatieve splicing in een transcript van een normaal, endogeen gen gekarakteriseerd. [11] Het gen dat codeert voor het schildklierhormoon calcitonine bleek alternatief te worden gesplitst in zoogdiercellen. Het primaire transcript van dit gen bevat 6 exons het calcitonine-mRNA bevat exons 1-4 en eindigt na een polyadenylatieplaats in exon 4. Een ander mRNA wordt geproduceerd uit dit pre-mRNA door exon 4 over te slaan en omvat exons 1-3, 5 , en 6. Het codeert voor een eiwit dat bekend staat als CGRP (calcitonine-gen-gerelateerd peptide). [14] [15] Voorbeelden van alternatieve splicing in transcripten van immunoglobinegenen bij zoogdieren werden ook waargenomen in de vroege jaren tachtig. [11] [16]

Sindsdien is gevonden dat alternatieve splicing alomtegenwoordig is in eukaryoten. [1] De "recordhouder" voor alternatieve splicing is a D. melanogaster gen genaamd Dscam, dat mogelijk 38.016 splitsingsvarianten kan hebben. [17]

In 2021 werd ontdekt dat het genoom van adenovirus type 2, het adenovirus waarin alternatieve splicing voor het eerst werd geïdentificeerd, een veel grotere verscheidenheid aan mRNA kon produceren dan eerder werd gedacht. [18] Door de volgende generatie sequencing-technologie te gebruiken, waren onderzoekers in staat om het menselijke adenovirus type 2 transcriptoom te updaten en een verbijsterend 904 uniek mRNA te presenteren, geproduceerd door het virus via een complex patroon van alternatieve splicing.

Vijf basismodi van alternatieve splicing worden algemeen erkend. [1] [2] [3] [19]

  • Exon overslaan of cassette exon: in dit geval kan een exon uit het primaire transcript worden gesplitst of behouden. Dit is de meest voorkomende modus in pre-mRNA's van zoogdieren. [19]
  • Wederzijds exclusieve exons: Een van de twee exons wordt vastgehouden in mRNA's na splitsing, maar niet beide.
  • Alternatieve donorsite: Er wordt een alternatieve 5'-splitsingsjunctie (donorplaats) gebruikt, waardoor de 3'-grens van het stroomopwaartse exon wordt gewijzigd.
  • Alternatieve acceptorsite: Er wordt een alternatieve 3'-splitsingsjunctie (acceptorplaats) gebruikt, waardoor de 5'-grens van het stroomafwaartse exon wordt gewijzigd.
  • Intron-retentie: Een sequentie kan worden gesplitst als een intron of gewoon worden behouden. Dit onderscheidt zich van exon skipping omdat de behouden sequentie niet wordt geflankeerd door introns. Als het vastgehouden intron zich in het coderende gebied bevindt, moet het intron coderen voor aminozuren in frame met de naburige exons, anders zal een stopcodon of een verschuiving in het leesframe ervoor zorgen dat het eiwit niet-functioneel is. Dit is de zeldzaamste modus bij zoogdieren. [19]

Naast deze primaire vormen van alternatieve splicing, zijn er twee andere hoofdmechanismen waarmee verschillende mRNA's kunnen worden gegenereerd uit hetzelfde gen, meerdere promotors en meerdere polyadenyleringsplaatsen. Het gebruik van meerdere promoters wordt goed beschreven als een transcriptioneel regulatiemechanisme in plaats van alternatieve splicing door transcriptie op verschillende punten te starten, transcripten met verschillende 5'-meeste exons kunnen worden gegenereerd. Aan het andere uiteinde verschaffen meerdere polyadenylatieplaatsen verschillende 3'-eindpunten voor het transcript. Beide mechanismen worden gevonden in combinatie met alternatieve splicing en zorgen voor extra variatie in mRNA's die zijn afgeleid van een gen. [1] [3]

Deze modi beschrijven elementaire splitsingsmechanismen, maar zijn mogelijk ontoereikend om complexe splitsingsgebeurtenissen te beschrijven. De figuur rechts toont bijvoorbeeld 3 spliceforms van het muishyaluronidase 3-gen. Het vergelijken van de exonische structuur weergegeven in de eerste regel (groen) met die in de tweede regel (geel) toont intronretentie, terwijl de vergelijking tussen de tweede en de derde spliceform (geel versus blauw) exon-skipping vertoont. Onlangs is een modelnomenclatuur voorgesteld om alle mogelijke splitsingspatronen op unieke wijze aan te duiden. [19]

Algemeen splitsingsmechanisme Bewerken

Wanneer het pre-mRNA van het DNA is getranscribeerd, bevat het verschillende introns en exons. (Bij nematoden is het gemiddelde 4-5 exons en introns in de fruitvlieg) Drosophila er kunnen meer dan 100 introns en exons in één getranscribeerd pre-mRNA zijn.) De exons die in het mRNA moeten worden vastgehouden, worden bepaald tijdens het splitsingsproces. De regulatie en selectie van splitsingsplaatsen worden gedaan door trans-acterende splitsingsactivator- en splitsingsrepressoreiwitten evenals cis-werkende elementen in het pre-mRNA zelf, zoals exonische splitsingsversterkers en exonische splitsingsdempers.

Het typische eukaryote nucleaire intron heeft consensussequenties die belangrijke regio's definiëren. Elk intron heeft de sequentie GU aan het 5'-uiteinde. In de buurt van het 3'-uiteinde is een filiaal. Het nucleotide op het vertakkingspunt is altijd een A, de consensus rond deze sequentie varieert enigszins. Bij mensen is de consensussequentie van de vertakkingsplaats yUnAy. [20] De vertakkingsplaats wordt gevolgd door een reeks pyrimidinen - het polypyrimidine-kanaal - en vervolgens door AG aan het 3'-uiteinde. [3]

Splicing van mRNA wordt uitgevoerd door een RNA- en eiwitcomplex dat bekend staat als het spliceosoom, dat snRNP's bevat die worden aangeduid als U1, U2, U4, U5 en U6 (U3 is niet betrokken bij mRNA-splitsing). [21] U1 bindt aan de 5' GU en U2, met behulp van de U2AF-eiwitfactoren, bindt aan het vertakkingspunt A binnen de vertakkingsplaats. Het complex in dit stadium staat bekend als het spliceosoom A-complex. De vorming van het A-complex is gewoonlijk de belangrijkste stap bij het bepalen van de uiteinden van het intron dat moet worden gesplitst en bij het definiëren van de uiteinden van het te behouden exon. [3] (De U-nomenclatuur is afgeleid van hun hoge uridinegehalte).

Het U4,U5,U6-complex bindt en U6 vervangt de U1-positie. U1 en U4 vertrekken. Het overblijvende complex voert vervolgens twee omesteringsreacties uit. Bij de eerste transverestering wordt het 5'-uiteinde van het intron gesplitst van het stroomopwaartse exon en verbonden met de vertakkingsplaats A door een 2',5'-fosfodiesterbinding. Bij de tweede omestering wordt het 3'-uiteinde van het intron gesplitst van het stroomafwaartse exon en worden de twee exons verbonden door een fosfodiesterbinding. Het intron wordt dan vrijgegeven in lasso-vorm en afgebroken. [1]

Regelgevende elementen en eiwitten

Splicing wordt gereguleerd door trans-werkende eiwitten (repressors en activatoren) en overeenkomstige cis-werkende regulerende plaatsen (silencers en enhancers) op het pre-mRNA. Als onderdeel van de complexiteit van alternatieve splicing wordt echter opgemerkt dat de effecten van een splicingfactor vaak positieafhankelijk zijn. Dat wil zeggen, een splitsingsfactor die dient als een splitsingsactivator wanneer deze is gebonden aan een intronisch versterkerelement, kan dienen als een repressor wanneer deze in de context van een exon aan zijn splitsingselement is gebonden, en vice versa. [22] De secundaire structuur van het pre-mRNA-transcript speelt ook een rol bij het reguleren van splitsing, zoals door splitsingselementen samen te brengen of door een sequentie te maskeren die anders zou dienen als een bindend element voor een splitsingsfactor. [23] [24] Samen vormen deze elementen een "splitsingscode" die bepaalt hoe splitsing zal plaatsvinden onder verschillende cellulaire omstandigheden. [25] [26]

Er zijn twee hoofdtypen cis-werkende RNA-sequentie-elementen die aanwezig zijn in pre-mRNA's en ze hebben overeenkomstige trans-werkende RNA-bindende eiwitten. Splicing geluiddempers zijn plaatsen waaraan splitsingsrepressoreiwitten binden, waardoor de kans kleiner wordt dat een nabijgelegen plaats als splitsingspunt wordt gebruikt. Deze kunnen zich in het intron zelf bevinden (intronic splicing silencers, ISS) of in een naburig exon (exonic splicing silencers, ESS). Ze variëren in volgorde, evenals in de soorten eiwitten die eraan binden. De meeste splitsingsrepressoren zijn heterogene nucleaire ribonucleoproteïnen (hnRNP's) zoals hnRNPA1 en polypyrimidine tract bindend eiwit (PTB). [3] [25] Splitsen versterkers zijn plaatsen waaraan splitsingsactivatoreiwitten binden, waardoor de kans groter wordt dat een nabijgelegen plaats als splitsingspunt zal worden gebruikt. Deze kunnen ook voorkomen in het intron (intronic splicing enhancers, ISE) of exon (exonic splicing enhancers, ESE). De meeste activator-eiwitten die aan ISE's en ESE's binden, zijn leden van de SR-eiwitfamilie. Dergelijke eiwitten bevatten RNA-herkenningsmotieven en arginine- en serinerijke (RS) domeinen. [3] [25]

Over het algemeen werken de determinanten van splitsing op een onderling afhankelijke manier die afhangt van de context, zodat de regels die bepalen hoe splitsing wordt geregeld vanuit een splitsingscode. [26] De aanwezigheid van een bepaald cis-werkend RNA-sequentie-element kan in sommige gevallen de kans vergroten dat een nabijgelegen plaats wordt gesplitst, maar in andere gevallen de kans verkleinen, afhankelijk van de context. De context waarbinnen regulerende elementen werken, omvat cis-werkende context die wordt vastgesteld door de aanwezigheid van andere RNA-sequentiekenmerken, en trans-werkende context die wordt vastgesteld door cellulaire omstandigheden. Sommige cis-werkende RNA-sequentie-elementen beïnvloeden bijvoorbeeld de splicing alleen als er meerdere elementen in hetzelfde gebied aanwezig zijn om de context vast te stellen. Als een ander voorbeeld kan een cis-werkend element tegengestelde effecten hebben op splitsing, afhankelijk van welke eiwitten in de cel tot expressie worden gebracht (bijvoorbeeld neuronale versus niet-neuronale PTB). De adaptieve betekenis van het splitsen van geluiddempers en versterkers wordt bevestigd door studies die aantonen dat er een sterke selectie is in menselijke genen tegen mutaties die nieuwe dempers produceren of bestaande versterkers verstoren. [27] [28]

DNA-methylatie en alternatieve splicing bij sociale insecten

CpG-DNA-methylatie heeft een rol laten zien bij het reguleren van de alternatieve splicing bij sociale insecten. [29] [30] Bij honingbijen (Apis mellifera), lijkt CpG-DNA-methylatie het overslaan van exon te reguleren op basis van de eerste paar genomische onderzoeken [31] [32] nadat het honingbijgenoom beschikbaar was. [33] CpG-DNA-methylatie reguleerde alternatieve splicing uitgebreider, niet alleen van invloed op exon-skipping, maar ook intron-retentie en andere splicing-gebeurtenissen. [34]

Voorbeelden Bewerken

Exon overslaan: Drosophila dsx Bewerking

Pre-mRNA's van de D. melanogaster gen dsx bevatten 6 exonen. Bij mannen worden exons 1,2,3,5 en 6 samengevoegd om het mRNA te vormen, dat codeert voor een transcriptioneel regulerend eiwit dat nodig is voor mannelijke ontwikkeling. Bij vrouwen zijn exons 1,2,3 en 4 samengevoegd en een polyadenyleringssignaal in exon 4 veroorzaakt op dat moment splitsing van het mRNA. Het resulterende mRNA is een transcriptioneel regulerend eiwit dat nodig is voor vrouwelijke ontwikkeling. [35]

Dit is een voorbeeld van exon-skipping. Het intron stroomopwaarts van exon 4 heeft een polypyrimidine-kanaal dat niet goed overeenkomt met de consensussequentie, zodat U2AF-eiwitten er slecht aan binden zonder hulp van splicing-activators. Deze 3'-splitsingsacceptorplaats wordt daarom niet gebruikt bij mannen. Vrouwtjes produceren echter de splicing activator Transformer (Tra) (zie hieronder). Het SR-eiwit Tra2 wordt door beide geslachten geproduceerd en bindt aan een ESE in exon 4 als Tra aanwezig is, het bindt aan Tra2 en vormt samen met een ander SR-eiwit een complex dat U2AF-eiwitten helpt bij het binden aan het zwakke polypyrimidine-kanaal. U2 wordt gerekruteerd naar het bijbehorende vertakkingspunt en dit leidt tot opname van exon 4 in het mRNA. [35] [36]

Alternatieve acceptorsites: Drosophila Transformator Bewerking

Pre-mRNA's van de Transformator (Tra) gen van Drosophila melanogaster alternatieve splitsing ondergaan via de alternatieve acceptorplaatsmodus. Het gen Tra codeert voor een eiwit dat alleen bij vrouwen tot expressie komt. Het primaire transcript van dit gen bevat een intron met twee mogelijke acceptorplaatsen. Bij mannen wordt de stroomopwaartse acceptorplaats gebruikt. Dit zorgt ervoor dat een langere versie van exon 2 wordt opgenomen in het verwerkte transcript, inclusief een vroeg stopcodon. Het resulterende mRNA codeert voor een afgeknot eiwitproduct dat inactief is. Vrouwtjes produceren het hoofdeiwit voor geslachtsbepaling Sex lethal (Sxl). Het Sxl-eiwit is een splitsingsrepressor die bindt aan een ISS in het RNA van het Tra-transcript nabij de stroomopwaartse acceptorplaats, waardoor wordt voorkomen dat het U2AF-eiwit aan het polypyrimidine-kanaal bindt. Dit voorkomt het gebruik van deze verbinding, waardoor de spliceosoombinding naar de stroomafwaartse acceptorplaats verschuift. Splicing op dit punt omzeilt het stopcodon, dat wordt weggesneden als onderdeel van het intron. Het resulterende mRNA codeert voor een actief Tra-eiwit, dat zelf een regulator is van alternatieve splicing van andere geslachtsgerelateerde genen (zie dsx bovenstaand). [1]

Exon-definitie: Fas-receptor Bewerken

Meerdere isovormen van het Fas-receptoreiwit worden geproduceerd door alternatieve splicing. Twee normaal voorkomende isovormen bij mensen worden geproduceerd door een exon-skipping-mechanisme. Een mRNA inclusief exon 6 codeert voor de membraangebonden vorm van de Fas-receptor, die apoptose of geprogrammeerde celdood bevordert. Verhoogde expressie van Fas-receptor in huidcellen die chronisch aan de zon zijn blootgesteld, en afwezigheid van expressie in huidkankercellen, suggereert dat dit mechanisme belangrijk kan zijn bij de eliminatie van prekankercellen bij mensen. [37] Als exon 6 wordt overgeslagen, codeert het resulterende mRNA voor een oplosbaar Fas-eiwit dat geen apoptose bevordert. Het opnemen of overslaan van het exon hangt af van twee antagonistische eiwitten, TIA-1 en polypyrimidine-tract-bindend eiwit (PTB).

  • De 5'-donorplaats in het intron stroomafwaarts van exon 6 in het pre-mRNA heeft een zwakke overeenkomst met de consensussequentie en wordt gewoonlijk niet gebonden door de U1-snRNP. Als U1 niet bindt, wordt het exon overgeslagen (zie "a" in bijgaande figuur).
  • Binding van TIA-1-eiwit aan een intronische splitsingsversterkerplaats stabiliseert de binding van de U1-snRNP. [3] Het resulterende 5'-donorplaatscomplex helpt bij het binden van de splitsingsfactor U2AF aan de 3'-splitsingsplaats stroomopwaarts van het exon, via een mechanisme dat nog niet bekend is (zie b). [38]
  • Exon 6 bevat een pyrimidine-rijke exonische splicing geluiddemper, ure6, waar PTB kan binden. Als PTB bindt, remt het het effect van het 5'-donorcomplex op de binding van U2AF aan de acceptorplaats, wat resulteert in exon-skipping (zie c).

Dit mechanisme is een voorbeeld van exon-definitie bij splicing. Een spliceosoom verzamelt zich op een intron en de snRNP-subeenheden vouwen het RNA zodat de 5'- en 3'-uiteinden van het intron worden samengevoegd. Recent bestudeerde voorbeelden zoals deze laten echter zien dat er ook interacties zijn tussen de uiteinden van het exon. In dit specifieke geval zijn deze exon-definitie-interacties nodig om de binding van kernsplitsingsfactoren mogelijk te maken voorafgaand aan assemblage van de spliceosomen op de twee flankerende introns. [38]

Repressor-activator competitie: HIV-1 tatoeage exon 2 Bewerken

HIV, het retrovirus dat aids bij mensen veroorzaakt, produceert een enkel primair RNA-transcript, dat op meerdere manieren wordt gesplitst om meer dan 40 verschillende mRNA's te produceren. [39] Evenwicht tussen differentieel gesplitste transcripten verschaft meerdere mRNA's die coderen voor verschillende producten die nodig zijn voor virale vermenigvuldiging. [40] Een van de differentieel gesplitste transcripten bevat de tatoeage gen, waarin exon 2 een cassette-exon is dat kan worden overgeslagen of opgenomen. De opname van tat-exon 2 in het RNA wordt gereguleerd door competitie tussen de splitsingsrepressor hnRNP A1 en het SR-eiwit SC35. Binnen exon 2 overlappen een exonic splicing silencer-sequentie (ESS) en een exonic splicing enhancer-sequentie (ESE). Als A1-repressoreiwit aan de ESS bindt, initieert het coöperatieve binding van meerdere A1-moleculen, die zich uitstrekken tot in de 5'-donorplaats stroomopwaarts van exon 2 en de binding van de kernsplitsingsfactor U2AF35 aan het polypyrimidine-kanaal voorkomen. Als SC35 aan de ESE bindt, voorkomt het A1-binding en houdt het de 5'-donorplaats in een toegankelijke staat voor assemblage van het spliceosoom. Concurrentie tussen de activator en de repressor zorgt ervoor dat beide mRNA-types (met en zonder exon 2) worden geproduceerd. [39]

Alternatieve splicing is een van de vele uitzonderingen op het oorspronkelijke idee dat één DNA-sequentie codeert voor één polypeptide (de hypothese van één gen-één enzym). Het is misschien juister om nu te zeggen: "Eén gen – vele polypeptiden". [41] Externe informatie is nodig om te beslissen welk polypeptide wordt geproduceerd, gegeven een DNA-sequentie en pre-mRNA. Omdat de regulatiemethoden worden geërfd, biedt dit nieuwe manieren voor mutaties om genexpressie te beïnvloeden. [7]

Er is voorgesteld dat alternatieve splicing voor eukaryoten een zeer belangrijke stap was naar een hogere efficiëntie, omdat informatie veel zuiniger kan worden opgeslagen. Verschillende eiwitten kunnen worden gecodeerd door een enkel gen, in plaats van dat er voor elk een apart gen nodig is, waardoor een meer gevarieerd proteoom van een genoom van beperkte grootte mogelijk is. [1] Het biedt ook evolutionaire flexibiliteit. Een enkele puntmutatie kan ertoe leiden dat een bepaald exon af en toe wordt uitgesloten of opgenomen uit een transcript tijdens splitsing, waardoor de productie van een nieuwe eiwit-isovorm mogelijk wordt zonder verlies van het oorspronkelijke eiwit. [1] Studies hebben intrinsiek ongeordende regio's geïdentificeerd (zie intrinsiek ongestructureerde eiwitten) als verrijkt in de niet-constitutieve exons [42] wat suggereert dat eiwit-isovormen functionele diversiteit kunnen vertonen als gevolg van de wijziging van functionele modules in deze regio's. Een dergelijke functionele diversiteit die wordt bereikt door isovormen wordt weerspiegeld door hun expressiepatronen en kan worden voorspeld door machine learning-benaderingen. [43] [44] Vergelijkende studies geven aan dat alternatieve splicing voorafging aan multicellulariteit in de evolutie, en suggereren dat dit mechanisme mogelijk is gecoöpteerd om te helpen bij de ontwikkeling van meercellige organismen. [45]

Onderzoek op basis van het Human Genome Project en andere genoomsequencing heeft aangetoond dat mensen slechts ongeveer 30% meer genen hebben dan de rondworm Caenorhabditis elegans, en slechts ongeveer twee keer zoveel als de vlieg Drosophila melanogaster. Deze bevinding leidde tot speculatie dat de waargenomen grotere complexiteit van mensen, of gewervelde dieren in het algemeen, te wijten zou kunnen zijn aan hogere snelheden van alternatieve splicing bij mensen dan bij ongewervelde dieren. [46] [47] Echter, een onderzoek naar monsters van 100.000 EST's, elk van mens, muis, rat, koe, vlieg (D. melanogaster), worm (C. elegans), en de plant Arabidopsis thaliana vond geen grote verschillen in frequentie van alternatief gesplitste genen tussen mensen en andere geteste dieren. [48] ​​Een andere studie stelde echter voor dat deze resultaten een artefact waren van de verschillende aantallen EST's die beschikbaar waren voor de verschillende organismen. Toen ze alternatieve splitsingsfrequenties vergeleken in willekeurige subsets van genen van elk organisme, concludeerden de auteurs dat gewervelde dieren hogere snelheden van alternatieve splitsing hebben dan ongewervelde dieren. [49]

Veranderingen in de RNA-verwerkingsmachinerie kunnen leiden tot het verkeerd splitsen van meerdere transcripten, terwijl veranderingen van één nucleotide in splitsingsplaatsen of cis-werkende reguleringsplaatsen kunnen leiden tot verschillen in splitsing van een enkel gen, en dus in het mRNA geproduceerd uit een transcripten van het gemuteerde gen. Een onderzoek in 2005 met probabilistische analyses gaf aan dat meer dan 60% van de menselijke ziekteveroorzakende mutaties de splitsing beïnvloeden in plaats van direct de coderende sequenties te beïnvloeden. [50] Een recentere studie geeft aan dat een derde van alle erfelijke ziekten waarschijnlijk een splitsingscomponent heeft. [22] Ongeacht het exacte percentage bestaat er een aantal splicing-gerelateerde ziekten. [51] Zoals hieronder beschreven, is kanker een prominent voorbeeld van aan splicing gerelateerde ziekten.

Abnormaal gesplitste mRNA's worden ook gevonden in een groot aantal kankercellen. [5] [6] [8] Gecombineerde RNA-Seq- en proteomics-analyses hebben een opvallende differentiële expressie van splice-isovormen van sleuteleiwitten in belangrijke kankerroutes onthuld. [52] Het is niet altijd duidelijk of dergelijke afwijkende patronen van splicing bijdragen aan de groei van kanker, of slechts het gevolg zijn van cellulaire afwijkingen die verband houden met kanker. Voor bepaalde soorten kanker, zoals bij colorectale en prostaatkanker, is aangetoond dat het aantal splitsingsfouten per kanker sterk varieert tussen individuele kankers, een fenomeen dat transcriptoominstabiliteit wordt genoemd. [53] [54] Instabiliteit van transcriptoom blijkt verder te correleren met een verminderd expressieniveau van splicingfactor-genen. Mutatie van DNMT3A is aangetoond dat het bijdraagt ​​aan hematologische maligniteiten, en dat DNMT3A-gemuteerde cellijnen vertonen transcriptoominstabiliteit in vergelijking met hun isogene wildtype-tegenhangers. [55]

In feite is er in feite een vermindering van alternatieve splicing in kankercellen in vergelijking met normale cellen, en de soorten splicing verschillen bijvoorbeeld, kankercellen vertonen hogere niveaus van intronretentie dan normale cellen, maar lagere niveaus van exon-skipping. [56] Sommige verschillen in splitsing in kankercellen kunnen te wijten zijn aan de hoge frequentie van somatische mutaties in splitsingsfactorgenen, [8] en sommige kunnen het gevolg zijn van veranderingen in fosforylering van trans-werkende splitsingsfactoren. [7] Anderen kunnen worden geproduceerd door veranderingen in de relatieve hoeveelheden geproduceerde splitsingsfactoren, bijvoorbeeld, van borstkankercellen is aangetoond dat ze verhoogde niveaus van de splitsingsfactor SF2/ASF hebben. [57] Eén studie toonde aan dat een relatief klein percentage (383 van de meer dan 26000) alternatieve splicing-varianten significant hoger was in frequentie in tumorcellen dan normale cellen, wat suggereert dat er een beperkte set genen is die, wanneer ze verkeerd worden gesplitst, bijdragen aan de ontwikkeling van tumoren. [58] Er wordt echter aangenomen dat de schadelijke effecten van verkeerd gesplitste transcripten gewoonlijk worden beschermd en geëlimineerd door een cellulair posttranscriptioneel kwaliteitscontrolemechanisme dat Nonsense-gemedieerd mRNA-verval [NMD] wordt genoemd. [59]

Een voorbeeld van een specifieke splicingvariant die is geassocieerd met kankers is in een van de menselijke DNMT-genen. Drie DNMT-genen coderen voor enzymen die methylgroepen aan DNA toevoegen, een modificatie die vaak regulerende effecten heeft. Verschillende abnormaal gesplitste DNMT3B-mRNA's worden gevonden in tumoren en kankercellijnen. In twee afzonderlijke onderzoeken veroorzaakte expressie van twee van deze abnormaal gesplitste mRNA's in zoogdiercellen veranderingen in de DNA-methyleringspatronen in die cellen. Cellen met een van de abnormale mRNA's groeiden ook twee keer zo snel als controlecellen, wat wijst op een directe bijdrage aan tumorontwikkeling door dit product. [7]

Een ander voorbeeld is de Ron (MST1R) proto-oncogen. Een belangrijke eigenschap van kankercellen is hun vermogen om te bewegen en normaal weefsel binnen te dringen. Productie van een abnormaal gesplitst transcript van Ron bleek geassocieerd te zijn met verhoogde niveaus van de SF2/ASF in borstkankercellen. De abnormale isovorm van het Ron-eiwit waarvoor dit mRNA codeert, leidt tot celmotiliteit. [57]

Overexpressie van een afgeknotte splitsingsvariant van het FOSB-gen - ΔFosB - in een specifieke populatie van neuronen in de nucleus accumbens is geïdentificeerd als het causale mechanisme dat betrokken is bij de inductie en instandhouding van een verslaving aan drugs en natuurlijke beloningen. [60] [61] [62] [63]

Recente provocerende studies wijzen op een sleutelfunctie van de chromatinestructuur en histonmodificaties bij alternatieve splitsingsregulatie. Deze inzichten suggereren dat epigenetische regulatie niet alleen bepaalt welke delen van het genoom tot expressie worden gebracht, maar ook hoe ze worden gesplitst. [64]

Genoombrede analyse van alternatieve splicing is een uitdagende taak. Doorgaans zijn alternatief gesplitste transcripten gevonden door EST-sequenties te vergelijken, maar dit vereist sequencing van zeer grote aantallen EST's. De meeste EST-bibliotheken zijn afkomstig uit een zeer beperkt aantal weefsels, dus weefselspecifieke splitsingsvarianten zullen in ieder geval waarschijnlijk worden gemist. Er zijn echter benaderingen met hoge doorvoer ontwikkeld om splicing te onderzoeken, zoals: DNA-microarray-gebaseerde analyses, RNA-bindingsassays en diepe sequencing. Deze methoden kunnen worden gebruikt om te screenen op polymorfismen of mutaties in of rond splicing-elementen die eiwitbinding beïnvloeden. In combinatie met splicing-assays, waaronder: in vivo reportergenassays, de functionele effecten van polymorfismen of mutaties op de splitsing van pre-mRNA-transcripten kunnen vervolgens worden geanalyseerd. [22] [25] [65]

Bij microarray-analyse worden arrays van DNA-fragmenten die individuele exons vertegenwoordigen (bijv. Affymetrix exon microarray) of exon/exon grenzen (bijv. arrays van ExonHit of Jivan) zijn gebruikt. De array wordt vervolgens onderzocht met gelabeld cDNA uit weefsels van belang. De probe-cDNA's binden aan DNA van de exons die zijn opgenomen in mRNA's in hun weefsel van oorsprong, of aan DNA vanaf de grens waar twee exons zijn verbonden. Dit kan de aanwezigheid van bepaalde alternatief gesplitste mRNA's onthullen. [66]

CLIP (Cross-linking and immunoprecipitation) gebruikt UV-straling om tijdens het splicen eiwitten te koppelen aan RNA-moleculen in een weefsel. Een trans-acting splicing regulerend eiwit van belang wordt vervolgens geprecipiteerd met behulp van specifieke antilichamen. Wanneer het RNA dat aan dat eiwit is gehecht, wordt geïsoleerd en gekloond, onthult het de doelsequenties voor dat eiwit. [4] Een andere methode voor het identificeren van RNA-bindende eiwitten en het in kaart brengen van hun binding aan pre-mRNA-transcripten is "Microarray Evaluation of Genomic Aptamers by shift (MEGAshift)".net [67] Deze methode omvat een aanpassing van de "Systematic Evolution of Ligands by Exponential Enrichment (SELEX)"-methode [68] samen met een microarray-gebaseerde uitlezing. Het gebruik van de MEGAshift-methode heeft inzicht gegeven in de regulatie van alternatieve splicing door de identificatie van sequenties in pre-mRNA-transcripten rond alternatief gesplitste exons die binding aan verschillende splicingfactoren, zoals ASF/SF2 en PTB, mogelijk te maken. [69] Deze benadering is ook gebruikt om te helpen bij het bepalen van de relatie tussen de secundaire structuur van RNA en de binding van splicingfactoren. [24]

Deep sequencing-technologieën zijn gebruikt om genoombrede analyses van mRNA's uit te voeren - onverwerkt en verwerkt - en zo inzicht te geven in alternatieve splicing. Resultaten van het gebruik van diepe sequencing geven bijvoorbeeld aan dat bij mensen naar schatting 95% van de transcripten van multiexon-genen alternatieve splitsing ondergaan, waarbij een aantal pre-mRNA-transcripten op een weefselspecifieke manier worden gesplitst. [2] Functionele genomica en computationele benaderingen op basis van het leren van meerdere instanties zijn ook ontwikkeld om RNA-seq-gegevens te integreren om functies voor alternatief gesplitste isovormen te voorspellen. [44] Deep sequencing heeft ook geholpen bij de in vivo detectie van de tijdelijke lariats die vrijkomen tijdens splitsing, de bepaling van sequenties van vertakkingsplaatsen en het op grote schaal in kaart brengen van vertakkingspunten in menselijke pre-mRNA-transcripten. [70]

Het gebruik van reporterassays maakt het mogelijk om de splitsingseiwitten te vinden die betrokken zijn bij een specifieke alternatieve splitsingsgebeurtenis door reportergenen te construeren die een van twee verschillende fluorescerende eiwitten tot expressie brengen, afhankelijk van de splitsingsreactie die optreedt. Deze methode is gebruikt om mutanten te isoleren die de splitsing beïnvloeden en dus om nieuwe regulerende splitsingseiwitten te identificeren die in die mutanten zijn geïnactiveerd. [4]

Er is een verzameling alternatieve splitsingsdatabases. [71] [72] [73] Deze databases zijn nuttig voor het vinden van genen met pre-mRNA's die alternatieve splitsing en alternatieve splitsingsgebeurtenissen ondergaan of om de functionele impact van alternatieve splitsing te bestuderen.


Hoofdstuk 12. Vragen over RNA-verwerking

12.1 Nucleosidetrifosfaten gelabeld met [32P] op de a-, b- of g-positie zijn nuttig voor het volgen van verschillende aspecten van transcriptie. Geef voor het specifieke proces vermeld in a-c de positie van het label dat geschikt is om die stap te onderzoeken.

a) Initiatie door E coli RNA-polymerase.

b) Vorming van het 5'-uiteinde van eukaryoot mRNA.

c) Verlenging door eukaryote RNA-polymerase II.

12.2 (POB) RNA posttranscriptionele verwerking.

Voorspel de waarschijnlijke effecten van een mutatie in de sequentie (5')AAUAAA in een eukaryoot mRNA-transcript.

12.3 Een fosfoester-overdrachtsmechanisme (of transverestering) wordt vaak waargenomen bij splitsing en andere reacties waarbij RNA betrokken is. Zijn de volgende uitspraken over deze mechanismen waar of niet waar?

a) Het mechanisme vereist de splitsing van hoogenergetische bindingen van ATP.

b) Het initiërende nucleofiel voor het splitsen van Groep I-introns (inclusief het intron van pre-rRNA van Tetrahymena) is de 3'-hydroxyl van een guaninenucleotide.

c) De initiërende nucleofiel voor splitsing van nucleair pre-mRNA is de 2'-hydroxyl van een intern adenine-nucleotide.

d) The individual reactions in the phosphoester transfers are reversible, but the overall process is essentially irreversible because of circularization (includes lariat formation) of the excised intron.

12.4 What properties are shared by the splicing mechanism of Tetrahymena pre-rRNA and Group II fungal mitochrondrial introns?

12.5 Please answer these questions on splicing of precursors to mRNA.

a) What dinucleotides are almost invariably found at the 5 and 3 splice sites of introns?

b) Which splicing component binds at the 5' splice junction?

c) What nucleotides are joined by the branch structure in the intron during splicing?

d) What is ATP used for during splicing of precursors to mRNA?

What is the minimum number of transesterification reactions needed to splice an intron from an mRNA transcript? Waarom?

12.7 Match the following statements with the appropriate eukaryotic splicing process listed in parts a-c.

1) A guanine nucleoside or nucleotide initiates a concerted phosphotransfer reaction.

2) The consensus sequences at splice junctions are AG'GUAAGU. YYYAG'G (' is the junction, Y = any pyrimidine).

3) Splicing occurs in two separate steps, cutting to generate a 3'-phosphate followed by an ATP dependent ligation.

4) Splicing requires no protein factors.

5) Splicing requires U1 small nuclear ribonucleoprotein complexes.

b) Splicing of pre-tRNA in yeast

c) Splicing of pre-rRNA in Tetrahymena

12.8 The enzyme RNase H will cleave any RNA that is in a heteroduplex with DNA. Thus one can cleave a single-stranded RNA in any specific location by first annealing a short oligodeoxyribonucleotide that is complementary to that location and then treating with RNase H.

This approach is useful in determining the structure of splicing intermediates. Let's consider a hypothetical case shown in the figure below. After incubation of radiolabeled precursor RNA (exon1-intron-exon2) with a nuclear extract that is capable of carrying out splicing, the products were analyzed on a denaturing polyacrylamide gel. The results showed that the exons were joined as linear RNA, but the excised intron moved much slower than a linear RNA of the same size, indicative of some non-linear structure. The excised intron was annealed to a short oligodeoxyribonucleotide that is complementary to the region at the 5' splice site (labeled oligo 1 in the figure), treated with RNase H and analyzed on a denaturing polyacrylamide gel. The product ran as a linear RNA with the size of the excised intron (less the length of the RNase H cleavage site). As summarized in the figure, the excised intron was analyzed by annealing (separately) with three other oligodeoxyribonucleotides, followed by RNase H treatment and gel electrophoresis. Use of oligodeoxyribonucleotide number 2 generated a Y-shaped molecule, use of oligodeoxyribonucleotide number 3 generated a V-shaped molecule with one 5' end and 2 3' ends, and use of oligodeoxyribonucleotide number 4 generated a circle and a short linear RNA.

(a) What does the result with oligodeoxyribonucleotide 2 tell you?

(b) What does the result with oligodeoxyribonucleotide 4 tell you?

(c) What does the result with oligodeoxyribonucleotide 1 tell you?

(d) What does the result with oligodeoxyribonucleotide 3 tell you?

(e) What is the structure of the excised intron? Show the locations of the complementary oligos on your drawing.


Resultaten

Overview of the transcriptome

To explore the AS events, we downloaded 75-nt paired-end RNA-seq reads from the ten tissues, including ovary, expanded ovary under fertilization, expanded ovary not fertilized, root, stem, leaf, male flower, female flower, tendril, and the base part of the tendril. We applied Trimmomatic to filter out the low-quality reads [33]. After quality control of the reads, 199,307,425 high-quality reads, occupying 90.39% of the total reads, were remained (Table 1).

We used the program TopHat2 [34] to map the high-quality reads to the cucumber genome, in which 92.94% reads were uniquely aligned (Table 1). Moreover, we obtained 36,910 complete novel junctions and 40,884 partial novel junctions (Additional file 1: Figure S1a), which can help in finding new splicing events.

The RNA-seq reads mapped to the genome were assembled into transcripts using Cufflinks [36]. Altogether, 21,387 genes, corresponding to 88.11% (21387/24274) of the annotated genes, produced 74,543 transcripts, and were expressed in at least one of the ten tissues. These transcripts were distributed in ten tissues, ranging from 24,406 (the base part of tendril) to 27,175 (expanded ovary not fertilized) (Table 2). The number of expressed genes in the ten tissues ranged from 17,859 (tendril) to 18,572 (root) (Table 2). Moreover, 3344 new genes were detected, which produced 5173 transcripts.

A global view of the AS events

We applied the program ASTALAVISTA [39] to identify the AS events in cucumber. According to the current annotation, we analysed only the AS events occurring on the transcripts encoded by the annotated genes. A total of 40,195 AS events, distributed in 10,015 intron-containing genes, were identified, which accounted for 58.17% (10,015/17,216) of the expressed multi-exon genes in the ten tissues. Among the AS events identified, IR represented 37.55% of the total AS events and was the most abundant type, followed by AA (17.83%), AD (9.02%) and ES (5.01%) (Fig. 1). The results were consistent with the observations in soybean [25] and tomato [29]. In addition to the four basic types of AS events, there were also 12,291 complex AS events (30.58%), containing more than one of the four types of AS events, which further suggested the complexity of AS in cucumber (Fig. 1). Of all the AS events, 13,154 were identified by comparing the transcripts among different tissues (among-tissue events), and the other 27,041 were identified by comparing within individual tissues (within-tissue events). For the basic AS types, the ratios between within-tissue events and among-tissue events were similar: IR was the most common, whereas ES was the lowest (Additional file 2: Figure S2).

Statistics of different AS events

Functional annotation of genes

To determine the functions of genes in cucumber, we conducted a functional annotation of all genes by performing Blast2GO [41]. Altogether, 59% (14,390/24,274) genes have potential functions, involving 8660 GO terms, which are partitioned into 5352 biological process, 2406 molecular functions and 902 cellular components.

Genes subjected to AS

Of the annotated genes, 10,015 genes contained one or more AS events. To assess the potential functional relevance of the AS genes, we examined the functional associations of these genes. We tested for enrichment among the genes. Biological processes of AS genes were mainly enriched in the regulation of cellular component organization, protein modification process and cellular response to DNA damage stimulus. For molecular function, these genes were mainly enriched in N-acetyltransferase activity, endodeoxyribonuclease activity, transcription factor binding, and protein binding (Additional file 3: Figure S3). These results suggested the importance of AS genes in plants [43].

For 10,015 AS genes, the number of AS events varied widely. Some genes were subjected to many AS events, whereas others were subjected to only a few. To gain further insight into the genes with significantly more AS events compared with random genes, a randomization process was used to extract these genes. We obtained 565 genes with significantly more AS events compared with random genes. We found that these genes were significantly enriched in biological processes related to regulation of actin filament length, such as positive regulation of cellular component organization, regulation of protein complex assembly, and biological adhesion (Fig. 2). A previous study reported that the rich AS of cell adhesion molecules increases the number of available cell–cell recognition molecules in the insect or vertebrate genome [44]. These results indicated that cell adhesion molecules might employ the similar mechanisms to increase the ability of cell–cell recognition molecules in cucumber.

GO enrichment of genes with more AS events

Four basic types of AS events

For each type of AS events the mechanism of regulation is different. Therefore, we explored whether there is a functional significance for the different types of AS events occurring in different genes. As previously mentioned, there were 10,015 genes with AS, wherein the numbers of IR, AA, AD, and ES genes were 7241, 4558, 2648, and 1504, respectively. The GO enrichments showed that different AS gene types were involved in different functions, with a few overlapping GO terms (Additional file 4: Figure S4). The AS genes underwent different types of events simultaneously. To better understand the functions of the AS type, we isolated the genes with only one type of AS. We extracted 3262, 1153, 463 and 202 genes which only had IR, AA, AD and ES, types of events respectively. In genes with only the IR events, the significant biological processes were related to cell wall macromolecule metabolism (Fig. 3). In Arabidopsis, a gene regulated starch metabolism by IR type of AS [45]. This indicates that genes participating in regulating metabolism by IR might be widespread in plants.

GO enrichment of genes with only IR events

Different AS events profiles among the ten tissues

To further investigate the profiles of AS events in the ten tissues, we used the within-tissue events for further analysis. Among these AS events, IR was the most abundant type (1912–3004), followed by AA (966–1450), complex events (731–1157), AD (510–695) and ES (323–401) (Fig. 4). In the ten tissues studied, the highest AS events were found in the expanded not fertilized ovary, which were significantly higher than the expanded ovary under fertilized (Fisher’s one-tailed test, p-value = 1.53e-10). Conversely, the smallest number of AS events was detected in the base part of the tendril and was significantly lower than the tendril (Fisher’s one-tailed test, p-value = 2.48e-4) (Additional file 1: Figure S1b). This is in accordance with our hypothesis that the greater the number of transcripts, the higher the number of AS events this result has been verified in human [46].

Numbers of different AS event types in the ten tissues

To compare the AS events among tissues, each tissue was represented by a vector denoted as an AS event profile. We found significantly different AS event profiles among the ten tissues (chi-square test, p-value ≤ 2.2e-16). To further detect the similarity in the AS event profiles among tissues, we used hierarchical clustering to analyse the relationship among the ten vectors. As Fig. 5 shows, the AS event profiles of stem and leaf are similar the AS event profiles of the ovary, expanded ovary under fertilization, and the expanded ovary not fertilized were similar.

The cluster of AS event profiles of ten tissues

Genes showing tissue-specific AS among the ten tissues

Many AS events are regulated in a tissue-specific manner therefore, we wanted to determine the genes with tissue-specific AS among the ten tissues and their functions. We first isolated the genes showing tissue-specific AS event using our Perl scripts. Altogether, we observed 7,370 genes showing tissue-specific AS events, scattered in ten tissues. To understand the biological significance of these genes, the GO enrichment was applied with Ontologizer [42]. In the list of the genes with tissue-specific AS events among the ten tissues, we found that they were highly enriched in biological processes related to positive regulation of cellular component organization and molecular functions related to structure-specific DNA binding (Additional file 5: Figure S5). The results indicated that these genes might be involved in tissue-specific regulation.

We further investigated the genes with tissue-specific AS events. Among the ten tissues, the number of genes with tissue-specific AS events ranged from 1067 to 1763. The most genes with tissue-specific AS events were in the expanded ovary not fertilized, followed by root (1469) with significantly fewer genes with tissue-specific AS event than in the expanded ovary not fertilized (Fisher’s one-tailed test, p-value = 1.523e-06). The fewest genes with tissue-specific AS event were in the stem, followed by the base part of the tendril (1173) wherein there were significantly more genes with tissue-specific AS event than in stem (Fisher’s one-tailed test, P-value = 1.95e-02) (Additional file 1: Figure S1c).

The functions of the genes, with tissue-specificity for AS events in the ten tissues, were investigated using the GO enrichment results shown in Fig. 6. For example, in the root, the cellular response to DNA damage stimulus was significantly enriched. A previous study detected a stem cell niche in the Arabidopsis roots [47]. These stem cells must have effective DNA damage response to prevent mutations propagated to other parts of the plant [48]. Moreover, RNA splicing was a new player in the DNA damage response [49]. Based on these studies, we speculated that in cucumber roots there was a stem cell niche and root-specific AS events were observed in response to DNA damage.

GO enrichment analysis of genes with tissue-specific AS events in ten tissues. The colour square represents ( -_<10>^ ) for the enrichment of GO terms. Red indicates that the term is significantly enriched, and black represents no enrichment in the term. een Molecular function. B Biological process

Genes with similar IR patterns among the ten tissues

IR is the dominant AS in plants, and short introns are more retained than long introns [25]. Therefore, we investigated the length of the retained introns compared with other introns and found that the lengths of the retained introns were significantly shorter than the other introns (Mann-Whitney U test, p-value ≤ 2.2e-16) (Additional file 6: Figure S6). This indicated a tendency for shorter retained introns in cucumber.

For each gene undergoing IR, we obtained an IR pattern among the ten tissues (see Materials and Methods). According to their IR patterns, the genes were clustered into 12 classes (Fig. 7a) with genes in the same cluster having similar IR patterns. Based on this cluster, we explored 4 features of these 12 groups: retained-intron length, retained-intron GC percentage, the exon number and major transcripts (transcript with highest FPKM in all tissues for one gene) expression value. Interestingly, these groups had similar lengths for the retained introns (Kruskal–Wallis rank sum test, p-value = 0.1765) GC percentages of the retained introns, number of exons and FPKM of major transcripts are significantly different among the groups (Kruskal–Wallis rank sum test, p-value = 0.04874, p-value = 7.318e-05, p-value = 0.03796, respectively) (Fig. 7). These results indicated that the feature of genes might affect the IR patterns of genes in the ten tissues.

Clustering of genes by IR patterns. een The hierarchical clustering of IR genes. The red line was drawn at the height of 0.95, and these genes were classified into 12 parts. B Features of IR genes and p-values by Kruskal–Wallis rank sum test. C The length of the retained introns. NS GC percentage of the retained introns. e Exon number of genes. F FPKM of major isoforms

Validation of AS events by RT-PCR

To validate the AS events predicted by RNA-seq, we performed reverse transcription-PCR (RT-PCR) experiments for 41 AS events in two tissues (leaf and stem) using newly extracted RNA. First, we verified the accuracy of these events in leaf, and 31 AS events (76%) were validated (Additional file 7: Figure S7). Then, we chose 18 out of 41 AS events, which showed different AS events between leaf and stem. Among these 18 events, 10 (56%) were validated (Additional file 8: Figure S8). Due to the sensitivity of RT-PCR, more events can be obtained. Given that the RNAs for the experiments are not the same for generating the analyzed RNA-seq, some AS events which were not validated may be due to the changes of spatial and temporal gene expression. Furthermore, according to the results detected by the gel, we can see the differences in expression levels between the primary and alternative transcript, such as Csa5G621964 and Csa6G01160 (Additional file 8: Figure S8).


Toegangsopties

Krijg volledige toegang tot tijdschriften voor 1 jaar

Alle prijzen zijn NET prijzen.
De btw wordt later bij het afrekenen toegevoegd.
De belastingberekening wordt definitief tijdens het afrekenen.

Krijg beperkte of volledige toegang tot artikelen op ReadCube.

Alle prijzen zijn NET prijzen.


Materialen en methodes

Computational prediction of strength of U2AF65 binding sites in PY tracts

The March 2006 human reference sequence (NCBI Build 36.1) in conjunction with the UCSC KnownGenes (hg18) annotation database (Release 8 April 2007) [73] was used to create a non-redundant database of human intronic sequences. After excluding annotated introns that did not begin with G [T/C] [A/G] and end with AG, and were less than 60 bases in length, we were left with 171,475 unique acceptor ends.

In order to score PY tracts according to their likely affinity towards U2AF65, we developed a score that reflects the level of similarity of the PY tract sequence to the sequences that were enriched in RNAs derived from in vitro SELEX experiments using human U2AF65. In particular, if we let the frequency of occurrence of an n-mer N of length k within the SELEX sequences be represented by F N, then for a subject sequence of length L the S65 score is determined according to:

waar F Nrepresents the frequency (within the SELEX population) of the n-mer found at position l in the subject sequence.

The term ln ( f n i 1 4 k ) [email protected]@[email protected]@+=feaafiart1ev1aaatCvAUfeBSjuyZL2yd9gzLbvyNv2Caerbhv2BYDwAHbqedmvETj2BSbqee0evGueE0jxyaibaiKI8=vI8viVeY=Nipec8Eeeu0xXdbba9frFj0xb9qqpG0dXdb9aspeI8k8fiI+fsY=rqGqVepae9pg0db9vqaiVgFr0xfr=xfr=xc9adbaqaaeGaciGaaiaabeqaaeqabiWaaaGcbaGaciiBaiaac6gadaqadaqcfayaamaalaaabaGaamOzamaaBaaabaGaamOBamaaBaaabaGaamyAaaqabaaabeaaaeaadaWccaqaaia[email protected][email protected] is a log-odds representation of the degree to which the particular n-mer was enriched within the SELEX sequences. Since the SELEX experiment began with uniformly random sequences, the denominator is simply the expectation for random occurrence of an n-mer of length k. For this study we chose the n-mer length to be five and the SELEX data were those reported in Singh et al. [27] and both SELEX experiments reported in Banerjee et al. [39]. The frequency of occurrence for all pentamers within these sequences is shown in Additional data file 1. Introns with 'strong' PY tracts (that is, expected to have high affinity for U2AF65) were defined to be those that are above the median value for all introns (0.811). All but one of the RNAs derived from in vitro SELEX had S65 scores above this value.

Identification of intronic motifs over-represented upstream of weak PY tracts

In order to avoid biases due to long interspersed repetitive elements (LINEs) and short interspersed repetitive elements (SINEs), repetitive elements in the intronic sequence database (obtained as described above) were masked using the masking coordinates associated with the UCSC hg18 annotation database (Release 8 April 2007) [73]. However, simple repeats (many of which resemble known hnRNP binding sites) were not masked. The intronic acceptor sequences were then separated according to their GC content within the last 100 bases (or last half if the intron was less than 200 bases in length). AT-rich introns were defined to be introns containing less than 50% GC content. GC-rich introns were defined to be those containing greater than or equal to 50% GC content.

For each of these data sets, the occurrence of all n-mers (4-7 nucleotides) in the 50 nucleotide region from -80 to -30 (relative to the acceptor splice-junction) were determined using a sliding window. These counts were used to determine the background expectations for each n-mer. The occurrence of each 4-7 nucleotide n-mer within the equivalent region for all introns possessing 'weak' PY tracts (defined as above) was determined using a sliding window. From these values, n-mers that are enriched upstream of the branchpoint region for introns possessing weak PY tracts was determined using the binomial confidence interval method described in Voelker and Berglund [52]. For the AT-rich class, 99 n-mers were determined to be significantly enriched (P < 0.01), and 349 n-mers were determined to be significantly enriched for the GC-rich class. Enriched n-mers and corresponding counts and statistics are available in Additional data files 2 and 3. Enriched n-mers were used to construct motifs as in Voelker and Berglund [52]. All of the derived motifs and the identities and occurrences of all n-mers that were used to construct the motifs are available in Additional data files 4 and 5.

U2AF65 binding

RNA oligonucleotides (listed in Figure 2b, IDT, Integrated DNA Technologies, San Diego, CA, USA) for U2AF65 binding assays were 5' end-labeled with γ- 32 P ATP using T4 polynucleotide kinase (NEB, Ipswich, MA, USA) for 30 minutes at 37°C. The RNAs were then gel purified using an 8% denaturing gel, eluted from the gel in 0.3M Na acetate and ethanol precipitated. The resulting pellet was resuspended in nanopure water and purified with a Bio-spin 6 column (BioRad, Hercules, CA, USA) equilibrated with nanopure water. The radioactivity level of the purified RNA solution was determined by scintillation. Gel-shift binding assays were performed using varying concentrations of recombinant human U2AF65 with constant amounts of radiolabeled RNA oligonucleotides as previously described [49]. The Ensembl gene accession numbers for the genes addressed in this study are: BRUNOL4 [ENSEMBL: ENSG00000101489], INSR [ENSEMBL: ENSG00000171105], LCAT [ENSEMBL: ENSG00000124067], MBNL1 [ENSEMBL: ENSG00000152601], SR140 [ENSEMBL: ENSG00000163714], and U2AF2 [ENSEMBL: ENSG00000063244].

Cloning of mini-genes and mutants

WT LCAT intron 4 mini-gene was cloned from HeLa genomic DNA using primers to amplify the region between the last 50 nucleotides of LCAT intron 3 to the first 50 nucleotides of LCAT intron 5 (502 nucleotides). The forward primer included a BamH1 site and the reverse primer included an EcoR1 site. The amplified genomic DNA was cut with BamH1 and EcoR1, inserted into pcDNA3 and sequenced. LCAT intron 4 mutants were made by PCR using the WT LCAT 4 mini-gene as template and primers containing the mutation of interest. LCAT intron 4 mutants were also cloned into pcDNA3 using BamH1 and EcoR1 and sequenced. The WT and mutant GNPTG [ENSEMBL: ENSG00000090581] intron 2 mini-genes were cloned using overlapping primers to create a sequence containing exon 2, intron 2 and exon 3. This sequence was flanked by cut sites hihidIII en Niet1, cloned into pcDNA3 and sequenced.

In vivosplicing assays: cell culture, transfection, and harvesting

HeLa cells were grown in monolayers in DMEM with GLUTAMAX (Invitrogen, Carlsbad, CA, USA) and supplemented with 10% fetal bovine serum (GIBCO). For the LCAT splicing experiments 1.5 (± 0.2) × 10 5 cells were plated in 6-well plates and transfected 18-20 h later at approximately 70% confluency. Plasmid (1 μg) was transfected into each well of cells using 5 μl of Lipofectin (Invitrogen, Carlsbad, CA, USA) and 10 μl of Plus reagent (Invitrogen) according to the manufacturer's protocols. For the GNPTG splicing experiments, 2 × 10 5 cells were plated in 6-well plates and transfected with 1 μg plasmid 18-20 h later using 5 μl of Lipofectamine 2000. Cells were harvested 24 h (LCAT experiments) or 16 h (GNPTG experiments) after transfection using TriplE (GIBCO) and then pelleted by centrifugation. RNA was isolated from the cell pellets using an RNeasy kit (QIAGEN, Valencia, CA, USA).

In vivosplicing assays: DNAsing, reverse transcription, PCR, and quantifying percent mRNA

Isolated RNA (500 ng) was incubated with 1 unit of RQI DNase (Promega, Madison, WI, USA) in a 10 μl reaction for 2 h (LCAT experiments) or 1 h (GNPTG experiments) according to the manufacturer's protocol. DNAsed RNA (2 μl (100 ng)) was reverse transcribed in a 10 μl reaction (1:5 dilution) using Superscript II and an LCAT-specific reverse primer or a reverse primer to the pCDNA3 SP6 sequence for the GNPTG experiments, according to manufacturer's protocols with the exception that we used half the recommended amount of Superscript II (Invitrogen, Carlsbad, CA, USA). For the LCAT splicing experiments, 2 μl of the reverse transcription reaction was subjected to 20 rounds of PCR amplification in a 20 μl reaction (1:10 dilution) using LCAT specific primers spiked with a kinased LCAT forward primer (0.4 nM). Twenty rounds of PCR were found to be within the linear range for this PCR experiment (data not shown). The resulting PCR products were run on an 8% (19:1) polyacrylamide native gel. For the GNPTG splicing experiments, 2 μl of the reverse transcription reaction was subjected to 27 rounds of PCR amplification in a 20 μl reaction (1:10 dilution) using primers specific to the T7 (forward) and SP6 (reverse) sequences of the pcDNA3 plasmid spiked with kinased T7 forward primer. Twenty-seven rounds of PCR were found to be within the linear range for this PCR experiment (data not shown). The resulting PCR products were run on a 10% (19:1) polyacrylamide gel. The gels were dried and exposed overnight to a phosphorimager screen. Quantification of the radioactive bands was performed using ImageQuant software (GE Healthcare, London, UK). The percent pre-mRNA was calculated by dividing the amount of the pre-mRNA band by the total amount of the pre-mRNA and mRNA bands and multiplying by 100%.


What are the Similarities Between Group I and Group II Introns?

  • Group I and group II introns are two types of RNA enzymes, ribozymes that catalyze their own splicing by different mechanisms.
  • They are large ribozymes.
  • Both are found in all three domains.
  • They are mobile elements.
  • Moreover, they are found in rRNA, tRNA and protein-coding genes.
  • Both enzymes are using as tools in biotechnology and molecular medicine for targeted gene knock-out/knock-down, gene delivery or gene therapy systems.

Advances in Bacterial Pathogen Biology

Adam P. Roberts , . Peter Mullany , in Advances in Microbial Physiology , 2014

2 Introns

Introns were first discovered in eukaryotes and are ubiquitous in higher eukaryotes such as humans. In prokaryotes, some introns are capable of transposition and are often associated with other MGEs such as conjugative transposons and conjugative plasmids. Introns are classified into either group one (I) or two (II) according to their highly conserved secondary structure ( Belfort & Perlman, 1995 ). Group II introns have six conserved helices which emanate from a central wheel. This secondary structure is required for splicing. In one of the conserved helix (number IV), there is often an ORF encoding a multifunctional protein which has a reverse transcriptase domain which, as part of a riboprotein complex, can catalyse transposition of the intron to an allelic site via retrohoming or transposition to a different site ( Belfort & Perlman, 1995 ).

In C. moeilijk, there is a group II intron inserted into the conjugative transposon, Tn5397 in strain 630 ( Mullany, Pallen, Wilks, Stephen, & Tabaqchali, 1996 ). This group II intron is found within the gene within orf14, which is believed to be essential for conjugation of the element. Splicing of the group II intron has been demonstrated by PCR with primers reading across the predicted splice site ( Roberts, Braun, von Eichel-Streiber, & Mullany, 2001 Roberts, Johanesen, Lyras, Mullany, & Rood, 2001 ) demonstrating that this group II intron is capable of splicing from the mRNA. However, when the reverse transcriptase encoding domain was disrupted by insertion of a kanamycin resistance gene, the ability of the intron to splice was abolished but Tn5397 was still capable of transfer. One explanation for this is that the intron has inserted very close to the 3′ end of the gene and splicing is not required to obtain a functional Orf14. Another group II intron has been found associated with a Tn5397-like element in strain QCD-63Q42 ( Brouwer, Warburton, Roberts, Mullany, & Allan, 2011 ), which inserted within a different gene compared to the strain 630 group II intron. It is not yet known if splicing is required for conjugation of this element.

The contribution of group II introns to the overall biology of C. moeilijk is likely to be low due to the fact that they can perfectly splice out of the pre-mRNA transcript rather than creating a mutation. However, they do offer the possibility of a regulatory step, if they only splice under certain environmental conditions and/or differentially splice under certain conditions then different proteins can be produced. This ability to generate a variety of proteins from a small genome is one of the hallmarks of bacteria. Furthermore, due to their small size (3 kb), they are likely to have little biological cost to their host cell.


Splicing of Pre-tRNAs Differs from Other Splicing Mechanisms

Comparison of the sequences of tRNA genes with the sequences of the corresponding cytosolic tRNAs has shown that some eukaryotic nuclear tRNA genes contain introns. For example, the pre-tRNA expressed from the yeast tyrosine tRNA (tRNA Tyr ) gene contains a 14-base intron that is not present in mature tRNA Tyr (see Figure 11-52). Some archaeal tRNA genes also contain introns. The introns in nuclear pre-tRNAs are shorter than those in pre-mRNAs, and they do not contain the splice-site consensus sequences found in pre-mRNAs (see Figure 11-14). Pre-tRNA introns also are clearly distinct from the much longer self-splicing group I and group II introns found in chloroplast and mitochondrial pre-rRNAs.

The mechanism of pre-tRNA splicing, outlined in Figure 11-53, differs in several ways from the mechanisms utilized by self-splicing introns and spliceosomes (see Figure 11-51). For instance, during pre-tRNA splicing the intron is excised in one step rather than two GTP and ATP are required a 2′, 3′-cyclic monophosphate forms on the cleaved end of the 5′ exon and the process is catalyzed by proteins (enzymes) rather than RNA. Certain mutations in pre-tRNA that change its secondary structure prevent the splicing reaction, indicating that pre-tRNA molecules must be folded into a particular secondary structure for intron excision to occur. Since introns always are found in the anticodon loop of pre-tRNAs, pre-tRNAs most likely are folded similarly to mature tRNAs, thereby bringing the two intron-exon junctions into proximity (see Figure 11-52 andFigure 4-26b).

Figure 11-53

Mechanism of splicing in pre-tRNA. First, the pre-tRNA is cleaved at two places, on each side of the intron, thereby excising the intron. The cleavage mechanism generates a 2′,3′-cyclic phosphomonoester at the 3′ end of the 5′ (more. )

When intron-containing yeast tRNA genes are microinjected into Xenopus oocyte nuclei, correctly processed tRNAs are produced. This finding indicates that enzymatic systems for cleaving, modifying, and splicing pre-tRNAs have been conserved over a wide evolutionary range.


Bekijk de video: DNA Transcription Advanced (Januari- 2022).